ALI, LLM, RAG 용어

->^_^<- 2025. 8. 20. 13:05

1. ALI (Adversarially Learned Inference)

정의: **생성 모델(GAN)**의 아이디어를 확장한 프레임워크로, 잠재공간(latent space)과 데이터 공간 간의 양방향 매핑을 학습하는 방식.

등장 배경: 일반적인 GAN은 데이터 → 잠재공간 방향(인코딩)을 직접 배우지 못하는 한계가 있었음. ALI는 이걸 극복.

작동 원리:

Generator: 잠재 벡터 z → 데이터 x 생성

Encoder: 데이터 x → 잠재 벡터 z 추론

Discriminator: (x, z) 쌍이 진짜인지 가짜인지 판별

활용: 이미지 생성, representation learning, semi-supervised learning 등

✅ 쉽게 말하면: “데이터 ↔ 잠재 공간”을 동시에 학습하는 양방향 GAN

---

2. LLM (Large Language Model)

정의: 방대한 양의 텍스트 데이터를 학습해, 자연어를 이해·생성할 수 있는 초거대 언어 모델.

대표 예시: GPT 시리즈(OpenAI), Claude(Anthropic), Gemini(Google), LLaMA(Meta)

핵심 특징:

Transformer 구조 기반

수십억~수천억 개 파라미터

텍스트 요약, 번역, 대화, 코드 작성 등 다양한 작업 수행

✅ 쉽게 말하면: ChatGPT 같은 똑똑한 언어 AI 모델

---

3. RAG (Retrieval-Augmented Generation)

정의: LLM이 답변할 때, **외부 데이터베이스에서 관련 문서를 검색(Retrieval)**해서 활용하는 생성(Generation) 방식.

필요한 이유:

LLM은 학습 시점 이후 정보(최신 정보)를 모름

긴 문서나 특정 데이터(내 문서, 회사 데이터)를 잘 기억 못함

작동 구조:

1. 사용자의 질문을 받아 → 검색기(Retriever)가 관련 문서 찾음

2. 찾은 문서를 LLM 입력에 포함 → 답변 생성

예시:

기업 내부 문서를 LLM과 연결해 Q&A 서비스 구축

최신 뉴스 검색 후 답변 제공

✅ 쉽게 말하면: “검색 + AI 대화”를 합친 방식

---

📌 요약

ALI: GAN을 확장한 양방향 생성·추론 모델

LLM: GPT 같은 초거대 언어 모델

RAG: 검색을 곁들여 답변하는 검색+생성 결합 방식

---