ALI, LLM, RAG 용어
1. ALI (Adversarially Learned Inference)
정의: **생성 모델(GAN)**의 아이디어를 확장한 프레임워크로, 잠재공간(latent space)과 데이터 공간 간의 양방향 매핑을 학습하는 방식.
등장 배경: 일반적인 GAN은 데이터 → 잠재공간 방향(인코딩)을 직접 배우지 못하는 한계가 있었음. ALI는 이걸 극복.
작동 원리:
Generator: 잠재 벡터 z → 데이터 x 생성
Encoder: 데이터 x → 잠재 벡터 z 추론
Discriminator: (x, z) 쌍이 진짜인지 가짜인지 판별
활용: 이미지 생성, representation learning, semi-supervised learning 등
✅ 쉽게 말하면: “데이터 ↔ 잠재 공간”을 동시에 학습하는 양방향 GAN
---
2. LLM (Large Language Model)
정의: 방대한 양의 텍스트 데이터를 학습해, 자연어를 이해·생성할 수 있는 초거대 언어 모델.
대표 예시: GPT 시리즈(OpenAI), Claude(Anthropic), Gemini(Google), LLaMA(Meta)
핵심 특징:
Transformer 구조 기반
수십억~수천억 개 파라미터
텍스트 요약, 번역, 대화, 코드 작성 등 다양한 작업 수행
✅ 쉽게 말하면: ChatGPT 같은 똑똑한 언어 AI 모델
---
3. RAG (Retrieval-Augmented Generation)
정의: LLM이 답변할 때, **외부 데이터베이스에서 관련 문서를 검색(Retrieval)**해서 활용하는 생성(Generation) 방식.
필요한 이유:
LLM은 학습 시점 이후 정보(최신 정보)를 모름
긴 문서나 특정 데이터(내 문서, 회사 데이터)를 잘 기억 못함
작동 구조:
1. 사용자의 질문을 받아 → 검색기(Retriever)가 관련 문서 찾음
2. 찾은 문서를 LLM 입력에 포함 → 답변 생성
예시:
기업 내부 문서를 LLM과 연결해 Q&A 서비스 구축
최신 뉴스 검색 후 답변 제공
✅ 쉽게 말하면: “검색 + AI 대화”를 합친 방식
---
📌 요약
ALI: GAN을 확장한 양방향 생성·추론 모델
LLM: GPT 같은 초거대 언어 모델
RAG: 검색을 곁들여 답변하는 검색+생성 결합 방식
---
