[LLM]파인튜닝 (Fine-tuning)? RAG (Retrieval-Augmented Generation)? 무엇일까??

안녕하세요.

오늘은 LLM (Large Language Model)에서 빠질수 없는 파인튜닝 (Fine-tuning)과 RAG (Retrieval-Augmented Generation)에 대하여 알아보겠습니다.

1. 개념

파인튜닝(Fine-tuning)이란, 사전 학습된 대형 언어 모델(LLM)을 특정 도메인이나 작업에 맞게 추가 학습시키는 과정입니다. 이미 대규모 텍스트 데이터를 통해 기본적인 언어 이해 능력을 갖춘 모델을, 특정 목적에 맞춰 추가 데이터를 학습시켜 성능을 향상시킵니다.
주로 Supervised Fine-tuning 방식을 사용하며, 정답이 포함된 데이터셋으로 모델의 가중치를 조정합니다.

2. 장점

3. 단점

1. 개념

RAG는 정보 검색(Retrieval)과 텍스트 생성(Generation)을 결합한 방식입니다.
- Retrieval: 질문에 적합한 외부 문서를 검색.
- Generation: 검색한 문서를 참고해 답변을 생성.
파인튜닝 대신, 외부 지식 베이스를 활용해 실시간으로 정보를 조회해 답변을 생성합니다.
주로 벡터 검색(Vector Search)와 전이 학습(Transformer-based Models)을 사용해 유사한 문서를 빠르게 찾습니다.

2. 장점

3. 단점

좀더 정리해보자면 RAG는 불특정 다수의 웹 정보 기반, 파인튜닝은 신뢰성 있는 근거 기반이라고 생각하면 됩니다.

■ 래그: 불특정 다수의 웹 정보 기반

데이터 출처 -
- 블로그, 커뮤니티, 뉴스, 위키 등 다양한 웹페이지.
- 검색 결과에 따라 신뢰성이 달라짐.
학습 방식 -
- 사전에 학습된 언어 모델에 검색한 정보를 추가해 실시간으로 답변.
특징 -
- 최신성과 유연성: 신뢰도는 낮을 수 있지만, 최신 정보를 빠르게 반영.
- 예시 -
  - 기술 블로그: "2025년 자바스크립트 최신 프레임워크는?"에 대해, 최신 블로그 글을 찾아 실시간으로 정보 제공.

■ 파인튜닝: 신뢰성 있는 근거 기반

데이터 출처 -
- 전문서적, 논문, 검증된 자료
- 도메인 전문가가 작성한 문서나 기업의 내부 데이터 등.
학습 방식 -
- 특정 주제에 대한 정제된 데이터를 선별해 추가 학습.
특징 -
- 높은 신뢰성과 일관성: 특정 분야에서 깊이 있는 지식을 바탕으로 일관된 답변 가능.
- 예시 -
  - 의료 챗봇: 의학 논문으로 파인튜닝된 경우, **"편도염에 어떤 항생제를 써야 하나요?"**라는 질문에 정확하고 근거 있는 답변을 제공.

감사합니다.

[AI] 머신러닝 핵심 개념 요약 정리 - Day_1 (0)	2025.05.30
LangChain(랭체인)이란? (2)	2025.03.22
청크(Chunk)와 임베딩 (Embedding)이란 (1)	2025.03.10
LLM과 RAG란 무엇일까? (3)	2025.03.04
[ kakao / kanana ] 최근 공개한 kakao의 언어 모델인 kanana란? (2)	2025.02.28

암자의 코딩생활