vector database(3)
-
RAG 검색 품질 개선: Hybrid Search, Reranking, Query Transformation
RAG의 응답 품질은 검색 품질에 의해 결정됩니다. 아무리 좋은 LLM을 사용해도, 검색 단계에서 관련 문서를 가져오지 못하면 정확한 답변을 생성할 수 없습니다. 이 글에서는 검색 품질을 개선하는 세 가지 핵심 전략을 다룹니다.핵심 요약순수 벡터 검색(Dense Retrieval)만으로는 키워드 매칭이 필요한 질문에 취약합니다. BM25와 결합한 Hybrid Search로 커버리지를 높일 수 있습니다.검색 결과의 순위를 Cross-encoder로 재정렬하는 Reranking은 적은 비용으로 정밀도를 높이는 효과적인 방법입니다.사용자 질문을 그대로 검색하지 않고, LLM으로 변환하는 Query Transformation은 질문-문서 간 의미 격차를 줄입니다.세 전략은 독립적이지 않으며, Hybrid Sea..
2026.06.08 -
RAG Chunking 전략: 문서를 나누는 기준과 성능 영향
Chunking은 RAG 시스템에서 원본 문서를 검색 가능한 단위로 분할하는 과정입니다. Chunk 크기와 분할 방식은 검색 정밀도, 응답 품질, 비용에 직접적인 영향을 미칩니다.핵심 요약Chunking은 RAG 파이프라인에서 검색 품질을 결정하는 가장 중요한 단일 변수입니다.Chunk가 너무 작으면 문맥이 유실되고, 너무 크면 노이즈가 섞여 검색 정밀도가 떨어집니다.전략 선택은 문서 구조, 질문 유형, 응답 요구사항에 따라 달라집니다.운영 환경에서는 단일 전략보다 Overlap, Parent-Child, Metadata 보강을 조합하는 것이 일반적입니다.Chunk 크기는 이론적 정답이 없으므로, 평가 데이터셋을 기반으로 실험하고 측정하는 방식이 필요합니다.1. 왜 Chunking이 중요한가RAG 시스템..
2026.06.06 -
RAG란 무엇인가: LLM 애플리케이션 아키텍처 관점에서 이해하기
RAG(Retrieval-Augmented Generation)는 LLM이 응답을 생성하기 전에 외부 지식 저장소에서 관련 문서를 검색하여 컨텍스트로 제공하는 아키텍처 패턴입니다.핵심 요약RAG는 LLM의 학습 데이터 한계를 보완하기 위해 외부 지식을 실시간으로 검색하여 응답에 활용하는 구조입니다.핵심 구성 요소는 문서 수집(Ingestion), 임베딩(Embedding), 벡터 저장소(Vector Store), 검색(Retrieval), 생성(Generation) 5단계입니다.Fine-tuning과 달리 모델 재학습 없이 지식을 업데이트할 수 있어 운영 비용과 유연성 측면에서 유리합니다.검색 품질이 응답 품질을 결정하므로, Chunking 전략과 Embedding 모델 선택이 설계의 핵심입니다.프로토타..
2026.05.29