지식 그래프(Knowledge Graph)는 엔티티(Entity)와 관계(Relation)로 구성됩니다. 그래프가 노드(Node)와 에지(Edge)로 이루어진 데이터 구조이므로, 엔티티는 노드에, 관계는 에지에 대응됩니다. 엔티티는 사람, 장소, 사물 등 구체적인 대상을 나타내고, 관계는 이들 엔티티 간의 연결을 표현합니다.
지식 그래프는 의료, 금융, 법률 등 다양한 분야에서 활용될 수 있습니다. 예를 들어, 의료 분야에서는 질병-증상-치료법 간의 관계를 그래프로 표현하여 진단을 지원하고, 금융 분야에서는 기업-투자자-거래 관계를 분석하여 리스크를 평가하는 데 사용할 수 있습니다. 법률 분야에서는 판례-법조항-사건 간의 연결을 통해 유사 사례를 검색하고 법적 논리를 추적하는데 적용할 수 있습니다.
LLM의 추론 능력이 급격히 향상되면서, 단순한 유사도 기반 검색만 제공하는 벡터 DB의 한계가 드러나고 있습니다. 지식 그래프는 "A는 B의 부분이고, B는 C와 연관된다"와 같은 다단계 관계 추론을 가능하게 하여, 복잡한 질의와 맥락 기반 추론을 효과적으로 지원합니다.
그래프 DB 구축에서 가장 어려운 점은 초기 구축 자체보다 지속적인 유지관리입니다. 데이터와 비즈니스 환경이 끊임없이 변화하면서 그래프의 정확성과 유효성이 빠르게 저하될 수 있습니다. 이는 지식 그래프의 실용성을 지속적으로 유지하는 데 큰 도전 과제가 됩니다.
Graph RAG는 벡터 검색과 지식 그래프의 결합하여 검색의 정확도를 높일 수 있을 것으로 기대되고 있어 많은 관심을 가지고 있는데, 특히 지식 그래프 메모리 구조를 사용하여 LLM 성능을 높이는 MS의 프로젝트가 유명합니다.

MS Graph RAG : https://github.com/microsoft/graphrag
GitHub - microsoft/graphrag: A modular graph-based Retrieval-Augmented Generation (RAG) system
A modular graph-based Retrieval-Augmented Generation (RAG) system - microsoft/graphrag
github.com
Graph RAG는 전통적인 RAG와 다른 방식으로 작동합니다.
1. Entity와 Relation 추출
문서에서 LLM을 사용하여 자동으로 엔티티와 관계를 추출합니다. 예를 들어, "삼성전자는 반도체 사업을 확장하고 있다"라는 문장에서 "삼성전자"(기업), "반도체 사업"(사업부문), "확장"(관계)을 추출합니다.
2. 커뮤니티 탐지 및 요약
추출된 그래프에서 밀접하게 연결된 엔티티 그룹(커뮤니티)을 탐지하고, 각 커뮤니티의 내용을 LLM으로 요약합니다. 이를 통해 주제별, 영역별 정보를 계층적으로 구조화할 수 있습니다.
3. Global Search vs Local Search
- Local Search: 특정 엔티티와 직접 연결된 정보를 검색 (전통적 RAG와 유사 - 예: "삼성전자의 CEO는 누구인가?" → 직접 연결된 정보 검색)
- Global Search: 커뮤니티 요약을 활용하여 전체 데이터셋에 걸친 질문에 답변 (예: "반도체 산업의 주요 트렌드는 무엇인가?" → 여러 커뮤니티의 요약 정보 종합)
통계학에서 상관관계와 인과관계가 구별되는 것처럼, 지식 그래프 역시 엔티티 간의 연결은 표현하지만 인과관계를 자동으로 파악하기는 어렵습니다. 그러나 LLM을 활용한 의사결정, 계획 수립 등 복잡한 추론 작업에서는 단순한 요약이나 문서 생성을 넘어 인과관계 이해가 필수적입니다.
지식 그래프는 관계와 속성을 저장하지만, 정보의 진위를 자체적으로 판단할 수 없습니다. 잘못된 정보나 편향된 데이터가 입력되면 왜곡된 인사이트가 도출될 위험이 있습니다. 따라서 실제 세계의 변화와 맥락을 정확히 반영하기 위해서는 전문가의 지속적인 검증(human-in-the-loop)이 반드시 필요합니다.
MS GraphRAG 같은 오픈소스 프로젝트의 등장으로 접근성이 높아지고 있어, 앞으로 더 많은 실무 적용 사례가 나올 것으로 기대됩니다. 정부 및 공공 부문의 복잡한 업무 처리, 대기업의 지식 관리 시스템, 법률·의료 분야의 전문가 지원 시스템 등에서 Graph RAG의 활용이 확대될 것으로 예상됩니다.
'Technology > RAG' 카테고리의 다른 글
| 기존 RAG의 문제점을 해결하는 방법 : REFRAG (0) | 2025.11.20 |
|---|