문서로 돌아가기

체계적 문헌고찰 자동화

I-카테고리 에이전트를 통한 PRISMA 2020 파이프라인

AI 지원 스크리닝, 자동 PDF 검색, RAG 기반 분석을 갖춘 대화형 체계적 문헌고찰 자동화.

체계적 문헌고찰 자동화란?

Diverga의 I-카테고리 에이전트는 PRISMA 2020 지침을 따르는 7단계 자동 체계적 문헌고찰 파이프라인을 제공합니다. 대화형 워크플로우와 AI 지원 스크리닝, RAG 기술을 결합합니다.

PRISMA 2020 준수 워크플로우

Groq LLM을 사용한 AI 지원 스크리닝

자동 PDF 검색 (5개 데이터베이스)

RAG 기반 문헌 분석

7단계 파이프라인

각 단계는 이전 단계를 기반으로 구축되어 체계적이고 재현 가능한 연구를 보장합니다.

1

연구 영역 설정

15-20분

연구 질문, 범위, 제약 조건 정의

2

쿼리 전략 설계

20-30분

키워드와 연산자를 사용한 검색 쿼리 설계

3

PRISMA 구성

15-25분

포함/제외 기준 및 임계값 설정

4

데이터베이스 검색

10-20분

Semantic Scholar, OpenAlex, arXiv에서 논문 검색

5

스크리닝 및 선택

30-60분

구성 가능한 LLM을 사용한 AI 지원 관련성 스크리닝

6

RAG 시스템 구축

20-40분

의미론적 검색을 위한 벡터 데이터베이스 생성

7

분석 및 종합

지속적

문헌 쿼리 및 PRISMA 다이어그램 생성

두 가지 프로젝트 유형

연구 범위에 맞는 워크플로우를 선택하세요:

지식 저장소

15,000-20,000편의 논문
50% 관련성 임계값

광범위한 탐색, 주제 발견, RAG 우선 워크플로우

신흥 연구 분야
학제간 주제
탐색적 리뷰

체계적 문헌고찰

50-300편의 논문
90% 관련성 임계값

엄격한 PRISMA 2020 준수, 출판 준비 완료

메타분석
임상 지침
증거 종합

프로젝트 구조

Diverga는 시스템 파일과 연구자용 문서를 분리하는 이중 디렉토리 구조를 생성합니다:

일반 연구 프로젝트

자연어 프로젝트 초기화 또는 /diverga:setup으로 생성

.research/                    # 시스템 파일 (숨김)
├── baselines/
│   ├── literature/
│   ├── methodology/
│   └── framework/
├── changes/
│   ├── current/
│   └── archive/
├── sessions/
├── project-state.yaml        # 연구 설정
├── decision-log.yaml         # 체크포인트 결정
├── checkpoints.yaml          # 체크포인트 상태
└── hud-state.json            # HUD 표시 상태

docs/                          # 연구자 문서 (자동 생성)
├── PROJECT_STATUS.md          # 진행 상황 추적
├── DECISION_LOG.md            # 결정 감사 추적
├── RESEARCH_AUDIT.md          # IRB/재현성 감사
├── METHODOLOGY.md             # 연구 설계 요약
├── TIMELINE.md                # 마일스톤 및 기한
├── REFERENCES.md              # 참고문헌 추적
└── README.md                  # 프로젝트 개요 (편집 가능)
PRISMA 파이프라인 프로젝트

체계적 문헌고찰 파이프라인 실행 시 추가 생성되는 구조

data/
├── raw/                       # 다운로드된 PDF
│   ├── semantic_scholar/
│   ├── openalex/
│   └── arxiv/
├── processed/
│   ├── deduplicated.json      # 중복 제거 후
│   ├── screened.json           # AI 스크리닝 후
│   └── included.json           # 최종 포함 논문
├── vectordb/                   # ChromaDB 벡터 데이터베이스
│   └── chroma/
├── reports/
│   ├── prisma_flow.png         # PRISMA 2020 다이어그램
│   └── screening_report.md     # 스크리닝 통계
└── config.yaml                 # 파이프라인 설정

지원 데이터베이스

API 접근과 PDF 가용성을 위해 선택된 세 가지 데이터베이스:

Semantic Scholar

~40% 오픈 액세스

무료 API 접근
인용 네트워크
영향력 있는 논문

OpenAlex

~50% 오픈 액세스

폴라이트 풀 (더 빠름)
풍부한 메타데이터
기관 추적

arXiv

100% PDF 접근

프리프린트 서버
전문 접근
속도 제한 없음

비용 효율성

품질을 유지하면서 API 비용 최소화:

500편 논문 리뷰

~$0.07

스크리닝 시간

30-60분

PDF 검색률

50-60%

  • Groq LLM (기본값): 100편당 $0.01
  • 로컬 임베딩: 무료 (sentence-transformers)
  • 기관 구독 불필요

주요 기능

AI 지원 스크리닝

구성 가능한 임계값을 가진 Groq LLM (llama-3.3-70b) 관련성 점수 매기기

대화형 방식

단계별 프롬프트가 연구자를 PRISMA 워크플로우로 안내

자동 PDF 검색

재시도 로직, 폴백 체인, 50-60% 성공률을 위한 진행 상황 추적

RAG 기반 분석

의미론적 검색 및 종합을 위한 ChromaDB 벡터 데이터베이스

PRISMA 다이어그램

제외 추적을 통한 PRISMA 2020 흐름도 자동 생성

품질 검증

체크포인트 통합으로 재현성 및 투명성 보장

더 알아보기

각 구성 요소에 대한 자세한 문서를 탐색하세요:

체계적 문헌고찰을 자동화할 준비가 되셨나요?

Diverga의 I-카테고리 에이전트로 시작하여 몇 주가 아닌 몇 시간 만에 PRISMA 2020 준수 체계적 문헌고찰을 수행하세요.