PDF 원본
스캔/전자 원본 그대로
PDF를 끌어다 놓아 업로드
또는 클릭하여 파일 선택
Tesseract 원시 (plain_text)
로컬 Tesseract kor+eng OCR의 1차 원시 출력. 사람·LLM 후처리 없음 (기준선).
평문(plain_text)이 비어 있습니다.
스캔본은 Tesseract OCR 결과, 전자 PDF는 pdfplumber 추출 결과가 들어갑니다.
Vision 평문 (vision_plain_text)
Claude Vision이 이미지+Tesseract 초안으로 만든 마크다운에서 문법만 제거한 평문. Tesseract와 비교용.
Vision 평문이 비어 있습니다.
스캔 PDF나 이미지로 등록된 차수에만 채워집니다.
Vision 마크다운 (vision_markdown_body)
Vision OCR의 원본 마크다운 출력 (frontmatter 등 추가 가공 전). markdown_body의 직전 단계.
최종 Markdown (markdown_body)
frontmatter + 페이지 마커 + 정제까지 완료된 출판본. 포털 기본 표시본.
Markdown 본문이 아직 없습니다.
왼쪽에 PDF를 업로드하거나, 메타 편집에서 차수를 선택하세요.