텍스트 PDF 변환
pymupdf4llm 엔진으로 헤딩, 리스트, 코드블록 등 문서 구조를 그대로 보존하며 Markdown으로 변환합니다.
최대 50MB / 텍스트 PDF + 스캔 이미지 PDF 모두 지원 / 80개+ 언어 OCR
모든 파일은 24시간 후 자동 삭제됩니다. 서버에 보관하지 않습니다.
pymupdf4llm 엔진으로 헤딩, 리스트, 코드블록 등 문서 구조를 그대로 보존하며 Markdown으로 변환합니다.
Tesseract OCR로 스캔된 이미지 PDF에서 텍스트를 추출합니다. 한국어 포함 80개 이상 언어를 지원합니다.
PDF 내 테이블을 Markdown 테이블로, 이미지를 개별 파일로, 수식을 LaTeX 문법으로 동시 추출합니다.
Markdown과 JSON 두 가지 형식으로 동시 출력. AI 학습, RAG 파이프라인, 문서 아카이빙에 즉시 활용 가능합니다.