|
|
hace 1 mes | |
|---|---|---|
| .. | ||
| src | hace 1 mes | |
| .gitignore | hace 1 mes | |
| README.md | hace 1 mes | |
| package-lock.json | hace 1 mes | |
| package.json | hace 1 mes | |
这是一个完全独立的 MinerU 精准解析 API demo,使用 Token,不依赖 tools/doc2markdown-node 或 tools/Doc2MarkdownService。
tools/mineru-accurate-demo/.env 中的 MINERU_API_TOKEN。POST https://mineru.net/api/v4/file-urls/batch 申请上传链接。PUT 上传本地文件。GET https://mineru.net/api/v4/extract-results/batch/{batch_id}。full_zip_url,解压并保存 full.md。cd tools\mineru-accurate-demo
npm install
npm run parse -- "..\测试文件\pdf-1.pdf" --out-dir ".\out"
npm run parse -- "..\测试文件\word-1.docx" --out-dir ".\out"
npm run smoke -- "..\测试文件" --out-dir ".\out"
npm run parse -- "..\测试文件\pdf-1.pdf" --out-dir ".\out" --model-version vlm --timeout 600 --interval 5
--model-version:默认 vlm,也可传 pipeline。--language:默认 ch。--ocr:开启 OCR,默认关闭。--no-table:关闭表格识别。--no-formula:关闭公式识别。--page-ranges:精准 API 页码范围,例如 1-10。out/
pdf-1.md
pdf-1.raw.json
pdf-1.zip
pdf-1.error.txt
summary.md
summary.json