marker使用

1. 介绍

Marker是一款可以快速准确地将 PDF 转换为 Markdown、JSON 和 HTML的工具

pip install marker-pdf

2. 使用

转换单个PDF文件

marker_single /path/to/file.pdf /path/to/output/folder --batch_multiplier 2 --max_pages 10 --langs English

转换多个文件

marker /path/to/input/folder /path/to/output/folder --workers 10 --max 10 --metadata_file /path/to/metadata.json --min_length 10000