Marker是一款可以快速准确地将 PDF 转换为 Markdown、JSON 和 HTML的工具
pip install marker-pdf
转换单个PDF文件
marker_single /path/to/file.pdf /path/to/output/folder --batch_multiplier 2 --max_pages 10 --langs English
转换多个文件
marker /path/to/input/folder /path/to/output/folder --workers 10 --max 10 --metadata_file /path/to/metadata.json --min_length 10000