Firecrawl выкатили Fire-PDF — парсер, который превращает PDF в markdown в 5 раз быстрее!
🟢 Скорость нереальная — он конвертирует каждую страницу за 400 мс. Так финансовый отчет на 216 страниц обрабатывается примерно за 83 секунды.
🟢 Таблицы сохраняет как таблицы, а формулы — в LaTeX;
🟢Поддерживает несколько типов документов (PDF, DOCX, XLSX и др.)
🟢 Плюс есть режимы парсинга: fast (только текст), auto (текст + OCR если надо). https://docs.firecrawl.dev/features/document-parsing