MarkItDown da Microsoft converte PDF, Word, Excel e 29+ formatos em Markdown otimizado para LLMs. 102K stars, MCP nativo, MIT License. Essencial para RAG e AI agents....
OpenDataLoader PDF é o parser open-source #1 em benchmarks que extrai dados de qualquer PDF para IA. 14.9K stars, 93% accuracy em tabelas, 100% local, Apache 2.0....

