Skip to content

Data-Engineering

Au-delà de la recherche : le RAG agentique et le pattern "navigator"

Dans mon article précédent, j'ai expliqué pourquoi la Recherche Hybride est une première étape importante. Mais pour des domaines de précision comme la banque ou le droit, la recherche statistique par similitude ne suffit pas. L'agent doit savoir exactement où il se trouve.

C'est là qu'intervient le RAG Agentique, et plus précisément le pattern Navigator. Ici, oubliez les Vector DB et les Embeddings : nous passons sur une navigation déterministe basée sur la structure et les outils.

Du PDF au Markdown : choisir le bon pipeline d'ingestion pour son RAG

On dit souvent que la qualité d'un système RAG dépend de son modèle d'embedding ou de son LLM. Mais mon expérience m'a montré qu'en réalité, la bataille se gagne bien plus tôt : au moment du parsing des documents. Un agent IA ne peut pas naviguer intelligemment dans un document s'il reçoit un bloc de texte brut sans structure.

Aujourd'hui, je partage avec vous mon approche pour transformer des PDF complexes en Markdown structuré, et surtout comment choisir entre les deux outils phares du moment.