IA · RAG

Bases vectorielles : pgvector, Qdrant, comment choisir

Stocker et interroger des embeddings : quand une extension Postgres suffit, quand passer à une base dédiée.

np
Mei « nullptr »
IA appliquée · 16 avr. 2024

Une base vectorielle stocke des embeddings et trouve les plus proches d’une requête. Deux familles : les extensions (comme pgvector pour Postgres) et les bases dédiées (Qdrant, Milvus, Weaviate).

pgvector est imbattable de simplicité si vous utilisez déjà Postgres : une extension, une colonne, et vos données restent au même endroit. Pour des volumes modestes à moyens, c’est largement suffisant.

Les bases dédiées prennent l’avantage à grande échelle : index optimisés, filtrage avancé, montée en charge. Règle pragmatique : commencez avec pgvector, migrez le jour où la performance le justifie vraiment.