Choix des embeddings
Le choix du modèle d’embeddings est un élément crucial pour la performance et l’efficacité du filtrage sémantique dans l’application. Cette page vous guide pour sélectionner le modèle le plus adapté à votre cas d’usage, en fonction de votre environnement d’exécution (Docker ou ligne de commande) et de vos contraintes matérielles.
Tableau de compatibilité des modèles
Le tableau ci-dessous résume les modèles d’embedding recommandés, leur compatibilité et les réglages associés.
Fournisseur |
Modèle |
Seuil de |
CLI |
Docker |
|---|---|---|---|---|
Local |
|
0.5 |
Recommandé |
Consommation |
|
0.6 - 0.8 |
Oui |
Oui |
|
|
0.6 - 0.8 |
Oui |
Oui |
|
Compatible OpenAI |
|
0.6 - 0.8 |
Oui |
Oui |
Mistral |
|
0.6 - 0.8 |
Oui |
Oui |
Note
Le modèle jinaai/jina-embeddings-v3 est le plus performant mais aussi le plus gourmand en ressources. Il est donc recommandé de l’utiliser en local sur une machine disposant de suffisamment de mémoire RAM. Pour une utilisation avec Docker, les modèles de la série sentence-transformers sont plus adaptés.
Variables d’environnement
Activez le modèle d’embedding de votre choix en configurant les variables d’environnement appropriées dans votre fichier .env. Le tableau ci-dessous récapitule les variables à définir selon le fournisseur choisi. Désactivez les variables EMBED_API_KEY_* non utilisées en les commentant ou en les supprimant.
Fournisseur |
Variables |
|---|---|
Local |
|
Compatible OpenAI |
|
Mistral |
|
Utilisation de fastembed en local
Lorsque vous utilisez un modèle d’embedding local, l’application s’appuie sur la bibliothèque fastembed pour gérer le calcul des embeddings. Afin d’optimiser les performances sans surcharger le système, fastembed est configuré pour utiliser un quart des cœurs de processeur (CPU) disponibles, avec un minimum d’un thread.
Cette configuration permet de garantir un traitement efficace des textes tout en laissant suffisamment de ressources pour les autres processus de l’application.
Comment configurer votre modèle
Pour sélectionner le modèle d’embedding que vous souhaitez utiliser, vous devez définir les variables d’environnement correspondantes dans votre fichier
.env. Vous trouverez des exemples et des instructions détaillées dans la section configuration de la documentation.