menu icon

Enrichir les données et réécrire les requêtes avec le percolator Elasticsearch

Cet article est une transcription de notre intervention cette semaine à Haystack - une conférence sur l'amélioration de la pertinence des moteurs de recherche. Nous avons montré une méthode permettant d'enrichir et de réécrire les requêtes des utilisateurs en utilisant Wikidata et le percolator Elasticsearch.

Enrichir les données et réécrire les requêtes avec le percolator Elasticsearch

Haystack nous a donné la parole lors de la conférence. Nous avons présenté une méthode innovante qui peut être utilisée afin de réécrire les requêtes des utilisateurs. Cette méthode a l’avantage de ne nécessiter qu’une instance d’Elasticsearch et des Open Data provenant de Wikidata.

Lorsqu’il s’agit de recherche vocale, d’un chatbot ou même d’un certain type d’utilisateurs ou de cas d’utilisation, les requêtes des utilisateurs peuvent être assez verbeuses. Un processus de réécriture est alors nécessaire pour extraire les mots-clés significatifs.

Pour cette tâche, nous utilisons Wikidata - une base de données Open Source maintenue par la Wikimedia Foundation et le percolator Elasticsearch - une fonctionnalité disponible dans Elasticsearch depuis les premiers jours mais encore peu connue.

Les slides suivantes présentent en détail le processus que nous avons mis en place.

Enrichir les données et réécrire les requêtes avec le percolateur Elasticsearch de Lucian Precup

Vous pouvez facilement mettre en œuvre le même cadre sur votre infrastructure mais si vous avez besoin d’aide, n’hésitez pas à nous contacter.

Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne – retour sur la conférence ElasticON

10/03/2023

Retour sur la présentation Assurer la scalabilité d’un moteur de recherche pour des milliers de magasins en ligne par Roudy Khoury et Aline Paponaud à ElasticON 2023

Lire l'article

Question answering, une approche plus humaine à nos recherches sur all.site.

19/01/2023

Tout sur les Question-Answering et comment l'implémenter en utilisant flask et elasticsearch.

Lire l'article

Retour d’Expérience - Fine-tuning d’un modèle VOSK

05/01/2022

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

Retour d’Expérience - Indexation des transcriptions de fichiers média

17/12/2021

all.site est un moteur de recherche collaboratif. Il fonctionne comme Bing ou Google mais il a l’avantage de pouvoir aller plus loin en indexant par exemple les contenus média et en organisant les données de systèmes comme Slack, Confluence ou l’ensemble des informations présentes dans l’intranet d’une entreprise.

Lire l'article

La revue de presse du 25 Novembre 2021

25/11/2021

Bientôt le weekend, bientôt l'hiver, alors une petite revue de presse pour occuper vos longues soirées...

Lire l'article

Nouveau meetup Search & Data - E-Commerce Search et Open Source

28/10/2021

La cinquième édition du meetup Search and Data est dédiée au search e-commerce et à l'open source. Un bel agenda pour cette édition de rentrée et de reprise.

Lire l'article

Expédition vers Synonym Graph dans Elasticsearch

21/04/2021

Dans cet article, nous expliquons comment nous sommes passés des anciens filtres de synonymes d'Elasticsearch aux nouveaux filtres de type graphe, les Synonym Graph Token Filter.

Lire l'article

Quand les requêtes sont très verbeuses

22/02/2021

Dans cet article, nous présentons une méthode simple pour réécrire les requêtes utilisateurs afin qu'un moteur de recherche basé sur des mots clés puisse mieux les comprendre. Cette méthode est très utile dans le contexte d'une recherche vocale ou une conversation avec un chatbot, contexte dans lequel les requêtes utilisateur sont généralement plus verbeuses.

Lire l'article

A2 le moteur qui sublime Elasticsearch

13/06/2018

Elasticsearch est une technologie ouverte qui permet aux intégrateurs de construire des solutions toujours plus innovantes et puissantes.

Lire l'article