menu icon

Meetup Search & Data - Les moteurs de recherches made in Station F

Mardi 15 novembre 2022 s’est tenue la septième édition du Meetup Search & Data autour des moteurs de recherche développés à Station F.

Meetup Search & Data - Les moteurs de recherches made in Station F

François Massot, co-founder de Quickwit, Arthur Caillaud, co-founder de Outmind et Lucian Precup, founder de all.site ont donc présenté à leur tour ce qui fait la spécialité de leur moteur.

Talk 1 : Construire un moteur de recherche distribué pour les logs.

François Massot, Quickwit

Dans un monde où les données sont omniprésentes, il est commun de devoir effectuer des recherches dans des téraoctets de logs. Cette tâche simple peut s’avérer décourageante et très coûteuse. Cet exposé a présenté comment implémenter un tel moteur avec une architecture efficace fortement inspirée de Snowflake qui sépare le calcul et le stockage.

Présentation de François Massot
Présentation de François Massot

Talk 2 : Trouvez le bon document instantanément, où qu’il soit stocké.

Arthur Caillaud, Outmind

Outmind est un moteur de recherche qui se connecte à tous vos outils, et améliore l’efficacité de vos équipes grâce à une puissante intelligence artificielle. Fondée par Arthur et Grace en 2019, Outmind repose massivement sur l’usage de la technologie ElasticSearch. A travers cette présentation, Arthur a parlé spécifiquement de cette technologie. Pourquoi a-t-elle été choisie ? Quelles ont été les principales difficultés d’implémentation ? Cette première partie a permis d’aborder des sujets plus complexes et de rentrer dans le détail de l’infrastructure as code d’Outmind. Comment sont déployés leurs clusters mais aussi comment ils garantissent la sécurité des données de leurs clients. Pour finir, Arthur a parlé des technologies NLP développées et utilisées par Outmind. Quel est le besoin de leurs clients sur ces sujets d’avenir et comment ils pensent y répondre.

Présentation de Arthur Caillaud
Présentation de Arthur Caillaud

Talk 3 : Vers un moteur de recherche décentralisé et collaboratif

Lucian Precup, all.site

Est-il possible d’indexer tout Internet avec un nouveau moteur de recherche ? Nous ne le savons pas. Mais nous avons essayé en construisant un moteur de recherche collaboratif fonctionnant sur le modèle de GitHub et Wikipedia.

Dans les moteurs de recherche du Web, la pertinence et l’ordre des résultats sont gérés par le nombre de liens, la qualité et la conformité avec certaines règles et un peu de personnalisation. Les sites e-commerce classent et filtrent les résultats au moyen d’algorithmes business. En entreprise, la pertinence des résultats peut être configurée par les experts et expertes des différents domaines. D’un autre côté, les réseaux sociaux fournissent une expérience basée principalement sur la notoriété : les préférences et le suivi des autres utilisateurs. Nous tentons de regrouper le meilleur de ces mondes en créant all.site - un moteur de recherche collaboratif dont le contenu et la pertinence seraient proposés par la communauté à la manière de Wikipedia ou GitHub. Dans cette présentation nous avons partagé l’expérience de cette aventure : ce que nous avons essayé, ce que nous avons appris, les limites que nous avons rencontrées et les étapes à venir. Nous avons présenté le fonctionnement interne d’un moteur de recherche avec ses différentes étapes, l’architecture et l’infrastructure d’une telle plateforme, les notions de sécurité, le passage à l’échelle et la performance.

Présentation de Lucian Precup
Présentation de Lucian Precup

Merci à tous les participants, nous espérons vous retrouver nombreux très prochainement.

Un grand merci à François Massot, Arthur Caillaud et Grace Mehrabe et Lucian Precup pour leur intervention !

Un énorme merci aux sponsors de la soirée : Quickwit, Outmind et Adelean. Et bien entendu merci à Station F qui nous a mis à disposition encore une fois son infrastructure. Merci Adèle Duvillier, la team Events et à l'équipe Fennix pour le service et la collation.

Bonjour OpenSearch Conference Europe 2024

06/05/2024

La première conférence OpenSearch en Europe se tiendra à Berlin en mai prochain et Adelean participera à cet événement. Cette page répertorie certaines de nos références et présentations OpenSearch que vous pourrez consulter pendant et après l'événement.

Lire l'article

Devoxx France - la conférence des développeurs - cette année sous le signe de l'intélligence artificielle generative

20/04/2024

L'équipe Adelean est de retour de la conférence Devoxx France 2024, la grande conférence des développeurs et développeuses, placée cette année sous le signe de l'intélligence artificielle generative.

Lire l'article

Retour de la conférence DevFest Toulouse

19/11/2023

Nous sommes de retour du DevFest Toulouse, occasion pour nous d'assister à plusieurs conférences, nous former et partager une version personnalisée de notre presentation Cloner ChatGPT avec Hugging Face et Elasticsearch.

Lire l'article

De retour de MICES 2023

22/06/2023

L'équipe Adelean est de retour du Mix Camp for E-Commerce Search 2023 et en partage les temps forts.

Lire l'article

Retour sur Devoxx France 2023

17/04/2023

Compte-rendu de la conférence avec un point sur les différents sujets auxquels j'ai pu assister.

Lire l'article

Haystack EU 2022 - Berlin

27/09/2022

Haystack est une conférence sur l'amélioration de la pertinence des moteurs de recherche.

Lire l'article

Nos speakers à Berlin Buzzwords 2022

16/05/2022

Berlin Buzzwords est la conférence indépendante de référence sur le stockage, le traitement, le streaming et la recherche de grandes quantités de données numériques, avec un accent sur les projets de logiciels en open source. Une opportunité pour nous de présenter trois sujets.

Lire l'article