menu icon

Retour de la conférence DevFest Toulouse

Nous sommes de retour du DevFest Toulouse, occasion pour nous d'assister à plusieurs conférences, nous former et partager une version personnalisée de notre presentation Cloner ChatGPT avec Hugging Face et Elasticsearch.

Retour de la conférence DevFest Toulouse

Après trois ans d’absence, la conférence DevFest Toulouse est de retour grâce à une équipe d’organisation renouvelée.

Le DevFest, ou “Developers Festival”, est une conférence technique destinée aux développeurs et développeuses. Elle s’adresse aussi bien aux étudiants et étudiantes, qu’aux professionnels et professionnelles ou tout simplement aux curieux et curieuses technophiles. Durant toute la journée, des orateurs et oratrices sont venus présenter des sujets variés autour du développement mobile, du Web, de la Data, des objets connectés, du Cloud, du DevOps, des bonnes pratiques de développement. Des pauses ont permis d’engager le dialogue et d’approfondir les sujets présentés.

Le comité de sélection a eu à cœur de proposer un programme varié et captivant. Cette journée a été l’occasion de rencontrer des orateurs et oratrices de renommée nationale, mais une place importante a été dédiée aux conférenciers locaux. Le DevFest s’inscrit dans un cadre international et est organisé en partenariat avec Google.

Le DevFest Toulouse est un événement organisé par des bénévoles, dont notre collègue Aline Paponaud fait partie. L'édition 2023 a eu lieu au Centre de Congrès et d’Exposition Diagora à Labège le 16 novembre 2023.

Adaptations pour DevFest Toulouse de notre conférence Cloner ChatGPT avec Hugging Face et Elasticsearch

Nous étions invités pour présenter notre conférence Cloner ChatGPT avec Hugging Face et Elasticsearch. Nous avons exploré le puissant duo d’Elasticsearch et Hugging Face dans notre présentation. Elasticsearch, un outil polyvalent de recherche, de base de données NoSQL et d’analyse de données, s’allie parfaitement avec Hugging Face, la plateforme de pointe pour le développement de modèles de Machine Learning Open Source. Cette combinaison crée des applications extraordinaires, enrichissant les données et améliorant leur rendu. Nous avons illustré cela par des exemples et prototypes utilisant ces technologies, offrant une occasion unique de plonger dans l’univers de Hugging Face, de revisiter Elasticsearch et de redécouvrir ChatGPT.

Pour l’occasion, nous avons amené quelques modifications à notre présentation. Pour donner un exemple de la tâche NLP extraction d’entités nommées, nous avons utilisé les noms de quelques organisateurs, les endroits ainsi que les dates de la conférence, erratum compris ;-).

Copie d'écran du retour d’un modèle NER de Hugging Face
Tâches NLP : NER - Named Entity Recognition. Clin d'oeil aux organisateurs de DevFest Toulouse

Nous avons apprécié le sujet et les efforts pour l'écriture inclusive de la keynote : L’AGC : retour sur l’ordinateur qui a amené l’humanité sur la Lune. Nous avons adapté nos slides traitant le question answering. La question posée à Google était : qui a été le premier humain sur la Lune ?

Copie d'écran de Google - résultats pour la recherche qui a été le premier humain sur la Lune ?
Question answering - Une nouvelle étape pour les moteurs de recherche

Nous avons rendu hommage à Google, pionnier des LLMs et de l’architecture des Transformers, tout en soulignant les avancées du nouveau Bing, intégrant ChatGPT et citant ses sources dans les réponses de question answering, même dans un contexte où la conférence était parrainée par Google Developers Group.

Copie d'écran de Bing - résultats pour la recherche qui a été le premier humain sur la Lune ?
Question answering dans Bing - un moteur de recherche qui cite ses sources

L’interaction et le retour d’information de l’audience ont été exceptionnels. La salle Pastel 1 était comble, témoignant de l’intérêt porté à notre sujet.

Photo de la salle Pastel 1 lors de la présentation de Lucian et Pietro
Lucian Precup et Pietro Mele devant le public de DevFest Toulouse. Merci pour les retours constructifs que les participants nous ont apportés.

Après la session de questions-réponses, nous avons eu l’occasion d'échanger avec plusieurs participants. Ces interactions ont été enrichissantes, permettant non seulement de clarifier certains points de notre présentation, mais aussi de recueillir des perspectives diverses sur l’utilisation des technologies d’IA dans différents domaines. Nous avons été particulièrement impressionnés par l’enthousiasme des participants à explorer davantage les capacités de Hugging Face et Elasticsearch dans leurs propres projets.

La keynote : retour sur l’ordinateur qui a amené l’humanité sur la Lune

Nous avons cité la keynote et voici un résumé. Nous avons eu le privilège d’assister à une conférence fascinante intitulée L’AGC : retour sur l’ordinateur qui a amené l’humanité sur la Lune, présentée par Olivier Poncet et Romain Berthon. Cette présentation a brillamment mis en lumière les défis technologiques et informatiques incroyables surmontés durant le programme Apollo. L’ordinateur de bord Apollo Guidance Computer (AGC) a été au cœur de cette aventure, jouant un rôle crucial dans la réussite de ces missions lunaires.

Ce qui nous a particulièrement marqué, c’est la manière dont les conférenciers ont replacé l’AGC dans son contexte historique, détaillant les avancées technologiques de l'époque et l’ingénierie logicielle héritée de ce programme. Les retours du public reflètent bien la qualité de cette keynote : majoritairement perçue comme super intéressante et très enrichissante, même si certains ont trouvé le niveau technique un peu élevé.

Photo de la conférence d’ouverture par Olivier Poncet et Romain Berthon
Conférence d'ouverture par Olivier Poncet et Romain Berthon

Un commentaire a particulièrement résonné avec nos propres réflexions : la comparaison entre les ressources limitées utilisées pour ces missions spatiales historiques et les enjeux actuels de sobriété énergétique. Cela soulève des questions passionnantes sur l’innovation et l’utilisation efficiente des ressources, des sujets plus pertinents que jamais. En définitive, cette conférence a non seulement été un voyage dans le passé de l’exploration spatiale, mais aussi une source d’inspiration pour envisager notre avenir technologique et environnemental.

La conférence et les efforts des organisateurs sur l’inclusivité

Le DevFest Toulouse 2023 a accueilli une session éclairante intitulée Comment inclure l’inclusivité dès les premières étapes de conception d’un service ou d’un produit digital ? animée par Noémie M. Rivière. Au cœur de cette session, Noémie a dévoilé les subtilités de l’UX inclusive, une approche qui s’inscrit dans la volonté de créer des produits numériques qui non seulement parlent à tous mais qui représentent également chacun. L’inclusivité, selon Noémie, n’est pas seulement un concept éthique mais aussi une pratique qui enrichit l’expérience utilisateur en tenant compte de la diversité des publics.

Les organisateurs du DevFest ont pleinement embrassé cette philosophie, en prenant des mesures concrètes pour l’accessibilité et l’inclusivité à travers leur site web et l’agenda des conférences. Ils ont également veillé à ce que l’information soit accessible, en intégrant notamment des sous-titres automatiques pour les conférences dans l’amphithéâtre. Ces efforts montrent que l’inclusivité n’est pas un simple ajout mais une composante essentielle de la conception de services.

Le slide ci-dessous de la présentation de Noémie est notre take-away pour mettre en œuvre l’inclusivité dans les projets numériques. L’accent est mis sur l’adoption de formulations équitables, l’emploi de termes non-genrés, et l’utilisation d’un vocabulaire qui respecte tous les utilisateurs.

Slide de la conférence de Noémie M. Rivière sur l’inclusivité
Notre take-away de la conférence de Noémie M. Rivière sur l'inclusivité

Cette conférence a été non seulement enrichissante et intéressante mais aussi un rappel puissant que l’inclusivité doit être intégrée dès la genèse de tout projet digital.

Retour sur la Conférence “Generative AI par la pratique” avec Guillaume Laforge

Nous avons eu le plaisir d’assister à la conférence passionnante de Guillaume Laforge intitulée Generative AI par la pratique : cas concrets d’utilisation d’un LLM en Java, avec l’API PaLM. La salle Hémicycle était le théâtre d’un échange enrichissant sur le potentiel des Large Language Models (LLM) pour les développeurs Java, habituellement plus éloignés de l’univers Python, traditionnellement associé à l’IA.

Les retours du public ont été éloquents : 6 votes pour “Drôle et original”, 7 pour “Très enrichissant”, 5 pour “Super intéressant”, et un remarquable 8 votes pour “Très bon orateur”. Ces évaluations reflètent l’ambiance dynamique et l’appréciation générale de la session.

Nos impressions sont tout aussi positives, avec une mention spéciale pour les infographies présentées. Elles étaient non seulement esthétiquement plaisantes mais aussi incroyablement instructives, couvrant des sujets variés comme l'évolution des LLMs depuis les Transformers en 2017 jusqu'à PaLM 2 en 2023, ou encore les nuances entre Intelligence Artificielle, Machine Learning, Data Science et Deep Learning.

Infographie sur l’IA, le Machine Learning, la Data Science et le Deep Learning
Infographie sur l'IA, le Machine Learning, la Data Science et le Deep Learning

Infographie sur l’histoire des Language Models depuis les Transformers en 2017 jusqu'à PaLM 2 en 2023
Infographie sur l'histoire des Language Models depuis les Transformers en 2017 jusqu'à PaLM 2 en 2023

Infographie sur la capacité des modèles de langage, de plus en plus gros jusqu’aux LLMs
Infographie sur la capacité des modèles de langage, de plus en plus gros jusqu'aux LLMs

Nous avons particulièrement apprécié l’approche de Guillaume Laforge, qui a su manier humour et expertise, tout en impliquant le publique, sans peur d’effet démo. Même lorsqu’il abordait les limitations des modèles Google, il le faisait avec légèreté et positivité. Son anecdote et démonstration d’histoire générée sur le pingouin Tux et les chats envahisseurs, bien que risquée, a ajouté une touche personnelle et humoristique à la présentation.

Guillaume a également mentionné LangChain4J, un projet important illustré dans la vidéo YouTube Java Meets AI: A Hands On Guide to Building LLM Powered Applications with LangChain4j By Lize Raes, et le programme de formation de Google Generative AI | Google Cloud, offrant des ressources précieuses pour approfondir le sujet.

En conclusion, cette conférence a non seulement été une source d’inspiration pour les développeurs Java s’intéressant à l’IA générative, mais aussi un excellent exemple de comment rendre des sujets techniques accessibles et divertissants.

Conclusion

Notre expérience au DevFest Toulouse a été extrêmement positive. Nous avons non seulement partagé nos connaissances et notre expertise, mais aussi appris beaucoup de la communauté. Nous sommes repartis inspirés et impatients d’appliquer de nouvelles idées dans nos projets futurs. Un grand merci aux organisateurs pour un événement mémorable !

Nous avons eu la chance de pouvoir présenter nos travaux sur les modèles de langage, la recherche vectorielle et les moteurs de recherche conversationnels. Merci pour les retours constructifs que les participants nous ont apporté.

Et si vous avez lu jusqu’ici, nous vous remercions et vous invitons à suivre nos travaux, à postuler pour rejoindre notre équipe ou à faire appel à nos services. Chez Adelean, nous valorisons la formation continue, le partage de connaissances et l’innovation.

Comprendre les différences entre les vecteurs sémantiques creux et denses

31/01/2024

De plus en plus fréquemment, nous entendons parler de la recherche sémantique et de nouvelles façons de la mettre en œuvre. Dans la dernière version d'OpenSearch (2.11), la recherche sémantique à travers des vecteurs creux a été introduite. Mais que signifie vecteur creux? Comment cela diffère-t-il d'une matrice dense? Tentons de clarifier cela dans cet article.

Lire l'article

Java pour Elasticsearch, épisode 1. Requêter le cluster

18/01/2024

Découvrir comment intégrer Elasticsearch dans votre code est une aventure passionnante et, en réalité, plus simple qu'il n'y paraît. Dans ce premier article de notre série, nous allons explorer ensemble la mise en place d'un cluster de trois nœuds et la manière de s'y connecter en utilisant des certificats auto-générés, démontrant ainsi l'accessibilité et l'efficacité de ce processus.

Lire l'article

Guide complet sur le RAG Open-Source

01/12/2023

Plongée dans le Retrieval-Augmented Generation (RAG). Dans cet article, nous explorons les concepts fondamentaux derrière le RAG, en mettant l'accent sur son rôle dans l'amélioration de la compréhension contextuelle et la synthèse d'informations. De plus, nous fournissons un guide pratique sur la mise en œuvre d'un système RAG en utilisant uniquement des outils open-source et des modèles de langage volumineux.

Lire l'article

L'Art de la Vectorisation d'Images - Un Guide avec OpenSearch

01/10/2023

BLIP-2 est un modèle qui combine les forces de la vision par ordinateur et des grands modèles de langage. Ce mélange puissant permet aux utilisateurs d'engager des conversations avec leurs propres images et de générer du contenu descriptif. Dans cet article, nous verrons comment tirer parti de BLIP-2 pour créer des descriptions d'images enrichies, suivies de leur indexation en tant que vecteurs dans Opensearch.

Lire l'article

De retour de MICES 2023

22/06/2023

L'équipe Adelean est de retour du Mix Camp for E-Commerce Search 2023 et en partage les temps forts.

Lire l'article

NLP dans OpenSearch

18/06/2023

Un guide pratique sur l'importation et l'utilisation de modèles NLP dans OpenSearch pour l'analyse et l'inférence de texte dans vos flux de recherche et d'analyse.

Lire l'article

Retour sur Devoxx France 2023

17/04/2023

Compte-rendu de la conférence avec un point sur les différents sujets auxquels j'ai pu assister.

Lire l'article

Plonger dans le NLP avec Elastic

01/04/2023

Un aperçu sur le NLP et un guide pratique sur la façon dont il peut être utilisé avec la Suite Elastic pour améliorer les capacités de recherche.

Lire l'article

Meetup Search & Data - Les moteurs de recherches made in Station F

15/11/2022

Mardi 15 novembre 2022 s’est tenue la septième édition du Meetup Search & Data autour des moteurs de recherche développés à Station F.

Lire l'article

Haystack EU 2022 - Berlin

27/09/2022

Haystack est une conférence sur l'amélioration de la pertinence des moteurs de recherche.

Lire l'article

Nos speakers à Berlin Buzzwords 2022

16/05/2022

Berlin Buzzwords est la conférence indépendante de référence sur le stockage, le traitement, le streaming et la recherche de grandes quantités de données numériques, avec un accent sur les projets de logiciels en open source. Une opportunité pour nous de présenter trois sujets.

Lire l'article