Beyond text-only LLMs: unlocking multimodality with Mistral AI

Les Large language models (LLMs) sont devenus des outils essentiels pour extraire des connaissances à partir de textes. Cependant, de nombreux cas d'utilisation nécessitent de comprendre le contenu et la signification des images, des diagrammes ou des figures. Pour exploiter pleinement ces données mixtes, il est nécessaire d'étendre les capacités des LLMs au domaine multimodal.

Dans cette présentation, nous explorerons le dernier modèle multimodal de Mistral, en examinant comment il a été développé, ses mécanismes sous-jacents, ainsi que les applications pratiques qu'il permet en combinant des entrées texte et image. Cette session est conçue pour offrir aux développeurs une compréhension complète de l'architecture du modèle et de ses cas d'utilisation potentiels.

Language Français
Level 0
Technologies

Speaker

Harizo Rajaona
Harizo Rajaona

Harizo is a Partner Engineer at Mistral AI. His role involves providing technical support, enablement and content to Mistral AI's partners who integrate and implement Mistral models. Previously, he worked at Dataiku, contributing to the Data Science ...

Details