Stability AI s’est forgé une réputation en repoussant les limites de l’intelligence artificielle, et sa dernière version, Stable LM 2 1.6B, ne fait pas exception à la règle. Ce modèle est le dernier né de leur gamme de modèles linguistiques, qui comprenait déjà des modèles à 3 milliards et à 7 milliards de paramètres. L’introduction de cette version plus compacte montre l’engagement de Stability AI à rendre l’IA plus accessible et plus efficace.

Multilingue et efficace

Le modèle stable LM 2 1.6B prend en charge sept langues, à savoir l’anglais, l’espagnol, l’allemand, l’italien, le français, le portugais et le néerlandais. Cette extension permet au modèle de s’adapter à un public plus large et ouvre de nouvelles possibilités de communication et de compréhension interculturelles.

Stable LM 2 1.6B trouve le juste équilibre entre vitesse et performance, grâce à de récentes avancées algorithmiques dans la modélisation du langage. Cet équilibre signifie que le modèle peut gérer un large éventail de tâches sans compromettre sa capacité à fournir des réponses précises et pertinentes en temps voulu.

Supériorité des performances

Malgré sa taille plus petite que les modèles précédents, le Stable LM 2 1.6B offre des performances exceptionnelles. Le nouveau modèle serait plus performant que d’autres petits modèles linguistiques comportant moins de 2 milliards de paramètres sur la plupart des points de référence. Ce qui est encore plus remarquable, c’est qu’il surpasse certains modèles plus grands, y compris le modèle Stable LM 3B de Stability AI.

Inconvénients de la petite taille

La taille réduite du LM 2 1.6B stable peut entraîner un taux plus élevé d’hallucinations. L’hallucination dans l’IA fait référence à la génération de contenu qui n’est pas factuellement exact ou contextuellement pertinent. Cela peut parfois conduire à des réponses contenant des informations trompeuses ou erronées.

Il est également possible que le modèle génère un langage toxique provenant de modèles linguistiques plus petits. Le langage toxique est un langage offensant, nuisible ou inapproprié. Les modèles linguistiques de petite taille et de faible capacité peuvent avoir du mal à filtrer ce type de contenu, ce qui pose un problème aux développeurs et aux utilisateurs.

Transparence et utilisation des données

Stabilité L’IA met fortement l’accent sur l’utilisation de données plus diversifiées et plus étendues dans la formation LM 2 stable 1.6B. Cela inclut des documents dans six langues en plus de l’anglais, afin de s’assurer que le modèle est exposé à un large éventail de modèles linguistiques et de nuances culturelles.

Ce processus de formation tient compte de l’ordre dans lequel les données sont présentées au modèle, ce qui permet à ce dernier de mieux comprendre les relations contextuelles entre les mots et les phrases.

Approche innovante de la formation

L’un des aspects les plus intéressants de Stable LM 2 1.6B est l’approche de la formation utilisée par Stability AI. L’entreprise propose le nouveau modèle sous plusieurs formes, y compris des versions pré-entraînées et affinées, ou le « dernier point de contrôle du modèle avant le refroidissement pré-entraînement ».

Ce format unique permet aux développeurs de prendre le modèle et de le spécialiser davantage pour des tâches ou des ensembles de données spécifiques. Cette approche permet aux développeurs d’utiliser tout le potentiel de Stable LM 2 1.6B et de l’adapter à leurs besoins spécifiques.

Objectif du nouveau modèle

Quel est donc l’objectif ultime de Stability AI avec la publication de Stable LM 2 1.6B ? La vision de l’entreprise est de fournir aux développeurs davantage d’outils et d’artefacts qu’ils peuvent utiliser pour innover et développer le modèle actuel.

Ce faisant, Stability AI vise à utiliser les capacités du modèle de manière nouvelle et surprenante. Ils souhaitent catalyser une vague de créativité et de résolution de problèmes dans la communauté de l’intelligence artificielle, en incitant les développeurs à explorer des territoires inexplorés et à repousser les limites de ce qui est possible avec l’intelligence artificielle.

Alexander Procter

février 5, 2024

3 Min