Google lance Gemini Nano pour le client de bureau Chrome

Prochaine manifestation à New York

Google a prévu un événement majeur le 5 juin à New York, centré sur l’audit des modèles d’IA afin d’évaluer leur partialité, leur performance et leur conformité éthique. À mesure que les technologies de l’IA s’intègrent plus profondément dans les processus commerciaux et les produits de consommation, l’impératif d’évaluer ces modèles en termes d’équité, d’efficacité et de respect des normes éthiques devient plus prononcé.

Des évaluations sont nécessaires pour atténuer les risques associés aux décisions prises par l’IA, en particulier dans des secteurs tels que la finance, les soins de santé et le recrutement, où les implications peuvent être considérables.

Objectifs de l’événement

L’objectif principal de l’événement est de favoriser la collaboration entre les dirigeants de différents secteurs d’activité. L’événement est considéré comme une plateforme permettant à ces leaders de partager des idées, des stratégies et des pratiques liées à la gouvernance des modèles d’IA.

S’intéresser à l’éthique et aux performances de l’IA permet d’affiner la technologie et de promouvoir la transparence et la confiance parmi les utilisateurs et les parties prenantes.

Les efforts de collaboration sont essentiels car ils aident les organisations à faire face aux paysages réglementaires et sociaux complexes associés aux déploiements de l’IA. En rassemblant des perspectives diverses, Google vise à lancer des discussions qui favorisent le développement de systèmes d’IA plus robustes, plus équitables et plus responsables.

Intégration de Gemini Nano dans Chrome

Google s’apprête à intégrer Gemini Nano dans le client de bureau Chrome à partir de la version 126. C’est important parce qu’il exploite WebGPU et WebAssembly (WASM), des technologies qui améliorent les performances des applications en permettant à des calculs plus complexes de s’exécuter efficacement dans un navigateur web.

WebGPU fournit une norme moderne pour l’accès aux capacités du GPU, accélérant les tâches graphiques et informatiques directement dans le navigateur, ce qui est essentiel pour les applications basées sur l’IA. Parallèlement, WASM permet au code écrit dans des langages tels que C++ ou Rust de s’exécuter sur le web à une vitesse quasi native, ce qui permet d’exécuter en douceur des applications plus lourdes et gourmandes en ressources.

L’utilisation de ces technologies permet à la fois d’améliorer les performances et de s’assurer que les développeurs atteignent un public mondial sans les limites imposées par les capacités matérielles propres à chaque appareil. À mesure que les applications deviennent plus sophistiquées grâce à l’intégration de fonctionnalités d’IA, ces technologies aideront les développeurs à offrir des expériences de haute qualité dans tous les domaines.

Avantages pour le développeur

L’intégration de Gemini Nano dans Chrome simplifie le déploiement des fonctionnalités d’IA pour les développeurs. Ils n’ont plus besoin de se pencher sur les détails complexes de l’ingénierie d’aide ou sur la complexité de l’ajustement des modèles d’IA à des tâches spécifiques.

Au lieu de cela, Google offre un accès simplifié grâce à des API de haut niveau qui gèrent des tâches telles que la traduction, le sous-titrage et la transcription. Ces API font abstraction des complexités de la gestion des modèles d’IA, ce qui permet aux développeurs de se concentrer sur la création de valeur par le biais de leurs applications plutôt que sur les complexités techniques sous-jacentes.

Par exemple, un développeur souhaitant ajouter une prise en charge multilingue à une application peut utiliser l’API de traduction pour activer rapidement cette fonctionnalité sans avoir besoin d’une connaissance approfondie des modèles linguistiques d’IA. De même, des fonctions telles que le sous-titrage en temps réel peuvent être intégrées avec un codage minimal, ce qui élargit les options d’accessibilité pour les utilisateurs du monde entier.

Soutien aux développeurs

Efforts de collaboration

Google collabore activement avec d’autres développeurs de navigateurs afin de normaliser et de promouvoir l’utilisation de ces capacités d’IA sur différentes plateformes. L’objectif est de faire en sorte que les avantages de l’IA, tels que ceux fournis par Gemini Nano, ne soient pas limités aux utilisateurs d’un seul navigateur, mais qu’ils soient disponibles sur l’ensemble du web.

Ces efforts s’inscrivent dans le cadre d’une initiative plus large visant à favoriser l’interopérabilité et l’innovation dans les technologies web, en créant un environnement dans lequel les développeurs peuvent créer des applications fonctionnant de manière transparente sur plusieurs navigateurs et appareils.

Programme de prévisualisation

Google a annoncé un programme d’avant-première pour les développeurs intéressés par l’intégration de Gemini Nano dans leurs applications. Il offre aux développeurs un accès anticipé aux nouvelles fonctionnalités, ce qui leur permet d’expérimenter, de fournir un retour d’information et d’adapter leurs applications avant la sortie de la version générale.

La participation au programme de prévisualisation permet aux développeurs d’accéder aux dernières technologies d’IA afin de les exploiter et de les intégrer à leurs offres dès le début. Cela permet d’affiner le produit en fonction de l’utilisation réelle et du retour d’information, mais aussi de s’aligner sur l’objectif déclaré de Google de démocratiser la technologie de l’IA, en la rendant plus accessible aux développeurs du monde entier.

Des outils d’IA accessibles aux utilisateurs

Exemple d’outil : « Aidez-moi à écrire »

Gemini Nano de Google présente « Help Me Write », un outil conçu pour aider les utilisateurs à générer du contenu tel que des critiques de produits, des messages sur les médias sociaux et des formulaires de commentaires de clients. Pour les entreprises, cela signifie une amélioration de l’engagement avec les clients grâce à un contenu constamment mis à jour qui maintient un niveau élevé de qualité et de pertinence.

Les utilisateurs individuels bénéficient de la possibilité de produire rapidement des textes soignés et bien construits, ce qui améliore leur présence et leur interaction en ligne.

« Help Me Write » exploite les capacités de Gemini Nano pour comprendre et générer un langage adapté au contexte et cohérent sur le plan stylistique. L’outil peut produire diverses formes de contenu écrit qui répondent aux besoins et aux préférences spécifiques des utilisateurs.

Son impact devrait être important, en particulier pour les propriétaires de petites entreprises, les spécialistes du marketing et les responsables des médias sociaux qui ont besoin d’une création de contenu rapide tout en respectant les normes de qualité.

Comparaison avec Microsoft Edge

Partenariat avec Microsoft

En 2023, Microsoft a annoncé un partenariat avec OpenAI, introduisant des fonctionnalités similaires à celles que Google met en œuvre avec Gemini Nano. Les modèles d’IA avancés d’OpenAI ont ainsi été intégrés à Microsoft Edge pour des fonctionnalités qui améliorent l’interaction avec l’utilisateur et la productivité directement dans le navigateur.

L’initiative de Microsoft a été l’une des premières à apporter des outils alimentés par l’IA dans l’environnement des navigateurs grand public, créant ainsi un précédent pour les autres acteurs du secteur.

L’approche de Google avec Gemini Nano et Chrome est parallèle à la stratégie de Microsoft, mais la développe également en intégrant ces capacités d’IA de manière native dans l’écosystème Chrome.

L’intégration de Google permet à l’utilisateur de bénéficier d’une expérience transparente grâce à laquelle les outils d’intelligence artificielle sont facilement accessibles sans qu’il soit nécessaire de les télécharger ou de les étendre. L’intégration directe dans Chrome offre aussi potentiellement une plus grande portée, étant donné la vaste base d’utilisateurs de Chrome, qui compte des milliards d’utilisateurs dans le monde.

Google et Microsoft visent tous deux à démocratiser l’accès aux technologies de l’IA, en les rendant plus accessibles à l’utilisateur et au développeur moyens. La méthode de Google met l’accent sur la facilité d’intégration et l’accessibilité à grande échelle, ce qui influencera probablement l’évolution future de l’intégration des fonctionnalités de l’IA dans les logiciels grand public et professionnels.

La concurrence entre ces géants de la technologie continue de repousser les limites de ce qui est possible en matière d’IA basée sur un navigateur, ce qui permet aux utilisateurs de bénéficier d’outils plus sophistiqués, plus intuitifs et plus accessibles.

Améliorations techniques et initiative globale d’accessibilité

Améliorations pour un chargement rapide des modèles d’IA

Modifications du navigateur

Google a apporté des modifications majeures au navigateur Chrome pour permettre le chargement rapide du modèle Gemini Nano AI. Reconnaissant l’importance de la vitesse dans l’expérience de l’utilisateur, ces modifications sont essentielles pour que les fonctionnalités de l’IA soient aussi réactives que possible.

Un chargement rapide est essentiel à la fois pour maintenir l’engagement de l’utilisateur et pour s’assurer que les outils d’IA sont pratiques pour les applications en temps réel telles que la traduction instantanée et la génération de contenu à la volée.

Les modifications apportées aux navigateurs impliquent l’optimisation du code sous-jacent et l’utilisation de technologies avancées telles que le chargement paresseux, qui permet de ne charger initialement que les parties nécessaires du modèle d’intelligence artificielle. Les temps de chargement et la quantité de données traitées lors de chaque interaction avec l’utilisateur sont réduits, ce qui se traduit par une expérience utilisateur plus fluide et plus efficace.

Les efforts de Google en matière d’accessibilité à l’IA

Annonces lors de la conférence Google I/O

Lors de la récente conférence Google I/O, Google a annoncé la sortie de modèles Gemini plus rapides et a présenté de nouvelles fonctionnalités pour la variante Gemma. Ces mises à jour s’inscrivent dans le cadre de l’engagement pris par Google d’améliorer l’accessibilité et l’efficacité des technologies de l’IA.

Les modèles Gemini plus rapides améliorent la vitesse à laquelle les tâches d’IA sont exécutées, réduisant la latence et améliorant la réactivité globale des applications d’IA.

Les nouvelles capacités de la variante Gemma sont axées sur l’élargissement de l’éventail des tâches que l’IA peut gérer, ce qui inclut une compréhension et une génération plus nuancées du langage humain, une meilleure intégration avec d’autres outils logiciels et des capacités de traitement des données plus robustes. Ces améliorations sont conçues pour répondre à un plus grand nombre de besoins des développeurs et pour repousser les limites de ce que l’IA peut réaliser au sein de l’écosystème de Google.

Fonctionnalité hors ligne pour la flexibilité des développeurs

L’une des principales caractéristiques de l’intégration de Gemini Nano dans Chrome est sa capacité à fonctionner hors ligne. Cette fonctionnalité est particulièrement avantageuse pour les développeurs qui doivent travailler dans des environnements où la connectivité internet n’est pas fiable ou qui préfèrent ne pas dépendre d’une connexion internet constante.

La possibilité de coder et de tester les fonctionnalités de l’IA sans Internet permet aux développeurs d’être plus flexibles dans leur environnement de travail. Il renforce également la confidentialité et la sécurité du processus de développement, car les données sensibles n’ont pas besoin d’être transmises sur l’internet.

La capacité hors ligne garantit que les applications créées avec Gemini Nano sont plus robustes et plus fiables, car elles ne dépendent pas uniquement de serveurs externes pour fonctionner. Elle est particulièrement intéressante dans les régions où l’infrastructure Internet est limitée, ce qui élargit la base d’utilisateurs potentiels pour les applications augmentées par l’IA de Chrome.

Tim Boesen

mai 22, 2024

10 Min