L’IA opère une transition vers des modèles locaux et compressés sur les appareils au lieu de s’appuyer uniquement sur des systèmes basés sur le Cloud

La voie de l’IA est en train de changer. Jusqu’à présent, nous nous appuyions fortement sur le cloud pour traiter les tâches complexes, car dans la plupart des cas, nous y étions obligés. Les modèles étaient trop grands, le matériel trop limité. Mais les choses changent rapidement. Les percées dans le domaine de la compression des modèles permettent d’intégrer une grande puissance d’IA directement dans les appareils grand public, les ordinateurs portables, les smartphones et même les équipements industriels sur le terrain. Nous ne sommes plus liés à des serveurs distants. L’intelligence peut désormais vivre à la périphérie.

Multiverse Computing l’a bien compris. Roman Orús, cofondateur et directeur scientifique de l’entreprise, a déclaré que les modèles compressés permettent d’exécuter des modèles de langage à haute performance directement sur les appareils. Ce que cela signifie, c’est que nous passons de l’IA dans le cloud à l’IA dans votre main, traitée localement, rapide et non attachée. Et oui, elle est fiable.

Il ne s’agit pas d’une course à la réduction des coûts du cloud. Il s’agit de donner aux utilisateurs plus de rapidité, de contrôle et d’indépendance. Dans de nombreux environnements, en particulier ceux où la connectivité est faible ou intermittente, l’IA intégrée devient essentielle. Vous obtenez une interaction sans latence combinée à une fonctionnalité hyperpersonnalisée. Pas de réseau ? Pas de problème. L’IA fonctionne toujours. L’essor de l Edge AI est l’un des signes les plus clairs de l’effondrement de la centralisation des technologies, et ce dans le bon sens du terme.

Pour les dirigeants, cette évolution mérite d’être suivie de près. En déplaçant le traitement vers la périphérie, on décentralise le risque système et on renforce la résilience. Elle ouvre également la voie à de nouveaux types de produits, plus rapides, plus sûrs, plus autonomes, ce qui est synonyme d’opportunités. Toute organisation qui exploite intelligemment cette évolution peut acquérir un avantage concurrentiel, non seulement en termes de rapidité, mais aussi de souplesse et de sécurité.

La confidentialité et la propriété des données des utilisateurs sont les principaux moteurs de l’adoption du traitement local de l’IA.

Voici une chose à laquelle la plupart des utilisateurs tiennent, même s’ils ne le disent pas toujours directement : faire confiance à ceux qui détiennent leurs données. À l’heure actuelle, les gens sont de plus en plus sceptiques à l’égard des services de cloud qui stockent des informations sensibles. C’est un problème pour les entreprises qui s’appuient sur les données personnelles pour fournir des services, sans parler des régulateurs et des décideurs politiques qui interviennent avec des normes plus strictes.

C’est là que l’IA locale change complètement la donne. Si un appareil traite des informations sur place, qu’il s’agisse d’une conversation, d’un horaire ou d’un document, les données ne quittent pas l’appareil. Les fournisseurs ou réseaux tiers ne peuvent rien intercepter. Cela redonne le contrôle à l’utilisateur. Et le contrôle est le fondement de la confiance.

Comme l’a souligné Roman Orús, la protection de la vie privée est le principal facteur qui incite les consommateurs à opter pour l’IA locale. Vous obtenez la même fonctionnalité, voire mieux, et vous n’avez pas à divulguer vos informations sensibles. C’est un bon échange. Il a également mentionné un élément important, l’IA de routeur. Il s’agit d’un petit modèle de coordination qui aide à décider si une tâche est traitée localement ou basculée vers le cloud, en optimisant à la fois les capacités et le contrôle. C’est grâce à une orchestration intelligente de ce type que vous pouvez maintenir une expérience utilisateur transparente tout en respectant la vie privée.

Pour le chef d’entreprise, voici l’essentiel : les solutions axées sur la protection de la vie privée sont plus qu’une simple question d’éthique, c’est une bonne affaire. Dans les régions où la pression réglementaire est plus forte, comme l’UE, l’IA locale offre un moyen de rester en conformité tout en développant des services basés sur l’IA. Elle renforce également la crédibilité auprès des clients. Si vous proposez un produit qui protège la vie privée dès sa conception, vous pouvez prendre la tête sur des marchés où la confiance est devenue un facteur de différenciation essentiel.

L’Edge AI est particulièrement transformatrice dans des secteurs tels que la défense et les soins de santé.

Certains environnements ne peuvent pas se permettre de retard ou de déconnexion. La défense et les soins de santé figurent en tête de liste. Dans ces secteurs, la rapidité d’exécution et le contrôle absolu des données ne sont pas de simples préférences, ce sont des exigences. C’est là que l’intelligence artificielle en périphérie (Edge AI) s’impose. Lorsque les modèles d’IA sont compressés et intégrés directement dans les appareils locaux, les plateformes sur le terrain ou dans les hôpitaux n’ont pas besoin d’accéder à un centre de données pour prendre des décisions. Elles peuvent traiter les informations instantanément, là où elles sont collectées.

La défense en est un bon exemple. Roman Orús, cofondateur et directeur scientifique de Multiverse Computing, a expliqué comment les drones, les véhicules, les systèmes navals et les équipements portés par les soldats peuvent tous être équipés d’une IA embarquée. Dans des environnements instables ou hostiles, avec une connectivité limitée ou contestée, le traitement centralisé dans le cloud ne fonctionne tout simplement pas. Au contraire, l’IA doit fonctionner en temps réel, détecter les menaces, naviguer de manière autonome et analyser les données des capteurs sans délai.

Dans le domaine des soins de santé, la logique est tout aussi forte. Orús a expliqué comment les hôpitaux utilisent des modèles d’IA ultra-compressés sur des postes de travail sécurisés et des clouds privés pour traiter les diagnostics et les résumés des patients sans transmettre aucune donnée sensible en dehors du réseau. C’est important dans les systèmes de santé réglementés, où la protection de la vie privée des patients n’est pas facultative. Ces modèles réduisent également la nécessité d’une infrastructure coûteuse, ce qui rend l’intelligence avancée abordable pour un plus grand nombre d’organisations.

Pour les dirigeants des secteurs de la défense ou de la santé, le principal avantage est l’indépendance stratégique. Avec l’IA intégrée localement, les opérations ne dépendent plus de la connectivité backhaul ou de systèmes tiers. Vous bénéficiez de la vitesse, de la sécurité et de la liberté d’agir immédiatement, sans compromettre les contraintes réglementaires ou critiques. Pour les entreprises qui fournissent des technologies à ces secteurs, l’offre de systèmes fiables et indépendants est désormais un marché en pleine croissance.

Les gouvernements exploitent des modèles d’IA auto-hébergés pour renforcer la souveraineté numérique et respecter des normes de sécurité strictes.

Les gouvernements s’orientent délibérément vers une IA non seulement efficace, mais aussi souveraine. Cela signifie qu’il faut construire des systèmes qui fonctionnent en interne, sans dépendre de plateformes ou de fournisseurs externes. Lorsque les agences nationales doivent traiter des données sensibles, stratégiques ou classifiées, l’hébergement de modèles d’IA sur une infrastructure interne n’est plus optionnel. Il s’agit d’un élément fondamental. L’objectif est de garder le contrôle total des systèmes d’information critiques de bout en bout.

Roman Orús, de Multiverse Computing, l’a clairement expliqué. Il a souligné que le secteur public adopte largement les modèles linguistiques compressés de grande taille hébergés par ses soins. Les cas d’utilisation comprennent l’automatisation des flux de travail bureaucratiques, le résumé de longs documents politiques et l’extraction d’informations à partir de consultations publiques. Ces outils ne se contentent pas d’accélérer l’administration, ils peuvent favoriser une prise de décision plus éclairée et fondée sur des données au plus haut niveau.

Mais la vitesse n’est pas le facteur clé. C’est la sécurité qui l’est. M. Orús a expliqué que le déploiement local garantit que les données sont conservées dans des réseaux internes sécurisés, isolés de l’internet public et accessibles uniquement au personnel autorisé. Cette approche répond aux préoccupations croissantes concernant la souveraineté numérique en Europe et dans d’autres économies avancées, notamment en raison de l’intensification des menaces qui pèsent sur les infrastructures de données.

Pour les cadres dirigeants des entreprises technologiques gouvernementales ou les fournisseurs travaillant avec le secteur public, il est important de soutenir cette souveraineté. L’IA basée sur le Cloud dans le cloud peut être rapide à déployer, mais elle ne peut pas toujours répondre aux exigences nationales strictes en matière de conformité. Proposer des modèles qui offrent de hautes performances hors ligne, tout en donnant aux agences un contrôle total sur l’accès et le flux de données, devient rapidement une attente de base. Si vous construisez ou mettez en œuvre l’IA dans le secteur public, donnez la priorité à la transparence, au confinement et au contrôle interne. C’est vers cela que se dirigent la confiance du public et les futurs marchés publics.

L’augmentation de la demande d’énergie liée aux opérations d’IA est à l’origine de l’attention portée à la conception et à la réglementation.

L’IA repousse les limites, mais la consommation d’énergie les repousse. La formation et l’exécution de modèles à grande échelle exigent une énorme puissance de calcul. Cela se traduit par des coûts énergétiques élevés, une augmentation des émissions de carbone et une pression croissante de la part des régulateurs. À mesure que l’IA pénètre de plus en plus de secteurs et s’étend, les gouvernements et les entreprises ne veulent pas seulement des performances, mais aussi de l’efficacité. Les modèles qui consomment moins d’énergie tout en produisant des résultats comparables sont de plus en plus recherchés.

Goldman Sachs estime que l’IA entraînera une augmentation de 165 % de la consommation d’énergie des centres de données d’ici 2030. Ce n’est pas une hypothèse. Il s’agit d’une question de réglementation et d’environnement. La loi européenne sur l’IA exige désormais que les développeurs de modèles à usage général documentent l’utilisation de l’énergie. En outre, la directive européenne sur l’efficacité énergétique de 2023 impose la production de rapports détaillés sur l’énergie, l’eau et les paramètres de durabilité dans les centres de données. Et ce n’est pas fini : d’ici à 2026, de multiples initiatives impliqueront de nouveaux seuils de conformité.

Roman Orús, cofondateur et directeur scientifique de Multiverse Computing, a déclaré que l’efficacité des modèles n’est plus seulement un problème d’ingénierie, mais qu’elle devient une condition de viabilité commerciale. Il a souligné que les modèles d’IA comprimée fonctionnant en périphérie ne sont pas seulement plus rapides et plus résistants, ils consomment fondamentalement moins d’énergie. C’est une bonne chose pour les coûts de l’entreprise et pour répondre aux attentes de l’ESG.

Pour les dirigeants, cela signifie que l’empreinte environnementale de vos choix technologiques est en train de devenir un élément de votre stratégie concurrentielle. Les régulateurs sont attentifs. Les clients observent. Les investisseurs posent des questions. Pour garder une longueur d’avance, vos déploiements d’IA doivent être prêts pour la réglementation, conscients de la consommation d’énergie et optimisés en termes de performances. Cela ne signifie pas qu’il faille sacrifier des capacités, mais qu’il faut optimiser la conception, choisir de meilleures architectures et s’aligner sur l’évolution du marché et de la législation.

Principaux enseignements pour les dirigeants

  • L’IA périphérique gagne du terrain : Les dirigeants devraient anticiper une transition de l’IA dans le cloud vers des modèles sur appareil à mesure que la technologie de compression progresse. Cette transition permet des capacités plus rapides, hors ligne, avec une latence réduite et une dépendance à l’égard de l’infrastructure.
  • La protection de la vie privée stimule la demande des utilisateurs : Les chefs d’entreprise doivent donner la priorité au traitement local pour répondre aux attentes croissantes des consommateurs en matière de propriété et de confidentialité des données. L’IA locale renforce la confiance en éliminant l’exposition à des fournisseurs tiers.
  • L’impact sectoriel s’accélère : Les leaders de la défense et de la santé devraient investir dans l’Edge AI pour améliorer la résilience, la sécurité et la prise de décision en temps réel dans des environnements contraints ou à forts enjeux.
  • Les gouvernements construisent leur indépendance en matière d’IA : Les fournisseurs et les stratèges du secteur public doivent s’aligner sur la demande croissante de modèles auto-hébergés qui soutiennent les mandats de sécurité nationale, d’efficacité et de souveraineté numérique.
  • L’efficacité énergétique devient un avantage concurrentiel : Les dirigeants doivent choisir des architectures d’IA qui offrent des performances élevées tout en consommant peu d’énergie afin d’atteindre les objectifs de développement durable et de se conformer aux réglementations européennes de plus en plus strictes en matière d’énergie.

Alexander Procter

décembre 19, 2025

12 Min