Les contrôles traditionnels de sécurité de l’IA basés sur le réseau deviennent inefficaces

Depuis un an et demi, la plupart des organisations suivent une règle simple pour gérer les risques liés à l’IA : contrôler ce qui quitte le réseau. Les RSSI se sont concentrés sur le navigateur, en resserrant l’accès via des courtiers de sécurité d’accès au cloud (CASB) et en surveillant les appels d’API vers des outils d’IA externes. Cela avait du sens lorsque chaque requête d’IA passait par Internet, lorsque les données quittaient l’organisation, elles pouvaient être vues, enregistrées et stoppées.

Ce modèle est en train de s’effondrer. L’inférence locale de l’IA, les modèles s’exécutant directement sur les ordinateurs portables ou les appareils de l’entreprise, ont changé la donne. Ces nouveaux flux de travail se déroulent hors ligne, sans trace sur le réseau. Les systèmes de sécurité construits pour la surveillance du cloud ne peuvent pas voir ce qui se passe sur l’appareil. Si un développeur utilise un outil d’IA localement, il n’y a pas de paquet à inspecter, pas d’appel API à intercepter et pas de piste d’audit à examiner.

Les dirigeants doivent comprendre qu’il s’agit de la prochaine phase de l’adoption de l’IA. La surface des menaces se déplace du cloud vers les terminaux. Les entreprises qui continuent de s’appuyer uniquement sur les règles de pare-feu ou la surveillance du réseau ne font que poursuivre des ombres. La sécurité prête pour l’avenir exigera une approche visible et gouvernée au niveau de l’appareil, là où l’IA fonctionne aujourd’hui.

Les dirigeants doivent voir cela pour ce que c’est : une transition structurelle dans le risque d’entreprise. Les contrôles axés sur le réseau ne disparaîtront pas, mais ils perdront de leur impact. Le périmètre le plus important se trouve désormais entre les mains des utilisateurs et des développeurs. C’est au niveau des terminaux, et non du réseau, que la visibilité de la sécurité doit évoluer. Ce changement exige de repenser les budgets, les piles technologiques et les politiques.

L’inférence locale est désormais possible grâce aux progrès réalisés dans le domaine du matériel, de la compression des modèles et de la distribution.

Jusqu’à récemment, l’exécution d’un grand modèle linguistique sur un appareil personnel était l’apanage des laboratoires de recherche. Ce n’est plus le cas aujourd’hui. Au cours des deux dernières années, trois avancées ont permis de rendre les modèles d’IA puissants accessibles à toute personne disposant d’un ordinateur portable haut de gamme.

Tout d’abord, le matériel est devenu plus rapide. Les machines grand public sont désormais équipées d’accélérateurs avancés qui rivalisent avec les petits centres de données. Un MacBook Pro doté de 64 Go de mémoire unifiée peut exécuter des modèles à 70 milliards de paramètres dans des délais acceptables pour un travail réel. Deuxièmement, la quantification des modèles, qui consiste à encoder les données de manière compacte sans perdre beaucoup de performance, est devenue la norme. Elle réduit l’utilisation de la mémoire tout en maintenant une qualité d’inférence suffisamment élevée pour la plupart des tâches. Enfin, la distribution est devenue un jeu d’enfant. Grâce à des écosystèmes à code source ouvert tels que Hugging Face, il suffit d’exécuter une ligne de code pour obtenir un modèle prêt à fonctionner. En quelques minutes, un développeur peut télécharger, exécuter et discuter avec un modèle de grande capacité, hors ligne.

Pour les équipes techniques, cela signifie une expérimentation plus rapide. Pour les équipes de sécurité, cela signifie moins de visibilité. Un ingénieur peut effectuer une analyse de code, résumer des documents ou rédiger des communications à l’aide de ces outils locaux, le tout sans aucun trafic réseau. L’ordinateur portable devient essentiellement un poste de travail d’IA isolé. Du point de vue de la surveillance, rien ne semble se passer. Mais il y a une chose très importante : les opérations d’IA sont désormais invisibles pour les systèmes traditionnels.

Pour les dirigeants, ce changement représente à la fois une opportunité et un risque. La productivité augmente lorsque les équipes peuvent exécuter l’IA localement, mais les modèles de gouvernance doivent évoluer. Traitez l’IA locale non pas comme une simple fonctionnalité, mais comme un nouvel écosystème au sein de l’infrastructure de votre entreprise. L’innovation qui accélère le développement augmente également les risques. Les dirigeants qui planifient aujourd’hui l’inférence locale conserveront le contrôle lorsque d’autres le perdront.

Experts Okoone
PARLONS-EN !

Un projet en tête ?
Planifiez un appel de 30 minutes avec nous.

Des experts senior pour vous aider à avancer plus vite : produit, tech, cloud & IA.

Veuillez saisir une adresse email professionnelle valide.

Le passage de l’exfiltration des données à l’intégrité, à la provenance et aux risques de conformité dans l’inférence locale

Lorsque l’IA s’exécute directement sur les terminaux, la préoccupation centrale n’est plus d’empêcher les données sensibles de quitter le réseau. Le véritable risque réside désormais dans ce qui se passe à l’intérieur de l’appareil, dans la manière dont le modèle traite les informations, dans le code qu’il génère et dans la conformité de cette activité avec les normes de l’entreprise et les normes juridiques. Trois vecteurs de risque se détachent clairement.

La première est l’intégrité. Les développeurs adoptent des modèles exécutés localement pour des raisons de productivité, car ils sont rapides, privés et ne nécessitent pas d’approbation. Mais les modèles non vérifiés peuvent introduire des vulnérabilités cachées, une validation d’entrée faible, des configurations par défaut non sécurisées ou des dépendances non prises en charge. Si ces entrées ou sorties sont intégrées à un système de production, il en résulte une base de code contaminée qui passe les tests mais qui érode discrètement la posture de sécurité de l’organisation.

Le second concerne la conformité et l’exposition à la propriété intellectuelle. De nombreux modèles ouverts très performants sont assortis de licences restrictives. Elles limitent souvent l’utilisation commerciale, exigent une attribution ou interdisent l’intégration dans des produits privés. Lorsque ces modèles sont utilisés localement sans examen formel, la conformité est compromise. Le risque est cumulatif : une équipe utilise un modèle non approuvé, son code entre en production et, des mois plus tard, un processus de diligence raisonnable ou un audit révèle la violation.

Le troisième est la provenance. Les développeurs tirent quotidiennement les poids des modèles de dépôts publics. Les formats plus anciens, comme les fichiers PyTorch basés sur Pickle, peuvent exécuter un code arbitraire lorsqu’ils sont chargés. Cela signifie qu’un modèle compromis n’est pas seulement défectueux, il peut exécuter des actions malveillantes sur l’appareil lui-même. Des alternatives plus récentes telles que Safetensors atténuent cette menace en interdisant l’exécution de code, mais uniquement si les entreprises normalisent leur utilisation.

Les dirigeants doivent reconnaître qu’il s’agit là de risques commerciaux autant que techniques. L’inférence locale complique la traçabilité et la responsabilité, toutes deux essentielles pour la conformité légale et la confiance dans la marque. Les RSSI et les directeurs techniques ont besoin d’une gouvernance coordonnée qui permette de suivre les sources des modèles, d’assurer la connaissance des licences et de valider les résultats. L’intégration de ces processus aujourd’hui permet d’éviter un impact financier et de réputation important plus tard. Il ne s’agit pas d’un risque temporaire, mais du coût d’un écosystème d’IA d’entreprise en pleine évolution.

La gouvernance des points finaux est désormais essentielle pour gérer efficacement les risques liés à l’introduction de votre propre modèle (BYOM).

Les équipes de sécurité ne peuvent plus s’appuyer uniquement sur des outils axés sur le cloud pour identifier ou bloquer l’utilisation non autorisée de l’IA. Avec le BYOM, la majeure partie de la gestion des risques se déplace vers le point final, où les appareils individuels deviennent les principaux vecteurs d’exposition. La stratégie doit évoluer de la surveillance du réseau à l’intelligence des terminaux.

Une gouvernance locale efficace commence par la détection et l’inventaire. Les entreprises doivent détecter les artefacts importants liés à l’IA tels que les fichiers de modèle .gguf, surveiller les processus actifs (par exemple, Ollama ou llama.cpp) et observer les auditeurs locaux inhabituels sur les ports d’inférence connus tels que 11434. Ce sont des signes révélateurs de l’activité d’inférence locale. La couche suivante est la sensibilisation à l’exécution, qui permet de suivre l’utilisation élevée et répétée du GPU ou du NPU qui ne correspond pas aux charges de travail approuvées. Associés à l’application de la politique des appareils par le biais de la gestion des appareils mobiles (MDM) ou de la détection et de la réponse aux points d’extrémité (EDR), ces signaux restaurent la visibilité là où les outils réseau échouent.

Les développeurs ont besoin de flexibilité pour innover, mais les entreprises ont besoin de traçabilité pour sécuriser leurs opérations. Trouver cet équilibre grâce à une gouvernance transparente permet de préserver la confiance et de soutenir la productivité.

Les dirigeants doivent comprendre que la gouvernance des points d’accès ne consiste pas à restreindre l’innovation, mais à maintenir le contrôle dans un environnement décentralisé. Permettre aux développeurs d’exécuter des modèles locaux sanctionnés, tout en imposant l’observabilité, crée un cadre durable pour que la sécurité et l’innovation coexistent. Alors que de plus en plus d’employés expérimentent l’IA locale, la capacité à gérer proprement le comportement des terminaux déterminera les entreprises qui progresseront en toute sécurité et celles qui resteront à la traîne.

La mise en place d’un centre de modèles internes curatés peut atténuer l’utilisation non autorisée de modèles locaux.

Les développeurs se tournent vers des modèles locaux non approuvés principalement par nécessité. Lorsque l’approbation officielle prend trop de temps ou que les outils autorisés sont limités en termes de fonctionnalité, les gens choisissent ce qui leur permet de faire leur travail. Le résultat est l' »IA de l’ombre ».IA de l’ombre » – des équipes talentueuses résolvant des problèmes réels avec des méthodes non approuvées qui exposent l’entreprise à des risques. La création d’un hub de modèles internes curatés s’attaque directement à ce comportement en fournissant des alternatives accessibles et sécurisées.

Un hub de modèles curatés devrait héberger des modèles pré-approuvés pour les tâches courantes de l’entreprise, le codage, le résumé et l’analyse de documents. Chaque modèle doit faire l’objet d’une validation de licence claire, d’une documentation d’utilisation et de hachages de version épinglés pour en vérifier l’authenticité. Donner la priorité aux types de fichiers sûrs, tels que les capteurs de sécurité, réduit les risques de la chaîne d’approvisionnement. Lorsqu’ils sont accompagnés de conseils d’utilisation clairs et de règles de traitement des données, ces modèles approuvés donnent aux employés les outils dont ils ont besoin sans contourner la gouvernance.

Un hub interne améliore également l’efficacité. Il supprime les frictions dans les flux de développement, garantissant que les équipes peuvent expérimenter en toute confiance dans des limites de sécurité définies. Il transforme la conformité en infrastructure plutôt qu’en application de politiques.

Les dirigeants devraient considérer un centre de modèles curatés non pas comme un mécanisme de contrôle, mais comme un outil de productivité doté d’une gouvernance intégrée. Permettre la liberté au sein d’une structure crée une stabilité culturelle à long terme autour de l’utilisation de l’IA. L’entreprise évite le chaos de l’adoption incontrôlée de modèles tout en maintenant le rythme créatif qui génère un avantage concurrentiel. Pour les dirigeants, l’opportunité est de remplacer la surveillance réactive par une habilitation proactive, une gouvernance mise en œuvre par le biais de la conception et non de la restriction.

Le libellé de la politique actualisée doit traiter explicitement des opérations du modèle d’IA local.

Les politiques d’entreprise autour de l’utilisation des technologies sont encore principalement axées sur les outils cloud et les logiciels en tant que service. C’est un problème dans un monde BYOM, où l’activité principale de l’intelligence artificielle se déroule désormais localement. Les politiques qui ne concernent que les outils en ligne créent de la confusion et des lacunes. Un langage clair et actualisé est nécessaire pour couvrir les téléchargements de modèles locaux, l’utilisation et les responsabilités en matière de conservation.

Les politiques d’utilisation acceptable mises à jour doivent définir l’origine des modèles, les licences autorisées et les types de données pouvant être traités localement. Elles doivent préciser les attentes en matière de journalisation, les durées de conservation des modèles et les directives relatives aux versions pour les environnements d’inférence locaux. Cette clarté permet de fixer les limites d’une expérimentation sûre et de maintenir la conformité en cas d’examen externe, qu’il s’agisse d’audits juridiques ou d’examens de la sécurité des clients.

Des politiques bien rédigées servent également de passerelle de communication. Elles alignent les équipes techniques et non techniques en éliminant l’ambiguïté sur ce qui est considéré comme un comportement approuvé. Lorsque les employés comprennent le « pourquoi » de la règle, l’application devient plus aisée et la gouvernance s’intègre dans le flux de travail normal plutôt que de constituer un obstacle.

Les dirigeants doivent considérer cette actualisation de la politique comme une responsabilité fondamentale de gouvernance, et non comme une mise à jour de procédure. Une formulation ambiguë de la politique crée déjà un risque dans tous les secteurs d’activité. En définissant explicitement les opérations locales d’IA, les organisations peuvent anticiper les nouveaux paysages de conformité et réduire les risques d’audit futurs. Il ne s’agit pas d’ajouter de la bureaucratie, mais de faire en sorte que la politique suive le rythme des capacités. Des règles claires protègent à la fois l’entreprise et ses employés, en renforçant l’intégrité opérationnelle grâce à la transparence.

La gouvernance de l’IA se recentre sur les points d’extrémité individuels

Après des années de centralisation des contrôles dans le cloud, l’activité de l’IA est à nouveau centrée sur les appareils personnels et d’entreprise. L’expansion discrète de l’inférence de modèles locaux marque un changement fondamental : les employés exécutent désormais de puissants modèles d’IA directement sur leurs machines. Cette décentralisation affaiblit l’efficacité des défenses périmétriques traditionnelles, laissant les RSSI aveugles aux signaux de sécurité vitaux qui existaient auparavant à l’intérieur des limites du réseau.

Les entreprises perçoivent déjà les signes de cette transition. Les grands modèles (fichiers .gguf ou .pt) consomment des espaces de stockage inattendus. Les serveurs d’inférence locaux occupent des ports tels que le 11434 utilisé par des outils comme Ollama. Les pics de performance du GPU se produisent même lorsque les appareils sont hors ligne ou déconnectés d’un VPN. Dans de nombreuses entreprises, il n’existe pas non plus d’inventaire clair reliant les sorties de code à des versions de modèles spécifiques. Dans certains cas, les versions de production contiennent même des modèles sous licence non commerciale, ce qui crée des complications juridiques et de conformité. Ces schémas confirment que l’activité de l’IA s’est rapprochée de l’appareil, où la gouvernance est plus faible et la visibilité minimale.

Pour s’adapter, les entreprises doivent traiter les terminaux comme des participants à part entière dans l’environnement IA de l’entreprise. Ils ont besoin de surveillance, de contrôle de la configuration et de procédures de gouvernance normalisées, auparavant réservées aux systèmes centralisés. Cela inclut le suivi des modèles téléchargés, la vérification de la provenance grâce à des hachages sécurisés, l’application de restrictions de licence et la création de journaux opérationnels transparents liés à l’activité de l’utilisateur.

Les dirigeants doivent comprendre que ce passage à une gouvernance au niveau de l’appareil définira le prochain chapitre de l’IA d’entreprise. Il s’agit d’un changement structurel plutôt que progressif. Une surveillance efficace dépend maintenant de l’intégration de la télémétrie des terminaux dans les cadres d’observabilité de l’entreprise tout en maintenant l’autonomie dont les employés ont besoin pour innover. Les investissements dans l’analyse des terminaux, les systèmes d’inventaire des modèles et les outils de reporting simplifiés porteront leurs fruits en termes d’assurance de la conformité et d’efficacité opérationnelle. Les entreprises qui s’adaptent rapidement garderont le contrôle alors que les flux de travail de l’IA continuent à se décentraliser.

Réflexions finales

L’IA n’est plus confinée au cloud. Elle s’installe sur les ordinateurs portables, s’intègre dans les flux de travail quotidiens et fonctionne en dehors de la supervision traditionnelle. Pour les dirigeants, il ne s’agit pas d’un changement temporaire, mais d’un changement permanent dans la manière dont la technologie interagit avec l’infrastructure de l’entreprise.

Le défi n’est pas d’arrêter l’IA locale, mais de la gouverner intelligemment. Les organisations qui réussiront traiteront les poids des modèles, les licences et la provenance comme faisant partie de leur inventaire logiciel de base. Elles mettront à jour les politiques en fonction des capacités, investiront dans la visibilité des points finaux et donneront aux équipes l’accès à des modèles approuvés et très performants qui donneront à la sécurité une impression de fluidité plutôt que de restriction.

Il s’agit de la prochaine phase de maturité de l’adoption de l’IA. L’objectif n’est pas de contrôler pour le plaisir, mais de progresser de manière résiliente, d’innover de manière responsable en intégrant la transparence. Les dirigeants qui agissent maintenant guideront leurs entreprises vers une intégration plus sûre, plus rapide et plus intelligente de l’IA, transformant ce qui semble être un angle mort en une nouvelle source de force.

Alexander Procter

mai 26, 2026

16 Min

Experts Okoone
PARLONS-EN !

Un projet en tête ?
Planifiez un appel de 30 minutes avec nous.

Des experts senior pour vous aider à avancer plus vite : produit, tech, cloud & IA.

Veuillez saisir une adresse email professionnelle valide.