Google I/O 2026 : Gemini devient agent, créateur vidéo et moteur de recherche augmenté

Google I/O 2026 : Gemini devient agent, créateur vidéo et moteur de recherche augmenté

Google I/O 2026 a été l’un des événements les plus denses de ces dernières années pour l’intelligence artificielle. Le message de Google est clair : Gemini n’est plus seulement un assistant conversationnel. Il devient un moteur d’action, capable de chercher, planifier, coder, créer des vidéos, organiser un quotidien numérique et s’intégrer aux produits déjà utilisés par des milliards de personnes.

Le fil rouge de la conférence, tenue le 19 mai 2026, tient en deux mots : IA agentique. Google veut passer d’une IA qui répond à une question à une IA qui suit un objectif, travaille en arrière-plan, utilise des outils et construit des expériences adaptées à chaque demande. Cette ambition traverse presque toutes les annonces : Gemini 3.5 Flash, Gemini Omni, Gemini Spark, Search, Workspace, Antigravity, Google Pics, les lunettes connectées et même la recherche scientifique.

Gemini 3.5 Flash, le modèle qui doit rendre les agents plus rapides

La principale annonce technique est Gemini 3.5 Flash, premier modèle d’une nouvelle famille pensée pour combiner intelligence de haut niveau, rapidité et capacité d’action. Google le présente comme son modèle le plus important pour les agents et le codage, avec une disponibilité immédiate dans la Gemini app, AI Mode dans Google Search, Google Antigravity, l’API Gemini, AI Studio, Android Studio et les offres Gemini Enterprise.

L’intérêt de Flash, dans la stratégie de Google, est son compromis entre puissance et coût. L’entreprise affirme que Gemini 3.5 Flash est nettement plus rapide que d’autres modèles frontaliers, tout en étant capable de traiter des tâches longues : développement d’applications, maintenance de code, analyse de documents, automatisation de processus administratifs ou workflows d’entreprise.

En clair, Google ne cherche pas seulement à gagner une course de benchmarks. Il veut un modèle suffisamment bon et suffisamment rapide pour être utilisé partout : dans le moteur de recherche, dans les outils de productivité, dans les environnements de développement et dans les agents personnels.

Une réponse au coût réel de l’IA

Cette insistance sur la vitesse et le prix n’est pas anodine. Les entreprises commencent à se heurter au coût de l’IA générative à grande échelle. Un modèle très puissant mais lent ou cher reste difficile à intégrer dans des produits de masse. Google mise donc sur Flash pour réduire la latence, absorber davantage de requêtes et permettre des agents actifs en continu.

Sundar Pichai a donné plusieurs chiffres pour montrer cette montée en charge : Google affirme traiter plus de 3,2 quadrillions de tokens par mois sur ses surfaces, contre environ 480 trillions l’an dernier, et plus de 8,5 millions de développeurs construisent chaque mois avec ses modèles. Ces volumes expliquent pourquoi l’infrastructure, les TPU et l’optimisation des modèles sont devenus des sujets centraux de Google I/O.

Gemini Spark : l’agent personnel arrive dans la Gemini app

L’annonce la plus parlante pour le grand public est Gemini Spark. Google le décrit comme un agent personnel disponible dans la Gemini app, capable d’agir en continu sous la direction de l’utilisateur. Spark doit fonctionner sur des machines virtuelles dans Google Cloud, travailler en arrière-plan et se connecter progressivement à des outils Google puis à des services tiers via MCP.

L’exemple est important : au lieu de demander à l’utilisateur de rester dans une conversation et de relancer sans cesse l’assistant, Spark doit pouvoir suivre une tâche longue, donner des mises à jour et poursuivre une action sans que l’ordinateur reste ouvert. Sur Android, Google prévoit aussi Android Halo, une interface pour suivre la progression d’agents comme Spark.

Cette vision soulève immédiatement des questions de confiance. Un agent personnel qui lit des informations, prend des décisions et agit à travers plusieurs services doit être contrôlable, explicable et réversible. Google insiste sur l’idée d’une action “sous la direction” de l’utilisateur, mais le vrai test viendra des permissions, des garde-fous et de la clarté des validations.

Search devient un produit agentique

Google Search reste le cœur stratégique de l’entreprise, et I/O 2026 montre à quel point il change. AI Mode a dépassé le milliard d’utilisateurs actifs mensuels, selon Google, tandis que les AI Overviews dépassent 2,5 milliards d’utilisateurs mensuels. La recherche ne se limite plus à une liste de liens : Google veut en faire une interface de conversation, d’exploration et d’action.

La nouveauté est l’arrivée d’agents d’information dans Search. Ces agents pourront travailler en arrière-plan pour trouver des informations au bon moment, suivre un besoin ou aider à construire des réponses plus personnalisées. Google prévoit aussi des interfaces générées dynamiquement : au lieu d’afficher seulement du texte, Search pourra produire des visuels, des tableaux, des mini-outils ou des expériences interactives adaptées à une question.

Cette évolution est majeure pour le web. Si Search fabrique des “mini-apps” et des tableaux de bord persistants directement dans ses résultats, les éditeurs, les développeurs et les marques devront repenser leur relation au trafic. La recherche devient moins un point de passage vers d’autres sites et davantage un environnement où l’utilisateur peut accomplir une tâche complète.

Des usages déjà différents

Google affirme que les requêtes AI Mode sont en moyenne trois fois plus longues qu’une recherche classique. Plus d’une recherche sur six aux États-Unis utilise désormais la voix ou l’image, et les requêtes liées à la planification progressent plus vite que l’ensemble des requêtes AI Mode. Cela confirme un changement de comportement : les utilisateurs ne cherchent plus seulement une information, ils confient un problème.

Gemini Omni veut transformer la création vidéo

Autre annonce forte : Gemini Omni. Google le présente comme un modèle capable de créer à partir de n’importe quel type d’entrée, en commençant par la vidéo. Gemini Omni Flash est lancé dans la Gemini app, Google Flow et YouTube Shorts, avec une arrivée prévue pour les développeurs et les entreprises via API.

La promesse est ambitieuse : mélanger texte, image, vidéo et audio pour générer ou modifier une vidéo cohérente. L’utilisateur pourra demander des changements en langage naturel, garder la continuité d’une scène, modifier un style, transformer un mouvement ou créer un contenu explicatif visuel.

Ce n’est pas seulement un outil créatif. C’est une étape vers des modèles qui comprennent mieux le monde physique : mouvement, continuité, objets, causalité, style, narration. Google parle de “world models”, c’est-à-dire des modèles capables de simuler des scènes plutôt que de simplement prédire la suite d’un texte.

Pour les créateurs, les marques et les médias, Gemini Omni pourrait réduire les barrières d’entrée de la vidéo. Pour les plateformes, il crée aussi un besoin plus fort de provenance et de vérification, car les vidéos générées deviendront plus réalistes et plus faciles à produire.

SynthID, Content Credentials et la traçabilité des contenus

Google a aussi renforcé son discours sur la transparence. L’entreprise rappelle que SynthID a déjà marqué plus de 100 milliards d’images et de vidéos, ainsi que 60 000 années d’actifs audio. Elle annonce l’extension de la vérification SynthID et des Content Credentials à Search et Chrome.

Le point important est l’interopérabilité. Google indique que de nouveaux partenaires, dont OpenAI, Kakao et ElevenLabs, adoptent SynthID. Cette annonce dépasse Google I/O : elle montre que la provenance des contenus IA devient une infrastructure commune, pas seulement une fonctionnalité de plateforme.

La limite reste claire : un filigrane ou une métadonnée ne prouve pas qu’un contenu est vrai. Cela indique une origine technique ou une modification connue. Mais pour les journalistes, les plateformes, les entreprises et les utilisateurs, cette information peut devenir indispensable face à la montée des images et vidéos synthétiques.

Workspace : la voix, Google Pics et l’agent au bureau

Google Workspace reçoit plusieurs fonctions qui traduisent la même logique agentique dans les outils de travail. Gmail Live, Docs Live et de nouvelles fonctions dans Keep doivent permettre de chercher, rédiger ou organiser des informations à la voix. L’idée est de transformer une pensée orale, parfois désordonnée, en document structuré, note exploitable ou réponse synthétique.

Google annonce aussi Google Pics, un nouvel outil de création et d’édition d’images basé sur le modèle Nano Banana. La promesse est de permettre des modifications précises : sélectionner un objet, changer une couleur, déplacer un élément, modifier du texte dans une image ou traduire du texte en conservant le style visuel. Pics doit aussi s’intégrer à Slides et Drive.

Pour Workspace, l’enjeu est moins spectaculaire que Gemini Omni, mais plus quotidien. Si ces fonctions tiennent leurs promesses, l’IA devient une couche de travail permanente : elle organise la boîte mail, transforme les notes, crée des visuels et agit comme assistant de production.

Antigravity 2.0 et les annonces pour développeurs

Google I/O reste une conférence développeurs, et l’édition 2026 a fortement poussé Antigravity 2.0. La plateforme évolue vers un espace de travail où l’on peut orchestrer plusieurs agents autonomes. Google annonce aussi un Antigravity CLI, un SDK, des agents gérés dans l’API Gemini et des intégrations avec Google AI Studio.

L’objectif est de permettre à des agents de coder, tester, migrer, corriger et construire des applications avec moins de friction. Le Developer keynote détaille aussi des outils pour Android et le web : Android CLI stable, Android skills open source, Android Bench, agent de migration vers Kotlin natif, WebMCP, Modern Web Guidance, Chrome DevTools pour agents et HTML-in-Canvas.

Ces annonces montrent une évolution nette : Google ne propose plus seulement des modèles aux développeurs, mais un environnement complet pour déléguer des portions de développement à des agents spécialisés, avec sandboxing, masquage des identifiants et règles Git renforcées.

Le développement logiciel comme premier terrain d’essai

Le codage est l’un des domaines où les agents peuvent être évalués rapidement : un correctif compile ou ne compile pas, un test passe ou échoue, une migration fonctionne ou casse. C’est donc un terrain naturel pour Google, qui peut utiliser Antigravity comme laboratoire de l’IA agentique avant de pousser des agents similaires dans Search, Workspace et Android.

Google AI Ultra : l’IA devient une offre premium

Google a aussi restructuré ses abonnements IA. L’entreprise lance un nouveau plan Google AI Ultra à 100 dollars par mois, destiné aux développeurs, créateurs avancés et travailleurs du savoir, avec des limites d’usage plus élevées, Gemini 3.5 Flash, un accès prioritaire à Antigravity, 20 To de stockage et YouTube Premium. Le plan Ultra supérieur passe de 250 à 200 dollars par mois.

Cette partie commerciale est importante. Elle montre que les fonctionnalités les plus avancées — agents persistants, génération vidéo, limites élevées, outils de développement — ne seront pas seulement des démonstrations gratuites. Google cherche à construire une économie d’abonnement autour de l’IA, avec différents niveaux d’accès selon les besoins.

Lunettes IA et Gemini for Science

Google a aussi donné des nouvelles de ses lunettes intelligentes. Deux directions sont mises en avant : des lunettes audio, qui apportent une aide vocale dans l’oreille, et des lunettes avec affichage, capables de montrer une information au bon moment. Les lunettes audio doivent arriver en premier, plus tard à l’automne.

Dans la recherche scientifique, Gemini for Science regroupe plusieurs expériences autour de l’analyse de littérature, de la génération d’hypothèses et de la découverte computationnelle. Les outils présentés sur Google Labs visent à aider les chercheurs à explorer des articles, extraire des données, produire des synthèses avec citations, générer des pistes de recherche et tester des variations de code ou de modèles.

Cette partie est moins grand public, mais elle est stratégique. Google veut montrer que Gemini n’est pas seulement un produit de consommation : c’est aussi une infrastructure pour la science, le développement logiciel et l’industrie.

Ce que Google I/O 2026 change vraiment

Google I/O 2026 marque une étape parce que les annonces ne sont pas isolées. Elles forment une architecture : des modèles plus rapides, une infrastructure TPU massive, des agents personnels, des agents développeurs, des produits grand public transformés, des outils créatifs et des mécanismes de provenance.

Le risque, pour Google, est la complexité. L’utilisateur devra comprendre la différence entre Gemini app, Gemini Spark, AI Mode, Search agentique, Workspace, Google Pics, Flow, Omni, Antigravity et les abonnements Ultra. Le défi n’est donc pas seulement technologique : il est aussi ergonomique et économique.

Mais la direction est claire. Google veut que l’IA soit moins un outil séparé et davantage une couche active au-dessus de ses produits. Search ne répond plus seulement, il construit. Workspace ne suggère plus seulement, il organise. Gemini ne converse plus seulement, il agit. Les développeurs ne demandent plus seulement du code, ils orchestrent des agents.

Ce qu’il faut retenir

Google I/O 2026 installe Gemini au centre de presque toute la stratégie Google. Gemini 3.5 Flash apporte la vitesse et le coût nécessaires aux agents. Gemini Spark pousse l’agent personnel vers le grand public. Gemini Omni ouvre une nouvelle étape dans la vidéo générative. Search devient plus conversationnel et plus actif. Workspace absorbe l’IA dans les tâches quotidiennes. Antigravity transforme le développement logiciel en terrain d’orchestration d’agents.

Cette édition montre aussi que la course à l’IA ne se joue plus seulement sur le meilleur modèle. Elle se joue sur l’intégration : qui peut déployer l’IA dans les produits existants, à grande échelle, avec une infrastructure suffisante, des garde-fous visibles et un modèle économique viable. Google a profité de I/O 2026 pour répondre : toute sa pile, du TPU au navigateur, est désormais orientée vers cette nouvelle phase.

Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.