Suite au dernier événement du 8 février 2023, dans les locaux de Google à Paris, Prabhakar Raghavan, responsable des produits Google Search, Assistant, Geo, Ads, Commerce et Payments a annoncé les détails de la mise en œuvre de l’intelligence artificielle (IA) dans les produits Google.
Evénement jugé en demi-teinte, les révélations tant attendues sur Bard et autres nouveautés ont vraisemblablement laissé une partie de la communauté SEO sur sa faim.
Peut-être avons-nous aussi oublié de prendre la mesure de toutes les avancées technologiques déjà réalisées depuis la naissance du géant californien. Explications.
Un événement parisien en demi-teinte
De nombreux experts s’attendaient à une présentation et à une démonstration plus approfondies de Bard, mais le vice-président senior de chez Google a semble-t-il préféré présenter plusieurs améliorations apportées et déjà connues des produits majoritairement alimentés par l’IA.
En effet, la majorité ayant déjà été présentée lors du Search On 2022 et du Keynote Google I/O de 2022.
Bard n’a été que très peu évoqué lors de l’événement, alors que beaucoup d’entre nous retenaient leur souffle. Cependant, l’accent de ce « mini événement » a réaffirmé que l’IA alimenterait notre avenir et démontré que l’intelligence artificielle (IA) était désormais indispensable pour répondre aux objectifs du géant californien : rendre ses produits toujours aussi utiles que possible à chaque instant grâce à une recherche « naturelle et intuitive« .
Google live from Paris : des actualités plutôt que des révélations
La firme de la Mountain View a dévoilé quelques mises à jour mineures et annoncé que diverses fonctionnalités seraient bientôt disponibles sur plusieurs applications : Google Lens, Google Translate et Google Maps notamment.
Bien qu’il ne s’agisse pas de la grande annonce à laquelle beaucoup de personnes s’attendaient, elle a donné un aperçu des évolutions ou mises à jour à venir. Peut-être nous sommes-nous habitués à trop en attendre ou à vouloir trop en savoir… Pour ceux qui n’ont pas déjà pris le train en marche, voici ce qu’il faut retenir.
Les produits mis en avant lors de l’événement comportent 3 volets principaux orchestrés et entrecoupés d’interventions de Prabhakar Raghavan :
- « Understanding information » avec Liz Reid.
- « Exploring the real word » avec Christopher Philips.
- « Unlocking creativity » expliquée par Marzia Niccolai.
L’ère de la recherche visuelle est là
Avec l’IA en tête, le géant californien cherche à « rendre la recherche plus naturelle et plus intuitive« , comme l’a déclaré Sundar Pichaï lors du Google I/O en 2022.
La recherche multiple et multimodale ouvrent la voie à cet avenir centré sur le mobile first et désormais l’IA first. Comme le mentionne le vice-président senior, la recherche visuelle est là : votre « téléphone est en phase de devenir votre nouveau clavier ».
Google Lens : utilisé plus de 10 milliards de fois chaque mois !
Google Lens vous fournit des informations provenant de différentes verticales du moteur de recherche – Google Images, Google Maps, Google Shopping, Google Books – en analysant une seule image.
Lens, nouvelle verticale de Google Search
Grâce à l’utilisation de plusieurs algorithmes combinés entre eux, Lens exécute des opérations basées sur un processus d’apprentissage spécifique, de la même manière que les humains perçoivent les images.
Google Lens utilise de puissantes techniques d’apprentissage automatique (ML) et d’apprentissage profond (DL) pour soutenir son apprentissage, sa classification et ses résultats.
Ces méthodes, transversales à l’intelligence artificielle (IA), sont utilisées pour alimenter les performances de Google Lens. Pour en savoir plus sur le fonctionnement de Google Lens, lisez nos articles dans le magazine Réacteur d’Olivier Andrieu.
Votre téléphone devient votre nouveau clavier
Rendre l’information accessible à tous
La façon dont nous effectuons nos recherches évolue.
Au lieu de devoir formuler une requête, nous pouvons obtenir des résultats sans avoir à les exprimer en texte. Pour les personnes illettrées, aveugles ou dyslexiques, une application comme Google Lens facilite leur vie quotidienne, c’est indéniable.
Une IA responsable et générative
A défaut de mettre l’accent sur Bard, le live parisien a préféré parler d’IA responsable et générative (avec NORA). Le but étant de « fournir des informations de haute qualité et d’améliorer la vie des gens du monde entier, en s’engageant à établir des normes élevées sur la manière de les apporter, à la fois audacieuse et responsable », dixit Prabhakar Raghavan.
En effet, celle-ci est désormais capable d’interpréter plusieurs langues (133 langues dans Google Translate), de coupler les images au texte et de rendre les résultats de recherche locaux immersifs ou en réalité augmentée.
NORA : No One Right Answer
NORA de Google, technologie d’IA générative, fournit aux utilisateurs des réponses aux questions qui n’ont pas de réponse définitive. La technologie utilisée propose donc des choix à l’utilisateur. Les réponses de l’IA générative offrent ainsi à l’utilisateur plusieurs options parmi lesquelles il peut choisir.
La réalité augmentée déployée bientôt partout dans le monde
Quant à la réalité augmentée, l’immersion et autres nouveautés visuelles et interactives de Google Maps, elles arrivent à grands pas dans de nombreuses villes du monde. Déjà mises en avant lors du Search On et du Keynote I/O de 2022, ces nouveautés, en version beta à Paris, Londres, New York, San Francisco, Los Angeles et Tokyo, arrivent à Barcelone, Dublin et Madrid.
Multisearch : la nouvelle manière d’effectuer nos recherches visuelles
De nouvelles façons de vous exprimer deviennent possibles grâce à la recherche multiple – désormais disponible dans le monde entier sur tous les téléphones mobiles avec Google Lens.
Effectuez des recherches à partir d’images couplées avec du texte simultanément, c’est quelquepart ouvrir un nouveau monde de possibilités.
Multisearch est, de plus, disponible dans toutes les langues proposées par Google.
Cette fonctionnalité sera, elle-aussi, bientôt déployée dans le monde entier.
Google Maps : réalité augmentée (RA) et immersion assurées
Google priorise la recherche locale, c’est indéniable. Les nouveautés déjà proposées lors du Search On 2022 sont actualisées et remises en avant au Google Live from Paris.
Parmi elles, Immersive View, Search With Live View, Indoor Live View et Multisearch near me.
De nouvelles typologies de recherche locale
Désormais, le géant californien vous permet, depuis votre écran, de :
- Plonger dans un monde pour découvrir et voyager avec Immersive View.
- Connaître l’environnement et les ressources dans un aéroport, une gare ou un centre commercial avec Indoor Live View.
- Vivre la réalité en RA (Réalité Augmentée) avec Search with Live View.
- Coupler le texte à l’image pour obtenir des réponses locales : MultiSearch Near me.
La version multisearch near me étant en version beta en France, contrairement aux USA.
Elle devrait être déployée en France dans les prochains mois de l’année 2023.
Immersive View : un monde qui prend vie
Grâce aux progrès de la vision par ordinateur et de l’IA, des milliards d’images issues de Street View et aériennes sont fusionnées pour créer un monde numérique plus riche.
Une toute nouvelle façon d’explorer des lieux voit le jour avec Google Maps. Grâce à la nouvelle vue immersive, vous pouvez découvrir à quoi ressemble un quartier, un point de repère, un restaurant ou un lieu populaire – et même avoir l’impression d’y être avant même d’y avoir mis les pieds.
La vue immersive vous permet d’explorer et de comprendre l’ambiance d’un lieu, que ce soit sur le moment ou avant de partir, de programmer un voyage ou de connaître la météo lors de votre séjour.
Voici les explications de la vue immersive par Chris Phillips, vice-président et directeur général, Géo : « Pour créer ces scènes réalistes, nous utilisons des champs de rayonnement neuronal (NeRF), une technique d’IA avancée, qui transforme des images ordinaires en représentations 3D. Avec NeRF, nous pouvons recréer avec précision le contexte complet d’un lieu, y compris son éclairage, la texture des matériaux et ce qu’il y a en arrière-plan. Tout cela vous permet de voir si l’éclairage tamisé d’un bar est la bonne ambiance pour un rendez-vous galant ou si la vue d’un café en fait l’endroit idéal pour un déjeuner entre amis », source Google Keywords 08 02 2023.
Search with Live View : la recherche en réalité augmentée dans Google Maps
Datant de 2019, le mode Live View de 2023 vous permet de naviguer en réalité augmentée (AR).
Beaucoup plus performant que son prédecesseur, Search with Live View utilise la localisation globale combinant le service de positionnement visuel (VPS), Street View, et la vision par ordinateur.
Voici l’exemple donné par Google : « Imaginons que vous êtes en ville, dans le deuxième arrondissement de Paris et que vous ayez besoin de trouver un café. Grâce à Live view, il suffit de lever votre téléphone et de lancer la recherche. Vous pouvez voir si autour de vous, des cafés sont ouverts, fréquentés et quelles notes (sur leur fiche Google my Business) ils possèdent ».
Indoor Live View
Indoor Live View facilitera votre navigation dans des endroits comme les aéroports, les gares et les centres commerciaux grâce à la réalité augmentée.
Celle-ci, grâce à des flèches vous indique les ascenceurs, les endroits pour récupérer vos bagages, etc…Cette fonctionalité est à venir les prochains mois dans de nombreuses capitales possédant des aéroports, centres commerciaux ou gares ferroviaires.
Multisearch near me
Multisearch near me vous offre la possibilité d’effectuer une recherche en couplant des images et du texte et d’ajouter une requête locale.
Avec cette nouvelle fonctionnalité, en plus d’identifier un plat servi dans un restaurant (mais aussi un logo d’un banque, d’une mutuelle, d’une enseigne de cuisiniste…), Multisearch near me vous indiquera le restaurant, la banque, et autre prestataire de service, le plus proche de votre position géographique. C’est dire l’importance du référencement local, déjà en cours et à venir.
Comment fonctionne multisearch near me ?
Bien que tout cela semble simple, cette future fonctionnalité repose sur la recherche multimodale. Voici comment les algorithmes procèdent pour trouver un plat à proximité de chez vous ou de votre position géographique :
- Google identifie les spécificités et les subtilités visuelles contenues dans l’image notamment grâce à Google Cloud Vision : OCR, Landmark detection, logo detection et détection d’objets.
- Votre recherche visuelle est associée à votre intention de recherche locale (celle de manger le plat dans un restaurant, celle de trouver une banque, un guichet…).
- Google pioche dans son index, analyse des millions d’images et d’avis publiés sur les pages web (contribution des « Google local guides » notamment).
- Google répond à votre intention et vous donne des résultats sur des restaurants à proximité, un guichet de banque ou encore une enseigne commerciale.
Google maps Built-in pour les véhicules électriques
Pour les véhicules électriques équipés de Google maps, vous avez la possibilité de :
- Ajouter une pause recharge pour des trajets plus courts.
- Filtrer et trouver les bornes de recharges rapides.
- Trouver les bornes de recharge dans vos trajets.
L’IA au service de l’humanité ?
Dans le dernier volet de cette conférence, les acteurs de la société Alphabet ont tenté de montrer comment l’IA pouvait servir à sauvergarder le patrimoine culturel ou à le mettre encore plus en avant.
Préserver l’histoire visuelle et la nature
Un point qui, selon nous, aurait dû être mis en exergue. Expliquer comment l’apprentissage automatique et l’intelligence artificielle contribuent à sauvegarder la mémoire visuelle de l’humanité : archivage massif de photos et d’articles, identification des objets, des lieux et des images grâce à l’API Cloud Vision avec logo detection et landmark detection notamment.
En effet, l’API Cloud Vision aider à traiter, stocker et lire les images mais aussi le texte et autres informations qu’elles contiennent (grâce à OCR detection).
Quant à la sauvegarde des espèces menacées et à la lutte contre le réchauffement climatique, la société Alphabet y contribue, elle aussi, quotidiennement.
Deux articles à lire sur le blog Google Cloud :
- Classificateurs côtiers : utiliser AutoML Vision pour évaluer et suivre les changements environnementaux.
- Zoological Society of London : Prendre le pouls de la planète avec AutoML.
Le géant du Search n’a pas perdu la bataille, seulement le premier round
Même si le Google Live from Paris est jugé par certains comme « moment éclair », de « décevant » ou de « déjà vu », la société Alphabet priorise l’IA majoritairement au service de la recherche. Bien sûr, beaucoup attendaient que Google sonne le glas avec BARD pour contrer Bing et chat GPT, le robot conversationnel d’OpenAI. Ce ne fut pas le cas, le géant du Search n’a pas pour autant perdu la bataille, seulement le premier round…
Dans l’attente d’un prochain « live from Paris » avec de nouvelles révélations toujours plus prometteuses, il semble nécessaire de prendre du recul et de mesurer, avec un peu d’humilité, les avancées titanesques du géant californien réalisées depuis 1998.