Tech&Co
Vie numérique

Derrière l'assistant vocal de Google, des petites mains pour écouter nos conversations

L'écoute de fragments de conversations permet à Google d'améliorer son assistant vocal.

L'écoute de fragments de conversations permet à Google d'améliorer son assistant vocal. - Google Home/ YouTube

Au même titre qu'Amazon, Google recourt à des micro-travailleurs pour écouter les conversations des utilisateurs de Google Home et faire progresser son assistant vocal.

Google Assistant aurait-il les oreilles qui traînent? L'assistant vocal de Google, intégré aux enceintes connectées Google Home mais aussi dans les smartphones Android, s'en remet à des employés pour s'améliorer et répondre plus précisément aux questions de ses utilisateurs. Et, pour ce faire, des fragments de conversations sont analysés, souligne le média flamand VRT NWS.

VRT s'est essentiellement concentré sur des enregistrements recueillis en Belgique et aux Pays-Bas. En tout, plus d'un millier de fragments d'enregistrements ont pu être écoutés. De quoi permettre à VRT d'être au cœur de disputes entre époux ou d'entendre les plaintes d'une femme visiblement en situation d'urgence. Les échantillons n'étaient néanmoins pas écoutés en direct.

Pour se déclencher et répondre à une requête, Google attend en théorie que soit prononcée la formule "Hey Google". Mais VRT fait remarquer que l'écoute peut être activée par erreur, dès lors que l'enceinte croît reconnaître cette expression. En cas d'enregistrement, Google Home fait apparaître sur son enceinte des points lumineux, pour ne pas prendre son utilisateur au dépourvu. 

Ce que VRT reproche à Google? Le fait de mentionner dans ses conditions d'utilisation que les enregistrements vocaux sont conservés, sans préciser qu'ils puissent être écoutés. Par ailleurs, le média fait remarquer que malgré l'anonymisation des données réalisée par la société, il est parfois possible de remonter la piste des utilisateurs ayant discuté avec Google Assistant. 

En réponse, Google a indiqué auprès de VRT ne transcrire et n'utiliser qu'environ 0,2% de tous les clips audio pour améliorer sa technologie de reconnaissance vocale. Il s'agit essentiellement d'extraits mal compris ou de mots sur lesquels Google Assistant a buté. Ce dernier est actuellement le plus plébiscité en France, devant Siri d'Apple et Alexa d'Amazon, notait un sondage fin mars, mené par OnePoll et Reichelt Electronik.

Toutes ces entreprises, au même titre que Microsoft, pour son assistant vocal Cortana, analysent les enregistrements vocaux pour permettre à leurs logiciels d'avoir une conversation plus fluide et de trouver plus rapidement des réponses aux questions. Mi-avril, une enquête de Bloomberg révélait que des milliers de salariés d'Amazon étaient chargés d'écouter des fragments de conversation avec Alexa. Le tout à raison de neuf heures par jour, pour un millier de courts extraits sonores analysés. Là encore, le média avait relevé des manquements dans l'anonymisation des contenus.

https://twitter.com/Elsa_Trujillo_?s=09 Elsa Trujillo Journaliste BFM Tech