Cet ordinateur peut détecter les tweets sarcastiques
Faire comprendre l'ironie à un ordinateur, cette bête machine qui ne connaît que les 0 et les 1, est une mission complexe. C'est justement ce qui a plu à David Bamman et Noah Smith, chercheurs des universités américaines de Berkeley et de Washington, qui ont travaillé sur un système informatique capable de repérer les messages au second degré sur Twitter.
Les deux hommes ont ainsi développé un algorithme qui analyse non seulement le contenu des messages, mais aussi un grand nombre d'informations contextuelles: qui en est l'auteur, s'il est destiné à quelques amis ou s'il est public, l'historique du twitto... Ils complètent cette analyse de métadonnées par une étude plus classique des mots et expressions utilisés dans le tweet.
La machine a alors été "entraînée" à partir de tweets comprenant le hashtag #sarcasm et petit à petit, grâce au machine learning, a pu progresser.
Et ça marche: lors de sa mise à l’épreuve, le programme a pu reconnaître 85 % des textes sarcastiques alors que seuls 56% des humains réussissent normalement à les détecter.
Avec cet exercice, les chercheurs ont également pu conclure que le sarcasme est bien plus courant chez les hommes que chez les femmes... et surtout que pour comprendre le second degré sur les réseaux sociaux, il faut obligatoirement avoir des éléments contextuels.
Ils réfléchissent désormais à de futurs développements de leurs recherches pour, pourquoi pas, commercialiser leur outil. Il pourrait ainsi servir à mieux filtrer les contenus en distinguant les propos au premier degré et les pointes d’humour.
a lire aussi