Bonjour à tous !
Un petit article sur l’opinion mining / analyse des opinions / des sentiments (bref, toutes les appellations possibles et inimaginables). A travers ce post, je souhaite faire comprendre aux personnes qui sont intéressées par ces domaines que l’analyse des opinions ou des sentiments ne peut (pour l’instant ?) se faire que manuellement pour assurer un maximum de qualité. En effet, aucune machine ou aucun outil peut déterminer la tonalité d’un texte. J’ai travaillé sur ce sujet à plusieurs reprises, testé des outils, développé mes propres outils, et les résultats en sortie étaient toujours assez peu précis.
En revanche, on peut toujours se servir d’un catégoriseur automatique pour faire le premier gros tri parmi les 1000000 contenus rapatriés lors de la collecte. Récemment, j’ai développé un catégoriseur de tonalités, mais je le mentionne une nouvelle fois, un tri à la main est obligatoire.
Pour travailler dans la e-réputation, je pense que les outils peuvent réellement intervenir lors de la fouille d’opinions (opinions mining), dans la collecte des contenus, en fait. Ces outils peuvent être une grande aide pour trouver tous les contenus possibles / existants sur un sujet, mais ensuite l’analyse de ces opinions doivent se faire, en grande partie, à la main. Non seulement, la qualité est assurée, mais en plus vous serez sûr de vous quand vous allez présenter les résultats aux clients.
Bon, je retourne constituer un corpus de tweets 😀
Bon courage !
Véronique Duong