Llenguatge Natural

Un mètode automàtic extrau el significat dels populars emojis

Investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural de la UPF han fet una anàlisi automàtica de 10 milions de missatges de Twitter

El model permet entendre el significat dels emojis i proposa les paraules que es troben més a prop d’un ideograma concret

Redacció Barcelona 20-04-2016 19:28 Lectures 1551
Un mètode automàtic extrau el significat dels populars emojis. EIX

Un mètode automàtic extrau el significat dels populars emojis. EIX

Francesco Barbieri, Francesco Ronzano i Horacio Saggion, investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural (TALN) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, han fet una anàlisi automàtica de 10 milions de missatges de Twitter publicats per usuaris nord-americans i han desenvolupat un mètode per caracteritzar de manera automàtica el significat dels populars emojis. Un treball que presentaran com a comunicació al Language Resource and Evaluation Conference 2016, que se celebrarà del 23 al 28 de maig a Portoroz (Eslovènia).

En els darrers temps, els emojis o ideogrames d’origen japonès s’han popularitzat enormement i han estat publicats abastament en comunicació per web. Inclouen tot un univers de significats que va més enllà de les tradicionals emoticones o símbols gràfics emprats per transmetre estats d’ànim formats habitualment a partir de caràcters ASCII. Els emojis ens permeten descriure objectes, situacions i sentiments fins i tot amb petites imatges, proporcionant una forma visual i ràpida de comunicar-se. D’aquí que els emojis els trobem a les aplicacions dels telèfons intel·ligents, en la misstageria instantània, les xarxes socials, els social media, en els populars Twitter, Facebook, Whatsapp, etc.

Caracteritzar el significat dels ideogrames

Amb l’anàlisi automàtica de 10 milions de missatges de Twitter i el mètode ideat pels investigadors Saggion, Barbieri i Ronzano en el Grup de Recerca TALN es pot caracteritzar de manera automàtica el significat dels emojis,  amb la qual cosa ara es poden comparar els ideogrames “semànticament”, és a dir segons el seu significat.

Per exemple, el mètode és capaç de discernir la proximitat semàntica que hi pot haver entre els emojis ❤ i , o entre els emojis  i  .

A més a més, el model permet entendre el significat dels emojis i proposa les paraules que es troben més a prop d’un ideograma concret. Per exemple, l’emoji ⚽ apunta cap a “soccer”, “futbol” “regionals”, i així successivament. I a l’inrevés,  el mètode desenvolupat per aquests investigadors, a partir d’un determinat text permet suggerir els ideogrames associats més apropiats per complementar i enriquir de manera gràfica el seu significat.

Els nous models desenvolupats s’han contrastat amb experiments de similitud semàntica, “comparant els resultats dels nostres models amb l'avaluació humana, així com també duent a terme una avaluació qualitativa exhaustiva”, han manifestat els autors del treball.

En definitiva, les emoticones i els ideogrames no són només un assumpte d’adolescents en els seus missatges de text, sinó que s’han posicionat com un tipus d’expressió matisada que té la capacitat de traspassar les barreres idiomàtiques.


Eleccions municipals

Temps de voreres aixecades

Miquel Casellas

Uns pressupostos aprovats o amb pròrroga són més que suficients per començar a aixecar voreres i fer petites grans obres principalment al mig de la ciutat perquè la gent vegi que aquell equip de govern que ha de passar la revalida al cap de poc es preocupa per la gent administrada

ENQUESTA WEB

Si no han d'estudiar, ni treballar, ni fer la neteja obligada, ni el temps acompanya per sortir al carrer, ni el "no fer res" és una opció, què t'agrada fer a casa quan tens una estona per a tu?

Quan tens temps lliure a casa, quina és l'activitat de lleure que prefereixes fer?

Llegir
Veure la TV
Cuinar
Fer manualitats
Escriure
Meditar
Jugar
Altres