Llenguatge Natural

Un mètode automàtic extrau el significat dels populars emojis

Investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural de la UPF han fet una anàlisi automàtica de 10 milions de missatges de Twitter

El model permet entendre el significat dels emojis i proposa les paraules que es troben més a prop d’un ideograma concret

Un mètode automàtic extrau el significat dels populars emojis. EIX

Un mètode automàtic extrau el significat dels populars emojis. EIX

Dona suport al periodisme local col·laborant amb nosaltres i fes-te’n subscriptor per només 3€ al mes sense permanència.

Francesco Barbieri, Francesco Ronzano i Horacio Saggion, investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural (TALN) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, han fet una anàlisi automàtica de 10 milions de missatges de Twitter publicats per usuaris nord-americans i han desenvolupat un mètode per caracteritzar de manera automàtica el significat dels populars emojis. Un treball que presentaran com a comunicació al Language Resource and Evaluation Conference 2016, que se celebrarà del 23 al 28 de maig a Portoroz (Eslovènia).

En els darrers temps, els emojis o ideogrames d’origen japonès s’han popularitzat enormement i han estat publicats abastament en comunicació per web. Inclouen tot un univers de significats que va més enllà de les tradicionals emoticones o símbols gràfics emprats per transmetre estats d’ànim formats habitualment a partir de caràcters ASCII. Els emojis ens permeten descriure objectes, situacions i sentiments fins i tot amb petites imatges, proporcionant una forma visual i ràpida de comunicar-se. D’aquí que els emojis els trobem a les aplicacions dels telèfons intel·ligents, en la misstageria instantània, les xarxes socials, els social media, en els populars Twitter, Facebook, Whatsapp, etc.

Caracteritzar el significat dels ideogrames

Amb l’anàlisi automàtica de 10 milions de missatges de Twitter i el mètode ideat pels investigadors Saggion, Barbieri i Ronzano en el Grup de Recerca TALN es pot caracteritzar de manera automàtica el significat dels emojis,  amb la qual cosa ara es poden comparar els ideogrames “semànticament”, és a dir segons el seu significat.

Per exemple, el mètode és capaç de discernir la proximitat semàntica que hi pot haver entre els emojis ❤ i , o entre els emojis  i  .

A més a més, el model permet entendre el significat dels emojis i proposa les paraules que es troben més a prop d’un ideograma concret. Per exemple, l’emoji ⚽ apunta cap a “soccer”, “futbol” “regionals”, i així successivament. I a l’inrevés,  el mètode desenvolupat per aquests investigadors, a partir d’un determinat text permet suggerir els ideogrames associats més apropiats per complementar i enriquir de manera gràfica el seu significat.

Els nous models desenvolupats s’han contrastat amb experiments de similitud semàntica, “comparant els resultats dels nostres models amb l'avaluació humana, així com també duent a terme una avaluació qualitativa exhaustiva”, han manifestat els autors del treball.

En definitiva, les emoticones i els ideogrames no són només un assumpte d’adolescents en els seus missatges de text, sinó que s’han posicionat com un tipus d’expressió matisada que té la capacitat de traspassar les barreres idiomàtiques.

El periodisme de proximitat necessita del compromís dels seus lectors per defensar un periodisme més independent, lliure i plural.

Subscriu-te ara!




SUBSCRIU-TE

Dona suport al periodisme local col·laborant amb nosaltres i fes-te’n subscriptor per només 1€ setmanal sense permanència. El periodisme de proximitat necessita del compromís dels seus lectors.

Subscriu-te ara! Al periodisme local