¿Se puede predecir si un tuit será trending topic?

Una investigación de la UNC determinó que es posible. Solo se deben analizar los retuiteos dentro de la hora posterior a su publicación

Twitter tiene 353 millones de usuarias y usuarios activos en el mundo. Sus publicaciones tienen formato de titular y se leen rápido. Cuando a alguien que utiliza esta red social le gusta el tuit de un tercero, puede recuperarlo y publicarlo en su propia cuenta y ese “retuiteo” se toma como medida del interés que despierta un mensaje.

Cuanto más retuiteos reciba un posteo, mayor será su popularidad. En ocasiones, puede convertirse en tendencia (“trending topic”) y ubicarse entre los principales temas de conversación en Twitter.

Con el propósito de predecir en el menor tiempo posible qué tuits serán populares, Emanuel Meriles realizó su tesis de grado con el grupo de Análisis y Procesamiento de Grandes Redes Sociales y Semánticas de la Facultad de Matemática, Astronomía, Física y Computación (FaMAF), de la Universidad Nacional de Córdoba.

En 2017, ese equipo generó un modelo capaz de predecir cuándo un tuit sería reposteado por un usuario particular, con una efectividad del 87%. El modelo ignoraba el contenido del posteo y solo se basaba en el comportamiento del usuario y sus contactos.

Un año más tarde, otra publicación del grupo demostró cómo las personas “influencers” son decisivas para definir si una publicación será o no popular, nuevamente de manera independiente de su contenido.

En este nuevo trabajo, realizado en 2020 por Emanuel Meriles, bajo la dirección de Martín Domínguez y Pablo Celayes, se incluyó la dimensión del tiempo: querían saber cuál es el menor lapso que debe considerarse para predecir de manera fiable si un tuit será tendencia.

Para ello, analizaron 9,5 millones de tuits –publicados entre septiembre y octubre de 2018–, y trabajaron con un conjunto inicial de 5589 usuarias y usuarios, que finalmente quedó reducido a 3911 tras eliminar a quienes permanecían en inactividad.

Concluyeron que, si solo se analizan las conexiones sociales entre las personas usuarias, la primera hora de actividad de un tuit permite saber, con un 70% de efectividad, si ese posteo será popular. Si en cambio se evalúa el comportamiento de influencers, el tiempo necesario se extiende a 90 minutos. Finalmente, si también se analiza el contenido de la publicación, la misma performance se consigue antes, entre 30 y 60 minutos.

“El análisis de contenido hace referencia a un conjunto de técnicas de aprendizaje automático aplicadas al procesamiento del lenguaje natural (o sea el lenguaje coloquial). Lo que se hace es aplicar esas técnicas para hacer de palabras, oraciones o, como es nuestro caso, publicaciones de Twitter, vectores de números reales, para luego procesarlos matemáticamente o con fines predictivos”, explica Meriles.

En consonancia con publicaciones anteriores, el trabajo muestra que sigue siendo más importante la lista de contactos que el contenido del mensaje para predecir la popularidad de un tuit. Sin embargo, al combinar ambos insumos, los resultados se potencian.

“La importancia de este último trabajo es que ahora se puede saber cuánto tiempo se tiene que analizar un tuit para predecir si va a ser popular o no. Esto es muy importante para medir el impacto de ciertos mensajes y la diseminación de noticias. A partir de saber qué discursos se van a convertir en populares, podríamos anticiparnos haciendo contranarrativas para frenar el avance de información falsa, por ejemplo”, explica Domínguez.

 
© 1997 - 2019 Todos los derechos reservados. Diseñado y desarrollado por HoyDia.com.ar