Estimados lectores, os daría las gracias uno a uno (ya que el blog tiene tan pocas visitas que no me tomaría demasiado tiempo) por haber completado la encuesta que publiqué hace unas semanas. En ella, pedía que se puntuara las novelas del Mundodisco en una escala de 10. Mi objetivo era estudiar en qué medida los sistemas automáticos de análisis de sentimiento arrojaban resultados similares al juicio humano con respecto a "cómo uno se siente al leer una novela".
Para ello, necesitaba obtener los datos de estos sistemas automáticos. Esto no fue difícil, ya que con un poco de programación en Python me apañé con dos de ellos, y el otro es un programa en Windows. Para quien tenga curiosidad, aquí va una brevísima descripción de cada enfoque:
1) Asignar una puntuación a unos sintagmas determinados, dependiendo de el número de veces que aparecen "en la proximidad" de palabras positivas y negativas. Fundamentos teóricos, en el artículo.
2) Existen varios diccionarios de polaridad. Es decir, listas de palabras con una valencia asociada. Utilicé uno de ellos (web de los autores) para simplemente contar cuántas palabras con valencia X aparecían en la novela, luego se sumaba todo, y listo. Aunque este enfoque es súper discutible, luego veremos que no lo es tanto.
3) Sentistrength es un programa desarrollado en la Universidad de Wolverhampton, que puntúa oraciones teniendo en cuenta la carga positiva y negativa que contiene, y teniendo en cuenta ciertas reglas de potenciación y atenuación.
Esperaré a Septiembre para publicar los resultados, ya que no es plan decir por aquí lo que diré en este congreso, pero hay algunas cosas verdaderamente interesantes.
Intentaré grabar la charla, por si sirve de algo.
De nuevo, muchas gracias a todos.