There are *no* inconsistencies in the Discworld books; ocassionally,
however, there are alternate pasts. (Sir Terry Pratchett, alt.fan.pratchett)

El trabajo en Sentiment Analysis verá la luz en Septiembre




Estimados lectores, os daría las gracias uno a uno (ya que el blog tiene tan pocas visitas que no me tomaría demasiado tiempo) por haber completado la encuesta que publiqué hace unas semanas. En ella, pedía que se puntuara las novelas del Mundodisco en una escala de 10. Mi objetivo era estudiar en qué medida los sistemas automáticos de análisis de sentimiento arrojaban resultados similares al juicio humano con respecto a "cómo uno se siente al leer una novela".

Para ello, necesitaba obtener los datos de estos sistemas automáticos. Esto no fue difícil, ya que con un poco de programación en Python me apañé con dos de ellos, y el otro es un programa en Windows. Para quien tenga curiosidad, aquí va una brevísima descripción de cada enfoque:

1) Asignar una puntuación a unos sintagmas determinados, dependiendo de el número de veces que aparecen "en la proximidad" de palabras positivas y negativas. Fundamentos teóricos, en el artículo.

2) Existen varios diccionarios de polaridad. Es decir, listas de palabras con una valencia asociada. Utilicé uno de ellos (web de los autores) para simplemente contar cuántas palabras con valencia X aparecían en la novela, luego se sumaba todo, y listo. Aunque este enfoque es súper discutible, luego veremos que no lo es tanto.

3) Sentistrength es un programa desarrollado en la Universidad de Wolverhampton, que puntúa oraciones teniendo en cuenta la carga positiva y negativa que contiene, y teniendo en cuenta ciertas reglas de potenciación y atenuación.

Esperaré a Septiembre para publicar los resultados, ya que no es plan decir por aquí lo que diré en este congreso, pero hay algunas cosas verdaderamente interesantes.

Intentaré grabar la charla, por si sirve de algo.

De nuevo, muchas gracias a todos.

3 comentarios:

Bocabuscabuque dijo...

Hola:

En realidad éste no es un comentario a la entrada, pero es que ésta es la última y no sé dónde escribir la pregunta, que es la siguente... por casualidad, ¿sabes dónde puedo encontrar un listado completo de los nombres propios de personas y lugares que aparecen Mundodisco? Pero que sea versión española con su equivalente en versión original.
Lo he buscado pero no encuentro. Sí, a parte de en Google ya he mirado en la Wikipedia, y tiene demasiadas ausencias.

Garacias.

Saludos.

Jose Ramon Santana Vazquez dijo...

...traigo
ecos
de
la
tarde
callada
en
la
mano
y
una
vela
de
mi
corazón
para
invitarte
y
darte
este
alma
que
viene
para
compartir
contigo
tu
bello
blog
con
un
ramillete
de
oro
y
claveles
dentro...


desde mis
HORAS ROTAS
Y AULA DE PAZ


COMPARTIENDO ILUSION


CON saludos de la luna al
reflejarse en el mar de la
poesía...




ESPERO SEAN DE VUESTRO AGRADO EL POST POETIZADO DE EXCALIBUR, DJANGO, MASTER AND COMMANDER, LEYENDAS DE PASIÓN, BAILANDO CON LOBOS, THE ARTIST, TITANIC…

José
Ramón...


Anónimo dijo...

Hola torredelarte, me enteresaria saber mas sobre este trabajo. Donde puedo encontrar el articulo?

Publicar un comentario

 
|  La torre del arte. Blogger Template By Lawnydesignz Powered by Blogger