Herramientas para el análisis de redes sociales

AdjuntoTamaño
File sna.tar400 KB

Siguiendo en la línea de Pooka (Alejandro Miranda), cuando nos mostró el Diagrama de la Red Social del IRC, generado por el Bot PieSpy, seguidamente les menciono una serie de herramientas basadas en Software Libre para el Análisis de Redes Sociales (SNA por sus siglas en Inglés):
1) Agna (Descarga: http://mac.softpedia.com/progDownload/AGNA-Download-47086.html).
- Descripción: Es una pequeña (700 KB aprox.), pero muy poderosa aplicación Java multiplataforma, diseñada para el análisis de redes sociales, sociometría y análisis secuencial.
Este software puede ayudar en el estudio de las relaciones de comunicación en grupo, las relaciones de parentesco o de la estructura del comportamiento humano o animal - para mencionar sólo unos pocos ámbitos en los que se puede utilizar.
Agna permite crear, editar, analizar, almacenar y visualizar las redes. Agna también permite crear redes a partir de la conducta detectada en las cadenas.
El análisis de redes (o análisis de redes sociales, Social Network Analisys en Inglés) es un conjunto de métodos matemáticos utilizados en la psicología social, la sociología, la etología, y antropología. Esta metodología asume que la forma en que los miembros de un grupo pueden comunicarse entre sí afecta a algunas propiedades importantes de ese grupo ( tales como el rendimiento, el liderazgo, la satisfacción del trabajo, etc)

- Uso. Una vez creada la matriz social (sociomatrix) que consiste en una matriz con tantas columnas y filas como usuarios se estén analizando, Ej. 10 x 10 en las imágenes adjuntas, donde se especifica el número de contactos que han tenido mediante herramientas sociales como Foros. Esta información puede extraerse de los registros de entornos virtuales de aprendizaje (Moodle, BB, etc.) y Agna se encarga de generar la topología de la red y un número importante de análisis matemáticos y estadísticos (excentricidad, densidad, promedios, desviación estándard, etc.).
Pueden ver la red y su análisis en
http://cid-b26cf91e2cc792c0.skydrive.live.com/browse.aspx/EDUSOL%202009?...

2) Moodle Forum SNA
- Descripción: Moodle Forum Social Network Analisys (SNA) es una herramienta en línea que permite hacer un SNA de los Foros de Moodle. Más información: http://research.uow.edu.au/learningnetworks/seeing/snapp/index.html
- Uso. La herramienta de análisis se añade a la lista de favoritos en IE o FireFox. Se ingresa al Foro Moodle y simplemente se pulsa el vínculo de la herramienta, la cual realiza el análisis mostrado en las imágenes (http://cid-b26cf91e2cc792c0.skydrive.live.com/browse.aspx/EDUSOL%202009?...). Moodle Forum SNA genera, además, un archivo GraphML (también incluido en el vínculo previo) y otro .VNA. El primero se puede visualizar mediante yED, tal y como se ejemplifica con el archivo GraphML-test.jpg (Descarga de yED: http://www.yworks.com/en/products_yed_about.html). Y el segundo con NetDraw. Así se puede graficar la topología de la red, de manera parecida a como lo realiza PieSpy en los IRCs.

Espero les sea de interés y utilidad. Saludos!

Nota: Las imágenes en referencia se adjuntan comprimidas, junto con el archivo .graphml que puede ser visualizado con yED.

Comentarios

Imagen de svalaerrubio

archivo.Ha sido todo un detalle el darlo.Saludos y hasta pronto

Imagen de psilab

Que interesante es lo que cuentas. El otro día platicaba con mi director de tésis acerca de la proyección clásica de los LMS, "sólo para el uso, no para la investigación", en el sentido de que la plataforma por si misma no te proporciona los medios necesarios para el análisis profundo de la información. En moodle por ejemplo hay muchísima información implícita dentro de las profundidades del esquema de la base de datos de moodle. Para lo que debemos de entender cual es la arquitectura de la información en esta para poder hacer inferencias más complejas.

Usarlo para análisis de interacciones en una red social es una de ellas, y la ventaja es que según yo el módulo extrae la información de donde debe y hace los calculos necesarios sin necesidad de que andes destripando la base de datos para localizar los cúmulos de información significativa.

Bien....aun así, hay muchísimas posibilidades al destripar la base de datos, estaba leyendo un articulo sobre minería de datos en moodle que decía que "Se toman desiciones en base a resultados, no en base a hipótesis".
http://sci2s.ugr.es/keel/pdf/specific/articulo/CAE-VersionFinal.pdf

Mi misión como padawan es asaltar los conocimientos del buen pooka para aprender sus secretos respecto al análisis de datos y redes sociales jeje.

Imagen de pooka

Y ¿dónde esta AGNA?

Estaba dispuestos probar AGNA, entre al enlace proporcionado y es un sitio de descargar (en general nunca bajo cosas de ahí). Me puse a buscar el sitio "oficial" del paquete y lo que veo es que tenía casa en Geocities, con el pequeño detalle de que dejó de existir hace poco.

Supongo entonces que hace rato que AGNA no tiene mantenimiento, así que quedo con pajek, que corre de lo lindo con wine, aunque en el laboratorio de redes de la UNAM me recomiendan siempre UCINET, pero como es DEMO. nunca lo he instalado.

Imagen de larrylugo

Mi intención fue mostrar a la comunidad herramientas fáciles de manejar, ligeras (poca demanada de recursos), libres, pero con un poder de análisis decente, a modo de introducción.
Entiendo que el sitio original de Agna fue reemplazado por un Wiki, pero lo colgaré en mi Skydrive. En todo caso, la utilidad de Agna es que puedes generar la "sociomatrix" a partir de registros (algo tedioso, pero un buen comienzo para estudiar las relaciones sociales en Foros, IRCs, etc.), con un programa multiplataforma y de menos de 1 MB, con una interfaz gráfica sencilla. Como bien destaca "psilab", profundizar en el análisis de las interacciones sociales es una tarea pendiente, y comenzar con herramientas de fácil manejo podría estimular este tipo de estudios. Hay programas muy poderosos como el que mencionas, entre decenas más (Network WorkBench, etc. citados en un artículo que también subí a SkyDrive), pero que entiendo se usan para redes grandes y complejas. En mi nota hablo de analizar Foros, lo que probablemente no requiera tanto poder informático.
SocNetV (Social Network Visualizer) es otra herramienta que viene empaquetada para Suse, Debian, Mandriva, Ubuntu y otros, de menos de 500 Kb y que tiene una sorpresita: Un Web Crawler!
Puedes ver más en http://socnetv.sourceforge.net/, y en mi SkyDrive también publiqué un PDF con lo que el Crawler produjo al analizar el log del Bot de Edusol. Los datos recopilados por el Crawler permiten construir, además, la sociomatrix automáticamente. SocNetV puede importar archivos de Pajek, graphML, entre otros y también hace análisis de densidad, proximidad, etc. de forma gráfica y numérica.
My Skydrive: http://cid-b26cf91e2cc792c0.skydrive.live.com/browse.aspx/EDUSOL%202009
Saludos y mi reconocimiento a ti y al resto de nuestros anfitriones por otro año de logros para la comunidad de Edusol!

Imagen de pooka

Divertido la arañaweb de SocNetV... pero la gráfica que genera dice poco de la actividad en el sitio.

Por que veo en varios de los ejercicios que me aventé el domingo, va representando los vínculos entre paginas en el sitio. Y ¿eso es de alguna utilidad?. Pues en otros contextos seguro y si, pero en este no dice más que tenemos una tremenda información :D, pero nos habla nulamente del la interacción entre nosotros.

También me dediqué un rato a probar la herramienta Ajax, para el análisis de los foros en Moodle: Te ahorra bastante en la cuenta de respuestas, pero me agrada más la solución que hemos leído [bib]6506[/bib] a uno de nuestros ponentes en el encuentro, pro que el cálculo lo hace desde un modulo y no como un servicio externo.

Ya sabes, esta idea de depender lo menos de terceros :)

Reportando desde la virtualidad

Imagen de larrylugo

Gracias por tu tiempo para evaluar las herramientas. Supongo que si las páginas de los Blogs tienen conexiones entre ellas, la Araña las registra. Por otro lado, los archivos .graphml (entre otros) generados por Moodle Forum SNA pueden ser vistos y analizados con SocNetV, que tiene más poder de análisis que yED.
No tengo claro si la herramienta de Lázaro Tio Torrente es libre, porque menciona que fue desarrollada con Windows. También funciona de forma remota, al igual que Moodle Forum SNA, pero sin duda el trabajo de Tio y su grupo es una excelente integración de varias herramientas, según se desprende de su ponencia, además de ser gráficamente atractiva.
Conoces el vínculo de descarga? En el artículo no lo indica.

Imagen de pooka

Al menos eso indico a pregunta de un par de dictaminadores de la ponencia, ahora habrá que escribirle para solicitar la libere.

Imagen de ltio

Gracias pooka y larrylugo. La herramienta es libre. Se implementó sobre la plataforma Windows pero se utilizaron herramientas de Open-Soft como lo son: Apache, Php, Javascript y Mysql,

Saludos.
LTio....

Imagen de pooka

Y ¿desde dónde la bajamos?

Imagen de larrylugo

Si las topologías de las redes sociales generadas a partir del IRC no arrojan la información deseada, el análisis de los logs de las charlas podrían complementarse con:
* Herramienta 1: Rainbow. Software libre para la clasificación estadística de texto (http://www.cs.cmu.edu/~mccallum/bow/rainbow/) en dos pasos: (i) lee los documentos y genera un modelo, (ii) a partir del cual realiza los análisis estadísticos basándose en los métodos Naive Bayes, k-nearest neighbor, TFIDF, y probabilistic indexing, con los que es posible saber:
- Palabras con promedios más altos de información mutua.
Ej.:
0.09381 linux
0.09003 god
0.07900 dod
0.07700 government
0.06609 team
0.06570 game
0.06448 people
0.06323 car
0.06171 bike
0.05609 hockey
- Palabras por probabilidad
Ej.:
god 0.05026782
people 0.64977338
government 0.24062629
car 0.03502266
game 0.00412031
team 0.01030078
bike 0.00041203
dod 0.00041203
hockey 0.00123609
linux 0.00782859
- Clases, total de ocurrencia de los términos y probabilidad.
Ej.:
2 / 125039 ( 0.00002) alt.atheism
6 / 119511 ( 0.00005) comp.graphics
5 / 91147 ( 0.00005) comp.os.ms-windows.misc
1 / 71002 ( 0.00001) comp.sys.mac.hardware
12 / 131120 ( 0.00009) comp.windows.x
15 / 62130 ( 0.00024) misc.forsale
- Matriz de presencia/ausencia
Ej.:
~/20_newsgroups/alt.atheism/53366 alt.atheism 1 1 0 0 0 0 0 0 0 0
~/20_newsgroups/alt.atheism/53367 alt.atheism 0 0 0 0 0 0 0 0 0 0
~/20_newsgroups/alt.atheism/51247 alt.atheism 1 0 0 0 0 0 0 0 0 0
~/20_newsgroups/alt.atheism/51248 alt.atheism 0 0 0 0 0 0 0 0 0 0
- Otros.

* Herramienta 2: Weka.Software libre para minería de datos basado en Java (http://www.cs.waikato.ac.nz/~ml/weka/)
Este es un campo esotérico para mi, por lo que los comentarios se los dejo a los expertos.
Saludos!

Imagen de pooka

Pues he intentado darme un clavado en el uso de Rainbow, pero su ayuda es poco clara :/.. ¿algún tutorial que recomiendes para introducirse en su uso?