Discussion:
[pyar] Análisis de datos con Python de la campaña electoral en Twitter
Matias Benedetto
2017-10-22 23:16:29 UTC
Permalink
Escribí un pequeño análisis de la campaña electoral en Twitter en base a la
recolección y procesamiento de datos cuantitativos que realizé para el
medio donde trabajo.
Es un primer ejercicio en eso de buscar historias detrás de los datos.
Técnicamente lo trabajé con Python, Tweepy, MongoDb, Pymongo y el APi de
Twitter.
Se los dejo:
http://oficiosterrestres.com/como-hacen-campana-en-twitter-los-politicos-argentinos/

Gracias por la ayuda el otro dia con pymongo :D

Saludos!
Matias
Carlos Miguel FARIAS
2017-10-23 11:28:46 UTC
Permalink
Interesante análisis de una red social, pero evidentemente, no existe
correlación con los resultados electorales.
Máxime que las personas que votaron a Cristina no deben ser muy asiduos a
redes sociales.
A pesar de la torpeza del gobierno para manejar ciertos temas, parece que
la gente esta prefiriendo a un bueno por no conocer que a un malo conocido.
Saludos: Miguel, Santa Rosa (LP)

El 22 de octubre de 2017, 20:16, Matias Benedetto <
Post by Matias Benedetto
Escribí un pequeño análisis de la campaña electoral en Twitter en base a
la recolección y procesamiento de datos cuantitativos que realizé para el
medio donde trabajo.
Es un primer ejercicio en eso de buscar historias detrás de los datos.
Técnicamente lo trabajé con Python, Tweepy, MongoDb, Pymongo y el APi de
Twitter.
http://oficiosterrestres.com/como-hacen-campana-en-twitter-
los-politicos-argentinos/
Gracias por la ayuda el otro dia con pymongo :D
Saludos!
Matias
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Fernando FLORES CORCOBA
2017-10-23 11:37:47 UTC
Permalink
buen aporte, muy interesante.
Gracias por compartirlo en el foro.
Saludos, Fernando (CBA)

El 22 de octubre de 2017, 20:16, Matias Benedetto <
Post by Matias Benedetto
Escribí un pequeño análisis de la campaña electoral en Twitter en base a
la recolección y procesamiento de datos cuantitativos que realizé para el
medio donde trabajo.
Es un primer ejercicio en eso de buscar historias detrás de los datos.
Técnicamente lo trabajé con Python, Tweepy, MongoDb, Pymongo y el APi de
Twitter.
http://oficiosterrestres.com/como-hacen-campana-en-twitter-
los-politicos-argentinos/
Gracias por la ayuda el otro dia con pymongo :D
Saludos!
Matias
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
Martín Gaitán
2017-10-23 12:39:17 UTC
Permalink
Post by Matias Benedetto
Escribí un pequeño análisis de la campaña electoral en Twitter en base a
la recolección y procesamiento de datos cuantitativos que realizé para el
medio donde trabajo.
Es un primer ejercicio en eso de buscar historias detrás de los datos.
Técnicamente lo trabajé con Python, Tweepy, MongoDb, Pymongo y el APi de
Twitter.
http://oficiosterrestres.com/como-hacen-campana-en-twitter-
los-politicos-argentinos/
Gracias por la ayuda el otro dia con pymongo :D
Hola Matías, gracias por el aporte, es interesante.

Entiendo de que analizar la "red" sólo haciendo foco en las cuentas de los
candidatos permite deducir algo de la fidelidad de los seguidores/votantes,
pero para nada es conclusivo de "las campañas" de cada espacio. Para esto
es sin dudas necesario hacer un análisis a nivel de grafos y analizar la
generación y flujo de contenido, por ejemplo estudiando la instalación de
tendencias.


Mi sensación (totalmente anticientifico este comentario, disculpas) es que
la campaña de Cambiemos en twitter está tercerizada en cuentas anónimas, en
general de tono sarcástico y provocador, donde abundan los latiguillos.
Evidentemente han sido muy efectivas para la consulidación de un nucleo
duro particularmente "anti-k".

Pablo Celayes, compañero de Open Data Córdoba y a veces activo por acá,
hizo recientemente su tesis de licenciatura sobre clasificacion en grafos
sociales, por ahi te interesa para pegarle una mirada

http://www.famaf.unc.edu.ar/boletin/?p=3509
https://github.com/pablocelayes/sna_classifier

saludos
Matias Benedetto
2017-10-23 18:51:50 UTC
Permalink
Post by Martín Gaitán
Entiendo de que analizar la "red" sólo haciendo foco en las cuentas de los
candidatos permite deducir algo de la fidelidad de los seguidores/votantes,
pero para nada es conclusivo de "las campañas" de cada espacio. Para esto
es sin dudas necesario hacer un análisis a nivel de grafos y analizar la
generación y flujo de contenido, por ejemplo estudiando la instalación de
tendencias.
Si, no tenia pretensiones de exhaustividad el análisis, sino tenia como
objetivo por un lado, producir información para un informe periodístico en
la tele que requiere síntesis extrema y poco complejidad. Y por otro,
introducirme de a poco en el mundo de la recolección y análisis de
volúmenes de datos, que no es lo que generalmente hago ni en lo que tengo
formación, pero me interesa mucho.
Post by Martín Gaitán
Mi sensación (totalmente anticientifico este comentario, disculpas) es que
la campaña de Cambiemos en twitter está tercerizada en cuentas anónimas, en
general de tono sarcástico y provocador, donde abundan los latiguillos.
Evidentemente han sido muy efectivas para la consulidación de un nucleo
duro particularmente "anti-k".
Es buena hipótesis para armar un lindo laburito sobre el tema!
Pablo Celayes, compañero de Open Data Córdoba y a veces activo por acá,
hizo recientemente su tesis de licenciatura sobre clasificacion en grafos
sociales, por ahi te interesa para pegarle una mirada
http://www.famaf.unc.edu.ar/boletin/?p=3509
https://github.com/pablocelayes/sna_classifier
Buenisima data. Me viene joya para investigar. Gracias!
Pablo Gabriel Celayes
2017-10-24 13:22:39 UTC
Permalink
Muy lindo laburo, Mati, y gran ilustración de lo que se puede hacer con
Python en materia de análisis de redes sociales.

Como bien comentaba Martín, he hecho una tesis en estos temas ( sobre la
que estaré contando en la PyCon y la PyData el mes que viene) y me interesa
mucho seguir profundizando en el tema.

En particular, en cuestiones de estructura de red, análisis de influencia,
difusión de mensajes, etc. y también en analizar los contenidos que se
comparten, las temáticas que se generan, y su dinámica.

Para quien quiera experimentar en el tema, tengo algunos sets de datos
interesantes, y algo de código útil perdido en la maraña de cosas que es
ese repo que pasó Martín.

Un abrazo, gracias por compartir!
Post by Martín Gaitán
Entiendo de que analizar la "red" sólo haciendo foco en las cuentas de los
Post by Martín Gaitán
candidatos permite deducir algo de la fidelidad de los seguidores/votantes,
pero para nada es conclusivo de "las campañas" de cada espacio. Para esto
es sin dudas necesario hacer un análisis a nivel de grafos y analizar la
generación y flujo de contenido, por ejemplo estudiando la instalación de
tendencias.
Si, no tenia pretensiones de exhaustividad el análisis, sino tenia como
objetivo por un lado, producir información para un informe periodístico en
la tele que requiere síntesis extrema y poco complejidad. Y por otro,
introducirme de a poco en el mundo de la recolección y análisis de
volúmenes de datos, que no es lo que generalmente hago ni en lo que tengo
formación, pero me interesa mucho.
Post by Martín Gaitán
Mi sensación (totalmente anticientifico este comentario, disculpas) es
que la campaña de Cambiemos en twitter está tercerizada en cuentas
anónimas, en general de tono sarcástico y provocador, donde abundan los
latiguillos. Evidentemente han sido muy efectivas para la consulidación de
un nucleo duro particularmente "anti-k".
Es buena hipótesis para armar un lindo laburito sobre el tema!
Pablo Celayes, compañero de Open Data Córdoba y a veces activo por acá,
hizo recientemente su tesis de licenciatura sobre clasificacion en grafos
sociales, por ahi te interesa para pegarle una mirada
http://www.famaf.unc.edu.ar/boletin/?p=3509
https://github.com/pablocelayes/sna_classifier
Buenisima data. Me viene joya para investigar. Gracias!
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
--
*ıl**l**ıl**l**ı* ρąβℓ๏ *ıllı**lı*
https://www.linkedin.com/in/pablogabrielcelayes
<http://ar.linkedin.com/pub/pablo-celayes/5/535/911/es>
Matias Benedetto
2017-10-24 15:04:55 UTC
Permalink
Se puede leer la tesis en algún lago Pablo?
Diego Mascialino
2017-10-24 15:45:04 UTC
Permalink
El 24 de octubre de 2017, 12:04, Matias Benedetto <
Post by Matias Benedetto
Se puede leer la tesis en algún lago Pablo?
Sí, podes leerla en un lago o en un sillón, donde prefieras ( :P )
está en el linkedin de Pablo:
https://www.linkedin.com/in/pablogabrielcelayes/

La compartió aca:
https://www.dropbox.com/s/vw295rgisv9sdu6/tesisSNA.pdf?dl=0

Saludos
Pablo Gabriel Celayes
2017-10-24 22:26:43 UTC
Permalink
Jjaja, gracias Diego por compartir el link!

Van algunos detalles más sobre los sets de datos:

* Tengo un dataset de 2 meses de tweets de hace dos años, de una selección
de unos 5k usuarios.
Son 2M tweets en total, de los cuales 1.6M están en español.

* Tengo también uno más reciente y más chico, son tweets de marzo/abril de
este año, 163K en total, 109k en español.

En ambos casos tengo además el grafo de seguidores entre los usuarios.

Los tengo una DB SQLite, pesa medio GB el primero y 40MB el otro,
a quien le interese me escribe en privado y se los comparto.


Saludos!
Post by Diego Mascialino
El 24 de octubre de 2017, 12:04, Matias Benedetto <
Post by Matias Benedetto
Se puede leer la tesis en algún lago Pablo?
Sí, podes leerla en un lago o en un sillón, donde prefieras ( :P )
https://www.linkedin.com/in/pablogabrielcelayes/
https://www.dropbox.com/s/vw295rgisv9sdu6/tesisSNA.pdf?dl=0
Saludos
_______________________________________________
Sitio web: http://www.python.org.ar/
Para administrar la lista (o desuscribirse) entrar a
http://listas.python.org.ar/listinfo/pyar
La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
Argentina - http://www.usla.org.ar
--
*ıl**l**ıl**l**ı* ρąβℓ๏ *ıllı**lı*
https://www.linkedin.com/in/pablogabrielcelayes
<http://ar.linkedin.com/pub/pablo-celayes/5/535/911/es>
Loading...