Twitter: fuentes de datos
Recientemente alguien me preguntó cómo obtener datos de Twitter para una investigación. Como pensé que podía servirle a otras personas, aquí mi respuesta.
Hay tres casos, que dependen de la fecha de creación de los tweets que te interesan.
A. Sólo tweets nuevos. En este caso, tienes que usar la API de streaming de Twitter, que permite especificar algunas palabras clave que son usadas para filtrar los nuevos tweets.
B. Tweets de los últimos días. En este caso, tienes que usar la API de búsqueda (search) de Twitter, que permite especificar algunas palabras clave y encontrar los tweets, ordenados por fecha o relevancia, que contienen dichas palabras clave.
C. Tweets más antiguos que 1-2 semanas. En este caso, la única opción es pasar por un proveedor de datos de Twitter, al que se paga por volumen de tweets descargados.
Software para acceder a la API de Twitter:
- Twitter search para Google Spreadsheets es un hack sobre Google Spreadsheets que te permite usar la API de búsqueda y descargar unos pocos cientos de tweets.
- Twitter Libraries contiene enlaces a bibliotecas de software que usan Twitter, en varios lenguakes.
Proveedores de datos de Twitter: GNIP, DataSift.
Imagen: OccupyStream.