miércoles, septiembre 30, 2015

Extracción y tratamiento de datos en línea

Gracias a twitter he llegado a esta presentación en diapositivas que creo que merece la pena ser enlazada. La extracción y tratamiento de datos con algunas herramientas que para mi eran desconocidas. Sobre todo a partir del cierre de Yahoo Pipes!!



Esta herramienta me ha parecido muy interesante para extraer de las webs solo los datos que te interesan. Es relativamente fácil de usar, ya que requiere sólo que identifiques partes de la página de la que queremos lograr los datos. Posteriormente los puedes recurperar en una excel.


Otra herramienta que desconocia es kimono. Que tambien es para la recuperacion de datos. Esta todavia no la ha mirado en profundidad. Los formatos de salida son JSON, CSV o RSS. Es bastante simple y luego los importas de forma dinámica en una hoja de cálculo, por ejemplo. Como import.io, la herramienta es aún limitada. Y como vemos aun es una beta. Pero promete.....

Dejo aquí de todas formas la publicación que os comento.

Extraire et trier des données en ligne 2015
Autor: Erwan Tanguy (@erwan_t)