Ir al contenido principal

Extracción y tratamiento de datos en línea

Gracias a twitter he llegado a esta presentación en diapositivas que creo que merece la pena ser enlazada. La extracción y tratamiento de datos con algunas herramientas que para mi eran desconocidas. Sobre todo a partir del cierre de Yahoo Pipes!!



Esta herramienta me ha parecido muy interesante para extraer de las webs solo los datos que te interesan. Es relativamente fácil de usar, ya que requiere sólo que identifiques partes de la página de la que queremos lograr los datos. Posteriormente los puedes recurperar en una excel.


Otra herramienta que desconocia es kimono. Que tambien es para la recuperacion de datos. Esta todavia no la ha mirado en profundidad. Los formatos de salida son JSON, CSV o RSS. Es bastante simple y luego los importas de forma dinámica en una hoja de cálculo, por ejemplo. Como import.io, la herramienta es aún limitada. Y como vemos aun es una beta. Pero promete.....

Dejo aquí de todas formas la publicación que os comento.

Extraire et trier des données en ligne 2015
Autor: Erwan Tanguy (@erwan_t)


Comentarios

Entradas populares de este blog

El paso del tiempo en #VTIC

A lo largo de los años, y basándome en mi experiencia, hay cambios en las empresas que trastocan tu manera de organizar la Vigilancia Tecnológica. Los departamentos de IC-VT que llevan años establecidos, van evolucionando poco a poco con la empresa. Pero a veces, se genera un cambio tan radical dentro de ella (fusión, compra, venta, cambio de gerencia...) que de repente te das cuenta que la organización que tenias ya no es operativa. Han cambiado departamentos, personas con poder de decisión, se han unido áreas, otras han desaparecido...Y aunque tu mientras tanto, sigues realizando las mismas labores que antes, hay un punto donde ves que ya no funcionan.

Es es momento de replantearte la organización y los flujos de información de tu sistema. Y lo mejor es empezar desde el principio. Bueno, realmente, principio no es, porque ya partes de una experiencia que hace años no tenias.

¿Cual es la mejor manera de conocer y analizar las necesidades de los usuarios?

¿Cual es la mejor manera de d…

La patente de la Aspirina

Aspirina: la atribulada vida de una celebridad
El Dr. Felix Hoffmann (1868-1946) tenía dos pasiones. Una de ellas (Historia del arte) sólo le reportó gratificaciones personales. La segunda (Química) proporcionó a la humanidad una de sus más famosas invenciones: la Aspirina®.

El Dr. Hoffmann fue un digno heredero de una larga tradición en el alivio del dolor, la cual se remonta miles de años atrás y que tiene su hito moderno en el año 1897, con la síntesis del ácido acetilsalicílico (ASA). Este es el nombre del principio activo de la Aspirina®, que proviene de la palabra latina Salix (sauce), árbol del que los antiguos médicos brujos obtuvieron este principio activo por primera vez.

Siendo aún un campo fértil de estudio para la química moderna y la farmacología, esta "droga milagrosa" tiene muchas otras propiedades aparte del alivio del dolor. Un fármaco para el cáncer, las enfermedades cardiacas, el Alzheimer, los ataques de apoplejía, la infertilidad, la hipertensión y muchas …

Referencias bibliográficas y fuentes sobre Vigilancia Tecnológica #VTIC