Estudio de Uso de Tecnologías en el millón de páginas más vistas según Alexa

Partiendo de la idea del blog de de Andros, y del post sobre su estudio del uso de Wordpress con un ejemplo de Clojure. He iniciado un proyecto secundario sobre el uso de las tecnologías usadas en las, más de 1.000.000 principales webs de Internet según Alexa. La idea, es la de ampliar la publicación de datos hasta cubrir el millón de páginas principales de Alexa.

Para realizar el trabajo he creado un proyecto basado en Python, utilizando el detector de tecnologías de Wappalizer, y una versión en python 3 de la biblioteca wappalizer. He almacenado los resultados en una BBDD MongoDB para su posterior revisión y utilizado Plotly par generar las gráficas.