En el script del presente post es un modelo base para extraer códigos fuentes de blogs y páginas con el objetivo de ser analizadas a beneficios de los usuarios o el estudio del lenguage HTML.

El script fue creado en sistema operativo Linux usando el lenguage de programación Python. Gracias a que Python es multi-plataforma, también es posible ejecutarlo en sistemas operativos Windows, sin embargo; puede que sea necesario realizar algunos cambios al script para que funcione apropiadamente en Windows.

Los requisitos principales para la ejecución del script es tener el módulo BeautifulSoup instalado y un ambiente virtual dedicado para Python (como por ejemplo virtualenv), en caso de tener anaconda instalado entonces no debería de ser necesario tener virtualenv.

LINK DE DESCARGA PARA EL SCRIPT.