[un/loquer] Descargar una serie de URL's consecutivas de forma sistemática
Santiago Gaviria
sgaviria en gmail.com
Mie Abr 13 22:25:21 UTC 2016
1. for n in $(seq -f "%03g" 1 999)
2. do
3. wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
visualizagr.jsp?nro=00000000000$n
4. done
2016-04-13 15:30 GMT-05:00 Federico lopez <fede2001 at hotmail.com>:
> Necesitaba bajar los grupos de investigación que están inscritos en
> Colciencias, la URL's que describen los grupos están definidas por un
> número al final que parece que va incrementando, el reto es que el número
> tiene varios ceros adelante entonces no lograba hacer un script que se
> trajera todas las URL, hice varios intentos parciales, Brolin encontró la
> manera (mientras se bañaba).
>
> El siguiente test baja los primeros mil grupos de investigación usando tres contadores,
> uno se encarga de los miles, otro de los decimos, otro de las unidades.
> Agregando más contadores se pueden traer cien mil, un millón; el
> programador fue bastante cauteloso (o iluso) de dejar espacio como para 99
> trillones (en numeración de escala corta) de grupos de investigación en
> Colombia.
>
>
>
>
> 1. #!/bin/bash
> 2. for a in {0..9}
> 3. do
> 4. for b in {0..9}
> 5. do
> 6. for c in {0..9}
> 7. do
> 8. wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
> visualizagr.jsp?nro=00000000000$a$b$c
> 9. done
> 10. done
> 11. done
>
>
> http://pastebin.com/U7fKFhr3
>
> Luego de bajarlos a una carpeta se pueden buscar palabras claves con
>
> $ grep "*palabra*"
>
>
> saludos,
>
> fede.
>
>
>
> _______________________________________________
> unloquer mailing list
> unloquer at lists.aktivix.org
> https://lists.aktivix.org/mailman/listinfo/unloquer
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.aktivix.org/pipermail/unloquer/attachments/20160413/29d74371/attachment-0001.html>
Más información sobre la lista de distribución unloquer