[un/loquer] Descargar una serie de URL's consecutivas de forma sistemática

brolin brolin108 en gmail.com
Jue Abr 14 15:57:43 UTC 2016


Gracias,

Santi una pregunta, vos sabías cómo se hacía? sino cómo buscaste?

2016-04-13 18:29 GMT-05:00 fede2001 <fede2001 en hotmail.com>:

> Santiago Muchas gracias una solución más económica y flexible
>
>
>
> -------- Mensaje original --------
> De: Santiago Gaviria <sgaviria en gmail.com>
> Fecha: 13/04/2016 05:34 p.m. (GMT-05:00)
> Para: hackerspace medellin <unloquer en lists.aktivix.org>
> Asunto: Re: [un/loquer] Descargar una serie de URL's consecutivas de forma
> sistemática
>
> for i in {1..99}; do
>   printf "%013d\n" $i
> done
>
> $ bash x.sh
> 0000000000001
> 0000000000002
> 0000000000003
> 0000000000004
> 0000000000005
> 0000000000006
> 0000000000007
> 0000000000008
> 0000000000009
> 0000000000010
> 0000000000011
> 0000000000012
> 0000000000013
> 0000000000014
> 0000000000015
> 0000000000016
> 0000000000017
> 0000000000018
> 0000000000019
> 0000000000020
> ...
>
> 2016-04-13 17:25 GMT-05:00 Santiago Gaviria <sgaviria en gmail.com>:
>
>
>    1. for n in $(seq -f "%03g" 1 999)
>    2. do
>    3.   wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
>    visualizagr.jsp?nro=00000000000$n
>    4.  done
>
>
> 2016-04-13 15:30 GMT-05:00 Federico lopez <fede2001 en hotmail.com>:
>
> Necesitaba bajar los grupos de investigación que están inscritos en
> Colciencias, la URL's que describen los grupos están definidas por un
> número al final que parece que va incrementando, el reto es que el número
> tiene varios ceros adelante entonces no lograba hacer un script que se
> trajera todas las URL, hice varios intentos parciales, Brolin encontró la
> manera (mientras se bañaba).
>
> El siguiente test baja los primeros mil grupos de investigación usando tres contadores,
> uno se encarga de los miles, otro de los decimos, otro de las unidades.
> Agregando más contadores se pueden traer cien mil, un millón; el
> programador fue bastante cauteloso (o iluso) de dejar espacio como para 99
> trillones (en numeración de escala corta) de grupos de investigación en
> Colombia.
>
>
>
>
>    1. #!/bin/bash
>    2. for a in {0..9}
>    3. do
>    4.   for b in {0..9}
>    5.   do
>    6.     for c in {0..9}
>    7.     do
>    8.       wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
>    visualizagr.jsp?nro=00000000000$a$b$c
>    9.     done
>    10.   done
>    11. done
>
>
> http://pastebin.com/U7fKFhr3
>
> Luego de bajarlos a una carpeta se pueden buscar palabras claves con
>
> $ grep "*palabra*"
>
>
> saludos,
>
> fede.
>
>
>
> _______________________________________________
> unloquer mailing list
> unloquer en lists.aktivix.org
> https://lists.aktivix.org/mailman/listinfo/unloquer
>
>
>
>
> _______________________________________________
> unloquer mailing list
> unloquer en lists.aktivix.org
> https://lists.aktivix.org/mailman/listinfo/unloquer
>
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://lists.aktivix.org/pipermail/unloquer/attachments/20160414/6baaeecb/attachment.html>


Más información sobre la lista de distribución unloquer