[un/loquer] Descargar una serie de URL's consecutivas de forma sistemática

Santiago Gaviria sgaviria en gmail.com
Mie Abr 13 22:34:16 UTC 2016


for i in {1..99}; do
  printf "%013d\n" $i
done

$ bash x.sh
0000000000001
0000000000002
0000000000003
0000000000004
0000000000005
0000000000006
0000000000007
0000000000008
0000000000009
0000000000010
0000000000011
0000000000012
0000000000013
0000000000014
0000000000015
0000000000016
0000000000017
0000000000018
0000000000019
0000000000020
...

2016-04-13 17:25 GMT-05:00 Santiago Gaviria <sgaviria at gmail.com>:

>
>    1. for n in $(seq -f "%03g" 1 999)
>    2. do
>    3.   wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
>    visualizagr.jsp?nro=00000000000$n
>    4.  done
>
>
> 2016-04-13 15:30 GMT-05:00 Federico lopez <fede2001 at hotmail.com>:
>
>> Necesitaba bajar los grupos de investigación que están inscritos en
>> Colciencias, la URL's que describen los grupos están definidas por un
>> número al final que parece que va incrementando, el reto es que el número
>> tiene varios ceros adelante entonces no lograba hacer un script que se
>> trajera todas las URL, hice varios intentos parciales, Brolin encontró la
>> manera (mientras se bañaba).
>>
>> El siguiente test baja los primeros mil grupos de investigación usando
>> tres contadores, uno se encarga de los miles, otro de los decimos, otro
>> de las unidades.
>> Agregando más contadores se pueden traer cien mil, un millón; el
>> programador fue bastante cauteloso (o iluso) de dejar espacio como para 99
>> trillones (en numeración de escala corta) de grupos de investigación en
>> Colombia.
>>
>>
>>
>>
>>    1. #!/bin/bash
>>    2. for a in {0..9}
>>    3. do
>>    4.   for b in {0..9}
>>    5.   do
>>    6.     for c in {0..9}
>>    7.     do
>>    8.       wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
>>    visualizagr.jsp?nro=00000000000$a$b$c
>>    9.     done
>>    10.   done
>>    11. done
>>
>>
>> http://pastebin.com/U7fKFhr3
>>
>> Luego de bajarlos a una carpeta se pueden buscar palabras claves con
>>
>> $ grep "*palabra*"
>>
>>
>> saludos,
>>
>> fede.
>>
>>
>>
>> _______________________________________________
>> unloquer mailing list
>> unloquer at lists.aktivix.org
>> https://lists.aktivix.org/mailman/listinfo/unloquer
>>
>>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.aktivix.org/pipermail/unloquer/attachments/20160413/79095331/attachment.html>


Más información sobre la lista de distribución unloquer