[un/loquer] Descargar una serie de URL's consecutivas de forma sistemática
Santiago Gaviria
sgaviria en gmail.com
Mie Abr 13 22:34:16 UTC 2016
for i in {1..99}; do
printf "%013d\n" $i
done
$ bash x.sh
0000000000001
0000000000002
0000000000003
0000000000004
0000000000005
0000000000006
0000000000007
0000000000008
0000000000009
0000000000010
0000000000011
0000000000012
0000000000013
0000000000014
0000000000015
0000000000016
0000000000017
0000000000018
0000000000019
0000000000020
...
2016-04-13 17:25 GMT-05:00 Santiago Gaviria <sgaviria at gmail.com>:
>
> 1. for n in $(seq -f "%03g" 1 999)
> 2. do
> 3. wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
> visualizagr.jsp?nro=00000000000$n
> 4. done
>
>
> 2016-04-13 15:30 GMT-05:00 Federico lopez <fede2001 at hotmail.com>:
>
>> Necesitaba bajar los grupos de investigación que están inscritos en
>> Colciencias, la URL's que describen los grupos están definidas por un
>> número al final que parece que va incrementando, el reto es que el número
>> tiene varios ceros adelante entonces no lograba hacer un script que se
>> trajera todas las URL, hice varios intentos parciales, Brolin encontró la
>> manera (mientras se bañaba).
>>
>> El siguiente test baja los primeros mil grupos de investigación usando
>> tres contadores, uno se encarga de los miles, otro de los decimos, otro
>> de las unidades.
>> Agregando más contadores se pueden traer cien mil, un millón; el
>> programador fue bastante cauteloso (o iluso) de dejar espacio como para 99
>> trillones (en numeración de escala corta) de grupos de investigación en
>> Colombia.
>>
>>
>>
>>
>> 1. #!/bin/bash
>> 2. for a in {0..9}
>> 3. do
>> 4. for b in {0..9}
>> 5. do
>> 6. for c in {0..9}
>> 7. do
>> 8. wget http://190.242.114.26:8080/gruplac/jsp/visualiza/
>> visualizagr.jsp?nro=00000000000$a$b$c
>> 9. done
>> 10. done
>> 11. done
>>
>>
>> http://pastebin.com/U7fKFhr3
>>
>> Luego de bajarlos a una carpeta se pueden buscar palabras claves con
>>
>> $ grep "*palabra*"
>>
>>
>> saludos,
>>
>> fede.
>>
>>
>>
>> _______________________________________________
>> unloquer mailing list
>> unloquer at lists.aktivix.org
>> https://lists.aktivix.org/mailman/listinfo/unloquer
>>
>>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.aktivix.org/pipermail/unloquer/attachments/20160413/79095331/attachment.html>
Más información sobre la lista de distribución unloquer