[AcLab] R: google sharing

Angelo Rosina angros47 a yahoo.it
Gio 18 Nov 2010 08:15:36 UTC


--- Gio 18/11/10, santec a riseup.net <santec a riseup.net> ha scritto:

> Il punto è: in pratica possiamo davvero fare a meno di
> Google? Non mi
> sembra che ci siano alternative che forniscano risultati
> abbastanza
> accurati. E se ci sono, da dove prendono i dati?

Una buona "raccolta" di URL, già classificati, è www.dmoz.org . Un'altra è wikipedia. Un crawler di un motore di ricerca potrebbe partire da lì.

> Sono
> finiti i tempi in
> cui chi faceva un sito lo segnalava a Lycos, Yahoo,
> Virgilio, Arianna,
> Supereva e il Trovatore: ormai se devi registrare un sito
> lo fai su
> un'unica fonte, e i motori di ricerca alternativi si basano
> anch'essi su
> Google... sbaglio?

Dipende: alcuni (come ecosia) si basano su bing, altri (come altavista, alltheweb...) si basano su yahoo (e quindi, sempre su bing). Poi ci sono i meta-motori, che si basano su entrambi.

> 
> 
> > Certo, e usare servizi come googlesharing ti consente
> di proteggere tali
> > informazioni; ma il limite grave è che funziona solo
.....
> Tutto questo è vero, mi fa piacere che tu lo scriva. Però
> penso che per
> uscire da questa situazione l'unica cosa da fare sia creare
> un'alternativa
> vera. Non un motore di ricerca alternativo che prenda i
> risultati da
> Google, il quale come si diceva censura e avvantaggia chi
> vuole. E
> comunque non un altro motore di ricerca "classico", come
> quelli a cui
> siamo abituati, basati su un server centrale del quale ti
> devi fidare
> ciecamente. Anche perchè chiunque crei un'alternativa
> simile, se un giorno
> riuscisse a raggiungere le dimensioni di Google, lo
> sostituirebbe
> trovandosi a gestire un potere enorme. E saremmo punto a
> capo, cambierebbe
> solo l'url da digitare per fare le ricerche.
> 
> Penso che l'unica alternativa credibile (credibile in
> termini di
> affidabilità) sia un sistema di ricerca peer-to-peer, non
> centralizzato,
> orizzontale, sostanzialmente anonimo, basato sul software
> libero e con un
> processo di sviluppo aperto e trasparente, senza scopo di
> lucro.


Esatto: il motore di ricerca yacy ha proprio queste caratteristiche: ogni computer su cui viene installato il software diventa, di fatto, un crawler. L'indice è condiviso tra vari computer, con il modello P2P, e non esiste un server centrale; quando tu digiti una richiesta, in primo luogo il programma controlla se è in grado di rispondere con i dati in suo possesso, poi gira la ricerca agli altri peer e si fa inviare ulteriori risultati. Anche se non hai installato il programma sul tuo computer, puoi collegarti via web a un computer dove è installato, e usarlo come un normale motore di ricerca: e ci sono diversi url a cui collegarti: in ogni caso, accedi sempre alla stessa rete. Così, se ad esempio per ogni ricerca ti colleghi ad un indirizzo diverso (esiste anche una pagina che permette di sceglierlo a caso: http://www.yacyweb.de/ ) fare un profilo delle tue ricerche diventa impossibile. E non è nemmeno possibile censurare i risultati, perchè
 bisognerebbe agire su ogni singolo peer... ed anche in tal caso, ciò non ti impedirebbe di installarti il tuo peer personale.

Il software (scritto in Java) è libero, con licenza GPL, e si può installare tranquillamente anche su hardware non molto potenti (un comune pc, anche di qualche anno fa, va benissimo)


> 
> Tempo fa una persona iscritta a questa lista accennò a un
> progetto del
> genere, portato avanti da lui e da un suo amico che si
> occupava del lato
> tecnico, se il progetto non è morto spero che ci scriverà
> qualcosa.

Mi ricordo: si parlava proprio di usare yacy.

> 
> In ogni caso, lancio la proposta: ci interessa provare a
> mettere in piedi
> un progetto simile?

Ognuno di noi può scaricarsi una copia del software di yacy, e iniziare a provarlo (si scarica da http://yacy.net/ ): già solo installandolo, si contribuisce ad allargare la rete di ricerca.
La cosa interessante sarebbe di installarlo sul server di aclab, e su altri server simili: un server sempre acceso è di sicuro più efficiente del proprio pc, e fornisce un punto di partenza valido (è possibile digitare un URL normale, mentre se si usano i normali peer installati su pc, per accedere alla pagina di ricerca occorre scrivere l'indirizzo IP).


Bye!


      



Maggiori informazioni sulla lista AcLab