[AcLab] R: scrivi la tua opinione... e spera che piaccia a google

santec a riseup.net santec a riseup.net
Sab 26 Set 2009 20:11:08 BST


> E' vero, wikipedia potrebbe registrare i miei dati e gli articoli che
> consulto più spesso (e farlo a mia insaputa, perchè magari il software che
> scarico io invece non lo fa), ma comunque registrerebbe solo l' indirizzo
> IP, che tanto cambia ogni volta, quindi non credo che sia un grosso
> problema.

Può ricordarsi l'IP, inserire cookie e ricordare la configurazione del tuo
browser, associandole poi alle parole che cerchi e ai link che visiti.
Funziona. La prova te la dà Google: anche se elimini i cookie, se cerchi
"odontoiatra" molto probabilmente ti mostrerà per primi i siti degli
odontoiatri che operano nella tua città... e non perchè sei molto
fortunato :)

Ma ripeto che sto evidenziando un problema generale. Non ho la minima idea
se Wikipedia faccia cose di questo genere oppure no. Ma certo esistono
siti che lo fanno e la GPL non offre alcuna tutela in questo senso (nè la
offre la AGPL, visto che come dicevo non è possibile verificare se viene
violata).


> L' importante è che chi vuole può clonare wikipedia e farne un mirror dove
> desidera: magari il software non sarà identico, ma potrà comunque fare la
> stessa cosa (per quello che posso controllare io), e questo è sufficiente
> per ricreare una wiki.

Beh, no. Anche questo fa parte del problema. Wikipedia è visitato da una
mole enorme di utenti. Ha a disposizione server molto potenti, e anche
così se può funzionare a una velocità decente è perchè utilizza un
software ben ottimizzato. Se io non ho a disposizione queste
ottimizzazioni, potrei non essere in grado di mettere su un mirror decente
o potrei essere costretto a spendere cifre elevate per l'hardware.

Non impuntiamoci su Wikipedia e nemmeno sull'esempio di chi vuole mettere
in piedi un mirror. Quello che voglio far capire è che nessuno dovrebbe
implementare ottimizzazioni, funzionalità, etc senza condividerli. Questa
E' una posizione dichiaratamente ideologica, che però puntualmente trova
riscontri nella pratica.


> Il problema che voglio sottolineare è che, se una decina di anni fa ogni
> articolo divulgativo era su un server diverso (e se un server si guastava
> perdevo l' accesso a poco materiale, che magari aveva anche delle copie
> altrove), oggi tutto quel materiale si trova sul server di wikipedia, e se
> a wikipedia accadesse qualcosa, le conseguenze sarebbero molto più gravi.
>
> Analogamente, i commenti e le opinioni che venivano raccolti su centinaia
> di siti, rischiano di finire su un sito solo, con le conseguenze del caso
> (e se si tratta di opinioni e dati personali, il data mining diventa molto
> facile).
>
> Quest' ultimo problema non riguarda Wikipedia (tutti i dati che ci sono lì
> sono informazioni di pubblico dominio, e chi scrive sa già che chiunque
> potrà leggerlo), ma il problema di avere "tutte le uova in un solo
> paniere" resta, e riguarda parecchi siti
> (http://archiveteam.org/index.php?title=Fire_Drill indica i siti
> "critici", che se cessassero le attività causerebbero perdite di dati
> enormi)

Si, questo era il centro dell'argomento. Ci tenevo a fare alcune
precisazioni, ma in realtà è di questo che volevo discutere e sono
d'accordo con ciò che hai scritto.

Fede




Maggiori informazioni sulla lista AcLab