File sharing

condivisione di file

Il file sharing è la condivisione di file all'interno di una rete comune. Può avvenire attraverso una rete con struttura client-server (cliente-servente) oppure peer-to-peer (pari a pari).

Le più famose reti di peer-to-peer sono: Gnutella, OpenNap, Bittorrent, eDonkey, Kademlia. Non vanno confuse con reti che costituiscono un filesystem distribuito, come Freenet.

Queste reti possono permettere di individuare più copie dello stesso file nella rete per mezzo di hash crittografici, di riprendere lo scaricamento del file, di eseguire lo scaricamento da più fonti contemporaneamente, di ricercare un file in particolare per mezzo di un URI Universal Resource Identifier.

Programmi di File-sharing, sono utilizzati direttamente o indirettamente per trasferire file da un computer ad un altro su Internet, o su reti aziendali Intranet. Questa condivisione ha dato origine al modello peer-to-peer.

La storia

Il file sharing, come fenomeno di massa, è strettamente legato alla diffusione di Internet e della banda larga. Il primo software dedicato al P2P (Napster) nasce nel 1999 negli Stati Uniti per opera dell'appena 19enne Shawn Fanning, studente alla Northeastern University di Boston.

Ancor prima della nascita di Napster i pionieri della condivisione di file su internet utilizzavano le BBS e i siti Warez, dove gli utenti mettevano a disposizione i propri file su spazi dedicati. Si trattava comunque di una minoranza di navigatori esperti, generalmente studenti di informatica, che si collegavano dai grossi centri di calcolo delle università.

Ma esistono esempi di file sharing, in senso lato, antecedenti l'avvento della rete. È il caso, ad esempio, di una piccola emittente radiofonica siciliana che nei primi anni 80 utilizzava la modulazione di frequenza per diffondere brevi programmi, utility e giochi freeware attraverso l'etere. L'allora popolare dj Alex, attraverso le frequenze di radio Pachino, trasmetteva il suono emesso dai nastri contenenti software per Commodore e Atari che gli ascoltatori potevano registrare e riprodurre sul proprio Personal Computer.

Programmi di file sharing

Attualmente sono disponibili diversi programmi di file sharing su reti differenti. La disponibilità dipende parzialmente dal sistema operativo, da differenti reti di comunicazioni aventi differenti caratteristiche (per esempio download a sorgente multipla, differenti tipi di ordinamento, differenti limiti nella ricerca, eccetera).

La dinamica del file sharing

Questi programmi di condivisione file possono portare sia vantaggi che svantaggi alla Privacy / Anonimato attraverso una centralizzazione o una decentralizzazione della rete su cui si basano. Com'è naturale, data la natura stessa di una rete di condivisione, non si è esenti da minacce malware et simila, seppur differenti a seconda dell'OS e della rete. Indipendentemente dal sistema in uso, il Firewall è uno strumento indispensabile per una navigazione privata, ma non priva di falle.

Se un navigatore di Internet crede di avere un guadagno grazie all'accumulo di file, cercherà di collegarsi con altri per condividere sempre più file. Questo può causare dei problemi quando il nodo collettore non è in grado di sostenere il traffico di dati. La decentralizzazione è un sistema per mitigare questo problema, specialmente nel caso in cui sia possibile assicurare che copie multiple di una canzone o di un programma popolare siano disponibili da risorse multiple (persino simultaneamente, mediante downloads multi source).

Concetti come accaparramento (in inglese "hoarding") sono emersi quando ci si è resi conto che non si riusciva a distribuire in rete ciò che si aveva caricato sul proprio computer. I sistemi Barter e ratio ridussero l'impatto dell'accaparramento. Grazie a questi sistemi le persone avrebbero condiviso solo ciò che loro si aspettavano di ottenere.

Nel sistema operativo Windows è possibile la creazione di directory personali, invisibili ai computer collegati in rete, semplicemente dandogli un nome che termina col simbolo "$". Software di scansione di rete o sistemi operativi differenti come Linux sono in grado di reperire queste risorse collegandosi a nodi remoti.

Windows, con il tasto destro del mouse, dal menu "Proprietà/Condivisione", permette di rendere disponibile una cartella in lettura (o anche in modifica) ad un network di contatti, oppure a qualunque utente in rete.

Le reti decentralizzate, come Emule ed Edonkey, avevano due aspetti che hanno favorito la loro diffusione:

-l'assenza di un server centrale nel quale erano presenti i file scaricati. In presenza di contenuti protetti da diritto d'autore, il sito poteva essere oscurato e la rete divenire inoperativa;

-il fatto che la velocità del download cresce con il numero degli utenti connessi. Si tratta della differenza sostanziale fra una rete centralizzata e una distribuita.

Una rete centralizzata possiede una capacità finita che prima o dopo viene saturata, generando code e attese.

Rispetto a venti anni fa, le dimensioni dei file da scaricare sono sempre dell'ordine di alcuni megabyte, almeno per testi e musica MP3, cui si sono aggiunti i film. É, invece, sceso drasticamente il costo del gigabyte: abbiamo molta più banda e molta più memoria, a costi più bassi. Da queste considerazioni è facile calcolare che:

  • un server è capace di connettere molti più utenti, senza generare code;
  • in presenza di code, le reti sono più scalabili. Grazie al basso costo delle memorie e a collegamenti veloci fra server, i server possono essere ridondati, lasciando terabyte di memoria inutilizzati per gestire le situazioni di maggiore traffico. In presenza di code, il server principale crea in tempi brevi molti mirror dello stesso file occupando le aree di server secondari, cui può connettersi parte degli utenti in coda.

I PC hanno una potenza di calcolo sufficiente a configurarli come server, in commercio sono reperibili memoria di terabyte a poche centinaia di euro, e una connessione da 20 a 100 megabit. Sono tutte premesse per una moltiplicazione dei server disponibili.

Negli utlimi tempi, stanno diffondendosi nuovamente i dowload di contenuti tramite reti centralizzate Internet Relay Chat, grazie a XDCC, un'estensione del protocollo DCC che permette lo scambio di file. Più utenti si collegano a un server centrale, attivando tanti download indipendenti.

I problemi della Privacy

I concetti di "tracciabilità" e di "classificabilità" sono ormai una realtà quotidiana. Informazioni che identificano ogni persona sono legalmente associate a ciò che fanno al fine di verificarne l'identità; per esempio le carte di credito: queste devono essere associate con l'acquirente, altrimenti non si è in grado di inviare le corrette informazioni necessarie per effettuare gli acquisti.

Questo concetto si è esteso grazie ad Internet a molti aspetti dei personal computer. Mentre i pubblicitari dichiarano che queste informazioni pubblicitarie sono distribuibili solo a chi è veramente interessato a riceverle, molti affermano che avviene esattamente il contrario.

Le reti di file sharing sono una risorsa di informazioni sulle preferenze degli utenti e le tendenze del mercato. Il problema della privacy era maggiore con le prime reti P2P non distribuite, come Napster, in cui tutti dovevano connettersi a un server centrale contenente i file.

Chiaramente il server poteva conservare informazioni sugli indirizzi IP e sul materiale scambiato da un elevato numero di utenti.

Concetti come decentralizzazione e credito sono stati utilizzati per giustificare l'occultamento dell'identità degli utenti.

Tecniche di tutela della privacy

Il desiderio di anonimato ha spinto alcuni client di file sharing a "codificare" i dati, a nascondere diverse funzionalità al fine di proteggere i propri utenti. Le misure possono essere: cifratura dell'ID utente nella rete P2P, offuscamento del protocollo, supporto a proxy server e Tor per nascondere l'indirizzo IP, supporto con crittografia SSL dell'intera connessione.

Per lo scambio della chiave di sessione (fase di handshake) i programmi non utilizzano le chiavi pubbliche e private delle certification authority, poiché renderebbero identificabile l'IP e la persona dell'utente. Per lo scambio, adottano chiavi pubbliche e private generate con altre fonti, come nei programmi OpenPGP o OpenSSL. Questi programmi gestiscono tutta la cifratura, sia il protocollo che la fase di avvio e generazione delle chiavi.

I modelli più recenti di file sharing

Napster è un servizio centralizzato, ed è stato uno dei primi e più popolari programmi di file sharing di massa. Napster consentiva la condivisione solo di file MP3 e fu successivamente chiusa la condivisione gratuita di file MP3 a causa degli attacchi legali condotti dalla RIAA e dalle major discografiche. Negli U.S.A. fu apertamente attaccato da alcuni artisti (particolarmente dal rapper Dr. Dre e dai membri della rock band Metallica) ma appoggiato da altri (Limp Bizkit, Courtney Love, Dave Matthews). Napster consentiva la ricerca di file MP3 condivisi da altri utenti collegati al sistema. Comprendeva un sistema tipo chat IRC e un instant messenger. I programmi successivi hanno seguito il suo esempio.

Ma prima che sorgessero i problemi legali, le diverse comunità di internauti avevano già sviluppato con OpenNap una valida alternativa. Una versione reverse-engineered fu rilasciata come server open source. Questa rete continua a funzionare e, anche dopo il collasso di Napster, molti client utilizzano questo protocollo che sembra essere molto utile al server Napigator nello sforzo di centralizzare tutti i differenti server.

Successivamente apparve Gnutella, una rete decentralizzata. Questo servizio era completamente open-source e permetteva agli utenti ricerche verso qualsiasi tipo di file, non solo MP3. Questo servizio fu creato per evitare gli stessi rischi legali corsi da Napster. L'aspetto fondamentale che ha decretato il successo di questi programmi di condivisione, e che sta dietro la decentralizzazione, è dovuto al fatto che se anche una persona interrompe il collegamento non causa l'interruzione di tutti gli altri. Gnutella ha fatto tesoro delle difficoltà iniziali e grazie a questo il suo uso si è incrementato in modo esponenziale.

Con Napster e Gnutella si scontrano due modi diversi di condividere i file in rete. Gnutella è un servizio a protocollo aperto, decentralizzato e libero senza specifiche direttive ma con una difficile scalabilità. Napster, è un servizio a protocollo centralizzato nonostante la sua velocità e i grossi investimenti, non è stato comunque in grado di convincere l'industria discografica della sua importanza. Molti sistemi di file-sharing hanno comunque scelto una via di mezzo tra i due estremi; esempio tipo è la rete eDonkey, ad oggi la più utilizzata.

Il file sharing anonimo è cresciuto in popolarità e si è diffuso rapidamente grazie alle connessioni di Internet sempre più veloci e il formato, relativamente piccolo ma di alta qualità, dei file audio MP3. Tale condivisione ha tuttavia provocato una massiccia diffusione di materiale coperto da copyright, spingendo le major discografiche e mediali ad attacchi legali per tutelare i propri diritti. La condivisione di materiali coperti da copyright è ritenuta in genere illegale ma ha acceso diverse discussioni anche a causa delle diverse legislazioni in vigore nei vari paesi.

Per tutto il 2001 e il 2002 tutta la comunità di file-sharing è stata in fibrillazione a causa dell'azione di contrasto delle major discografiche e della RIAA. Il server di Napster è stato chiuso con l'accusa di violazioni del copyright, ma la comunità ha reagito unita e compatta, producendo nuovi e differenti client. La seconda generazione di protocolli P2P, come per esempio Freenet, non sono dipendenti da un server centrale, come lo era Napster. Questo ha reso molto più difficile le azioni legali delle major discografiche. Un altro espediente utilizzato dai gestori di KaZaA è stato quello di modificare la ragione sociale dell'azienda allo scopo di rendere impossibile o inutile qualsiasi attacco legale.

La decentralizzazione è stata una risposta rapida agli attacchi delle major verso le reti centralizzate, al fine di evitare dispute legali ma anche utenti ostili. Questo implica che le reti decentralizzate non possono essere attaccate legalmente, in quanto non fanno riferimento ad un singolo individuo. Anche se il protocollo fondamentale di Internet TCP/IP era stato progettato per essere resistente ad attacchi concertati, i sistemi di file-sharing e di peer-to-peer hanno dimostrato una maggiore resistenza.

Tutto ciò ha prodotto una serie di client aventi una funzionalità ben definita che rendono la condivisione un fatto effettivo e definito in tutti i sensi consentendo il download e l'upload libero e immune da qualsiasi attacco legale, soprattutto grazie all'anonimato e alla decentralizzazione. Da un'altro lato invece, una più diplomatica analisi della questione, ha visto nascere movimenti di protesta e di tutela degli utenti ben organizzato: strenuo baluardo nella battaglia ai "brevetti" musicali, il Partito Pirata Norvegese.

Configurazione dei programmi di file sharing

Le cause di un rallentamento e instabilità delle connessioni durante il file sharing possono principalmente dipendere da un basso credito, da limitazioni dell'Internet Service Provider o da un'errata configurazione del programma.

I problemi di crediti possono dipendere dai file messi in condivisione (troppo pochi, tra i meno scaricati) e da restrizioni eccessive all'upload in termini di banda massima e numero massimo di collegamenti ammessi.

Alcuni provider riducono la velocità della connessione quando viene rilevato l'uso programmi o protocolli P2P. Ciò avviene per motivi legali, per non collaborare ed essere accusati di favorire uno scambio illegale di file, e perché l'impegno per ore di molta banda risulterebbe penalizzante per gli altri utenti del servizio. A proposito, diversi client mettono a disposizione un'opzione di offuscamento del protocollo P2P.

Problemi di configurazioni possono verificarsi soprattutto nella sincronizzazione delle porte fra router ADSL e PC, risolvendosi con il port forwarding.

Con tali accorgimenti è possibile velocizzare la condivisione e la diffusione di file propri o del materiale posto sotto licenza come le creative commons.

Lista di utilities e client file sharing

Categorie di client

  • Client Centralizzati: OpenNap
    • Pregi: Maggior velocità nella ricerca e nel downloading.
    • Difetti: Più vulnerabile agli attacchi legali e DoS.
  • Client Decentralizzati: Gnutella
    • Pregi: Di solito più affidabile, raramente si interrompe.
    • Difetti: Generalmente più lento di un sistema centralizzato.
  • Client Decentralizzati "Tracker-Based": BitTorrent
    • Pregi: Molto veloci grazie alla concentrazione di un singolo file sulle reti BitTorrent, viene utilizzato soprattutto per lo scambio di file di grosse dimensioni.
    • Difetti: ricerca non centralizzata, ricerca dei siti spesso chiusi o non funzionanti, non completamente anonimo.
  • Client Multi-Network:
    • Pregi: permette la connessione a uno più reti, quasi sempre dal punto di vista client.
    • Difetti: spesso costringono a rapidi aggiornamenti del software.

Voci correlate

Collegamenti esterni

Template:Dmoz