Sicurezza

Big data, siamo noi a informare il Grande fratello

L’ex agente della Cia Edward Snowden ha rivelato che l’Nsa effettua controlli a tappeto sulle comunicazioni telefoniche e in rete. In realtà l’agenzia si limita a elaborare i dati che forniamo a siti e social network

Credits: Elaborazione grafica di Stefano Carrara

di John Gapper

Le vendite del romanzo 1984 di George Orwell sono aumentate da quando Edward Snowden ha rivelato come l’Agenzia per la sicurezza nazionale (National security agency, Nsa) degli Stati Uniti ottenga l’accesso ai tabulati e dati telefonici delle società tecnologiche. La gente è tuttavia  preparata ad accettare un certo grado di invasione nella propria privacy in cambio di più sicurezza.

Ma che cosa significa «big data», ovvero i grandi dati? Le aziende che immagazzinano volumi sempre maggiori di informazioni personali stanno utilizzando nuovi tipi di analisi dei dati e di intelligenza artificiale per creare prodotti e servizi e per anticipare i desideri dei clienti. Per Larry Page, amministratore delegato della Google, la tecnologia ideale è quella che, «come un assistente estremamente intelligente, ti permette di non pensare alle cose che devi fare perché le esegue al posto tuo».

L’idea di vivere in una Downton Abbey virtuale, con un computer che ti programma le giornate, ti suggerisce la strada migliore da percorrere, i film che potresti voler vedere e il miglior volo da prendere (e, se vuoi, può anche prenotarlo per te), ha un certo fascino. Viviamo tutti sotto la tirannia del tempo e vogliamo una vita facile. Invece di essere bombardati dalle informazioni e costretti a scegliere, è bello avere un servizio su misura.

Ma vedendo come la gente è rimasta stupita dalle rivelazioni sulla National security agency, credo che molti non abbiano un’idea precisa né della portata della traccia di dati generati ogni giorno, né dei progressi tecnologici che stanno consentendo a un gruppo selezionato di imprese addette alla gestione e all’analisi dei big data di sfruttarla. La tecnologia sta evolvendo così rapidamente che quello che due anni fa era impensabile ora è routine.

«È un futuro meraviglioso e allo stesso tempo spaventoso. Le società in possesso di volumi enormi di dati ti conosceranno meglio di te stesso e saranno in grado di prevedere le tue prossime mosse» afferma Kai-Fu Lee, investitore di Pechino ed ex direttore della Google in Cina.

Oggi la Google è come la General Electric della fine del XIX secolo: un’impresa industriale innovativa sempre sull’onda della nuova tecnologia. Il rovescio della medaglia, però, è che Google, Amazon, Microsoft e altri giganti tecnologici stanno accumulando poteri che devono essere controllati con attenzione.

L’Nsa e le «big data company» utilizzano i loro database e il loro potere informatico per svariati scopi: la prima per identificare spie e terroristi e le altre per fornire agli utenti i servizi più puntuali. Hanno in comune l’utilizzo di banche dati molto estese e di tecniche particolari, quali il riconoscimento di pattern (campioni) e l’analisi di rete.

Sul fronte più avanzato tutto questo prende il nome di intelligenza artificiale, vale a dire sistemi in grado, per esempio, di intuire il termine che si cerca anche se le parole chiave sono state scritte in modo errato oppure capaci di tradurre discorsi in un’altra lingua in tempo reale (come dimostrato dalla Microsoft in Cina l’anno scorso), o che imparano a riconoscere la fotografia di un gatto osservando migliaia di immagini. La capacità dei computer di apprendere in modo simile agli esseri umani è nota come «deep learning», ovvero apprendimento profondo, ed è degno di nota che la Google abbia ingaggiato diversi pionieri nel settore, incluso lo scienziato e autore Ray Kurzweil.

Il trasferimento di tecnologia offerto dalla Nsa a società americane private comprende anche le innovative «tecnologie di apprendimento automatico». Questi software sono in grado di desumere molti dati da brandelli di informazioni, purché ne raccolgano a sufficienza, come si evince dal tentativo della Nsa di analizzare i metadati delle telefonate effettuate con Verizon (e forse anche con altri operatori). Il presidente Barack Obama ha garantito agli americani che «nessuno sta ascoltando le vostre telefonate», ma già questo sistema è in grado di fornire un’autentica miniera di informazioni.

Uno studio condotto da Latanya Sweeney, professore alla Harvard University, ha dimostrato che l’87 per cento delle persone può essere identificato semplicemente conoscendone l’età, il sesso e il codice postale e incrociando questi dati con quelli contenuti nei database pubblici. È il caso tipico dei dati raccolti dai social network e dai provider di internet.

Lo straordinario potere delle «big data company» deriva dalla capacità di combinare i dati personali dei clienti con osservazioni sugli stessi: da quali prodotti acquistano a dove si trovano (in base ai dati Gps dei telefoni cellulari). Ne consegue una serie di dati desunti circa i loro probabili desideri.

Per esempio, se con un telefono Android cerco «Taj Mahal» mentre mi trovo in India, Google darà la priorità ai risultati relativi al tempio in Uttar Pradesh. Se faccio la stessa ricerca da Brick lane, nell’area Est di Londra, mi verranno suggeriti i ristoranti bengalesi della zona. Quanto tempo ci vorrà perché il sistema mi proponga di prenotare un ristorante in base al giudizio che ho dato di altri locali mentre camminavo per una città straniera al tramonto?

Da un lato mi farebbe piacere se accadesse (purché sia un buon ristorante) perché mi risparmierebbe la fatica di scegliere da solo, dall’altro, come si legge in un rapporto del World economic forum sui dati personali, «i dati desunti trasmettono l’impressione di un Grande fratello onnisciente che ci scruta attraverso una videocamera a circuito chiuso».

Una delle preoccupazioni che emerge da queste considerazioni è che è molto difficile competere con le «big data company», visto che possiedono software di questo tipo. Tanti più dati io e altri utenti forniamo loro, tanto più queste società sono in grado di predire quello che vogliamo. E il «cervello automatico» migliora con l’uso.

Un’altra fonte di apprensione è l’aspetto della fiducia. I social network non si sono dimostrati affidabili a livello di protezione dei dati degli utenti e detengono informazioni sui comportamenti, le abitudini e le intenzioni delle persone relativamente alla nuova generazione di servizi. Non stupisce che la Nsa si rivolga a loro: l’Agenzia per la sicurezza nazionale detiene il potere di elaborazione, mentre i social network hanno montagne di materiale.

Infine c’è la questione della proprietà. Ognuno di noi possiede i diritti sulle proprie informazioni, ma cosa succede se tali dati si mescolano con quelli di altri e si combinano in un vasto database di intenzioni? E se cambio idea come avviene la decodificazione? Ma soprattutto non conosciamo il  significato di questa tecnologia perché siamo solo all’inizio dell’era dei grandi dati. Tanti sono gli aspetti degni di ammirazione, ma è ancora presto per parlare di affezione.

© The Financial Times Limited

Leggi Panorama on line

© Riproduzione Riservata

Commenti