Potresti aver già utilizzato Google Trends per conoscere l’utilizzo di alcune keyword. Puoi vedere, ad esempio, come è cambiata la ricerca che riguarda il termine “immigrazione” o “apprendimento dell’inglese” dopo che avvengono eventi tragici come guerre, terremoti e così via.
Potresti anche essere interessato al servizio di “completamento dei termini di ricerca” di Google.
Ad esempio, potresti digitare parole come “perché” o “come” o “desidero” e attendere che Google completi la tua frase.
Seth Stephens-Davidowitz, autore di Everybody Lies, è simile a te e ha svolto ricerche simili. Ma c’è una differenza importante tra te e lui: Davidbowitz ha messo insieme tutte queste ricerche e ne ha fatto un libro!
Non è giusto limitare tutto il suo lavoro a poche ricerche su Google, ma il fatto è che una parte significativa del suo libro è composta da questo livello di “dati e storie”.
Prima di spiegare ulteriormente il libro, Tutti mentono, leggiamo alcune frasi che troviamo inizio del quarto capitolo:
Tutti mentono. Le persone non dicono la verità sul numero di drink che bevono durante il viaggio di ritorno. Mentono su quanto spesso vanno al club, sul prezzo delle nuove scarpe che hanno comprato o se hanno letto un libro o meno. La gente dice “restiamo in contatto” ma poi non si sentono più. Dicono di non essere arrabbiati con te, ma lo sono. Dicono che ti amano quando non lo fanno. Dicono di essere felici anche se non lo sono. Dicono di amare le donne quando in realtà gli piacciono gli uomini.
Le persone mentono agli amici, mentono ai capi, mentono ai bambini, mentono ai loro genitori; viene mentito ai medici, viene mentito ai coniugi. Mentono persino a se stessi. E mentono ai sondaggi [studi, questionari e sondaggi].
Seth Stevens Davidowitz, di seguito solo Seth, sottolinea che molti questionari, sondaggi e studi accademici utilizzano informazioni e dati che non sono reali.
Cita, ad esempio, uno studio del 1950 fatto nella città americana di Denver che poneva alle persone una serie di domande. Compreso:
- Siete registrati per votare?
- Avete partecipato alle precedenti elezioni presidenziali?
- Avete donato a un evento di beneficenza?
- Avete una tessera della biblioteca?
Ci sono dati concreti su queste domande. Il confronto dei dati reali con ciò che le persone hanno detto rispondendo alle domande del questionario mostra che le persone dipingono un’immagine non realistica di se stesse.
Questo è così importante per Seth che (con un po’ di disattenzione e senza la citazione precisa ed evidente di dati) dice: “Le persone mentono circa un terzo delle volte nella vita reale. Questa abitudine trova spazio anche nella navigazione.”
Le persone mentono davvero?
Il termine mentire è un po’ forte ed è stato scelto per vendere più libri. Seth non si è fatto molti scrupoli. Per il titolo del libro, sarebbe stato disposto a utilizzare termini indicanti certe parti del corpo, ma l’editore lo ha dissuaso (+).
L’assunto di fondo è che ciò che le persone pensano o dicono di se stesse non è necessariamente esatto o vero.
Alcune persone sulla lista dei desideri di Netflix per la visione successiva indicano film classici e d’autore, ma alla fine guardano quelli superficiali e ridicoli.
Il 90% dei professori universitari pensa di essere al di sopra della media.
Questi sono due degli esempi che fa Seth nel suo libro.
Il fatto che la gente dica di amare i film di qualità, ma poi vada a vedere quelli comici, non può essere considerato semplicemente come una menzogna.
Anche l’eccesso di fiducia in sé stessi (Overconfidence) (che è un noto errore cognitivo) non può essere preso semplicemente come un esempio di menzogna.
Seth Stevens Davidowitz dice che le opinioni che dichiariamo ufficialmente di avere differiscono dalle opinioni che abbiamo davvero.
Inoltre, nella maggior parte dei casi, le nostre parole non corrispondono alle azioni che abbiamo fatto e che faremo.
Questo è ciò che Chris Argyris definisce come la differenza tra una teoria supportata e una teoria difesa.
Quale soluzione suggerisce il libro Everybody Lies?
Seth parte da un presupposto qui (ovviamente, lo vede come un principio, non come un presupposto): le persone nello spazio digitale lasciano un’impronta molto affidabile della realtà della loro vita.
Seth crede che invece di chiedere alle persone “Sei depresso” sia meglio vedere se hanno mai cercato modi per superare la depressione su Google.
Oppure, invece di chiedere a mille persone se si pentono di aver fatto un figlio, sarebbe meglio vedere in quanti cercano una frase del genere su Google.
Da qui, si entra nei dibattiti scientifici, oltre che in tema di big data. Per riassumere, chi si occupa di scienze sociali dovrebbe esaminare l’enorme quantità di dati sul comportamento delle persone su Internet, siti e social network, invece di progettare questionari e chiedere direttamente le cose alle persone.
Le scienze sociali stanno lentamente diventando una vera scienza.
Cosa ha spinto Popper a fare la guerra contro chi si occupa di scienze sociali?
Quando Popper ebbe a che fare con i migliori intellettuali del suo tempo – i migliori fisici, i migliori storici, i migliori psicologi eccetera- la sua attenzione fu attirata da un’interessante differenza. Quando parlavano i fisici, Popper credeva nel loro lavoro. Indubbiamente, a volte hanno anche commesso errori o sono stati ingannati dai loro pregiudizi inconsci. Ma i fisici erano impegnati in un processo che rivelava chiaramente le verità profonde dell’universo e culminava nella teoria della relatività di Einstein. Al contrario, quando i sociologi (ma anche gli psicologi e altri studiosi simili) più famosi del mondo hanno parlato, Popper si è sentito come se stesse ascoltando una manciata di sciocchezze.
Popper non è l’unico a fare questa distinzione. Quasi tutti concordano sul fatto che fisici, chimici e biologi sono veri scienziati. Usano rigorosi esperimenti scientifici per comprendere il mondo fisico. Al contrario, molte persone credono che economisti, sociologi e psicologi e quelli che si occupano di discipline umanistiche non siano veri scienziati e che usino termini privi di significato per ottenere una cattedra.
Qui, mentre entra in empatia con Popper, Seth sottolinea che quell’era sta gradualmente volgendo al termine e che le ormai scienze sociali, con l’enorme quantità di dati che viene prodotta ogni giorno, hanno a disposizione un laboratorio grande come tutto il mondo. È sufficiente che quelli che si occupano di scienze umane prendano sul serio questo problema:
I linguisti più famosi del mondo analizzano singoli testi, ma raramente prestano attenzione ai modelli che si trovano in miliardi di libri. Gran parte del metodo di ricerca insegnato agli studenti laureati in psicologia, scienze politiche e sociologia non ha nulla a che fare con la rivoluzione digitale.
… Possiamo trasportare questa scienza su larga scala, cioè applicare un metodo semplice e quindi utilizzare i metadati per eseguire un’analisi più e più volte in un breve periodo di tempo.
Sono finiti i giorni in cui i ricercatori passavano mesi a reclutare alcuni studenti universitari per fare un semplice test. Invece, i ricercatori useranno i dati digitali per testare centinaia o migliaia di idee in pochi secondi. Utilizzando questi dati saremo in grado di apprendere molte più cose in un tempo molto più breve.
Le debolezze analitiche del libro Tutti mentono
Se vogliamo giudicare il libro Tutti mentono, dobbiamo separare i capitoli dal primo al quinto da quelli dal sesto capitolo in poi.
La seconda metà del libro (dal sesto all’ultimo capitolo) è più accurata ed è stata scritta con maggiore attenzione. Ma nella prima parte ci sono molti punti deboli nell’argomentazione. Sebbene nella seconda metà del libro Seth sottolinei che le relazioni causali non possano essere scoperte ed estratte esclusivamente sulla base dei metadati, nella prima metà del libro si possono vedere molti esempi di queste congetture e inferenze.
Ad esempio, esamina le statistiche dei siti pornografici e formula giudizi sulle preferenze di uomini e donne in base a essi. Ma dimentica che molte persone su questi siti dichiarano di essere del genere opposto cui appartengono nella realtà.
Oppure, ad esempio, Google confronta le domande sul numero di ricerche di uomini e donne su Google, ma dimentica di considerare una variabile importante: quale percentuale di donne si rivolge a Google per le proprie domande? Quale percentuale di uomini lo fa? I due sessi si comportano in modo simile a questo riguardo?
In alcuni casi, come le elezioni statunitensi, cerca di estrarre le sue aspettative dai dati e, di conseguenza, viene sfidato a far coincidere il voto di un uomo di colore (Obama) e il voto di un razzista (Trump).
Allo stesso tempo, confonde la ricerca per curiosità con la ricerca per necessità. Ad esempio, se le persone in alcune province italiane cercano “influenza”, non significa necessariamente che l’influenza sia più grave lì. Potrebbe essere semplicemente che quelle province l’influenza sia più presente, cosa più importante, il tasso di diffusione di Internet non è lo stesso ovunque.
Ignora anche il fatto che l’impronta digitale non è necessariamente più onesta delle realtà del mondo fisico. Ad esempio, il modo di vivere pubblicato su Instagram e Facebook non è necessariamente più realistico dei comportamenti e delle affermazioni espressi nei questionari.
È interessante notare che ha sottoposto la sua ricerca a diverse riviste rispettabili e famose. Quando si sono rifiutate di pubblicarla sua ricerca, ha pensato che i suoi risultati della sua ricerca non fossero conformi alle ipotesi degli esperti di quelle riviste e, ancora una volta, non ha capito (o non ha voluto farlo) il criterio principale per cui hanno rifiutato il suo studio.
Ma con tutto ciò detto, il libro di Seth può essere un buon punto di partenza per qualcuno che non ha familiarità con i Big Data.
Tuttavia, in questo libro, l’autore solleva questi problemi senza fare riferimento a formule e calcoli matematici ed eliminando tutte le complessità e da questo punto di vista il libro può essere descritto come semplice e scorrevole.
Ma se hai un po’ di familiarità con i big data e gli algoritmi, la programmazione e la scienza dei dati, probabilmente sarai infastidito dall’aspetto superficiale del libro e dell’autore.