18 Luglio 2021

Chi guida non può non interessarsi alla grande trasformazione dell’auto elettrica. Chi ha uno smartphone spesso segue l’evoluzione del settore. C’è però una tecnologia che usiamo molto, anzi moltissimo, e che tuttavia tendiamo a trascurare: sono i motori di ricerca, che ciascuno di noi consulta ogni giorno, spesso anche molte volte, per rispondere a piccoli e grandi quesiti (“dove mangiare a Barcellona?”;“cos’era il Corpus Iuris Civilis?”; “qual è la capitale dell’Australia?”), cercare prodotti e servizi, informarsi. Il più famoso motore di ricerca del mondo è ovviamente Google, che non soltanto è un potentato economico (il fatturato di Alphabet, che controlla pure il motore di ricerca, ha oltrepassato i 180 miliardi di dollari, più del PIL della Romania), ma un player di grande rilevanza cultura, sociale e politica, come dimostra la recente querelle tra Trump e Google.

Naturalmente non esiste solo Google, ci sono anche motori di ricerca concorrenti come Bing (della Microsoft, altro colosso digitale), DuckGoGo (che a dispetto della sua notorietà limitata nell’agosto 2020 ha avuto due miliardi di ricerche), l’europeo Qwant, il cinese Baidu, il russo Yandex, l’ecologista Ecosia ecc. I motori di ricerca sono una delle tecnologie più presenti nella nostra vita. Eppure i media mainstream ne parlano poco, e dedicano scarsissima attenzione all’evoluzione degli algoritmi che li gestiscono. L’argomento però è capitale, e per capirne un po’ di più è bene parlare con gli esperti, quali il pugliese Andrea Santo Sabato, tra i massimi specialisti italiani di SEO, un acronimo in lingua inglese che sta per Search Engineering Optimization.

«Nel mondo circa sei miliardi di persone hanno accesso a internet. Trascorriamo sul web in media sei ore al giorno, continuamente connessi, alla spasmodica ricerca di informazioni, cercando di soddisfare compulsivamente risposte ai nostri bisogni (visuali, informazionali, transazionali). Nel mondo ogni giorno sviluppiamo oltre dodici miliardi di richieste (query) attraverso i motori di ricerca».

I numeri che snocciola Santo Sabato (che su RTL 102.5 ha anche una rubrica dove svela ai comuni mortali i segreti del web) sono colossali, e rendono Google una fonte di informazione ben più influente di qualsiasi enciclopedia, testata giornalistica, biblioteca.

«I motori di ricerca possono essere considerati dei moderni oracoli tutto-fare: intermediari universali del nostro rapporto con Internet. Sono considerati quasi come moderne divinità cui è demandato il compito di interpretare i nostri bisogni e fornirci “responsi” cui affidarci con benevolenza. Lo sviluppo e l’avvento dei moderni motori di ricerca ha cambiato il nostro approccio costruendo un sinallagma tra mondo fisico/reale ed entità virtuale. I motori di ricerca, i medium digitali sono stati ontologicamente assunti come “costitutivi” non solo dai nativi digitali ma anche dalle vecchie generazioni che un tempo guardavano con spirito critico all’avvento delle nuove tecnologie».

Parlando in via confidenziale con un manager italiano di una delle più grandi multinazionali ICT del mondo arriva la seguente risposta:

«I motori di ricerca sono l’intelaiatura del web, ormai. Immaginiamo di non poter consultare Google quando siamo online. Sarebbe come essere in una grande città sconosciuta, ed essere costretti a girarla a piedi, senza l’ausilio di mappe o smartphone; rimarremmo nel centro storico, andando in quell’importante museo o in quel famoso ristorante, ma ignoreremmo il 99% della città. I motori di ricerca, quindi, sono un elemento di libertà, dal momento che ci consentono di scoprire, per restare alla metafora, ogni angolo della grande città. Che, ovvio, ha anche i suoi quartieri poco raccomandabili, i suoi locali squallidi, i suoi posti da evitare. Ma è compito del viaggiatore decidere quali luoghi frequentare, e da quali tenersi invece alla larga».

Per Marco Guerini, ricercatore della Fondazione Bruno Kessler, i motori di ricerca contano «non solo perché le persone fanno ricerche volte all’acquisto (nel 2020 Google ha generato di sola pubblicità qualcosa come 146 miliardi di dollari di ricavi), ma perché vengono usati per informarsi. I motori di ricerca, pertanto, sono gatekeeper dell’informazione, e possono essere utilizzati, volontariamente o meno, per manipolare la percezione globale su determinati fenomeni o anche cambiare il corso degli eventi». Guerini precisa:

«Già alcuni anni fa dei ricercatori avevano studiato l’effetto che un’ipotetica manipolazione dei risultati dei motori di ricerca, chiamata Search Engine Manipulation Effect (SEME), potrebbe avere sui votanti durante un’elezione. I risultati degli esperimenti dimostravano che il SEME da solo avrebbe potuto cambiare il risultato delle principali elezioni americane degli ultimi anni, e di moltissime altre tornate elettorali sparse per il globo. Si potrebbero quindi tranquillamente usare tecniche di SEO per screditare l’avversario politico e farlo perdere. Ma, più in generale, la domanda è: se ci sono due candidati è giusto che uno dei due abbia una rappresentazione più negativa sui motori di ricerca (semplicemente perché questa è la rappresentazione che se ne da in rete) sapendo che ciò falserebbe il risultato delle elezioni?».

Il dilemma descritto da Guerini è etico più che tecnologico. Ma che cos’è di preciso la SEO, che emerge di continuo in qualsiasi conversazione sui motori di ricerca? Santo Sabato spiega che con il famigerato acronimo si intende «l’insieme delle attività volte a migliorare la visibilità delle risorse pubblicate sul web». Occorre, a suo parere (ed è l’essenza filosofica dell’azienda che ha fondato), puntare su «una visione e un nuovo approccio etico verso il web e i motori di ricerca», in modo da «superare il proliferare di visibilità di risorse unicamente “trattate” con tecniche SEO artificiali, volte a “burlarsi” dei vulnus insiti nelle pieghe degli algoritmi del motore di ricerca».

Santo Sabato è un cultore della cosiddetta SEO naturale, cioè finalizzata a favorire lo sviluppo “naturale” di trust, nel rispetto delle policy suggerite dal motore di ricerca. «Una risorsa ottimizzata secondo tecniche SEO naturali non solo perdurerà rispetto ai KPI di visibilità e rank nel tempo, ma apporterà valore all’azienda e al brand. E ciò sarà sempre più importante perché gli aggiornamenti degli algoritmi dei motori di ricerca sono e diventeranno così sofisticati da penalizzare i siti web e le risorse “dopati” da tecniche non-naturali».

Una cosa sconosciuta ai profani, ma assai nota agli addetti ai lavori, è che gli algoritmi che mandano avanti Google e compagnia evolvono di continuo. Si pensi soltanto a BERT, ossia, specifica Santo Sabato, «uno tra i più importanti upgrade del core dell’algoritmo di Google. È l’acronimo di Biderectional Encoder Representations for Transformers e consiste in un sistema di “librerie” capaci interpretare meglio il linguaggio naturale. Si basa sugli sviluppi della intelligenza artificiale e del machine learning. L’innovazione consiste nel fatto che mentre i precedenti metodi di interpretazione testuali (web) si basavano sull’analisi delle singole parole inserite all’interno del testo, ora il motore di ricerca è in grado di comprendere ogni parola nel contesto logico semantico in cui la parola è inserita, mettendola in relazione con quella che precede e che segue, interpolandola, comprendendone i molteplici significati e gli intenti di ricerca diretti e indiretti alla stessa, il bisogno cui l’utente vorrebbe soddisfare a fronte di una ricerca, riuscendo a fornire in modo più preciso, accurato e di qualità risposte a domande (query)».

Non è tutto, dice Santo Sabato.

«Il modello BERT è stata la evoluzione del RankBrain e dell’Hummingbird: si tratta di update del core dell’algoritmo che si basano su sistemi di auto apprendimento e su metodi di intelligenza artificiale debole che analizzando grandi quantità di dati riescono, attraverso una più precisa comprensione e interpretazione dei testi, a comprendere il loro significato estrapolando le porzioni dal palinsesto per fornire risposte quanto più vicine alle query degli internauti».

Ma è solo l’inizio. Dice il manager citato sopra:

«I motori di ricerca stanno evolvendo in fretta, per il semplice fatto che si tratta di un business gigantesco, e grazie ai progressi delle varie declinazioni dell’intelligenza artificiale neanche i tecnici più esperti possono facilmente immaginare cosa saranno tra dieci o vent’anni. Ma il punto è un altro: dato che sono così importanti nel nostro quotidiano, non potrebbe essere una buona idea far acquisire una visione più profonda e competente in materia al legislatore, e a chi ha ruoli regolatori? Penso che insegnare come funziona un motore di ricerca dovrebbe essere insegnato anche ai bambini, ad esempio durante le ore di educazione civica, o magari di educazione tecnica. Invece tutti preferiscono non capirne niente, salvo poi lamentarsi al minimo problema».

Il manager fa un esempio concreto: l’e-commerce. «Negozianti, piccole imprese e artigiani si lamentano ogni giorno della spietata concorrenza che gli farebbe un grande e-commerce americano che tutti noi ben conosciamo. Però fanno poco o nulla. Non basta avere un sitarello, uno shop online. Occorre farsi trovare dai clienti, e questo vuol dire ad esempio essere presenti sui social media (come Facebook o Instagram), lanciare campagne online con un budget serio, avere un sito con la SEO fatta bene, perché se no nel mare magnum del web non ti trova neanche tua mamma, e poi è inutile fare il pianto greco».

Immaginare come sarà il futuro dei motori di ricerca non è facile. Secondo Guerini «avremo un’esperienza sempre più cross-mediale (rispetto a un classico multimodale), ma la strada da fare è ancora molta. Infatti anche se l’intelligenza artificiale viene ora usata per classificare i i risultati (è il caso notissimo di BERT), dietro queste modifiche di facciata i motori di ricerca funzionano come vent’anni fa: le pagine web sono indicizzate e i risultati che corrispondono alla query sono classificati e presentati all’utente. Questo meccanismo non è mai stato davvero messo in discussione. Il problema è che ancora oggi i motori rispondono fornendo un elenco di documenti che includono le informazioni richieste, non le informazioni stesse. E il game changer di tutto questo potrebbero essere i language model, cioè modelli del linguaggio. Ma questi si portano dietro tutta una nuova serie di problemi da risolvere».

Anche Santo Sabato fornisce una risposta aperta:

«Tralascerò in questa sede le visioni distopiche, che io condivido, fornite da Domenique Cardon nel celebre “Che cosa sognano gli algoritmi” in cui si dimostra come i motori di ricerca non sono né saranno semplici strumenti tecnici neutrali, ma fonti (pericolose) di poiesi di una “nuova realtà” e pseudo-conoscenza. Né mi soffermerò sul film “Social Dilemma” diretto da Jeff Orlowski. I motori di ricerca continueranno ad evolvere, sfrutteranno le nuove potenzialità derivanti dagli sviluppi tecnologici, utilizzeranno al massimo i nuovi medium tecnici. Avremo maggiore multi-cross-canalità digitale; avremo, rispetto al singolo profilo utente, maggiore profilazione di informazioni filtrate rispetto ai gusti, bisogni e abitudini dello stesso; saremo più “coccolati e guidati” nelle scelte dagli assistenti digitali che sfrutteranno il voice speech, la comprensione semantica, la potenza quantistica di calcolo dei nuovi super computer. Nel 1945 Vannevar Bush aveva prefigurato in un mirabile saggio, As we may think, una macchina futuristica che rispecchiando il nostro processo cognitivo poteva indirizzare, guidare, condizionare i comportamenti degli uomini, sottolineando però come l’informazione sia un concetto ben diverso da quello di conoscenza. Ecco, gli algoritmi ci guideranno in una ubiquità digitale e socialità mediata da un continuo flusso informativo coerente e aderentea ciò che vogliamo. Il percorso è già tracciato».

Cover tratta dal sito Pixabay, per ulteriori informazioni si visiti il sito. Le altre foto del post sono state fornite dai rappresentati.