Venerdì 03 Aprile 2020

Web semantico

Definizione di Web semantico

Web semantico

Il Web semantico è quella "versione" del web che associa a ogni documento (un file, un’immagine, un testo, ecc.) informazioni e metadati che, fornendo un contesto semantico appunto, ne rendono più facile l’interrogazione e l’interpretazione automatica da parte di un motore di ricerca


Verso il web semantico

Già alla fine degli anni Novanta del resto Tim Berners-Lee, papà del World Wide Web come oggi lo conosciamo, ipotizzò la nascita di una Rete semantica, sottolineando come solo un approccio semantico al web avrebbe realizzato il «sogno […] di un web in cui i computer diventino capaci di analizzare tutti i dati: contenuti, link, transazioni tra persone e macchine. […] Quando ciò succederà il commercio, la burocrazia, le nostre stesse vite quotidiane saranno gestiti da macchine che parlano con altre macchine» (T. Berners-Lee, M. Fischetti, “Weaving the Web“, 1999).

È soprattutto dall’inizio degli anni Duemila, però, che questa interoperabilità tra macchine – o, meglio, una certa interoperabilità tra uomo e macchina derivata da un nuovo modo di concepire i documenti in Rete – diventa una sfida operativa per chi lavora al web. Da allora si rincorrono approcci e definizioni di semantic web diversi e che tentano, ciascuno, di cogliere aspetti salienti diversi di questa «evoluzione» della Rete (così si esprime, per esempio, Treccani nel dare di web semantico definizione in italiano).

Semantic web: definizione, struttura e funzionamento

Per capire meglio cos’è il web semantico e come funziona, però, può essere utile fare propria una delle definizioni più largamente accettate di semantic web, quella del W3C (il World Wide Web Consortium), che lo vuole un web «in cui a ciascuna informazione è dato un significato ben definito, che renda possibile per computer e persone lavorare in cooperazione». Senza scendere ancora troppo nel dettaglio della struttura del web semantico, ciò è possibile soprattutto grazie alle cosiddette ontologie del web semantico, ossia sistemi di codifica delle informazioni che, all’interno di uno specifico dominio di conoscenza, permettono una descrizione formale dei concetti articolata per classi, relazioni e regole, rendendo a valle la macchina in grado d’interpretare e utilizzare correttamente le informazioni a sua disposizione. In altre parole? Il web semantico non si basa su testi all’interno dei quali le informazioni si trovano nascoste in modo ambiguo e intelligibili solo grazie all’intervento umano, ma su asserzioni univoche che esprimono relazioni tra oggetti, risorse, esseri umani, fatti del mondo reale e che possono essere utilizzate anche da applicazioni automatiche.

L’architettura del web semantico, in breve

Com’è possibile tecnicamente tutto questo? Grazie all’architettura del web semantico, la cosiddetta semantic web tower, uno schema tipico (pare disegnato dallo stesso Tim Berners-Lee) che racchiude i principali livelli su cui dovrebbe basarsi la costruzione del web semantico.

semantic web tower

La piramide del web semantico. Fonte: W3C

Alla base ci sono i limiti di un linguaggio di markup come l’HTML, il più utilizzato nella costruzione delle pagine web. Si dia il caso della pagina di un catalogo di oggetti in vendita: l’HTML classico è in grado di descrivere ogni elemento del documento, può riconoscere attraverso gli specifici tag un titolo o un attributo, può individuare vicinanze tra due valori, ma non può capire per esempio qual è il nome dell’oggetto e ricollegarlo al prezzo a cui questo viene venduto. Semplificando, è quello che invece riescono a fare altri linguaggi come l’RDF, l’OWL, l’XML, pensati appositamente per il web semantico e in grado di descrivere le relazioni che esistono tra informazioni e documenti in rete. Il risultato finale è che, parafrasando uno dei più abusati esempi di web semantico, linguaggi e strumenti di questa “estensione” del web dovrebbero essere in grado di stabilire con certezza e, soprattutto, da soli che il signor Ciampi citato in un documento è lo stesso signor Ciampi che vive a Roma e che ricopriva la carica di Presidente della Repubblica.

Motori di ricerca e web semantico: cosa cambia?

È ancora il W3C a descrivere più didascalicamente come funziona il semantic web: «una domanda del tipo “come si arriva a Piazza della Pilotta a Roma?” potrebbe scatenare all’interno del nostro motore di ricerca intelligente una sequenza di ragionamenti di questo tipo: “vuoi arrivare in qualche posto a Roma, che è una città. Quindi ne deduco che non conosci tanto bene Roma, magari sei un turista. Posso allora chiederti se cerchi anche attrazioni turistiche, hotel, biglietti, ecc. Tra l’alto, visto che Roma è una città, posso offrirti un punto di partenza ben definito per cominciare il tuo cammino. Vediamo, passa la ferrovia a Roma? Altrimenti potrei provare con la piazza principale… ma, no, ecco qui, c’è la ferrovia a Roma, quindi ti offrirò come punto di partenza la stazione principale della città che è, eccola qui, la Stazione Termini».

Il connubio motori di ricerca web semantico non è affatto casuale. Per molto tempo anche i migliori motori di ricerca hanno tentato di «recepire i significati ricavandoli dal contesto della pagina (per capire, per esempio, se “espresso” si riferisse al caffè o a un treno veloce o se “verdi” fosse riferito a una classe di colore o al noto compositore italiano, ndr), di utilizzare i sinonimi per espandere le ricerche, ma in ultima analisi il loro archivio è un elenco, certamente molto ben organizzato, di parole chiave» (Epifani, “Introduzione al web semantico“, 2009). Se motori di ricerca intelligenti fossero in grado di comprendere davvero il significato di una pagina, ed è questa la sfida del web semantico, potrebbero accettare domande più complesse e, soprattutto, restituire indietro risposte più complesse e di valore per l’utente.

web semantico vs. web tradizionale

Una vignetta che mostra chiaramente i limiti del funzionamento attuale dei motori di ricerca.

Il web semantico, insomma, come spiegava anche Ivano Di Biasi in un’intervista ai nostri in occasione di Inbound Strategies 2017, può essere visto come «un metodo per comunicare diversamente con il motore di ricerca, per dargli i dati già pronti ed evitargli di doverli capire da solo analizzando i testi. Un modo, ancora, per rendere più facile a Google acquisire informazioni rapidamente, dal momento che i contenuti aumentano a dismisura ogni giorno, e dare anche i risultati più rapidamente, avere le risposte esatte a ogni esigenza degli utenti».

Web semantico e web 3.0: due sinonimi?

Non a caso web semantico è diventato nel tempo sinonimo di web 3.0: un termine ombrello che ha finito per indicare una serie di cambiamenti segnati dalla centralità, inedita per il “vecchio” web, dell’utente e delle sue esigenze. Mettere al centro l’utente e le sue esigenze significa, nel contesto del semantic web, soprattutto dare senso all’enorme mole di materiali disponibili in Rete: nonostante i notevoli passi avanti fatti soprattutto negli ultimi anni, non sempre quello che si cerca su Google e co. porta infatti l’utente verso ciò di cui ha realmente bisogno e tra quelli che vengono restituiti dai motori di ricerca ci sono ancora spesso risultati indesiderati, che rallentano o peggiorano la user experience .

I vantaggi del web semantico non hanno a che vedere, insomma, soltanto con la velocità con cui i motori di ricerca possono elaborare una quantità sempre più grande di informazioni, ma riguardano soprattutto l’usabilità e la reale utilità per le persone delle risorse in Rete. Al massimo delle sue possibilità il web semantico dovrebbe, cioè, facilitare l’integrazione tra informazioni provenienti da più fonti, ridurre l’ambiguità semantica, identificare le informazioni davvero rilevanti e, in questo modo, contribuire persino a colmare quell’infomation overload che sarebbe la cifra dell’odierno rapporto utenti-fonti. La tradizionale piramide del web semantico di cui si è detto, infatti, come sottolinea ancora il W3C, manca di una componente imprescindibile: l’asse P. È l’asse delle persone la cui cooperazione con i computer dovrebbe essere favorita per definizione dallo stesso web semantico, ma è anche l’asse della percezione che ha a che vedere appunto con una user experience soddisfacente.

piramide del web semantico

Una “rivisitazione” della semantic web tower con l’aggiunta dell’asse P (persone, percezione). Fonte: W3C

Web semantico: lo stato dell’arte e le prospettive future

Sarà per questo che, già nel 2013, oltre quattro milioni di domini web contenevano markup tipici del semantic web ed è facile immaginare che questo numero sia notevolmente aumentato nel tempo. Non mancano certo criticità che rendono ancora i principi del web semantico più materia di studi accademici e specialistici che applicazioni reali: tra queste criticità ci sono, per esempio, la vastità di documenti e informazioni reperibili online di cui si è abbondantemente detto e vaghezza e incertezza di alcuni elementi semantici come gli aggettivi qualificativi o le parole sinonimiche solo per fare due esempi. In altri termini? Per certi versi «la prospettiva di un web semantico realmente sviluppato è ancora lontana, ma non vi è dubbio che la tendenza alla standardizzazione e all’interoperabilità degli strumenti e dei parametri descrittivi abbia ricevuto, con la crescita di Internet, un impulso notevole», come scrive Treccani cercando di tracciare uno stato dell’arte del web semantico. Se il semantic web non riuscirà, insomma, a eliminare del tutto i messaggi not found, non nel breve periodo almeno, ha già reso “probabile” un futuro in cui, come auspicava ancora Tim Berners-Lee, si potranno prenotare delle visite mediche grazie a degli agenti che da soli capiscano dai sintomi la patologia di cui l’utente soffre e siano in grado di contattare direttamente centri medici specializzati.

Applicazioni ed esempi di web semantico

Di applicazioni del web semantico concrete, comunque, ne esistono già numerose. Basti pensare a come funzionano gli OPAC, ossia i cataloghi ad accesso pubblico dei sistemi bibliotecari, che sono appunto ormai da anni interoperabili.

web semantico esempi OPAC biblioteche

I sistemi OPAC, che permettono di accedere e confrontare i cataloghi online di più biblioteche (in questo caso quelle del circuito delle Biblioteche Nazionali), sono un buon esempio di web semantico in pratica.

Decisamente più sui generis è Talk to Books, una nuova funzione di ricerca presentata da Google nella primavera del 2018 che sfrutta i principi cardine di intelligenza artificiale e web semantico per rispondere alle domande dell’utente con citazioni letterarie estratte da oltre 100mila libri. Basta chiedere qualcosa, e farlo con un linguaggio del tutto umano e naturale come quello che si usa quotidianamente quando si parla con amici e familiari, insomma, per riuscire a conversare amabilmente con i libri e i loro autori. La sfida di Talk to Books è infatti quella di basarsi «sulla ricerca di significato rispetto a quella per parole chiave», sottolinea nel post di presentazione della feature di Google lo sviluppatore Ray Kurzweil. Sfida che è, come si accennava, quella più generale del web semantico. La comprensione del linguaggio umano, però, va di pari passo con la restituzione di risultati «intelligenti», scrivono da Big G: proprio come in una conversazione tra persone della stessa lingua, insomma, non sono ammessi qui pro quo o fraintendimenti grossolani, per questo Talk to Books evidenzia in grassetto i passaggi delle citazioni che meglio rispondono alla domanda dell’utente. Un esempio? Se si prova a chiedere se anche l’AI può avere una coscienza, si hanno indietro le diverse posizioni, dalla più apocalittica alla più integrata, tra cui si divide attualmente il dibattito in materia. I possibili utilizzi di Talk to Books? Scoprire nuove idee o nuovi modi di pensare, approfondire la letteratura riguardo a un determinato argomento, trovare fonti e citazioni per le proprie pubblicazioni o, semplicemente, divertirsi.

talk to books applicazione google web semantico

“Talk to books” è l’esperimento di Google che sfrutta i principi del web semantico per permettere agli utenti di “conversare” con i libri e i loro autori.

SEO e semantic web: che trend?

Proprio quest’ultimo esempio sembra piuttosto significativo di come i motori di ricerca si stiano muovendo sempre di più “dalle stringhe alle cose”. Il dubbio riguardo alle sorti della SEO nel tempo del semantic web, così, è lecito almeno quanto lo è cominciare a parlare di SEO semantica o indicizzazione semantica.

È vero che i motori di ricerca tengono sempre più in considerazione l’intera query e non la singola keyword e che persino alcune informazioni sull’utente – da dove, con che dispositivo e quando effettua la ricerca, qual è lo storico delle sue ricerche, ecc. – contano nella restituzione dei risultati di ricerca. Questo non significa, però, che delle buone strategie di SEO on site e off site non siano ancora indispensabili.

Secondo gli esperti almeno tre elementi sono importanti in questo senso. Titolo e meta, innanzitutto, che aiutano i crawler dei motori di ricerca a capire il contenuto della pagina e a ricostruire il contesto in cui si inserisce. La struttura del sito, in secondo luogo, che se logica e ben organizzata non solo serve all’utente a trovare più velocemente quello di cui ha bisogno ma soprattutto dà, ancora ai motori di ricerca, un’idea di come i contenuti siano interconnessi tra di loro. Dei dati strutturati, infine, sono indispensabili perché un motore di ricerca riesca a ben interpretare contenuti e contesto.

© RIPRODUZIONE RISERVATA
© Inside Marketing 2013 - 2020 è un marchio registrato ® P.iva 07142251219
×

Informativa

Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy.
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all’uso dei cookie.

loading
MOSTRA ALTRI