Clusty un motore di ricerca da analizzare e considerare con attenzione (Parte II)
Pagina 2 di 2
Clusty contro Goolia
Clusty è un motore di ricerca più intelligente di Google per un motivo ben preciso e molto semplice; il problema attuale dei big player della search non è la scarsità di informazioni, ma l’eccesso. Se una query anche di ‘nicchia’ come il nome di uno spaghetti webber come me, produce decine di migliaia di risultati di ricerca, come è possibile pensare che un utente sappia dove ‘andare a cliccare’? Il presupposto ‘infondato’ di Google è che i primi risultati rankati siano anche i più significativi per la ricerca stessa, ma non è quasi mai così e questo perchè Google ranka nelle prime posizioni i siti che contengono la keyword - keyphrase cercata e che hanno un ‘peso’ maggiore secondo il GooglePle$ (a prescindere dalla sua ‘votazione ufficiale’ con il PageRank).
Quindi, se il nome ‘federico riva’ appare in una pagina che è considerata ‘importante’, ma che parla di sfuggita di me o che contiente un pingback a un mio commento su un trackback di un Blog di un Blogger che nemmeno conosco, questa pagina viene considerata più ‘attinente’ alla query di una pagina di un mio sito. Il sistema di clustering di Clusty (che trova il suo punto di forza nella visualizzazione dei link ‘ritenuti’ correlati) sarebbe un’ottima soluzione per Google che ha un problema di eccesso di risultati che diventa palese nelle query molto generiche (e che invece quasi scompare con le query composte da 4 o 5 termini, dove la ‘potenza’ del DB di Ghole si mostra in tutta la sua forza).
Purtroppo Googlex ha ancora l’idea che un motore di ricerca per essere ‘puro’ debba essere ‘bianco’ (the whiter, the better…potremmo dire) e quindi qualsiasi ‘suggerimento’ che possa essere considerato ‘umano…troppo umano’ viene scartato in partenza. La mia previsione è che Google dovrà al più presto venire a patti con l’umanità del Web, perchè siamo un po’ tutti stanchi di dovere spulciare fra centinaia di migliaia di risultati per trovare qualcosa di utile o di leggere descrizioni dei siti che (per via di una paranoia anti meta-description) o si affida a una rocambolesca analisi del contenuto della pagina o a una ‘improvvisata e spesso datata’ redazione di Dmoz (o ODP che dir si voglia).
Il sistema di clustering ‘visualizzato’ è sicuramente un passo importante verso questa strada e un motore di ricerca ‘voluminoso’ come Google ne trarrebbe sicuramente più vantaggio di quello che fa ora Clusty. Certo, l’abbinamento a una – anche ‘soft’ – analisi semantica delle pagine e della keyword utilizzate come query potrebbe senza dubbio dare una grande mano a evitare che il dottor Riva sia oscenamente abbinato al Pissing estremo, a Godado o a un link come questo: http://14738.eregole.com/gifsex/ o come questo: http://www1051.webattrezzi.com/motorericercasex/.
Se aprite le pagine, vedrete che si tratta di “account terminated”, tanto simili a quelli che si possono trovare cercando con la query “jeans brasiliani” su Google, dove il primo sito visualizzato su Google è di proprietà, possesso, grafica e hosting di Federico Riva (solo perchè il nome del dominio coincide con la query, con il trattino tanto amato da Cutts), il secondo di ‘miss gustosona’ che su Ebay vende jeans ‘svasati’ a 10 - 20 euro cad. e il terzo del sito di Diego Ratti & Godado (dal Whois del Nic non si capisce bene chi sia il proprietario) che vende jeans brasiliani anche a 190 Euro.
A seguire, una ‘teoria’ di Account terminati che non si capisce perchè Google tenga ancora in indice, giacchè i siti abbondano all’eccesso. Come vedete, a volte il clustering può fare un po’ di confusione e anche un motore leader può diventare d’un tratto lamer.
Il gioco è comunque divertente; se cerco: Jeans brasiliani su Clusty ottengo una serp con un link clustering di questo tipo:
dove appare evidente che il clustering è ancora molto lessicale, perchè sono abbinate delle query (forse) o delle keyphrase spesso (anche se non sappiamo quanto…) abbinate alla query effettuata. La non semanticità di Clusty non gli permette di evitare che fra i link suggeriti ce ne sia uno che punta ai “motori di ricerca”. Una cosa che Clusty dovrebbe sicuramente permettere e una ‘disaggregazione’ della query composita; per esempio: cerco “jeans brasiliani” e mi propone anche “motori di ricerca”, ma attualmente solo in combinazione con il Brasile. Dovrebbe anche permettere di cercare con un semplice click sulla singola Keyword ‘Motori di ricerca’. A quel punto, potremmo visualizzare due tipi di link suggeriti nel clustering e quello per la sola ricerca ‘motori di ricerca’ darebbe questo risultato:
A quel punto, clicchiamo su motori di ricerca Italiani (perchè ce ne sono…) e vediamo che il sito Tuttoweb.it, propone fra i motori italiani anche Godado. Cerco allora “Godado” su Clusty (mentre sarebbe stato il caso che Clusty stesso me lo avesse suggerito fra i link”) e appare una nuova SERP che propone link e dove vedo che posso ‘raffinare’ la ricerca scegliendo fra ‘sources’ (gli engine che Clusty ‘metausa’ e fra gli URL). Scelgo Allora Godado.tv, ma vedo che il primo sito indicizzato (Godado.tv) non si apre. Allora cerco Godado TV su Clusty stesso e il primo risultato non è un motore di ricerca che si apre, ma il sito di un portale che annuncia una vecchia iniziativa di Godado di un sito che – anche lui – non si apre più, ovvero TeleGodado.
Clicco su Portale, Telegodado e la prima pagina non è la index di Telegodado.com (ma se andrete sul sito capirte il motivo) ma una news di Freeonline che riporta la dichiarazione entusiastica di Diego Ratti, presidente di Godado Italia S.r.l. che dice: "Grazie ad una grafica innovativa e alla sua semplicità di utilizzo, gli utenti, semplicemente eseguendo i links proposti da Telegodado, con un solo click avranno la possibilità di visualizzare uno schermo virtuale attraverso il quale vedere la Tv di tutto il mondo via internet”.
Sarebbe interessante se Clusty permettesse, attraverso una toolbar (con uno strumento simile a quello lanciato da Yahoo più di un anno fa) di individuare sulla pagina aperta grazie a un click ‘eseguito’ di ‘eseguire’ nuove query direttamente (in modalita ‘sinottica’ o ‘scorporata’) di modo che con un semplice click (eseguirò su Diego Ratti) avrei potuto vedere una nuova lista di link-informazioni suggeriti e quindi questa schermata, dove possiamo vedere che il Ratti non si occupa(va?) solo di Broadcasting, non solo di motori di ricerca e non solo di corsi di Trading, ma anche di “Superconductive components”…
Clusty e Search Entertainment
Beh con Clusty ci si può davvero divertire e potete farlo anche voi con amici, conoscenti, individui o altro e fatelo sempre più spesso, perchè contribuirete ad aumentare la qualità stessa dei risultati di ricerca di Clusty (non nelle SERP, ma nei link suggeriti, che ne sono il valore aggiunto). Sono infatti tornato sulla query iniziale “federico riva” e, indovinate un po’, i link suggeriti sono cambiati e adesso ReadyTrading è visualizzabile sulla prima ‘condensata’ serie di links:
Ma, per il momento, è visualizzabile solo per me perchè altri miei ‘net friend’ vedono degli altri link. Suppogo quindi che Clusty mantenga una history di quello che un utente cerca e si sforzi di consegnargli risultati sempre più attinenti non tanto alla ricerca ‘an sich’ quanto piuttosto ai suoi ‘interessi’, in un tentativo anche se embrionale di behavioral search che non può essere affatto tenuto sottogamba e che forse viene anche esteso agli altri utenti (ovvero: se tanti utenti hanno cliccato questi link…dobbiamo considerarli più attinenti di altri e quindi visualizzarli anche agli altri utenti, secondo una logica di ‘voto’ un po’ più intelligente del LarryRank).
Postilla: fra pochi giorni il sito ReadyTrading non sarà più visualizzabile perchè scadrà il dominio, ma per chi volesse navigare su questo sito, sulle vecchie edizioni di altri siti (come Godado o come il Pipe Digest che riporta la mia passione per le pipe di schiuma), potete utilizzare un bellissimo strumento che ho conosciuto anni fa grazie all’amatissima Alexa e che si chiama Archive.org. Con Alexa potete visionare l’andamento del traffico di un sito (vedi sotto l’andamento di Godado da quando il Riva se ne è andato…:-)):
Con Webarchive.org potete visualizzare il ‘passato’ di un sito e…con Clusty.com potete magari capire perchè ...fa parte del passato.
Federico Riva
- Articolo precedente Il futuro dei motori di ricerca. Cosa ci aspetta dopo i motori di ricerca semantici (Parte II)
- Articolo successivo E' diventato più facile indicizzare i siti web nei motori di ricerca rispetto al passato?