Spamdexing le tecniche per ingannare i risultati dei motori di ricerca

Giorgio Borelli

SpamdexingComparire nella prima pagina e ancora meglio tra i primi risultati dei motori di ricerca è il risultato che molte aziende, siti e professionisti vogliono ottenere per avere maggiore visibilità e possibilità di far conoscere i propri prodotti.

Veri e propri professionisti del web, chiamati SEO (Search Engine Optimization), si occupano di studiare ed ottimizzare i siti web affinche questi salgano nei risultati delle pagine fornite dai motori di ricerca, chiamata anche SERP (Search Engine Results Page). Le principali tecniche SEO sono mirate allo studio delle parole chiavi, ottimizzazione del contenuto, del layout del sito e della link popularity (numero di link che puntano al tuo sito web).

Vi sono poi degli strumenti di web marketing che permettono tramite il pagamento di somme predeterminate o per click per specifiche Keywords (parole chiavi) di spuntare tra i primi risultati dei motori. Tra le campagne di aumento della visibilità a pagamento dette Advertisement la più nota è utilizzata è sicuramente quella di Google AdWords.

Per farla breve le metodologie per migliorare i risultati di ricerca sono svariate e diversificate, e rappresentano tutto un'altro universo delle nuove comunicazioni, dove ogni giorno persone, aziende e professionisti investono lavoro, risorse, tempo e denaro. L'importanza di stare tra le prime pagine è oggi rilevante nell'era del Web 2.0 per avere successo in qualsiasi campo, ed incrementare in maniera esponenziale i propri guadagni.

Proprio per questo motivo, stare in cima ai motori di ricerca fà gola a molti, ed i soliti mascalzoni hanno messo appunto tutta una serie di tecniche fraudolente, mirate ad ingannare gli algoritmi dei motori di ricerca per falsare la SERP e stare in cima ai risultati a discapito di tutti gli altri siti web che usano tecniche legittime.

Tali tecniche illegittime prendono il nome di spamdexing, è una parola composta dai due termini spammingindexing, ovvero fare spamming col fine d'ingannare l'indicizzazione delle pagine eseguite dai motori di ricerca. Andiamo a scoprire quali sono le tecniche di spamming sui motori più diffuse, come vengono attuate e come i motori hanno preso le contromisure per combatterle.

La tecnica del Keyword Stuffing

Uno dei principali modi con cui i motori di ricerca classificano le pagine web è quella di individuare attraverso i suoi algoritmi (crawler o spider) i suoi contenuti, ovvero il testo contenuto nelle pagine web. La pertinenza del sito web invece viene data dalle parole chiavi che esso contiense, se all'interno del testo supponiamo che si ripeta diverse volte la parola "gelato" il motore capirà che quella pagina parla di gelati e gli darà maggior risalto nei risultati della ricerca per la parola "gelato" rispetto ad un sito web che parla di pizze e magari presenta una sola pizza al gelato, il primo sito spunterà molto prima del secondo poichè molto più pertinente.

Quindi tante più parole chiavi sono presenti nella nostra pagina web, tanto più sarà pertinente per il motore quella pagina per quella data parola chiave. Ogni medaglia ha però il suo rovescio, se riempire una pagina di parole chiavi migliorerebbe la pertinenza per quella key sui motori, d'altro canto comprometterebbe la leggibilità delle pagina stessa. Allora per ingannare i motori e non perdere la qualità dei contenuti, i furboni del web hanno messo appunto una tecnica detta di Keyword Stuffing che mira a riempire la pagina di parole chiavi nascondendole però all'occhio del navigatore, rendendole ad esempio trasparenti o dello stesso colore dello sfondo della pagina. In questo modo il navigatore non si accorge della presenza di tutte queste parole chiavi, per cui il testo gli risulta leggibile e comprensibile, mentre allo spider del motore di ricerca, il quale analizza il contenuto della pagina in modo automatico, da cima a fondo, una parola di un colore o di un'altro per lui è sempre testo, e conseguentemente si ritroverà ad indicizzare molto più testo e parole chiavi di quelle realmente necessarie.

Per contrastare il Keyword Stuffing, i motori di ricerca quali Google, Yahoo e Bing hanno perfezionato i propri spider, rendendoli più intelligenti, questi infatti adesso sono in grado d'inviduare le parole chiavi nascoste all'interno di un testo, inoltre se queste sono ripetute in maniera eccessiva non fanno altro che ottenere l'effetto contrario  di quello che volevano raggiungere, ovvero non solo non salgono nei risultati dei motori ma anzi vengono ulteriormente penalizzati, se non addirittura bannati scomparendo del tutto dai risultati di ricerca.

Per aggirare questo controllo da parte dei motori, i mascalzoni si sono inventanti un nuovo stratagemma, che consiste nel prendere una porzione di testo e rielabolarla in modo da farla sembrare naturale allo spider del motore, ingannandolo così nuovamente sottoponendo alla sua scansione ulteriore testo ed ulteriori parole chiavi che vanno a ripetersi e a sommare a quelle presenti nel testo originario. Vi sono diversi programmi che automaticamente rielaborano il testo, uno di questi è ArticleBot della Strike Saturday.

Purtroppo per loro, la tecnica del Keyword Stuffing e della rielaborazione testi anche tramite l'uso di programmi automatizzati è diventata facile da scoprire da parte degli spider dei motori di ricerca, questi sono sempre più sofistificati e con algoritmi raffinati in grado d'inviduare parole chiavi nascoste e ripetute in modo eccessivo.

 

La tecnica del Link Farming

Un'altro parametro molto importante valutato dai motori di ricerca è il numero di link che rimandano al proprio sito web da parte degli altri siti. Il presupposto è quello che se un sito è particolarmente linkato (riceve link in ingresso), vuol dire che quel sito è popolare, che offre risorse e/o contenuti importanti e di qualità. Quindi tanti più link un sito web riceve in ingresso tanto più alta sarà la valutazione di quel sito da parte dei motori, e conseguentemente spunterà nei risultati di ricerca prima degli altri per lo stesso contenuto trattato. Tale parametro viene chiamato anche link popularity, il quale influenza pesantemente il Page Rank di una pagina web (valore assegnato da Google ad una pagina web), quindi un sito con Page Rank più alto spunterà prima di altri nelle SERP.

Sfruttando il meccanismo della link popularity, i siti web che vogliono scalare i risultati in maniera non legittima, adottano delle soluzioni volte ad incrementare in modo non spontaneo il numero di link che puntano al proprio sito web. La soluzione più diffusa è quella di creare dei siti web fasulli, il cui solo scopo è quello di contenere dei link che rimandano al sito di cui si vuole aumentare la link popularity, detti siti vengono chiamati Link Farm.

Un'altra soluzione legata al link farming è quella di spargere per il web dei link che rimandano al sito oggetto di aumento della valutazione, sfruttando gli innumerevoli blog, forum e wiki presenti nel web, lasciando dei commenti in cui è possibile anche inserire un url di riferimento, tale tecnica è detta anche di Spam Comment.

Per contrastare il link farming e lo spamming sui commenti, i motori di ricerca ed in particolare Google hanno adottato una metodolgia diversa nel valutare i link in ingresso verso un sito web, non tutti i link infatti hanno peso uguale, ricevere un link da un sito autorevole e riconosciuto (magari con un page rank alto) ha molto più valore di ricevere un link da un commento presente in uno dei tanti blog sparsi per internet. Inoltre conta anche la pertinenza del sito stesso, ricevere un link da un sito che tratta il tuo stesso argomento è più pertinente di ricevere un link da un sito che tratta un tema del tutto diverso. Per questo oggi si parla sempre più di Trust Rank anzichè di Page Rank, ovvero la valutazione da parte di Google sulla qualità e popolarità di un sito web si spinge sempre più verso una valutazione qualitativa più che meramente numerica.

 

La tecnica del Cloaking

La tecnica del Cloaking consiste nel presentare allo spider del motore di ricerca un contenuto diverso e spesso arricchito rispetto alla pagina presentata invece all'utente. La tecnica del cloaking viene usata legittimamente dai webmaster dei siti fatti in flash, poichè i motori non sono in grado di leggere il testo presente in un filmato flash, tramite il cloaking è possibile segnalare al motore il contenuto della pagina così da essere indicizzati.

Purtroppo c'è chi usa il Cloaking per cercare d'ingannare i motori, usando del codice lato server su pagine dinamiche, viene riconosciuto se chi sta visitando la pagina web è uno user-agent di un motore di ricerca (lo spider) o un'utente normale, allo user-agent verrà presentata una pagina magari arricchita ed infarcita di parole chiavi ed al navigatore un'altra pagina.

La tecnica del Cloaking è particolare e non di facilissima implementazione per chi è alle prime armi, ciò nonostante anche in questo caso i motori di ricerca sono in grado di riconoscere le pagine che fanno uso di cloaking e se non usata legittimamente e molto facile essere bannati e scomparire dai risultati di ricerca.

 

La tecnica delle Doorway

La Doorway è una tecnica simile per certi versi ai siti di Link Farming, consiste infatti nel creare una pagina apposita con testi e parole chiavi per un determinato argomento. Quando l'utente cliccherà sulla doorway indicizzata dal motore non la visualizzerà, ma verrà reindirizzato al sito che si vuole promuovere. Le Doorway come il Cloaking è una tecnica spesso usata per ottimizzare i siti il cui contenuto grafico è prevalente rispetto a quello testuale, ed un uso legittimo delle doorway può portare a migliorie considerevoli in termini di risultati di ricerca, purtroppo però vengono spesso usate per fare spamdexing, pagine di doorway piene zeppe di parole chiavi col solo fine di essere indicizzate dai motori e spingere i siti interessati ed aumentarne la visibilità senza tener conto del contenuto e della qualità che poi verrà effettivamente presentata al navigatore.

 

La tecnica del Code Swapping

Il Code Swapping consiste nel creare una pagina ottimizzata per il motore di ricerca (e non per il navigatore) e sostituirla quando questa risulta ben indicizzata, tale tecnica fra tutte forse è la più difficile da individuare da parte dei motori, poichè nulla toglie al creatore della pagina di gestire ed affermare di aver sostituito la pagina col fine di aggiornare o migliorare il sito web.

 

La tecnica delle Pagine d'accesso

Molti siti Web mostrano una pagina di presentazione del sito, spesso realizzata con un'animazione flash o comunque dall'ottima grafica per attirare l'attenzione dell'utente ed invitarlo ad entrare e visitare il sito web. Ancora una volta soluzioni eleganti come queste vengono usate in maniera ingannevole per aggirare il motore di ricerca ed indirettamente a spese del navigatore, infatti alcuni siti sfruttano le pagine d'accesso per mostrare della grafica e del contenuto diverso da quello reale del sito. La pagina d'accesso così creata, riempita di parole chiave viene indicizzata dal motore che porterà navigatori su quella pagina, ma non è altro che uno specchietto per le allodole poichè il contenuto del sito e di tutt'altra natura, spesso pornografico.

Anche le pagine d'accesso illegittime vengono facilmente riconosciute oggi dai motori di ricerca, che tendono sempre più a dare importanza al contenuto dell'intero sito web.

 

Conclusioni

Gli spider dei motori di ricerca oggi sono molto più raffinati ed intelligenti del passato e molte delle tecniche di spamdexing illustrate in questo articolo sono facilmente riconoscibili e l'unico effetto che riuscirete ad ottenere sarà solo quello di essere penalizzati dal motore di ricerca se non addirittura bannati. Per vedere quali siti web sono stati banditi da Google e dagli altri principali motori di ricerca, potete visitare Search Engine Watch che oltre ad essere un'ottimo sito per SEO, può mostrarvi dei motori alternativi per la ricerca in grado di visualizzare anche i siti banditi.

Le tecniche di Farm Link, Cloaking, Doorway e Key Stuffing se non usate legittimamente sono assolutamente da evitare, essere banditi da Google per questo motivo può risultare disastroso per il vostro sito web che scomparirebbe completamente dai risultati di ricerca, e il suo reinsirimento è un'operazione lunga e difficile. L'unico consiglio che mi sento di dare in quest'ambito è quello di non far uso di tecniche di spamdexing, ma di lavorare onestamente al vostro sito web in modo da migliorare anche la posizione dei suoi risultati di ricerca, scrivete con naturalezza, parlate di argomenti pertinenti, siate utili per i navigatori, ottimizzate il layout del vostro sito web, puntate sempre più sul contenuto e sulla sua qualità che è quello a cui Google dà ogni giorno sempre più importanza, infine usate tecniche d'indicizzazione lecite o rivolgetevi ad esperti SEO seri, in generale siate onesti nel creare e gestire il vostro sito web e Google e gli altri motori vedrete che loro saranno con voi, i risultati poi verranno da sè.

 

Chiunque voglia aggiungere qualcosa in merito all'argomento, porre una domanda o dare un suggerimento, ogni commento è ben accetto.

Categorie: Sicurezza Informatica | Web

Tags:

Aggiungi Commento

biuquote
Loading