Blackhat SEO-blogeja on silmänkantamattomiin.  On SEOBlackHat, on Slightly shady seo, on Darkseoprogrammin ja miljoona muuta. Sitten löytyy keskustelualueita ja vaikka mitä. Monissa näistä ei jaeta kovin tarkkoja tietoja siitä miten tehdä mitäkin vaan puhutaan yleisemmin scenestä, tapahtumista tai vastaavista. Toisissa taas kerrotaan helposti hyödynnettäviä ohjeita jos haluaa alkaa käyttämään mustaa hattua, mutta ei sanota suoraan mitään hakukoneisiin liittyvää.

Näiden lisäksi on kuitenkin blogeja, joissa ajoittain kerrotaan mitä tehdä ja miten. Kysymys kuuluu, kuinka paljon näihin voi luottaa? Jos joku sanoo “Tämän tekeminen on sääntöjä vastaan ja tosi hyödyllistä, mutta kerron tämän nyt blogissani julkisesti. Ette jää kiinni, en käytä teitä koekaniineina tai mitään. Ilmaista hyötyä teille.”, kannattaako tähän uskoa?

Ellei oteta joitain oikein pienien underground piirien blogeja (joista täytyy tunnustaa, etten itse näihin piireihin kuulu), kaikki mikä blackhat blogeista löytyy on kuitenkin jo täysin julkista ja täten myös Googlen tiedossa. Eli jos on teknisesti mahdollista jäädä niistä kiinni, näin myös tapahtunee.

Malliesimerkki aiheesta

Malliesimerkki tästä ongelmasta on XSS haavoittuvuudet. En viittaa vain Marko Polojärven entryyn vaan tätä hänen väkisinlinkitykseksi kutsumaansa tekniikkaa on neuvottu käyttämään ainakin puolessa tusinassa mustaksi hatuksi itseään tituleeraavassa hakukoneoptimointiblogissa (ja ottaen huomioon minun seuraavan tusinaa sellaista, tuo on aika suuri osa).

Idea siis on, että saadaan hakukone uskomaan jollain sivustolla sivustolla olevan ihan eri sisältöä (vaikkapa linkki jonnekin), kuin siellä oikeasti on. Sitten hakukone luulee eduskunnan linkittävän sivuillesi ja niiden olevan todella arvokkaita. Tätä usein perustellaan sanomalla, että valtava määrä sivuja on tuolle haavoittuvaisia.

Ikävä kyllä, en usko hetkeäkään hakukoneiden lankeavan siihen. XSS on erittäin helppo tunnistaa ilman käytännössä yhtään false positiveja. Jos NoScript Extension - ilmainen, third party, open source, Firefoxin lisäosa - on tunnistanut nuo jo kuukausikaupalla, pitäisikö oikeasti uskoa, että Googlen insinöörit eivät osaa tai tajua lisätä paria yksinkertaista string-funktiota torjuakseen kyseiset menetelmät?

Mutta tuohan on jo vanha juttu!

Joku teistä voi miettiä, että miksi minä puhun näin vanhasta asiasta. Mainitsin Polojärven, jona artikkelista on jo jonkin aikaa. Mutta asia ei vanhene tässä ajassa. Jos katsotaan taaksepäin niin SEOBlackHat kirjoitti aiheesta vuonna 2005. Eteenpäin niin näitä entryjä on näkynyt vielä viimeisen kuukauden aikanakin.

Syitä ja seurauksia

Miksi tälläisiä ohjeita sitten kiertää? Yksi vaihtoehto on, että monien Blackhat SEO -blogien pitäjät eivät itse testaa kaikkea vaan lukevat vain jostain “Toi toimii” ja postaavat eteenpäin. Toinen vaihtoehto on, että se on jossain vaiheessa toiminut, blogin pitäjä testaa toimivaksi, postaa ja kun siitä tulee tunnetumpaa, se torjutaan. Kolmas vaihtoehto on, että näiden blogien pitäjät ovat vain v-mäistä porukkaa ja nauttivat ajatuksesta, että jonkun onnettoman yrittelijän sivustot tippuvat indeksistä.

Kenties kyseessä on jokin yhdistelmä noita. Blogin pitäjä tietää jonkin näistä toimivan, tietää ettei toimi pitkään ja lyö siis monta kärpästä yhdellä iskulla antaessaa lukijoille jotain hetken toimivaa herkkua. Täten blogi saa lukijoita, pitäjä kunnioitusta ja käyttäjät luulevat saavansa jotain erittäin hyödyllistä ja lopulta epäonnistuessaan kunnioittavat kirjoittajaa “Vau, se pystyy tohon vaikka mä en!”.

Vai onko Google (ja minä) oikeasti tyhmä?

Toisaalta, voinhan periaatteessa olla väärässä. Voihan olla, että Google ei tajua varoa edes XSS abusea. On niitä muitakin mokia siinä. Tänään tuli osuttua sivuun, jolla oli SEO titlensä ja sitten käyttäjille näytettiin Jasvascriptillä ihan eri title käyttäen normaali onLoadia body tagissa. Toki se  sivu oli googlen indeksissä (ja täten hakutuloslistassa) tällä SEO-titlellään, mutta silti aika räikeä viritelmä oli. Kun tuollaisia menee läpi, niin ehkä olen vain naiivi Googlerakastaja ajatellessani, että Google on korjannut tai tulee pian korjaamaan tämän vian.

Kenties olen ihan väärässä ja tällaiset helposti torjuttavat blackhat kikat jätetään täysin huomiotta? Totta puhuen, en edes vaivautunut testaamaan tätä. Jos asia on näin, niin elän mielummin naiivissa maailmankatsomuksessani, että Googlessa osataan parin vuoden varoitusajalla torjua tämä.

Ja mitäs tästä pitäisi jäädä käteen?

Kaikki Blackhat blogit (tai edes kaikki ne joihin pääsee ilman niitä IP-checkkejä ;)) eivät toki ole skeidaa vaan niissä on usein paljonkin hyödyllisiä ideoita, ohjelmointivinkkejä tai ihan vain mielenkiintoista luettavaa myös meille, joilla ei ole kauheasti intoa tai tarvetta lähteä oikeasti blackhattiä isossa mittakaavassa toteuttamaan.

Kannattaa kuitenkin aina niitä lukiessa miettiä, voiko siitä ohjeesta jäädä kiinni ja jos voi niin miksi se toimii yhä ja kauanko se vielä toimii. Kannattaa myös muistaa, että blogin ylläpitäjää tuskin harmittaa, jos sivustosi tippuu ohjeiden seurauksena indeksistä joko heti tai kolmen kuukauden päästä. Varmin tapa välttää nämä ongelmat lienee keskittyä blogeihin, joissa kerrotaan yleisiä ohjeita, joita kukin voi soveltaa sitten oman mielikuvituksensa ja taitojensa mukaan.

Esimerkiksi (muunmuassa) Polojärvi on kirjoitellut captchan murtamisesta, Slightly Shady SEO proxyjen scannaamisesta ja kun näihin yhdistää vielä elementin tai kaksi niin kaikki loppu configurointi jääkin oman halun, uskalluksen ja harkinnan varaan. Jos silloin mokaa niin ainakin saa syyttää vain itseään ja voi miettiä mitä teki väärin.

Niille jotka ovat lukeneet SEOBlackHatin “There is no advanced whitehat SEO” artikkelin, niin tiedätte kyllä mitä tarkoitan puhuessani mustan hatun hakukoneoptimoinnista tässä. Turha alkaa viilaamaan pilkkua määrityksistä. Tässä linkki jos joku ei ole lukenut kyseistä artikkelia.