Cloaking en het misleiden
van zoekmachines
Cloaking staat voor het 'misleiden' van een zoekmachine door
de bezoeker van een webpagina te identificeren. Indien de
bezoeker een zoekmachine is wordt er een andere pagina getoond
dan indien de bezoeker een gewone gebruiker met een browser
is. Twee argumenten om cloaking te hanteren zijn:
- Het beschermen van de strategische trefwoorden en opbouw
van de html code voor concurenten. Met cloaking kan je voorkomen
dat de code van je pagina die is geindexeerd door de zoekmachine
niet door de eindgebruikers kan worden bekeken.
- Het volledig optimaliseren van een pagina voor een zoekmachine.
Dit houdt in dat de pagina geen "overbodige" code
zoals bijvoorbeeld javascript of tabellen hoeft te hebben
maar puur op de zoekmachine is gericht.
Cloaking kan op een 2-tal manieren worden uitgevoerd:
- Door het afvangen van de agent name. Iedere bezoeker
van een webpagina kan worden geindentificeerd door zijn
agent name. Zo bevatten alle web browsers de naam Mozilla
in de agent name en hebben alle spiders van zoekmachine
een andere naam. Google gebruikt bijvoorbeeld de naam "google"
in de agent name.
- Door het afvangen van het ip-adres van de bezoeker. In
principe heeft iedere bezoeker / gebruiker op het web een
ip-adres. Zo heeft ook de spider van een zoekmachine een
ip adres.
Hoe gaat cloaking nu in zijn werk? Voordat de pagina door
de webserver aan de "verzoeker" van de pagina wordt
teruggegeven wordt er eerst op de server (middels een script)
gekeken wie de bezoeker is. Indien de bezoeker een spider
van een zoekmachine is wordt er een geoptimaliseerde pagina,
desnoods voor die specifieke zoekmachine, terug gegeven. Indien
de bezoeker een gewone gebruiker is krijgt deze een normale
pagina te zien. Om helemaal zeker te zijn dat een gebruiker
zich niet voordoet als een zoekmachine (immers de agent name
kan je zelf wijzigen, bijvoorbeeld met de Opera browser) wordt
er vaak gebruik gemaakt van een combinatie van de agent name
en het ip-adres. Voor een overzicht van spiders en hun ip-ranges
kan je het beste bij spiderhunter
terecht.
Overigens is cloaking iets anders dan het gebruiken van een
redirect. Het verschil zit hem in het feit dat bij cloaking
de pagina voordat deze naar de gebruiker wordt gestuurd aangepast
wordt aan deze gebruiker (server site) en bij een redirect
bestaat de pagina al en wordt de gebruiker doorgestuurd naar
een andere pagina.
Als je cloaking wilt gaan toepassen dan is mijn advies om
dit op ip-adres niveau te doen. Dit omdat je hiermee kan voorkomen
dat andere gebruikers (lees concurenten) je strategische code
kunnen achterhalen. Het enige nadeel is dat je in de gaten
moet houden wat de ip-adressen zijn van de specifieke zoekmachines,
dit omdat ip nummers nogal eens willen veranderen. Een goede
controle van de logfiles is dan ook noodzakelijk. Voer een
regelmatige controle uit op je log wie de robot.txt file opvraagt
(als het goed is vragen alleen spiders van zoekmachines deze
op!).
Wat vinden de zoekmachine's nu van cloaking? In het algemeen
houden zoekmachines niet van cloaking. Indien je cloaking
misbruikt dan loop je de kans dat de website uit de zoekmachine
wordt verwijderd. Als de cloak pagina bijvoorbeeld over zoekmachines
en cloaking gaat ga dan geen pagina over diensten en producten
van je website tonen maar wees oprecht en toon informatie
over zoekmachines en cloaking. In het algemeen: gebruik cloaking
dan ook alleen om je strategische code te beschermen.
Overigens ben je in staat de geindexeerde pagina in Google
te bekijken. Bij de zoekresultaten staat er altijd een link
"In cache". Hier kan je precies zien hoe de pagina
is geindexeerd (dus ook van je concurent!).
Toepassen van cloaking scripts
Er zijn een aantal mogelijkheden om cloaking toe te passen.
Indien je website uit statische pagina's bestaat kan je gebruik
maken van simpele perl scripts om cloaking toe te passen (mits
je in staat bent om zelf perl script te installeren op je
server). Op spiderhunter staan een aantal perl
scripts in combinatie met een database waarin de spiders
met ip-adressen staan.
Mocht je daarnaast over een dynamische website omgeving beschikken
zoals PHP / ASP / Coldfusion dan heb je zelf de mogelijkheid
om een stukje cloaking in te bouwen door of de gebruiker of
het ip adres uit te vragen en dan de juiste pagina te genereren.
Indien je meer informatie over cloaking zoekt dan kan je
wellicht het beste terecht bij Fantomaster. |