Förhindra duplikat innehåll med en kanonisk sida

Duplikat innehåll kan lätt uppstå och kan orsaka problem hos sökmotorer, det ska dock påpekas att de är ganska smarta nuförtiden. Med det sagt förhindrar det inte oss ifrån att använda de tekniker som finns tillgängliga för att påtala för sökmotorerna vilken sida det egentligen är som gäller bland flera snarlika.

Enkelt uttryckt är duplikat innehåll, eller duplicate content, som det heter på engelska en bieffekt utav att flera olika länkar presenterar samma sida och innehåll. Vi kan ta Göteborgs-Posten som ett typexempel som har detta problemet.

Duplicate content hos GP.se
Senast felaktigt indexerade filen skedde bara för 1 dag sedan

På varje sida hos GP.se finns det funktioner för att dela till Facebook och Twitter. För att enkelt mäta effekten av hur många besökare de erhåller läggs det därför på en kampanj-parameter på länken. Följande 3 länkar går alla till samma innehåll, men det är bara den översta som borde väljas att indexeras av sökmotorer, de andra skapas enbart när man delar sidan via sociala medier och e-post.

http://www.gp.se/nyheter/1.1081975-luras-med-falska-apple-sms
http://www.gp.se/nyheter/1.1081975-luras-med-falska-apple-sms?ref=fb
http://www.gp.se/dela/1.1081975-luras-med-falska-apple-sms

Båda de två typerna av länkar har indexerats av Google, det handlar i skrivande stund om 5700 sidor som blivit felaktigt indexerade och där man genom en enda kodrad kan rätta till felet.

rel=”canonical”

Genom att skapa en kanonisk sida talar man om vilken av av alla sidor som är den föredragna. Det finns i dagsläget två olika sätt att skapa en kanonisk sida.

Lägg till rel=”canonical” i html-kodens <head>
Genom att lägga in en rad html-kod i de sidor som inte är huvudsidan, påtalar du för sökmotorerna att du föredrar sidan du länkar till. I vårt exempel med Göteborgs-Posten ska de således lägga in följande i sidans huvud. Det skadar inte att även ha koden på den prioriterade sidan även om det är onödigt.
<link rel=”canonical” href=”http://www.gp.se/nyheter/1.1081975-luras-med-falska-apple-sms” />

Svara med rel=”canonical” i HTTP-huvudet
Denna variant är mer teknisk och kräver tillgång till din webbserver, den passar bra för indexerade filer som ej använder sig utan HTML, till exempel PDF-dokument. I HTTP-huvudet skickar du med länken till din föredragna variant av filen, precis som i exemplet ovan. Våra exempelsidor bör således svara med följande extra header i HTTP-huvudet.
Link: <http://www.gp.se/nyheter/1.1081975-luras-med-falska-apple-sms>; rel="canonical"

Ovanstående header kan skapas på flertalet sätt, ett exempel skrivet i PHP ser ut enligt:
<?php
header("Link: <http://www.gp.se/nyheter/1.1081975-luras-med-falska-apple-sms>; rel=canonical");
?>

Värt att tänka på är att rel=”canonical” ses som ett förslag till sökmotorer och är inget de måste följa, av erfarenhet har jag dock sett att de ofta litar på detta tips.

Om du flyttar innehåll och vill skicka vidare besökaren direkt till en annan adress är en kanonisk sida inte rätt väg, då ska du kika på 301-redirect som är ännu en header som kan anges i HTTP-huvudet. Återigen, om sidan använder PHP kan man t.ex. skriva följande i koden:

<?php
header ('HTTP/1.1 301 Moved Permanently');
header ('Location: http://www.exempel.se/ny-sida');
die();
?>

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *