Citera med blockquote och ange källan med cite

Jag älskar frågvisa kunder, det finns inget så utvecklande som att få formalisera sin kunskap till svar på vetgiriga frågor. Så när Katarina Jardenberg nu har kommit på plats på Flygstolen.se så ser jag fram emot en härligt utvecklande höst när det kommer till sökmotoroptimering. Dagens fråga från Katarina är hur man bäst kan använda sig av bra texter som man har fått tillstånd att återpublicera, utan att råka utsätta sig för risken att Google surar till över duplicerat innehåll. Och eftersom frågan är såväl allmängiltig som (i just den här kontexten) WordPress-specifik, så kommer svaret nu i form av ett blogginlägg istället för bara som ett mail.

Först och främst. Det är förstås hart när omöjligt att bygga hela din sajts Google-närvaro enbart med duplicerat innehåll. Men samtidigt: riskerna kring duplicerat innehåll är helt klart överdrivna. Du blir inte straffad för duplicerat innehåll, men Google är såpass bra på att förstå vem som var först med att publicera en text att det är nästintill omöjligt att ranka bra med någon annans innehåll. Det är däremot  inte alls farligt att återpublicera kortare eller längre stycken text från andras sajter, förutsatt att du attributerar texten korrekt, och även lägger till några egna stycken unikt innehåll på sidan. Och den som tittar i Googles sökresultat ska se att jag har rätt. Men mer om det längre ner.

Blockquote för korrekt citering av text

Det korrekta sättet att citera text från en annan sida är genom att använda html-taggen <blockquote>, som finns inbyggd i verktygsraden i många publiceringssystem, däribland WordPress.  Blockquote känner alla till men det finns ett attribut till taggen, cite, som är avsett för att peka på originalkällan för ett citat. Lika okänt verkar det vara att taggen blockquote kan ta alla de globala html-attributen, däremot attributet lang.

Man kan alltså, utan att ens länka till källan, ange vad som är originalkällan till en text på webben, och detta på ett maskinläsningsbart sätt. Tyvärr finns inget sätt att ange cite-attributet utan att gå in i källkoden för din bloggpost eller sida i WordPress-editorn, men så här gör du:

<blockquote cite=”http://the-big-bang-theory.com/quotes/character/Sheldon/” lang=”en_US”>

Sheldon: Why are you crying?

Penny: Because I’m stupid!

Sheldon: That’s no reason to cry. One cries because one is sad. For example, I cry because others are stupid, and that makes me sad.

</blockquote>

Det är en liten signal, men den säger, som jag ser det, att jag som sajtägare vet att den här texten kommer från en annan sajt och att jag vill att denna andra sajt ska ses som huvudkällan för den citerade texten. Och det verkar fungera. Låt mig illustrera med några exempel på användningsområden:

När man citerar en väldigt känd och brett spridd text

Jag har en citerar ofta Google när de berättar om nyheter i sitt sätt att arbeta. (För ofta enligt vissa.) Om jag citerar en längre text så använder jag alltid blockquote med attributet cite. Detta eftersom jag ju inte alls har för avsikt att ranka på den citerade texten, utan snarare på mina kommentarer till den. Ett exempel är bloggposten jag skrev om hur Google bytte till SSL-kryptering för inloggade användare och därmed gjorde det hart när omöjligt att spåra vilka sökfraser som driver trafik till sajten för denna typ av användare.

Ändå, om man söker på den första meningen i det stycke jag citerade, så har jag en hyfsad position på Google.se:

Placeringen tyder, som jag ser det, på att min bloggpost har vunnit på att citera källan korrekt. Om man istället söker efter min rubrik, formulerad som frågan som många ställde sig, så placerar sig förstås min sajt som etta och längre ner på Googles förstasida syns några av alla dessa sajter som återpublicerar hela eller delar av mina blogginlägg (med eller utan att länka till eller ens ange källa):

Ett annat exempel:

När man deltar i ett bloggupprop, eller vill återpublicera en gästbloggpost eller artikel som man skrivit åt en annan sajt

I det här exemplet ser man att man kan återpublicera även längre texter, och genom att ange huvudkällan undvika att ens texter filtreras bort som duplicerat innehåll. Men det gäller förstås att lägga till egen text, såväl innan, som efter, den citerade texten.

Ett exempel på det var det bloggupprop om två fänglsade egyptiska bloggare, som jag deltog i, i december 2011. Ett bloggupprop går ju till så att ett antal bloggare, mer eller mindre samtidigt, publicerar samma text, gärna länkar till varandra och försöker få fler att återpublicera samma text ännu fler gånger.

Jag citerade, i mitt inlägg, den gemensamma källan, som var ett öppet och för alla läsbart Google-dokument. När man söker på de första orden i uppropets text så placeras mitt blogginlägg ändå på en hyfsad position i sökresultatet. :

De sajter som rankar bättre, vederlägger, egentligen, på ett ännu bättre sätt, den allmänt vedertagna sanningen om att duplicerat innehåll straffar sig per automatik. Skillnaden är dock att de två översta ligger på den otroligt starka WordPress-domänen. Därefter syns Marcin de Kaminskis blogg, vilket alls inte är konstigt eftersom Marcin var en av de drivande bakom uppropet, och fick förstalänken från många av de bloggposter som publicerade blogguppropet. Om Politometern hade saknats i listningen hade det förvånat mig mycket.

Söker man på min rubrik, så finns det åtskilliga sajter som vill vara med och synas. Däribland Ajour.se, som inte alls syntes i den förra sökningen, trots att de, vid tillfället, troligen fick mer uppmärksamhet, och fler länkar till sin publicering.

Söker man efter enbart ordet Blogguupprop så ligger däremot Ajour.se överst, söker man efter de båda hashtaggarna som användes, #FreeAlaa och #freeMaikel så ligger den här sajten i topp.

En intressant detalj i sammanhanget är att min sajt inte alls kan hittas när man söker efter ett utdrag av den engelska texten till blogguppropet (som jag faktiskt glömde attributera i hetsen vid publiceringen), men att min sajt placerar sig när man söker efter den h2-markerade, engelska rubriken.

Sammanfattning

En kodmässigt korrekt attributering i citeringar hjälper mot att filtreras bort som duplicerat innehåll, och verkar även kunna stötta sidan på sökningar efter den citerade texten. Om du däremot struntar i attributeringen så kan det vara svårt att synas på sökningar efter unika textsträngar från den duplicerade texten, men själva det faktum att du återanvänder text förhindrar inte att sidan visas på andra relevanta söksträngar, som t.ex kan finnas i en introducerande och avrundande text på sidan eller i sidans unika rubrik.

Jag anser därför att riskerna med att då och då citera längre textstycken som redan finns publicerade på andra sajter är klart överdrivna, men att man bör göra sitt yttersta för att vara transparent med källan.