Moderat.se – nu i Drupal med nya SEO-missar

Moderaterna har gjort om sin webbplats igen, och äntligen övergivit det märkliga publiceringssystemet Lithium till förmång för Open Source-verktyget Drupal. Det är en ny fräsch sajt, där de flesta av de rena felaktigheter som fanns inbyggda i den gamla sajten nu verkar vara åtgärdade.

Tyvärr har Drupal (liksom de flesta CMS) sina egna inbyggda fel när det kommer till sökmotoroptimering, och det verkar inte som om utvecklarna har gjort särskilt mycket ha gjorts för att åtgärda dessa. Eller, det går att ana att man har vetat om några av dessa inbyggda SEO-fel, men försöken att åtgärda dem är en smula halvdana.

Duplicerat innehåll på klassiskt Drupal-sätt

Jag har försökt förstå varför Drupal-sajter alltid sprutar ur sig två URLar för alla sidor på en sajt, men inte fått några tydliga svar. På Moderat.se finns just nu 474 sådana sidor som Google har hittat. Sidan om Fredrik Reinfeldt kan alltså nås både från http://www.moderat.se/node/1322/foretradare/6 och från http://www.moderat.se/foretradare/fredrik-reinfeldt. Dessutom kan man nå samma sida via http://www.moderat.se/node/6, men den sidan är korrekt 301-redirectad.

Om någon Drupal-utvecklare kan förklara varför dessa /node/-sidor finns på alla Drupal-sajter så får ni gärna förklara för mig. Kommentarsfältet står öppet.

Canonical där den inte behövs

Nu verkar det som om utvecklarna har varit väl medvetna om duplicate content-problemet, och faktiskt lagt in en canonical-tagg på sidorna för att peka ut vilken sida som Google ska indexera. Det är bara det att canonical-taggen ligger på sidorna som har rätt URL (/foretradare/fredrik-reinfeldt) och inte på den andra, duplicerade, och på alla sätt oönskade sidan.

Det är alltså inte fel att skriva ut canonical-taggen på den korrekta sidan, men det är ju främst den felaktiga node-URLen som behöver den. Den sidan verkar dock inte ha modulen som skriver ut canonical-taggen. Det blir lite märkligt.

Fel sorts interna länkar skapar URL-problematiken

Problemet med den här typen av dubbla URL-uppsättningar som alltid skapas på Drupal-sajter, är att den förment sökmotorvänliga sidan (den med lättbegripliga URLar) är ett utanpåverk, som inte är inbyggd från grunden i Drupal. Det märks väldigt väl på att sajten själv sprätter ur sig fel länkar när länkar skapas automatiskt.

I det här fallet är det en sorts länkar som skapas ifrån sajtens nyhetssidor som åstadkommer URL-förvirringen. Den senaste nyheten (från 3 oktober) handlar om att Fredrik Reinfeldt har varit och besökt moderater i Paris och innehåller en länk till hans företrädarsida. Den skapas automatiskt av Drupal på en nivå som inte verkar ha tillgång till de ”SEO-vänliga” urlarna och länkar därför till  /node/1322/foretradare/6 istället för till /foretradare/fredrik-reinfeldt.

Själva nyhetssidorna på Moderat.se har inte några länkar innehållandes node, men det finns många andra typer av sidor som har det. Till exempel alla de platshållarsidor som finns för lokala moderatsajter. Därför kan man hitta en sida för moderaterna i Hjo både på http://www.moderat.se/hjo/node/node/2065 och på http://www.moderat.se/hjo/ – båda lika innehållstomma medan http://www.moderat.se/stockholms-stad-och-lan pekar vidare till http://moderaterna.net/ som är stockholmsmoderaternas officiella sajt.

Innehållslösa URL-parametrar

Det var länge sedan man brukade kunna förändra innehållet på webbplatser genom att hacka deras URLar. På mya moderat.se går det bara nästan att få till det som att jag skulle vara en av moderaternas företrädare i riksdagen: www.moderat.se/foretradare/nikke-lindqvist?f[0]=field_mod_representative_pos%3A8 är en fungerande länk, om möjligen är jag lite taskig som länkar med den här, eftersom den skapar en duplicerad sida mot andra URLar, men det är för roligt för att låta bli. Och eftersom det finns en sidbläddrare längst ner på söksidan som tar med sig den ursprungligt felaktiga URLen så lär det snart finnas massor av indexerade sidor med mitt namn på moderat.se.

Dessa oanvända URL-parametrar är ytterligare ett känt Drupal-problem när man använder sig av Drupals sökmoduler. Det värsta är att de skapar sidor som inte finns, men som kan indexeras av Google. Det bästa vore ju om man kunde blocka dem på något sätt, utan att behöva blocka de giltiga sidorna.

Väl många länkar innan innehållet på varje sida på sajten

 En annan sak som de Nya Moderaterna kommer att behöva se över på sin sajt är hur de olika menyerna ligger i koden. Varje enskild sida på sajten börjar med ett enormt menyblock där i stort sett varje politiskt distrikt länkas och alla de undermenyer som döljer sig i huvudmenyn. Först därefter, efter 61 länkar, kommer det egentliga innehållet på sidan. Då är vi på rad 409 i koden.

Det här skulle man kunna städa upp genom att flytta det stora länkblocket som visas när man klickar på Sverigekartan, till längre ner i sidkoden. Huvudmenyn ska förstås ligga där den ligger, men möjligen skulle man kunna strama upp hur många objekt som ska visas i de utfällbara undermenyerna.

Spretiga h-rubriker

Som så många andra sajter har nya moderat.se använt sig av h-rubriker som ett formelement istället för att faktiskt ta hänsyn till rubrikernas vikt. Det gör att väldigt många sidor på sajten delar en uppsättning betydelselösa <h2>-rubriker (Moderaterna där du bor, Moderata nätverk, Du är här, Published) och <h3>-rubriker (Kontakt, Följ oss!) och det gör att de betydelsebärande rubrikerna har fått gå ner till <h4> i vikt. Det gör att alla de verkligt relevanta underrubrikerna alla är mindre viktiga än de innehållstomma delade rubrikerna. Det här är ett otroligt vanligt fel som många webbplatser delar, och som ger stora möjligheter till förbättring.

Tillsammans ger felen dålig synlighet

Det här kommer, med tiden att bli ett problem för Moderat.se, eftersom de många länkarna innan innehållet leder bort intresset från vad varje enskild sida egentligen handlar om. Det märks, tycker jag, om man söker efter namnet på några moderata frågor och företrädare.

Fredrik Reinfeldt, som är länkad (på rätt sätt från huvudmenyn) syns ju bra i sökresultatet, men en sökning av lite olika moderata riksdagsledamöter visar att det är sämre med synligheten. Anton Abeles sida finns inte på förstasidan i Google, och det går heller inte att hitta moderat.se vid sökningar efter Lars Beckman eller Sofia Arkelsten.

Samma sak när man söker efter moderat politik i Google. Jag har försökt hitta några spår av de moderata politiska frågorna i Google. Men kanske har jag sökt slarvigt. Men det är väl, i slutänden, dessa som borde synas i Google? Då verkar det så konstigt att partibloggen eller nyhetssidan, främst handlar om olika företagsbesök, och inte diskuterar politiken.

 

 

  • Pingback: Nya Moderaternas nya Moderat.se

  • http://vvv.tobiassjosten.net/ Tobias Sjösten

    Problemet med de duplicerade sidorna är inget generellt Drupal-problem. Utvecklarna har byggt sajten med modulkombon Pages/Panels, vilken ger bättre kontroll på sidornas struktur oh möjlighet att återanvända innehåll i olika mallar. Men som Stan Lee lärt oss: med stor kraft kommer ett större ansvar.

    Du har dock rätt i att Drupal hanterar ”överflödiga” URL-parametrar på ett suboptimalt sätt. Om requestens path (t.ex. /ett/två/tre) inte har en exakt match så testas en nivå upp (t.ex. /ett/två), tills en match hittas. Exempelvis ger http://www.economist.com/world/united-states exakt samma sida om http://www.economist.com/world/united-states/trololol.

    Efter fem års dagligt arbete i CMS:et skulle jag säga att Drupal överlag har väldigt goda förutsättningar för att göra bra SEO. Det kräver ju så klart en insats av utvecklarna och att det prioriteras i projektet, vilket kanske inte var fallet här?

    • http://www.lindqvist.com/ Nikke Lindqvist

      Det är möjligen inget generellt Drupal-problem, men jag ser ju samma typ av URLar på i stort sett alla större Drupal-sajter. Det är dock inte alla som spottar ur sig dessa URLar i lika stor mängd som moderat.se.

      • Bernt Johansson

        Det finns tilläggsmoduler som säkerställer att ”system paths” alltid pekas om med 301 redirect till ”alias”. För det är så Drupal hanterar URLer. Alla URLer har en system path, och den kan man ändra med hjälp av ett alias, och man kan automatisera att alias skapas baserat på regler. Sedan finns det moduler som gör fel när de automatiskt skapar länklistor mm, och länkar till syste, path istället för till alias…

        Jag har jobbat med Drupal under de senaste 7 åren och även med SEO, och frågar du mig så är Drupal det absolut bästa ramverket. Mest flexibelt, och har man bra kunskaper i PHP så finns det nästan inget som man inte kan lösa.

        Men visst är det lätt att ta en Drupal installation ”off the shelf” och sedan sätta upp en sajt som blir helknasig ur SEO perspektiv, om man inte har koll på vad man gör. Man måste komma ihåg att Drupal inte är ett CMS utan ett CMF (F=Framework) och att man måste utveckla och anpassa en hel del för att det ska bli perfekt. DÅ inte bara ur ett SEO perspektiv.

      • http://www.mkse.com/ Martin Edenström

        Kolla om du hittar problemet hos detta nya parti på samma CMS: http://www.mkse.com/2012/11/22/miljopartiet-mp-se-lanserad-pa-drupal/

        • http://www.lindqvist.com/ Nikke Lindqvist

          Jag letar! Kommer dock inte att synas förrän de släpper in Google i nya sajten.

  • http://www.robertnyberg.com/ Robert Nyberg

    Det där verkar vara ganska vanligt sätt att hantera pages i Drupal och inte så framgångsrikt för SEO. Vad är lösningen?

    • http://vvv.tobiassjosten.net/ Tobias Sjösten

      Ja, Pages/Panels är en vanlig metod att bygga sidor i Drupal men det har inget inneboende problem för SEO. Som med all webbutveckling kräver det eftertanke och kunskap för att få till bra.

      Lösningen är så klart att inte skapa duplicerat innehåll. I de fall det inte går att undvika kan du enkelt lägga på en 301:a eller applicera en canonical-tag för att visa vilken av sidorna du vill använda.

      Resterande on-page-problem är helt och hållet upp till HTML:en. Om du inte använder ett befintligt tema så bör du se till att din frontendare har koll på headers och semantisk markup.

      • http://www.robertnyberg.com/ Robert Nyberg

        Jo jag är medveten om SEO lösningar. Men, varför är det så många som bygger upp sidorna så i Drupal? ligger inte det i kärnan?

        • http://vvv.tobiassjosten.net/ Tobias Sjösten

          Vad menar du med ”bygger upp sidorna så”? Just med Pages/Panels eller med dålig SEO? Oavsett så ligger det inte kärnan.

          Drupal är ett generalistiskt ramverk med en enorm flexibilitet. Tyvärr innebär det också *mycket* abstraktion (ännu mer så med Pages/Panels) och det blir lätt oöverskådligt och svårarbetat om man inte aktivt arbetar med att hålla nere komplexiteten.

          Det är nog det enda sättet som Drupal i sig påverkar produktionsvärdet negativt. Resten är upp till kunskap, erfarenhet och, framför allt, prioritet.

          • http://www.robertnyberg.com/ Robert Nyberg

            Jag menar med pages och jag har jobbat med Drupal och håller med dig om att det blir väldigt svårarbetat om du inte håller ner komplexiteten. SEO är kanske nedprioriterat i det här case som i många fall.

      • http://www.lindqvist.com/ Nikke Lindqvist

        Tack för svaret! Och jo, det är ju bara de duplicerade sidorna och de innehållslösa parametrarna som är distinkt knutna till Drupal. Men det jag inte förstår, är om det inte går att bygga denna typ av sidor på något annat sätt, som inte genererar en ”ursprunglig” node-URL? Det vore ju, rent SEO-mässigt, faktiskt bättre att inte genererera några ”SEO-vänliga” URLar för dessa sidor, om nu inte systemet självt kan låta bli att spotta ur sig dessa adresser vid olika anrop.

        Eftertanke behövs ju alltid, och i alla system. Men här verkar det vara nästintill omöjligt att övervinna. Jag har hittills inte hittat en enda större Drupal-installation som inte har de här problemen.

        • http://vvv.tobiassjosten.net/ Tobias Sjösten

          Det mesta innehållet i Drupal är s.k. ”noder” och varje nod får en landningssida per automatik. Du kan dock konfa Drupal att släppa eller redirecta de sidorna per nodtyp (artikel, bild, etc). Det är en ”femminutare”.

          Jag har inte uppfattat det här generella Drupal-problemet men jag har säkert inte heller sett de stora releaserna med samma ögon som dig, Nikke.

  • http://twitter.com/bjornorrenius Björn Orrenius

    Tjenare
    Jag tror inte vi har haft detta problem på http://Mobler.se som du vet är gjort i Drupal. Gör man motsvarande sökning: site:mobler.se inurl:node får man endast två träffar varav den ena är blockad av robots.txt och den andra är själva robots.txt.

    Vi har använt modulen Pathauto som automatiskt skapar URL-alias utan /node/ med en 301-redirect från node-URLen.
    Dessutom har vi blockat /node/ i robots.txt.

  • http://twitter.com/kalle_hansson Kalle H

    Nikke, kan du utveckla problematiken med att moderat.se läser in så många länkar i början av varje sida?

    • http://www.lindqvist.com/ Nikke Lindqvist

      Gärna det! Tänk dig att du är en blind person som får sidan uppläst för dig. Inklusive alla de där länkarna i sidhuvudet. Du skulle nästan ha tröttnat innan du kommer ner till huvudrubriken. Lite så föreställer jag mig att det är för Googlebot, bara att Googlebot även kommer att försöka följa alla länkarna.
      Riktigt stora, starka sajter, som Aftonbladet.se, kan mäkta med det, men vi andra bör inte ha mer än ett tiotal länkar i sidhuvudet.
      Däremot skulle man kunna flytta de här länkarna kodmässigt, då att de ligger i sidfoten, men ändå visa blocket där det ligger idag.

      • http://twitter.com/kalle_hansson Kalle H

        OK, tack! Det var ungefär så jag tänkte.

  • Pingback: Moderaterna i Google-resultatet

  • Pingback: Moderaterna överger Drupal för Wordpress, mobilanpassar år efter Sossarna | MKSE.com - All about CMS