Istället för ACAP – tjäna pengar på gamla nyheter

Eftersom jag, tvärt emot mina vanor, igår ägnade mig åt lite Google-bashing, är det idag dags för ytterligare ett hyllningstal. Google gör så mycket coolt som man kan ha så mycket nytta av – och faktiskt även tjäna pengar på.

Gårdagens stora nyhet var att tidningshuset Stampen, som äger några stora och en förfärlig massa små svenska tidningar, kommer att implementera ACAP, som är ett protokoll som syftar till att försvåra syndikering utan att för den skull förhindra spindling av tidningarnas webbplatser. Man vill gärna ha Google-trafiken, men man vill inte bjuda Google på något av innehållet i utbyte. ACAP fungerar där som ett sätt att ha kakan kvar även när den är uppäten (och WAN-företrädare skulle säkert hävda att det är exakt det som Google gör med deras textinnehåll). Det är så urbota dumt alltihopa. Jocke har skrivit en sammanfattning på Mindpark och Expressens chefredaktör Thomas Mattsson verkar tack och lov förstå att utlåsning inte är framtiden. Dagens webbchef, Emanuel Karlsten bloggade också om det underliga i att stänga ute sökmotorerna.

Tjäna pengar på artikelarkiven

Nåväl. Idag satt jag och Christian Bolstad och lekte med Googles robots.txt-fil som innehåller väldigt många godsaker. Där hittade vi bland annat Google Archive Search, en Google-tjänst som var en nyhet för oss båda. Ett underbart fynd faktiskt. Råkul att testa sökningar som faktiskt ger gamla historiska tidningsklipp från långt innan webben, och se att det finns tidningar som har förstått att det går att tjäna pengar på sina gamla arkiv. Många artiklar går nämligen att köpa som PDF-kopior. Det mesta är dock gratis. Vi lyckades inte hitta några svenska tidningar som PDF, men väldigt många amerikanska. Ett tips till de svenska tidningarna är att titta på Googles partnerprogram för att sälja PDF-filerna vidare.

Jag måste förstås även ge mig på en egosökning på mitt eget namn och hittade en och annan artikel från 2001 som jag aldrig förut hade sett.

När webben tar semester

Medan vi satt där, alldeles upphetsade över denna artikelskatt så dök nyheten om att City.se tar semesterstängt upp via Twitter. Det är så knasigt så jag knappt vet var jag ska börja. 40 000 sidor nyheter och bloggar har nu ungefär samma innehåll… I bästa fall kommer någon SEO-kunnig person styra upp semesterfrånvaron på City.se, i värsta fall kommer någon annan SEO-kunnig person få kavla upp armarna rejält i höst när City öppnar igen efter sin semester. David Nilsson var den som tipsade via Twitter och har också bloggat om knasigheterna.

DMOZ på ny adress hos Google

Det mest förvånande fyndet var faktiskt det som gjorde att vi började rota i google.com/robots.txt. Det var att Yahoo! listar backlinks (inkommande länkar) från Google.se/Top. Det visar sig att Google numera publicerar hela DMOZ-katalogen på Google.com/Top/ (och Google.se/Top eller valfri annan tdl) istället för bara under directory.google.com/ men inte har stängt ut andra sökmotorer från dessa sidor…

En annan godsak var att Google publicear urlarna till flera spännande xml-sitemaps längst ner i sin robots.txt-fil. Godis för folk med spindlar och helt öppet att rota igenom eftersom Google ju faktiskt rentav ber oss att göra det… Vem vill indexera alla Google Profile-sidor? Bing verkar tycka de är godis i alla fall… (exempel).