Kæmpe lækage afslører algoritmerne bag Googles søgemaskine
Googles søgealgoritme er måske det mest betydningsfulde system på internettet, idet den mere eller mindre dikterer, hvilke hjemmesider der lever og dør, og hvordan indholdet på internettet ser ud. Googles søgemaskine har nemlig en markedsandel på mere end 90 procent globalt.
Men hvordan Google helt præcist rangerer hjemmesider, har længe været et mysterium, som alle, der arbejder med søgemaskineoptimering (SEO), har forsøgt at gennemskue i årevis.
Se også: Google gjorde med vilje søgeresultater dårlige for at tjene flere penge
Lækage afslører hemmeligholdte mekanismer i Googles søgemaskine
Nu ser en enorm lækage offentliggjort på GitHub, der hævder at afsløre tusindvis af sider med interne dokumenter, ud til at give et hidtil uset kig under motorhjelmen på, hvordan Google Søgning, som søgemaskinen officielt hedder, fungerer.
De lækkede oplysninger antyder, at Google ikke har været helt ærlige om mekanismerne i algoritmerne bag, hvordan hjemmesider rangerer i søgeresultaterne. Indtil videre har Google ikke reageret på flere mediers anmodninger om at kommentere dokumenternes legitimitet.
Rand Fishkin, som har arbejdet med SEO i mere end et årti, siger, at en kilde delte 2.500 sider med dokumenter med ham i håb om, at rapportering om lækagen ville modvirke de “løgne”, som Google-medarbejdere har delt om, hvordan søgealgoritmen fungerer.
Dokumenterne beskriver Googles søge-API og viser, hvilke oplysninger der er tilgængelige for medarbejderne, hævder Rand Fishkin.
De detaljer, som han deler, er omfattende, tekniske og sandsynligvis mere læselige for udviklere og SEO-eksperter end for lægfolk. Indholdet af lækket er heller ikke nødvendigvis bevis for, at Google bruger de specifikke data og indikatorer nævnt i de lækkede oplysninger til at rangere hjemmesider i søgeresultater.
Se også: Google-forslag er ”den største trussel mod det åbne internet”
SEO-ekspert vil afsløre Googles “løgne”
Lækagen skitserer snarere, hvilke data Google indsamler fra hjemmesider og brugere af søgemaskinen og giver indirekte hints til SEO-eksperter om, hvad Google ser ud til at interessere sig for, som SEO-ekspert Mike King skrev i sin oversigt over dokumenterne.
De lækkede dokumenter berører emner som, hvilken slags data Google indsamler og bruger, hvilke hjemmesider Google bruger til følsomme emner som valg, hvordan Google håndterer små hjemmesider og meget mere. Nogle oplysninger i dokumenterne ser ud til at være i modstrid med offentlige udtalelser fra Googles repræsentanter, hævder Rand Fishkin og Mike King.
“‘Løgn’ er hårdt, men det er det eneste korrekte ord at bruge her. Selv om jeg ikke nødvendigvis bebrejder Googles offentlige repræsentanter, at de beskytter deres egne oplysninger, er jeg uenig i deres bestræbelser på aktivt at miskreditere folk i marketing-, teknologi- og journalistverdenen, som har fremlagt reproducerbare opdagelser,” skriver Mike King.
Ifølge Rand Fishkin har Google ikke bestridt rigtigheden af lækagen, men en medarbejder skulle have bedt ham om at ændre nogle formuleringer i indlægget om, hvordan en begivenhed blev karakteriseret.
Se også: Googles søgeresultater er blevet dårligere – fyldt med SEO-spam
Bruger data fra Chrome til rangering af hjemmesider
Googles hemmelighedsfulde søgealgoritme har skabt en hel industri af marketingfolk, som nøje følger Googles offentlige retningslinjer og udfører dem for millioner af virksomheder over hele verden. Bedre kendt som søgemaskineoptimering (SEO).
Men nogle detaljer i de lækkede dokumenter sætter spørgsmålstegn ved nøjagtigheden af Googles offentlige retningslinjer om, hvordan Googles søgemaskine fungerer.
Et eksempel, som Rand Fishkin og Mike King nævner, er, om Google Chrome-data overhovedet bruges i rangeringen af hjemmesider. Google-repræsentanter har gentagne gange antydet, at de ikke bruger Chrome-data til at rangere sider, men Chrome nævnes specifikt i afsnit om, hvordan hjemmesider vises i Søgning.
I skærmbilledet ovenfor skulle de links, der vises under den primære URL (24tech.dk), ifølge dokumenterne være oprettet delvist ved hjælp af Chrome-data.
Se også: Slut med at finde cachelagrede søgeresultater i Google
Ingen tegn på “E-E-A-T” i Googles algortime
Et andet spørgsmål er, hvilken rolle – om nogen – E-E-A-T spiller i rangeringen. E-E-A-T står for experience, expertise, authoritativeness og trustworthiness. Det er en Google-metrik, der bruges til at evaluere kvaliteten af resultater.
Googles repræsentanter har tidligere sagt, at E-E-A-T ikke spiller en faktor i rangeringen af hjemmesider. Rand Fishkin bemærker, at han ikke har fundet meget i dokumenterne, der nævner E-E-A-T ved navn.
Mike King beskrev dog i detaljer, hvordan Google ser ud til at indsamle forfatterdata fra en side og har et felt til at angive, om en enhed på siden er forfatteren. I en del af de dokumenter, som Mike King har delt, står der, at feltet “hovedsageligt blev udviklet og justeret til nyhedsartikler … men også udfyldes til andet indhold (f.eks. videnskabelige artikler).”
Selv om dette ikke bekræfter, at bylines er en eksplicit rangeringsmetrik, viser det, at Google i det mindste holder styr på denne egenskab. Google-repræsentanter har tidligere insisteret på, at forfatterens byline er noget, som hjemmesideejere skal anvende for læsernes skyld og ikke for Googles skyld, fordi det ikke påvirker rangeringen.
Se også: Googles AI-søgeresultater får allerede annoncer
Giver indblik i hidtil lukket land
Selv om dokumenterne ikke ligefrem er en rygende pistol, giver de et dybt, ufiltreret kig på et strengt bevogtet black box-system. Den amerikanske regerings antitrustsag mod Google – som drejer sig om søgemaskinen – har også ført til, at intern dokumentation er blevet offentliggjort, hvilket giver yderligere indsigt i, hvordan Googles vigtigste produkt fungerer.
Googles generelle lukkethed om, hvordan Søgning fungerer, har ført til, at hjemmesider ser ens ud, mens SEO-markedsførere forsøger at udmanøvrere Google ud fra de hints, som it-giganten giver. Rand Fishkin kritiserer også de publikationer, der troskyldigt støtter Googles offentlige påstande som sandhed uden yderligere analyse.
“Historisk set har nogle af søgeindustriens mest højlydte stemmer og mest produktive udgivere været glade for ukritisk at gentage Googles offentlige udtalelser. De skriver overskrifter som ‘Google siger, at XYZ er sandt’ i stedet for ‘Google hævder XYZ; beviserne tyder på noget andet’,” skriver Rand Fishkin og tilføjer:
“Vær sød at gøre det bedre. Hvis denne lækage og retssagen mod justitsministeriet kan skabe bare én ændring, så håber jeg, at det er den.”