Az elmúlt évtized legnagyobb adatkiszivárgása felfedi a Google keresőmotor titkos működését

Két hét telt el azóta, hogy a Google, egy nappal az OpenAI hasonló bejelentése után, bemutatta, milyen jelentős fejlesztéseket hajtott végre mesterséges intelligencia alapú platformján, a Geminin. Ekkor mutatták be a keresőmotorjukba integrált verziót is, amely AI Overviews néven fut, és lényegében ugyanazt teszi, mint amit a Bing már hónapok óta tud: rövid összefoglalót ír a keresési eredmények fölött az általunk keresett témáról. Az elmúlt hét tapasztalatai alapján azonban ez az újítás nem vált be annyira jól.

A mesterséges intelligencia azt javasolta az embereknek, hogy tegyenek ragasztót a pizzaszószba, hogy ne csússzon le róla a sajt – ezt egy Yahoo újságíró ki is próbálta, ami egy nagyszerű eredményt hozott. Emellett azt is tanácsolta, hogy rakjanak gázolajat a spagettibe, és egyenek naponta legalább egy követ. A pizzaszószos tanács egy fucksmith nevű redditező 11 éves kommentjéből származik, míg a köves ötlet az Onion nevű szatirikus oldalról. A Google szerint ezek extrém esetek, de elkezdte manuálisan eltávolítani a kockázatos javaslatokat.

Időközben azonban egy sokkal nagyobb problémával kell szembenézniük, miután több ezer oldalnyi, a keresőmotorjuk működésébe bepillantást nyújtó belső dokumentum szivárgott ki tőlük.

A szivárgásról Rand Fishkin, egykori SEO-specialista, számolt be hétfőn egy részletes blogposztban. Nem kell mélyen belemerülni a dokumentumokba, hogy kiderüljön: számos ponton ellentmondanak a Google korábbi, a keresőmotorjuk működéséről kiadott hivatalos közleményeinek. Fishkin posztja szerint május 5-én kereste meg a szivárogtató, aki hozzáfért a keresési divízió több mint 2500 oldalnyi belső API-dokumentációjához. A dokumentumok hitelességét volt Google-alkalmazottak is megerősítették. (Az API, vagyis alkalmazásprogramozási felület, leegyszerűsítve a szoftverek egymás közti kommunikációját teszi lehetővé.)

A forrás időközben nyilvánosságra lépett: Erfan Azimi, az EA Eagle Digital nevű cég alapítója, aki szintén a SEO területén dolgozik. Nem meglepő, hogy nyilvánosságra akarta hozni a dokumentumokat. Azimi múlt pénteken mutatta be Fishkinnek a dokumentumokat, amelyek idén március végén, valószínűleg véletlenül, kerültek fel a kódmegosztásra használt GitHubra, és május 7-ig hozzáférhetőek voltak. Ilyen dokumentációk a Google összes csapatánál léteznek, és az a funkciójuk, hogy a dolgozók tudják, pontosan milyen eszközök állnak rendelkezésükre és hol találják azokat.

Fishkin ezt követően több egykori Google-alkalmazott ismerősét is megkérdezte a szivárgásról. Az érintettek átnézték a dokumentumokat, és megerősítették, hogy ezek valóban megegyeznek az általuk látott belsős dokumentációval, és semmi sem utal arra, hogy hamisítványok lennének. Ezt követően Fishkin megkereste Mike Kinget, az iPullRank ügynökség alapítóját, aki jelenleg is SEO-val foglalkozik és az egyik legnagyobb szaktekintélynek számít a területen. King is arra a következtetésre jutott, hogy a szivárgás hiteles, és számos olyan információt tartalmaz, amelyet eddig csak sejteni lehetett.

Így a dokumentumok elemzése is teljesen indokolt volt. Ezt nemcsak Fishkin végezte el, hanem King is, aki itt tette közzé az elemzését. Mint írta, valószínűleg több további bejegyzés is követni fogja, mert rengeteg adatot tartalmaznak a dokumentumok. Mielőtt rátérnénk a konkrétumokra, Fishkin alapján érdemes megjegyezni, hogy nem lehet biztosan megállapítani, hogy ezek a dokumentumok a legfrissebbek-e, illetve hogy mely funkciókat használták ténylegesen vagy csak tesztelésre szánták.

Ezért nem lehet kiemelni különösen egyes részeit és ezek alapján bizonyos funkciókat hangsúlyozni, de mindenesetre Fishkin szerint ez továbbra is a legjelentősebb bizonyíték a Google évek óta húzódó trösztellenes perében nyilvánosságra került információk között.

King a saját posztjában rámutatott, hogy a per korábbi meghallgatásain elhangzottak jelentős részét megerősítik a dokumentumok. Ez rendkívül izgalmas fejlemény, mivel a Google keresőmotorjának működése eddig rejtélyesnek számított, ami miatt a keresőoptimalizálás üzletágában nagy üzlet alakult ki. Egy friss tanulmány szerint a Google rendszere, amelyet SEO-szakemberek is kihasználnak, jelentősen rontotta a keresési élményt, mivel egyre több tökéletesen optimalizált, de tartalmilag gyenge minőségű tartalom jelenik meg a találatok között. A Google ugyan hangsúlyozza, hogy ez nem a rendszerük nyomásgyakorlása miatt történik, de a szivárgott dokumentumok sok mindent sugallnak ezzel kapcsolatban.

Fishkin és King is felidéztek néhány ilyen példát saját írásaikban, de talán a legfontosabb közülük az, hogy a dokumentumok szerint ellentétben az eddigi állításokkal, valóban használják a Chrome-ból származó adatokat a keresési eredmények rangsorolásához. Amikor valaki egy weboldalra keres rá, a kereső nemcsak a főoldalt jeleníti meg, hanem külön aloldalakat is kattintható formában, amelyeket részben a Chrome-ból gyűjtött kattintási adatok alapján rendez.

Úgy tűnik, hogy bár korábban azt állították, hogy nem így van, valójában a Google is méri a weboldalak hitelességét (amit a szakmában domain authority-nek neveznek), és figyelembe veszi a rangsorolásnál a keresésekkor végrehajtott kattintásokat, valamint azt, hogy ezek után mi történt (pl. maradt-e a felhasználó az oldalon vagy visszatért a keresőbe). Ezen felül információk vannak arról is, hogy a Google különböző kritériumok alapján (pl. weboldal életkora, megbízhatósága) különböző „homokozókba” sorolja a weboldalakat, és valószínű, hogy a vitatott témájú weboldalak esetében fehérlistára tesznek megbízhatónak tartott honlapokat.

Ugyanakkor kiderült, hogy az E-E-A-T keretrendszer – tapasztalat (Experience), szakértelem (Expertise), tekintély (Authoritativeness) és megbízhatóság (Trustworthiness) kevésbé lehet fontos, mint ahogy sok keresőoptimalizálással foglalkozó szakember feltételezte, legalábbis a dokumentumok alapján nem szerepelt kiemelten. Bár a Google észleli és előnyben részesítheti a befolyásos szereplőket, nem világos, hogy pontosan milyen tényezőket vesznek figyelembe ebben a rendszerben. Fishkin szerint sokan vannak, akik jól teljesítenek a keresőben anélkül is, hogy ezekre az E-E-A-T szempontokra nagy hangsúlyt fektetnének.

Fishkin bejegyzésének végén kifejezte izgalmát, hogy a következő időszakban milyen újabb részleteket tárnak fel a szakértők a dokumentumokból. Ugyanakkor kritikát fogalmazott meg az iparági szereplők felé, akik ellenkező bizonyítékok ellenére is kritika nélkül ismétlik a Google tagadó közleményeit. Fishkin szerint ha ez a szivárgás és a tavalyi meghallgatás valóban változást hoz, reméli, hogy ez véget vet a jelenlegi gyakorlatnak.

Borítókép: Pixabay

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

Legfrisebb hírek

Közösségi média

Mellékletek

Hírlevél feliratkozás

* indicates required

Intuit Mailchimp

Időjárás

BUDAPEST IDŐJÁRÁS