A Google jelenleg módosítja az alapvető keresési algoritmusát, amely állítása szerint tíz lekérdezésnél mindegyiknél megváltoztathatja az eredmények rangsorolását. Ez a Google kutatói által kifejlesztett és a keresőtermékre az elmúlt 10 hónap során alkalmazott, csúcstechnológiájú természetes nyelvfeldolgozási (NLP) technikákon alapszik.

Lényegében a Google azt állítja, hogy javítja az eredményeket azáltal, hogy jobban megérti, hogy a szavak miként kapcsolódnak egymáshoz egy mondatban. 

Az alábbi mondattal példálóznak: “Can you get medicine for someone pharmacy?” ami magyar fordításban annyit tesz: “Lehet gyógyszert szerezni valakinek gyógyszertárban?

Pandu Nayak, a Google munkatársa és a keresés alelnöke szerint a régi Google keresési algoritmus ezt a mondatot „szavaknak” tekintette. Tehát megvizsgálta a fontos szavakat, az orvostudományt és a gyógyszertárt, és egyszerűen visszatért a helyi eredményekre. Az új algoritmus képes volt megérteni a „valakinek” szavak kontextusát, hogy felismerje, hogy kérdés merül fel arról, hogy felveheti-e valaki más receptjét, és ez a helyes eredményeket hozta.

A finomított algoritmus a BERT-en alapul , amely a „Bidirectional Encoder Reprezents from Transformers” kifejezést jelenti. Ennek a betűszónak minden szava az NLP művészetének kifejezése, de lényeg az, hogy a BERT ahelyett, hogy egy mondatot úgy kezelne, mint egy zsák szót, a szóban forgó betűkkel foglalkozik. egyáltalán, a mondat egészében. Ezzel lehetővé válik, hogy felismerje, hogy a „valakinek” szavakat nem szabad eldobni, hanem elengedhetetlenek a mondat értelméhez.

A BERT felismeri, hogy figyelmet kell fordítania ezekre a szavakra, alapvetően azáltal, hogy a Mad Libs titánjátékán önmagát tanulják az algoritmusok. A Google összegyűjti az angol mondatokat, és véletlenszerűen távolítja el a szavak 15 százalékát, majd a BERT feladata annak kitalálása, hogy ezeknek a szavaknak mit kell lenniük. Jeff Dean, a Google kutatási vezető munkatársa és az SVP szerint az idő múlásával az ilyen típusú képzés rendkívül hatékonynak bizonyul az NLP modell „megértésének” kontextusában.

Egy másik példa, amelyet a Google idézett: „parkolás domboldalon, járda nélkül”. A „nélkül” szó elengedhetetlen a lekérdezéshez, és a BERT keresésbe történő bevezetése előtt a Google algoritmusai ezt elmulasztották.

A Google azt állítja, hogy az elmúlt pár napban gördült be az algoritmus változtatás, és ez ismét az Egyesült Államokban angolul tett keresési kérdések kb. 10% -át érinti. Más nyelvekkel és országokkal később foglalkozunk.

 keresés minden változtatását egy tesztsorozaton keresztül hajtják végre, hogy megbizonyosodjon arról, hogy valóban javítják-e az eredményeket. Az egyik ilyen teszt a Google azon humán recenzensek kadrájának felhasználásával jár, akik a társaság algoritmusait a keresési eredmények minőségének osztályozásával képzik – a Google élő A / B teszteket is végez.

A BERT nem minden egyes lekérdezést érint, hanem a Google által a keresési eredmények rangsorolásához használt sokféle eszköz legújabb változata. Milyen pontosan működik együtt, kissé rejtély. Ennek a folyamatnak egy részét a Google szándékosan rejtélyesnek tartja, hogy megakadályozza a spamküldőket a rendszereinek kijátszásában. De rejtélyes még egy másik fontos ok miatt: amikor egy számítógép gépi tanulási technikákat alkalmaz a döntéshozatalhoz, nehéz lehet megérteni, miért döntött úgy.

A gépi tanulás úgynevezett „fekete doboza” problémát jelent, mivel ha az eredmények valamilyen módon tévesek, nehéz lehet diagnosztizálni, miért. A Google szerint arra törekedett, hogy a BERT hozzáadása a keresési algoritmusához ne növelje az elfogultságot – ez a gépi tanulás egyik általános problémája, amellyel képzési modelljeinél maguk is elfogultak. Mivel a BERT-t óriási angol mondatok körén képzik, amelyek szintén eredendően elfogultak, kérdést szem előtt kell tartani. Biztosan helyesek a találatok?

A társaság azt is kijelenti, hogy nem számít jelentős változásoknak abban, hogy az algoritmus mennyiben vagy hol irányítja a forgalmat, legalábbis amikor a nagy kiadókkal foglalkoznak. Google jelzi a keresési algoritmus megváltozását, az egész web feláll és észreveszi. A vállalatok éltek és meghaltak a Google keresési rangsorában bekövetkezett változások miatt.

A keresési eredmények minőségét illetően Payak szerint “ez az egyetlen legnagyobb … legpozitívabb változás, amely az elmúlt öt évben történt, és talán az egyik legnagyobb a kezdetektől.”

Ajánlott Postok