Google potwierdził, że masowy wyciek około 2500 wewnętrznych dokumentów związanych z jego wyszukiwarką jest prawdziwy, a jeden z ekspertów stwierdził, że ze skarbów wynika, że „Google mówi nam jedno, a oni robią co innego”, jeśli chodzi o jego tajemnicze algorytmy.
Technologiczny gigant milczy, jeśli chodzi o działanie jego wyszukiwarki, mimo że ma ona znaczący wpływ na przepływ informacji, ruch i przychody z reklam w Internecie.
Niektóre szczegóły wydają się zaprzeczać wcześniejszym publicznym oświadczeniom pracowników Google dotyczącym czynników wykorzystywanych i niewykorzystywanych do obliczania rankingów.
Na przykład pracownik wyszukiwarki Google powiedział w 2016 r., że… Firma nie posiada „oceny autorytetu witryny internetowej”.
Firma też ma Wykorzystywanie danych Chrome w rankingach wyszukiwania zostało wyraźnie potępione.
Z informacji zawartych w dokumentach wynika jednak, że Google bierze pod uwagę współczynniki klikalności, dane z przeglądarki Chrome, rozmiar witryny oraz czynnik zwany „władzą domeny” – miarę ważności witryny lub jej związku z określonym tematem – aby rankingi przewodników.
„Kluczową ideą jest to, że Google mówi nam jedno, a robi drugie” – powiedział The Post Michael King, dyrektor generalny iPullRank, który opublikował pierwszą analizę skarbu.
„Te dokumenty nam to pokazują” – dodał King. „Nie mamy przepisu, którego Google używa do wyszukiwania, ale teraz mamy naprawdę jasne wskazanie, jakie są składniki”.
Niektórzy eksperci, w tym branżowa publikacja Search Engine Land, zauważają, że dokumenty wskazują na moduły sugerujące, że Google wdraża „białe listy” dla niektórych tematów, w tym wyszukiwań związanych z wyborami (IsElectionAuthority) i pandemią Covid-19 (IsCovidLocalAuthority).
King stwierdził, że odniesienia są prawdopodobnie próbą Google zidentyfikowania „wartościowych źródeł” na dany temat.
Szczegóły na temat działania białych list są skąpe, ale Google od lat boryka się z zarzutami o okazywanie lewicowych uprzedzeń. Z niedawnej analizy przeprowadzonej przez firmę medialną AllSides wynika, że 63% artykułów w Google News pochodzi z mediów o orientacji lewicowej, w porównaniu do zaledwie 6% ze źródeł o orientacji prawicowej.
Analiza przeprowadzona przez Centrum Badań nad Mediami prawicowego organu nadzoru szczegółowo opisuje 41 rzekomych przypadków „ingerencji w wybory” w giganta wyszukiwarek internetowych od 2008 roku.
W raporcie przytoczono dane dr Roberta Epsteina, który Kiedyś zeznawał przed Senacką Komisją Sądownictwa O tym, że „stronnicze wyszukiwania generowane przez algorytm wyszukiwania Google” przesunęły „co najmniej 2,6 miliona głosów na Hillary Clinton”.
Google od dawna zaprzecza swoim uprzedzeniom wobec konserwatywnych punktów widzenia i twierdzi, że badania Epsteina zostały „powszechnie obalone”.
Wyciekły dokumenty badawcze Uważa się, że zawiera ponad 14 000 czynników klasyfikacyjnych Które Google bierze pod uwagę podczas organizowania witryn internetowych — od serwisów informacyjnych takich jak The Post po właścicieli małych firm i nie tylko.
Wewnętrzne dane podobno pojawiły się w internetowym repozytorium kodów GitHub w marcu, ale nie zostały nawet poddane publicznej analizie Eksperci SEO Rand Fishkin I Michael Hill nabyty i opublikowany osobno Awarie.
Google pośrednio potwierdził, że dokumenty są prawdziwe, chociaż przestrzegł, że brakuje im ważnego kontekstu i społeczeństwo nie powinno ich wykorzystywać do wyrobienia sobie jakichkolwiek wyobrażeń na temat działania wyszukiwania.
„Przestrzegamy przed dokonywaniem błędnych założeń na temat wyszukiwania w oparciu o informacje wyrwane z kontekstu, nieaktualne lub niekompletne” – powiedział w oświadczeniu rzecznik Google, Davis Thompson.
„Udostępniliśmy obszerne informacje o tym, jak działają badania i jakie czynniki uwzględniają nasze systemy, jednocześnie pracując nad ochroną integralności naszych wyników przed manipulacją” – dodał w oświadczeniu.
Google ostrzegł również, że dokumenty te nie stanowią kompleksowego, istotnego i aktualnego obrazu algorytmu rankingu wyszukiwania.
Nadal nie jest jasne, czy Google faktycznie wdrożył którykolwiek z czynników rankingowych wyszczególnionych w dokumentach, czy tylko je testuje lub eksperymentuje z nimi. Niektóre mogły w ogóle nie być używane.
Nawet gdyby były używane, nie da się ocenić, jak ważne są w kształtowaniu tego, co użytkownicy widzą w wynikach wyszukiwania.
Z dokumentów nie wynika, w jaki sposób ważono cechy klasyfikacyjne.
Według Barry’ego Schwartza, czołowego eksperta w zakresie optymalizacji wyszukiwarek i właściciela firmy konsultingowej RustyBrick, dokumenty, które wyciekły, dają ciekawy, choć niekompletny obraz wewnętrznego funkcjonowania firmy w wyszukiwarkach.
Schwartz stwierdził, że dokumenty najlepiej postrzegać jako wskazówkę, „co myśli Google” na temat wyszukiwania w Internecie.
„To, jak Google to robi, opiera się na pewnych czynnikach, takich jak linki, jakość treści, autorytet, autorzy – wszystko jest w środku” – powiedział Schwartz. „Pytanie jest takie, że nie wiemy, jaka jest ich waga, jak ważne są te sygnały i czy w ogóle są wykorzystywane. Na tym właśnie polega problem”.
Jednak według Kinga dokumenty te stanowią „największy wyciek z Google, jaki kiedykolwiek widzieliśmy”.
„To największa i najbardziej przejrzysta inicjatywa, jaką kiedykolwiek widzieliśmy, jeśli chodzi o sposób działania Google” – powiedział King.
More Stories
Z pewnością wygląda na to, że PS5 Pro zostanie zaprezentowane w ciągu najbliższych kilku tygodni
Wycieki ujawniają nazwę i projekt rzekomego urządzenia PS5 Pro
Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS