Co to jest BlockRank?

BlockRank (Blockwise In-context Ranking) to nowa metoda rankingu dokumentów przez modele generatywne (LLM), zaproponowana w najnowszej pracy badawczej Google DeepMind. Usprawnia ona tzw. „in-context ranking” – czyli sytuację, w której LLM dostaje zestaw dokumentów wraz z zapytaniem i ma je uporządkować od najbardziej do najmniej trafnych. Klucz: BlockRank drastycznie obniża koszt obliczeń (z kwadratowego do liniowego w liczbie dokumentów) przy zachowaniu jakości, dzięki czemu „zaawansowany ranking semantyczny” staje się osiągalny także dla mniejszych zespołów/organizacji.

Jak to działa (w skrócie, ale technicznie)

Klasyczny in-context ranking na LLM-ach jest drogi, bo uwaga (attention) między wszystkimi tokenami rośnie kwadratowo. Autorzy obserwują jednak, że w praktyce istotne wzorce uwagi są blokowe – skupione wewnątrz dokumentów i w pobliżu kluczowych tokenów zapytania, a nie „wszędzie ze wszystkimi”.
BlockRank robi więc dwie rzeczy:

Wymusza blokową rzadkość uwagi (structured sparse attention) – LLM patrzy na segmenty („bloki”) odpowiadające poszczególnym dokumentom zamiast na wszystkie tokeny na raz → złożoność ~ liniowa.
Dodatkowe uczenie kontrastowe na wewnętrznych mapach uwagi – tak, aby „nośniki sygnału wyszukiwania” (np. konkretne tokeny zapytania w warstwach środkowych) mocniej wyróżniały trafne dokumenty.
W testach na standardowych benchmarkach (BEIR, MS MARCO, Natural Questions) BlockRank osiąga wysokie wyniki w ICR (in-context ranking) przy dużo niższych kosztach.

Po co to powstało i czym różni się od dotychczasowych podejść?

Od PageRank do BlockRank – inny problem: PageRank to grafowy ranking popularności na podstawie linków w całej sieci. BlockRank to ranking trafności semantycznej w kontekście LLM dla podanego zestawu dokumentów i konkretnego zapytania. To nie jest „nowy PageRank” i nie ma potwierdzenia, że działa dziś w Google Search. To praca badawcza o tym, jak LLM sam w sobie może porządkować candidate-dokumenty skuteczniej i taniej.
Wobec retrieverów (BM25/dense/Cross-Encoder): zamiast (albo obok) klasycznych rankerów, BlockRank pozwala LLM-owi robić re-ranking we własnym kontekście bez gigantycznych kosztów – co zbliża „prawdziwie semantyczny” ranking do praktycznych budżetów.

Czy Google używa BlockRank w wyszukiwarce?

Nie ma publicznego potwierdzenia, że BlockRank jest wdrożony w Google Search. Google publikuje listę publicznie omawianych systemów rankingowych i BlockRank tam nie występuje. Traktuj to jako stan badań (potential → product później).

Dlaczego to jest ważne dla GEO/AEO i answer engines?

Jeśli kierunek BlockRank się upowszechni (w wyszukiwarkach, „answer browsers”, agentach), to:

Liczy się semantyka w kontekście zadania – LLM re-rankuje dokumenty widząc całe bloki treści i pytanie. Wygrywają treści:
- wysokogęste w fakty i liczby,
- z jasną strukturą (sekcje, tabele, definicje, porównania),
- z krótkimi „short answers” do cytowania.
Struktura = przewaga – segmentowanie stron (blokami) i spójne nagłówki pomagają modelowi „trafić w blok”, który najlepiej odpowiada intencji.
Źródła „preferred” i llms.txt – skoro LLM-y same re-rankują, opłaca się wskazać kanoniczne sekcje/endpointy (np. /faq, /spec, /price, /quote) i opisać je w llms.txt, aby trafiły do zestawu kandydatów i były łatwe do oceny.
Schema.org Actions (Quote/Order/Rent/Book) – jeśli równolegle rośnie udział agentów (agentic commerce), „trafny blok” powinien mieć zdefiniowaną akcję do wykonania (wycena, rezerwacja).

Co zrobić praktycznie (dla SalesBot.pl / GEOknows.pl)

Blokowe makiety stron: na kartach produktów i FAQ wprowadź stały układ bloków: Short answer → Parametry → Zastosowania → Porównania → ROI/kalkulator → Źródła/cytaty.
Tabele i checklisty: twarde dane + gotowe porównania (np. „Wiązarka ramowa vs stołowa” z metrykami).
„Answer hubs” z kotwicami: każdy podrozdział z własnym ID (#kotwica), by model mógł „zobaczyć” blok jako odrębny kawałek.
llms.txt + preferred sources: wypisz, które URL-e są kanoniczne do cytowania przez LLM (FAQ, spec, cennik/cena-widełki, warunki wynajmu).
Schema.org + Actions: do bloków Wycena/Wynajem/Zamówienie dodaj QuoteAction/OrderAction/RentAction (JSON-LD).
Dane treningowe „dla ludzi i dla LLM”: krótkie akapity definicyjne (≤ 50–80 słów) + dłuższe rozwinięcia; jasne nagłówki, małe akapity.

TL;DR: BlockRank to sposób, by LLM lepiej i taniej porządkował dokumenty, patrząc na nie blokowo. Dla nas oznacza to: projektować strony tak, aby „najmocniejsze bloki odpowiedzi” były wyraźne, samodzielne i bogate w fakty oraz miały od razu akcję do wykonania.