BigQuery

Najczęstsze pytanie na rozmowie SQL:

PrzezBartosz Spychalski 2026-03-022026-03-02 Czas czytania 3 min.

ROW_NUMBER vs RANK vs DENSE_RANK – czym się różnią i kiedy ich używać?

Jeśli byłeś na rozmowie rekrutacyjnej na stanowisko analityka, data engineera czy BI developera, bardzo możliwe, że padło to pytanie:

„Explain ROW_NUMBER vs RANK vs DENSE_RANK.”

To tzw. „Big Three” ranking functions w SQL.
I choć różnice wydają się subtelne, wybór złej funkcji może całkowicie zmienić logikę biznesową raportu.

ROW_NUMBER()

Każdy wiersz dostaje unikalny numer.
Brak remisów. Brak luk.

Przykład wyników:
1, 2, 3, 4

Jeśli dwie osoby mają taki sam wynik – i tak dostaną różne numery.

RANK()

W przypadku remisu wiersze dostają tę samą pozycję.
Kolejna pozycja zostaje „przeskoczona”.

Przykład:
1, 2, 2, 4
(„3” znika, bo były dwa drugie miejsca)

DENSE_RANK()

Remisy również mają tę samą pozycję.
Ale numeracja nie ma luk.

Przykład:
1, 2, 2, 3

Zobaczmy to na przykładzie

Załóżmy, że mamy ranking wyników:

Score	?
95
90
90
85

W zależności od funkcji otrzymamy:

ROW_NUMBER: 1, 2, 3, 4
RANK: 1, 2, 2, 4
DENSE_RANK: 1, 2, 2, 3

Różnica wygląda niewinnie.
W praktyce może zmienić premię sprzedażową, dashboard KPI albo raport dla zarządu.

Wrong function = wrong business logic

To nie jest tylko pytanie rekrutacyjne.

Zła funkcja rankingowa może:

zdublować rekordy przy deduplikacji,
błędnie policzyć „Top 3”,
zmienić ranking najlepszych sprzedawców,
zaburzyć dashboard z leaderboardem.

W komentarzach do oryginalnego posta wiele osób zwracało uwagę, że użycie RANK() zamiast ROW_NUMBER() w deduplikacji potrafi zostawić dwa „najnowsze” rekordy.

Mała różnica w SQL. Duża różnica w biznesie.

ROW_NUMBER – gdy liczy się unikalna kolejność

Najczęstsze przypadki:

Paginacja (strona 1, 2, 3…)
Systemy kolejkowe (pozycja zgłoszenia)
Deduplikacja (zostaw najnowszy rekord)

Przykład deduplikacji:

SELECT *
FROM (
    SELECT *,
           ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY updated_at DESC) AS rn
    FROM users
) t
WHERE rn = 1;

Tu ROW_NUMBER() jest właściwym wyborem.
RANK() mógłby zostawić więcej niż jeden rekord.

RANK – gdy liczy się rzeczywista pozycja

Idealne do:

Rankingów sprzedaży
Wyników sportowych
Wyszukiwarek (ranking trafności)

Jeśli dwóch sprzedawców ma ten sam wynik – obaj są na 2. miejscu.
A kolejne miejsce to 4.

To często najbardziej „uczciwa” logika rankingowa.

DENSE_RANK – gdy nie chcesz luk

Sprawdza się w:

Kategoriach ocen (A, B, C)
Przydzielaniu nagród
„Top 5 produktów”

Tu nie chcemy, by po dwóch drugich miejscach pojawiło się czwarte.

Jak wybrać właściwą funkcję?

Zadaj sobie pytanie:

Czy każdy wiersz musi mieć unikalny numer? → ROW_NUMBER
Czy remis powinien powodować „dziurę” w numeracji? → RANK
Czy remis bez luk jest bardziej logiczny? → DENSE_RANK

To nie kwestia składni.
To kwestia logiki biznesowej.

Dlaczego to najczęstsze pytanie rekrutacyjne?

Bo pokazuje, czy:

rozumiesz różnicę między danymi a ich interpretacją,
myślisz o konsekwencjach biznesowych,
potrafisz dobrać funkcję do celu,
rozumiesz window functions.

Rekruter nie sprawdza tylko SQL-a.
Sprawdza sposób myślenia.

Podsumowanie

Funkcja	Remisy	Luki w numeracji	Główne zastosowanie
ROW_NUMBER	❌	❌	Deduplikacja, paginacja
RANK	✅	✅	Rankingi, leaderboard
DENSE_RANK	✅	❌	Kategorie, top N

Jedna linijka SQL może zmienić cały raport.

Dlatego warto rozumieć różnice — nie tylko na rozmowie kwalifikacyjnej, ale w realnych projektach.

BigQuery

Gemini 3.1 Pro dostępny w BigQuery.
PrzezBartosz Spychalski 2026-02-232026-02-23 Czas czytania 3 min.

Google właśnie udostępnił Gemini 3.1 Pro w BigQuery – i to może być jeden z ważniejszych momentów dla wszystkich, którzy pracują na danych w ekosystemie Google Cloud. To obecnie najbardziej zaawansowany model Google, zaprojektowany do złożonych zadań wymagających głębokiego rozumowania, pracy na dużych zbiorach danych i przetwarzania treści multimodalnych. Teraz można go wywołać bezpośrednio w SQL. Brzmi ciekawie? Sprawdźmy, co to oznacza w praktyce. Gemini 3.1 Pro + BigQuery = AI…

Dowiedz się więcej Gemini 3.1 Pro dostępny w BigQuery.
BigQuery

Jak policzyć First User Primary Channel Group w GA4 BigQuery
PrzezBartosz Spychalski 2026-01-162026-01-16 Czas czytania 5 min.

(i dlaczego logika jest ważniejsza niż sam SQL) Jeśli pracujesz z danymi GA4 w BigQuery, prędzej czy później trafisz na ten problem:jak poprawnie odtworzyć „First User Primary Channel Group” poza interfejsem GA4. Niby proste pole.A w praktyce — złożona logika, dziesiątki warunków i łatwy sposób, żeby się pomylić. Ten wpis pokazuje jak podejść do tego zadania poprawnie i dlaczego kluczem nie jest kopiowanie SQL-a, tylko zrozumienie logiki stojącej za channel…

Dowiedz się więcej Jak policzyć First User Primary Channel Group w GA4 BigQuery
BigQuery

Przyspiesz analizę w BigQuery dzięki gotowym szablonom notebooków
PrzezBartosz Spychalski 2026-03-022026-03-02 Czas czytania 3 min.

Praca z notebookami w BigQuery Studio to potężny sposób na eksplorację danych, wizualizację, analizę i tworzenie workflowów łączących SQL, Python i ML w jednym środowisku. Jednak rozpoczęcie od pustego notebooka bywa trudne — dlatego Google przygotował bibliotekę gotowych szablonów, które pomagają szybko wejść w analizę i przyspieszają pracę z danymi. 🧠 Co to są szablony notebooków? Notebooki w BigQuery Studio łączą w jednym miejscu kod SQL, Python oraz wykresy i wizualizacje, umożliwiając: Szablony notebooków…

Dowiedz się więcej Przyspiesz analizę w BigQuery dzięki gotowym szablonom notebooków
BigQuery

Conversational Analytics w BigQuery: koniec kolejek do analityków?
PrzezBartosz Spychalski 2026-02-022026-02-02 Czas czytania 3 min.

Google ogłosił Conversational Analytics w BigQuery (preview) — funkcję, która ma rozwiązać jeden z najbardziej uporczywych problemów w organizacjach opartych na danych: biznes chce odpowiedzi teraz,a zespoły data są wąskim gardłem. Idea brzmi znajomo: zapytaj dane językiem naturalnym, a system sam: Różnica polega na tym, że tym razem nie jest to tylko chatbot nad hurtownią danych. To nie jest „kolejny AI chat do danych” Conversational Analytics w BigQuery to agent analityczny osadzony bezpośrednio w środowisku BigQuery, a nie warstwa…

Dowiedz się więcej Conversational Analytics w BigQuery: koniec kolejek do analityków?
BigQuery|Google Search Console

Jak szybko sprawdzić, jakie frazy “wypadły” z Google Search Console
PrzezBartosz Spychalski 2025-12-302026-01-06 Czas czytania 2 min.

Google Search Console w UI trzyma dane maks. ~16 miesięcy i często nie pozwala wygodnie porównywać okresów tak, jak chcesz. Jeśli masz eksport GSC do BigQuery, możesz analizować historię dłużej i robić porównania “tydzień do tygodnia” bez stresu. Ten snippet odpowiada na proste pytanie: jakie zapytania (queries) były obecne w poprzednim tygodniu, ale nie pojawiły się w tygodniu bieżącym. Dodatkowo pokazuje kliki i wyświetlenia dla tych “utraconych” fraz…

Dowiedz się więcej Jak szybko sprawdzić, jakie frazy “wypadły” z Google Search Console
BigQuery

Jak zabezpieczyć swój budżet w Google BigQuery
PrzezBartosz Spychalski 2026-03-022026-03-02 Czas czytania 3 min.

Praca z dużymi zestawami danych w chmurze daje ogromne możliwości, ale też — jeśli nie zadbamy o kontrolę — niespodziewane koszty. Google BigQuery oferuje elastyczność i skalowalność, ale każde zapytanie kosztuje. Na szczęście można wprowadzić proaktywne mechanizmy, które działają jak osobista sieć bezpieczeństwa — tzw. cost safety net — i pomagają uniknąć nieplanowanych wydatków. Poniżej znajdziesz najlepsze praktyki oraz narzędzia, które warto skonfigurować, aby BigQuery było zarówno potężne, jak…

Dowiedz się więcej Jak zabezpieczyć swój budżet w Google BigQuery