Jak korzystać z danych geolokalizacyjnych w GA4 BigQuery
Dane geolokalizacyjne to jeden z najczęściej analizowanych, a jednocześnie najczęściej źle interpretowanych obszarów w Google Analytics 4. Interfejs GA4 daje tylko podstawowy wgląd w lokalizację użytkowników, natomiast pełną kontrolę i elastyczność zapewnia dopiero eksport danych do BigQuery.
W tym artykule pokazuję:
- jakie pola geolokalizacyjne są dostępne w GA4 BigQuery,
- jak poprawnie je interpretować,
- jak policzyć unikalnych użytkowników według lokalizacji,
- oraz jak myśleć o geolokacji w analizach, a nie tylko jak pisać zapytania SQL.
Jakie dane geolokalizacyjne są dostępne w GA4 BigQuery?
W tabelach eksportu GA4 do BigQuery wszystkie dane geolokalizacyjne znajdują się w obiekcie geo.
Najważniejsze dostępne pola to:
geo.continent– kontynent użytkownikageo.sub_continent– subkontynent (np. Western Europe)geo.country– krajgeo.region– region / województwo / stangeo.city– miastogeo.metro– obszar metropolitalny (głównie dla USA)


Te dane są przypisywane na podstawie adresu IP i dostępne na poziomie zdarzenia, ale w praktyce najlepiej analizować je na poziomie użytkownika.
Jak myśleć o geolokalizacji w GA4?
Zanim przejdziemy do SQL-a, warto zrozumieć kilka kluczowych zasad:
- geolokalizacja nie jest stała – użytkownik może zmieniać lokalizację,
- dane są przybliżone, nie precyzyjne,
- blokady prywatności, VPN-y i sieci korporacyjne mogą zniekształcać wyniki,
- najlepsze zastosowanie geolokacji to analiza trendów, nie dokładnych adresów.
Dlatego w większości przypadków:
- liczymy unikalnych użytkowników,
- grupujemy ich według kraju, regionu lub miasta,
- analizujemy udział lokalizacji w ruchu, konwersjach i przychodach.
Logika liczenia unikalnych użytkowników według lokalizacji
Aby policzyć unikalnych użytkowników według geolokalizacji, należy:
- pobrać dane z obiektu
geo, - użyć
user_pseudo_idjako identyfikatora użytkownika, - zastosować
COUNT(DISTINCT user_pseudo_id), - pogrupować dane według wybranych poziomów lokalizacji.
Najczęściej analizowane kombinacje to:
- kraj,
- kraj + region,
- kraj + miasto (dla dużych serwisów).
Przykładowe zapytanie SQL
Poniższe zapytanie oblicza liczbę unikalnych użytkowników według:
- kontynentu,
- subkontynentu,
- kraju,
- regionu,
- miasta
dla października 2025 roku.
Pamiętaj, aby podstawić własny identyfikator tabeli.
-- Obliczanie liczby unikalnych użytkowników według lokalizacji geograficznej
SELECT
geo.continent AS continent,
geo.sub_continent AS sub_continent,
geo.country AS country,
geo.region AS region,
geo.city AS city,
COUNT(DISTINCT user_pseudo_id) AS total_users
FROM
`<Enter your table id here>`
WHERE
_TABLE_SUFFIX BETWEEN '20251001' AND '20251031'
GROUP BY
continent,
sub_continent,
country,
region,
city
ORDER BY
total_users DESC;
Co dokładnie robi to zapytanie?
Zapytanie:
- przypisuje użytkowników do lokalizacji na podstawie danych
geo, - eliminuje duplikaty użytkowników dzięki
COUNT(DISTINCT user_pseudo_id), - pozwala zobaczyć, skąd realnie pochodzą użytkownicy, a nie tylko sesje,
- umożliwia dalsze łączenie danych z:
- kampaniami,
- źródłami ruchu,
- konwersjami.

Najczęstsze zastosowania danych geolokalizacyjnych
Dane geo w GA4 BigQuery są szczególnie przydatne do:
- analizy rynków zagranicznych,
- identyfikacji regionów o najwyższym potencjale,
- wykrywania anomalii (np. ruch botów z jednego kraju),
- porównywania efektywności kampanii lokalnych,
- optymalizacji treści i oferty pod konkretne lokalizacje.
O czym trzeba pamiętać?
- geolokalizacja opiera się na IP, nie GPS,
- dane mogą być zanonimizowane lub modelowane,
- im bardziej szczegółowy poziom (miasto), tym większe ryzyko niedokładności,
- najlepiej łączyć geolokację z innymi wymiarami (kanał, kampania, urządzenie).
Najważniejsza lekcja
Praca z danymi geolokalizacyjnymi w GA4 BigQuery nie polega na pisaniu zapytań, tylko na rozumieniu logiki danych.
Jeśli wiesz:
- skąd pochodzą pola
geo, - na jakim poziomie analizujesz użytkowników,
- co dokładnie liczysz,
to:
- możesz skalować analizy,
- automatyzować raporty,
- wykorzystywać AI do generowania SQL-a bez ryzyka błędnych wniosków.