e-commerce

Struktury zagnieżdżone są Twoim sprzymierzeńcem w GA4 BigQuery

PrzezBartosz Spychalski 2025-12-292025-12-29 Czas czytania 3 min.

Praca z surowymi danymi GA4 w BigQuery przez długi czas była… po prostu bolesna.
Dane są głęboko zagnieżdżone. Zdarzenia zawierają tablice parametrów. Sesje nie istnieją „gotowe” – trzeba je zbudować samodzielnie.

Pisanie SQL-a, który poprawnie porusza się po ARRAY, STRUCT, UNNEST, wymagało specjalistycznej wiedzy, której większość analityków zwyczajnie nie miała.

I właśnie dlatego powstał cały ekosystem narzędzi, które spłaszczają dane.

„Stary wiktoriański problem” analityki

Schemat był zawsze ten sam:

bierzemy zagnieżdżone, „brudne” dane,
transformujemy je do ładnych, płaskich tabel,
a potem analitycy mogą je odpytywać jak klasyczną bazę danych.

To miało sens kiedy SQL był drogi:

drogi w czasie,
drogi w kompetencjach,
drogi w wysiłku poznawczym.

Spłaszczanie struktury danych było wtedy protezą. Ułatwieniem. Kompromisem.

świat się zmienił

Momentem przełomowym było pojawienie się AI, które potrafi pisać poprawny SQL do BigQuery.

Dziś:

opisujesz, czego chcesz, zwykłym językiem,
dostajesz zapytanie, które:
- obsługuje UNNEST,
- agreguje tablice,
- przechodzi przez zagnieżdżone struktury,
- zachowuje kontekst zdarzeń.

Bariera, która uzasadniała spłaszczanie danych, przestała istnieć.

Struktury zagnieżdżone są Twoim sprzymierzeńcem

Brzmi kontrowersyjnie, ale to prawda:

Zagnieżdżone struktury są naturalnym formatem danych GA4.
Płaskie tabele są sztucznym uproszczeniem.

Jeśli spłaszczasz dane GA4 w BigQuery, robisz z BigQuery…
przerośniętego Excela.

Co tracisz, spłaszczając dane GA4?

Gdy rozbijasz tabelę events na osobne tabele (sesje, użytkownicy, transakcje):

tracisz bezpośrednią relację między:
- zdarzeniem,
- użytkownikiem,
- parametrami zdarzenia
niszczysz kontekst sekwencji zdarzeń
→ trudniej analizować ścieżki, kolejność interakcji, mikro-konwersje
agregujesz dane zbyt wcześnie
→ tracisz granularność potrzebną do zaawansowanej atrybucji
fragmentujesz kontekst użytkownika
→ analiza cross-device i multi-session staje się problematyczna
pozbawiasz się naturalnego mechanizmu śledzenia ścieżek konwersji

To wszystko są realne straty analityczne, a nie tylko „techniczne niuanse”.

BigQuery jest zbudowany pod dane zagnieżdżone

BigQuery:

jest kolumnowy,
jest skalowalny,
jest zoptymalizowany pod STRUCT i ARRAY.

Zagnieżdżone dane:

zmniejszają redundancję,
zachowują relacje,
lepiej odzwierciedlają rzeczywistość zdarzeń.

Spłaszczanie GA4 idzie wbrew temu, jak BigQuery został zaprojektowany.

To nie problem struktury danych. To problem kompetencji SQL.

Dane nie są „zbyt skomplikowane”.
Ludzie są niekomfortowi z zapytaniami zagnieżdżonymi.

Flattening nie rozwiązuje problemu – on go maskuje.

„Ale AI nie jest wiarygodne w produkcji!”

Ten argument pada często:

„Nie można ufać AI-generated SQL w systemach produkcyjnych.”

I to jest… częściowo prawda.

Ale:

większość pracy analitycznej jest eksploracyjna,
zapytania można przeglądać przed uruchomieniem,
AI nie zastępuje myślenia – zastępuje składnię.

Pipeline produkcyjny ≠ analiza ad hoc.

„A co ze spójnością w dużych zespołach?”

Kolejny argument:

„Jak utrzymać spójność definicji sesji w 50 dashboardach?”

To ważne:

w bardzo dużych organizacjach,
z wieloma zespołami,
z rygorem governance.

Ale dla większości przypadków biznesowych:

koszt spłaszczania danych przewyższa korzyści,
elastyczność analizy jest ważniejsza niż centralna abstrakcja.

Przestań traktować BigQuery jak Excela

BigQuery nie jest:

arkuszem kalkulacyjnym,
klasyczną relacyjną bazą OLTP.

BigQuery jest:

silnikiem analitycznym,
zaprojektowanym pod dane zagnieżdżone,
gotowym na złożone analizy zachowań użytkowników.

Używaj go tak, jak został zaprojektowany.

e-commerce

Jak korzystać z danych geolokalizacyjnych w GA4 BigQuery
PrzezBartosz Spychalski 2025-12-292025-12-29 Czas czytania 4 min.

Dane geolokalizacyjne to jeden z najczęściej analizowanych, a jednocześnie najczęściej źle interpretowanych obszarów w Google Analytics 4. Interfejs GA4 daje tylko podstawowy wgląd w lokalizację użytkowników, natomiast pełną kontrolę i elastyczność zapewnia dopiero eksport danych do BigQuery. W tym artykule pokazuję: Jakie dane geolokalizacyjne są dostępne w GA4 BigQuery? W tabelach eksportu GA4 do BigQuery wszystkie dane geolokalizacyjne znajdują się w obiekcie geo. Najważniejsze dostępne pola to: Te dane są przypisywane…

Dowiedz się więcej Jak korzystać z danych geolokalizacyjnych w GA4 BigQuery
e-commerce

GA4 bez utraty danych: 21 kluczowych kroków konfiguracji
PrzezBartosz Spychalski 2025-12-292025-12-29 Czas czytania 7 min.

Konfiguracja Google Analytics 4 to proces, którego nie da się „naprawić później”. GA4 działa w modelu zdarzeniowym, ma ograniczoną retencję danych i w wielu miejscach nie pozwala na cofnięcie decyzji. To oznacza, że błędy popełnione na starcie będą wpływać na raporty przez miesiące, a czasem bezpowrotnie. Poniżej znajdziesz 21 kluczowych kroków konfiguracji GA4, które warto wykonać natychmiast po utworzeniu nowej właściwości, aby zminimalizować utratę danych, zniekształcenia raportów i problemy z atrybucją. 1. Zmień…

Dowiedz się więcej GA4 bez utraty danych: 21 kluczowych kroków konfiguracji
e-commerce

Dlaczego GA4 NIE przypisuje source/medium do wszystkich zdarzeń
PrzezBartosz Spychalski 2025-12-292025-12-29 Czas czytania 3 min.

Wielu marketerów i analityków zakłada, że Google Analytics 4 automatycznie przypisuje source/medium do każdego zdarzenia. W praktyce szybko okazuje się, że w raportach na poziomie zdarzeń bardzo często widzimy wartość „(not set)”. To nie jest błąd — to sposób, w jaki GA4 został zaprojektowany. Poniżej wyjaśniam: Dlaczego source/medium jest często „(not set)” w zdarzeniach GA4? W GA4 source i medium nie są traktowane jako uniwersalne parametry zdarzeń. Ich rola jest ściśle związana…

Dowiedz się więcej Dlaczego GA4 NIE przypisuje source/medium do wszystkich zdarzeń
e-commerce

Dlaczego BigQuery często pokazuje więcej użytkowników powracających niż interfejs GA4?
PrzezBartosz Spychalski 2025-12-292025-12-29 Czas czytania 3 min.

Jeśli kiedykolwiek porównałeś liczbę Returning Users w interfejsie GA4 z wynikami policzonymi samodzielnie w BigQuery, prawdopodobnie zauważyłeś coś niepokojącego:BigQuery niemal zawsze pokazuje więcej użytkowników powracających niż GA4 UI. To nie jest błąd Google.To różnica w logice liczenia, poziomie agregacji i dostępie do danych użytkownika. Poniżej krok po kroku wyjaśniam, skąd biorą się te rozbieżności. 1. GA4 UI liczy użytkowników powracających na poziomie użytkownika Interfejs GA4 działa w bardzo…

Dowiedz się więcej Dlaczego BigQuery często pokazuje więcej użytkowników powracających niż interfejs GA4?
e-commerce

Jak poprawnie obliczać Active Users w GA4 BigQuery
PrzezBartosz Spychalski 2025-12-302025-12-30 Czas czytania 4 min.

W GA4 pojęcie Active Users wydaje się proste – dopóki nie spróbujesz policzyć go samodzielnie w BigQuery. Wtedy bardzo szybko okazuje się, że większość zapytań SQL liczy aktywnych użytkowników błędnie albo w sposób uproszczony, który przestaje działać przy większych zbiorach danych. Ten artykuł pokazuje: Najprostszy sposób: is_active_user = true Active Users w GA4 BigQuery można policzyć jako: liczbę unikalnych użytkowników, którzy w danym okresie wyzwolili co najmniej…

Dowiedz się więcej Jak poprawnie obliczać Active Users w GA4 BigQuery
e-commerce

Tworzenie contentu z AI – praktyczne porady.
Przezadmin 2023-12-232023-12-27 Czas czytania 6 min.

Czy AI zastąpi Cię w pracy? Jak produkować jakościowy content? Poznaj 10 praktycznych porad z pracy przy użyciu ChatGPT.

Dowiedz się więcej Tworzenie contentu z AI – praktyczne porady.