Powrót do podstaw: Ciasteczka (cookies) w Google Analytics

Ciasteczka (cookies) w Google AnalyticsGoogle Analytics działa na podstawie odczytywania, modyfikacji (tworzenia, jeżeli na witrynie jesteśmy po raz pierwszy) oraz nadpisywania ciasteczek. Proces ten opisaliśmy w artykule poświęconym zasadzie działania Google Analytics.

Ciasteczko to bardzo mały plik tekstowy wysyłany przez serwer www i zapisywany na dysku twardym komputera, z którego odwiedzamy stronę internetową. To właśnie ciasteczka gromadzą informacje o naszych zachowaniach w ramach strony internetowej.

W związku z tym, że część osób blokuje obsługę ciasteczek na poziomie przeglądarki, to nasze Google Analytics nie są w stanie śledzić takich użytkowników. Według badań Gemiusa w Polsce tacy użytkownicy stanowią ok 2,5% wszystkich Internautów (luty 2012).

Ciasteczka Google Analytics

Ogólnie rzecz ujmując Google Analytics posługuje się 5 ciasteczekami: _utma, _utmb, _utmc, _utmz, oraz _utmv. Możemy się o tym przekazać wchodząc do ustawień zaawansowanych naszej przeglądarki (lub korzystając z odpowiednich wtyczek) dla witryny, w której zainstalowany jest kod śledzący Google Analytics.

Ciasteczka w przeglądarce Google Chrome dla strony conversion.pl

Cztery ciasteczka (_utma, _utmb, _utmz i _utmv) to ciasteczka trwałe. Oznacza to, że ich żywotność nie kończy się wraz z zamknięciem przeglądarki. Mogą więc one pozostać zapisane na naszych komputerach nawet kilka lat (chyba, że wcześniej sami je usuniemy). Ciasteczko _utmc jest ciasteczkiem tymczasowym i jego żywotność ustaje wraz z zamknięciem okna przeglądarki.

Czytając o ciastkach możecie też często spotkać się z podziałem na ciasteczka pierwszej i trzeciej kategorii. Jest to bardzo ważna kwestia, zwłaszcza z perspektywy bezpieczeństwa naszych danych. Ciasteczka pierwszej kategorii mogą być tworzone, a informacje z nich przekazywane tylko do aplikacji odpowiedzialnej za zbieranie danych z tej konkretnej witryny. Ciasteczka trzeciej kategorii umożliwiają przekazywanie danych z konkretnej witryny podmiotom trzecim, przez co uznawane są za znacznie mniej bezpieczne. Google Analytics korzysta tylko z ciasteczek pierwszej kategorii.

_utma – (unikalny) użytkownik

Jest to ciasteczko zapisywane na naszych komputerach przy pierwszych odwiedzinach danej witryny. Ciasteczko to zawiera unikalny numer identyfikacyjny, dzięki któremu narzędzie potrafi określić unikalnego użytkownika i nowego użytkownika. Jeżeli usuniemy z naszego komputera to ciasteczko, to przy kolejnych odwiedzinach tej samej witryny zostanie nam utworzone ciasteczko o nowym numerze identyfikacyjnym. Żywotność tego ciasteczka wynosi dwa lata. Jeżeli więc przez 2 lata nie odwiedzaliśmy danej witryny, to przy kolejnych jej odwiedzinach zostaniemy zidentyfikowani jako nowi użytkownicy (stare ciasteczko wygasa i nagrywane jest dla nas nowe z nowym numerem identyfikacyjnym).

Musimy również pamiętać o tym, że tak naprawdę ciasteczko zapisywane jest w przeglądarce. Implikacja z tego jest taka, że mówiąc o unikalnym użytkowniku mamy na myśli pojedynczą przeglądarkę – stąd w analityce internetowej posługujemy się pojęciem użytkownika, a nie osoby. W końcu z jednej przeglądarki na tym samym komputerze może korzystać kilka różnych osób. Pamiętajmy o tym, ponieważ w Google Analytics część raportów jest błędnie przetłumaczona:)

Błędne tłumaczenie w Google Analytics

Pamiętajmy również o tym, że % nowych użytkowników w Google Analtics to po prostu % nowych ciasteczek __umta. Według różnych badań ok 30-40% użytkowników kasuje swoje ciasteczka. Poza tym korzystamy z różnych przeglądarek i różnych komputerów, przez to metryka ta jest najczęściej w naszych raportach zawyżona.

Weźmy dla przykładu ciasteczko, które nagrało się na moim komputerze po odwiedzeniu strony www.conversion.pl:

Ciasteczko __utma

268932707.1844624451.1334655749.1334655749.1334656399.2

Jego poszczególne elementy przekazują nam następujące informacje:

  • 268932707: jest to unikalny identyfikator domeny (czasami nazywany haszem), który (jak sama nazwa wskazuje) jest unikalny dla każdej witryny. Nawet jeżeli skasujemy ciasteczko i ponownie odwiedzimy daną witrynę to numer ten pozostanie bez zmian, ponieważ jest on stały dla danej witryny. Czasami może się zdarzyć, że numer ten jest określony jako „1”. Mówimy wówczas, że ciasteczko zostało „zhaszowane” – dzieje się to po zastosowaniu zmodyfikowanego kodu śledzącego. Ciasteczka haszujemy, aby śledzić użytkownika jednym kontem pomiędzy różnymi domenami. Jednak jest to temat na oddzielny artykuł, który jest już na naszej liście wydawniczej.
  • 1844624451: identyfikator, który służy to rozpoznawania unikalnych użytkowników. Pewną ciekawostką będzie informacja, że ten ciąg liczb jest kombinacją czasu utworzenia oraz losowej liczby (jestem naprawdę ciekawy jak dokładnie to się odbywa—jeżeli macie informacje na ten temat to zachęcam do umieszczania komentarzy pod artykułem :]).
  • 1334655749: czas naszej pierwszej odwiedziny danej strony (tutaj mam dla Was ciekawostkę, mianowicie ten ciąg liczb reprezentuje nic innego jak liczbę sekund, które upłynęły od daty 1 stycznia 1970. Jeżeli ktoś zastanawia się, dlaczego została wybrana akurat ta data, to zachęcam do poszukania informacji na temat Czasu Uniksowego :]).
  • 1334655749: czas poprzedniej wizyty (akurat w naszym wypadku liczba ta jest identyczna jak wcześniejsza. Oznacza to tyle, że poprzednia wizyta była naszymi pierwszymi odwiedzinami danej witryny).
  • 1334656399: czas rozpoczęcia naszej obecnej odwiedziny.
  • 2: liczba rozpoczętych odwiedzin na danej stronie.

Jeżeli jesteście bardziej zainteresowani w jaki sposób można dokładnie obliczać czasy na podstawie tych „magicznych” ciągów liczb to… no cóż musicie poczytać trochę więcej o Czasie Uniksowym :) Zachęcam również do małego ćwiczenia – z Excelem – bardzo szybko można sprawdzić czy data utworzenia ciasteczka zgadza się z jego prezentacją „uniksową”.

_utmb i _utmc – śledzenie odwiedzin

Ciasteczko _utmb jest odpowiedzialne za przechowywanie informacji na temat danej odwiedziny, natomiast ciasteczko _utmc współpracuje z _utmb i jego zadaniem jest ustalenie, czy należy rozpocząć śledzenie nowej odwiedziny, czy też zbierane dane powinny zostać zaliczone do starej. Przypominamy, że w zeszłym roku zmieniła się definicja wizyty/odwiedzin w Google Analytics.

Tym razem znowu posłużę się przykładem ciasteczka _utmb z naszej witryny:

268932707.8.9.1334657598624

Ciasteczko zdecydowanie różni się od poprzedniego i jego poszczególne elementy oznaczają inne rzeczy niż w przypadku ciastka _utma:

  • 268932707: to akurat jest znany element—unikalny identyfikator witryny. Dzięki, któremu wiemy z jakiej witryny ciastko to zbiera dane.
  • 8: liczba stron obejrzanych w ramach obecnej odwiedziny.
  • 9: miernik ten zaczyna się od 10 i zmniejsza się o 1 po każdym kliknięciu w dowolny link wychodzący (po kliknięciu, w który opuszczamy daną witrynę).
  • 1334657598624: czas rozpoczęcia naszej obecnej odwiedziny (zaprezentowany w przedstawionej już wcześniej formie upływu czasu od 1 stycznia 1970).

Ciasteczko _utmc zawiera tylko informację o unikalnym identyfikatorze witryny i wygasa po zamknięciu okna przeglądarki (jest to ciasteczko tymczasowe). Tak jak pisałem wcześnie służy więc ono do identyfikacji tego, czy zbierane dane powinny być liczone na poczet obecnej odwiedziny czy też powinna zostać rozpoczęta nowa odwiedzina.

_utmz – źródła odwiedzin

To jest naprawdę ważne ciastko, ponieważ zawiera ono informację na temat źródeł odwiedzin. Dzięki niemu możliwe jest policzenie odwiedzin z wyszukiwarek oraz danych z kampanii marketingowych. Ciasteczko to jest uaktualniane po obejrzeniu każdej strony i jego żywotność wynosi 6 miesięcy.

Weźmy zawartość przykładowego ciastka ze znanej już (naszej) witryny:

268932707.1334660925.2.2.utmcsr=facebook.com|utmccn=8%20sposobów%20na%20poprawę%20formularzy%20rejestracyjnych%20(sign-up)|utmcmd=social

Jest ono trochę bardziej rozbudowane, ale już wyjaśniam co wchodzi w jego skład:

  • 268932707: tutaj Was nie zaskoczę, jest to unikalny identyfikator witryny (cały czas ten sam:P).
  • 1334660925: czas kiedy ciasteczko pojawiło się na naszym komputerze.
  • 2: numer odwiedziny.
  • 2: numer kampanii.
  • utmcsr= facebook.com: źródło kampanii (w naszym przypadku źródłem jest akurat facebook.com).
  • utmccn=8%20sposobów%20na%20poprawę%20formularzy%20rejestracyjnych%20(sign-up): nazwa kampanii (tutaj ktoś nazwał kampanię tytułem artykułu na blogu).
  • utmcmd=social: medium kampanii.

_utmv – zmienne niestandardowe

To ciasteczko nie jest powszechnie stosowane. Pojawia się ono tylko wtedy kiedy na witrynie zastosujemy śledzenie niestandardowych zmiennych poprzez wykorzystanie metody _setCustomVar (index, nazwa, wartość, zakres) lub _setVar. Dla porządku napiszę, że jego żywotność to 2 lata.

Przykładowe ciastko może wyglądać następująco:

268932707.|3=User%20ID=1134146168.1334660318=1

Rozłożone na czynniki pierwsze przedstawia się w taki sposób:

  • Majka

    A ja mam pytanie czemu liczba unikalnych użytkowników nie jest równa liczbie nowych odwiedzin (New Visitors)- drugie zdjęcie od góry?Czy te dwie wartości dotyczą innych danych. Na marginesie dodam, że u mnie w raportach GA te dwie wartości również nie pokrywają się.

  • Konrad

    Unikalni użytkownicy liczeni są w danym wybranym przez Ciebie czasie natomiast nowi użytkownicy to tacy o których system nie wie, ze byli kiedykolwiek w serwisie bo nie mają cookiesa utma (w ciągu ostatnich dwóch lat). Unikalny użytkownik wcale nie znaczy nowy użytkownik. Może to być użytkownik powracający ale w tym okresie wybranym przez Ciebie jest on unikalny czyli liczony raz nawet jeśli wielokrotnie wracał w tym okresie na stronę.

x

Pobierz najnowsze case study

Przeczytaj jak Limango Polska wykorzystuje potencjał analityki internetowej w swojej organizacji.

Pobierz case study
Przeczytaj poprzedni wpis:
8 sposobów na poprawę formularzy rejestracyjnych (sign-up)

Często celem (pośrednim lub bezpośrednim) naszych stron internetowych jest rejestracja użytkownika — czy to na newsletter, czy do grona użytkowników...

Zamknij