Metody zbierania danych: tagi JavaScript, dzienniki serwerowe, obrazy web beacon
Tagi: Analityka internetowa, Analiza danych, Bogata aplikacja internetowa, dzienniki serwerowe, obrazy web beacon, tagi JavaScript, Web analytics
Swego czasu Mariusz opisywał w jaki sposób Google Analytics zbiera dane o użytkownikach. W artykule został zawarty opis pozyskiwania danych za pomocą umieszczonych w kodzie tagów JavaScript.
Prawdą jest, że tagi JavaScript są obecnie najpopularniejszą metodą zbierania danych w analityce internetowej. Dzieje się tak, ponieważ mają wiele zalet:
- są bardzo proste w implementacji,
- w przypadku braku dostępu do serwerów (brakiem własnej infrastruktury IT) jest to praktycznie jedyne dostępne narzędzie,
- przechowywanie stron internetowych w cache przeglądarek nie stanowi problemu,
- w łatwy sposób można je dopasowywać do indywidualnych wymogów i śledzić dodatkowe elementy na wybranych podstronach (np. koszyk zakupowy, potwierdzenie zamówienia lub wyszukiwanie w witrynie),
- umożliwiają zbieranie danych ze stron typu RIA (ang. Rich Internet Application – Bogate Aplikacje Internetowe),
- narzędzia tej klasy mogą umożliwiać zbieranie i analizowanie danych w czasie rzeczywistym.
Jednak pomimo tej długiej listy zalet, tagi JavaScript mają również swoje minusy do których należy zaliczyć:
- niepełna lub niepoprawna implementacja powoduje, że tracimy dane na zawsze (nie można powrócić, aby ponownie przeanalizować niektóre dane),
- część użytkowników posiada wyłączone ciasteczka, obsługę JS lub ich zapory sieciowe blokują wykonywanie skryptów tego typu (ok. 5% ruchu na stronie),
- brak możliwości zliczania faktycznej liczby pobrań plików (możemy zmierzyć jedynie liczbę rozpoczęć pobierania, która jest daleka od liczby pobrań zakończonych sukcesem),
- brak możliwości śledzenia aktywności robotów wyszukiwarek internetowych (w Polsce jest to niedużym problemem bo Google posiadający 93% udziały w rodzimym rynku udostępnia nam Narzędzia dla Webmasterów),
- brak możliwości pełnego śledzenia kampanii newsletterowych za ich pomocą (niepełne dane jedynie o przeklikach – np. brak informacji o otwarciach).
Jeśli nie tagi JavaScript to co?
Nie istnieje niestety duża liczba alternatyw do tagów JavaScript. Skupię się na dwóch z nich, które są najbardziej popularne: dzienniki serwerowe i obrazy web beacon.
Dzienniki serwerowe
Praktycznie na każdym serwerze zainstalowane jest przynajmniej jedno narzędzie do zbierania logów serwerowych. Oryginalnie to właśnie z nich wywodzi się analityka internetowa.
Dzienniki serwerowe zostały oryginalnie stworzone w celu rejestrowania błędów występujących na serwerze. Obecnie logi serwerowe używane są przez takie narzędzia jak np. Google Urchin (płatna wersja programu analitycznego od Google). Screen takich statystyk dla naszej strony internetowej wygląda następująco:
Kliknij na zdjęcie, aby je powiększyć
Proces zbierania danych poprzez dzienniki serwerowe przebiega w następujący sposób:
a) Użytkownik wpisuje adres strony www w przeglądarce internetowej.
b) Zapytanie zostaje wysłane do serwera na którym znajduje się witryna.
c) Serwer akceptuje zapytanie i tworzy zapis w dzienniku serwera (zazwyczaj są to nazwa podstrony, adres IP, typ przeglądarki, data i godzina).
d) Serwer wysyła stronę internetową do użytkownika.
Do plusów korzystania z dzienników serwerów zaliczyć można:
- są jedynym narzędziem, które rejestruje działalność robotów wyszukiwarek,
- informacje zbierane za ich pomocą są zawsze dostępne – jest to automatyczna konfiguracja każdego serwera (jeśli mówimy o standardowych rozwiązaniach),
- posługując się dziennikami serwerowymi firma jest właścicielem danych – są one przetrzymywane na firmowym serwerze,
- jako jedyne umożliwiają całkowite śledzenie pobrań plików z serwera (nie tylko rozpoczęcie, ale również czy plik został z sukcesem ściągnięty).
Ograniczeniami dzienników serwerów są:
- narzędzie zostało zaprojektowane do śledzenia błędów serwerów, przez co nie dostarcza wystarczających informacji biznesowych i marketingowych,
- adaptacja dzienników serwerów wymaga ścisłej współpracy z działem IT, co spowalnia proces wprowadzania zmian,
- dzienniki serwerów zbierają informacje na temat wszystkich wywołań – nie tylko stron, ale również obrazów, plików, wywołań robotów wyszukiwarek, przez co dane muszą być dokładnie odfiltrowane, aby można było na ich podstawie wnioskować,
- ponieważ część stron przechowywana jest w pamięci podręcznej przeglądarek, część ruchu jest w ogóle nie widoczna w tej metodzie (ok. 10%).
Obrazy web beacon
Web beacon to jednopikselowe (zazwyczaj), przezroczyste obrazy w formacie GIF umieszczane na stronie internetowej. W obecnych czasach obrazy web beacon stosowane są najczęściej do śledzenia kampanii newsletterowych:
Proces zbierania danych w przypadku obrazów web beacon przebiega w następujący sposób:
a) Użytkownik wpisuje adres strony www w przeglądarce internetowej.
b) Zapytanie zostaje wysłane do serwera na którym znajduje się witryna.
c) Serwer wysyła z powrotem treść strony internetowej wraz z zapytaniem o jednopikselowy obrazek znajdujący się na drugim serwerze.
d) Strona w trakcie ładowania wysyła zapytanie do drugiego serwera wraz z informacjami o przeglądanej stronie internetowej.
e) Serwer wysyła obrazek GIF wraz z kodem, który jest w stanie czytać ciasteczka, przechwytując tym samym anonimowe informacje o adresie IP użytkownika, czasie oglądania strony itp.
Kliknij na zdjęcie, aby je powiększyć
Wśród zalet korzystania z obrazów web beacon należy wymienić:
- ich łatwą implementację,
- możliwość wskazania danych, które mają być zbierane,
- możliwość korzystania z narzędzi do zbierania statystyk na temat kampanii newsletterowych,
- jeżeli obrazy umieszczane są na kilku witrynach mogą być używane do śledzenia jednego użytkownika korzystającego z wielu witryn.
Ograniczeniami obrazów web beacon są:
- z powodu możliwości śledzenia jednego użytkownika na wielu witrynach to narzędzie ma złą reputację – wielu użytkowników uważa, że narusza ono ich prywatność, przez co wyłączają obsługę ciasteczek w swoich przeglądarkach,
- jeżeli obrazy są wyłączone w klientach poczty e-mail (a staje się to domyślnym ustawieniem wielu programów) dane nie mogą być zbierane przy zastosowaniu tej metody,
- narzędzia nie można tak łatwo dostosować do indywidualnych potrzeb jak np. tagów JavaScript.
Która z wymienionych metod jest najlepszą?
Każde z trzech metod posiada swoje zalety i wady, które powinny być brane pod uwagę w przypadku doboru metod zbierania danych ilościowych dla konkretnej witryny internetowej. Najbardziej optymalnym rozwiązaniem jest połączenie wszystkich trzech metod w strategii zbierania danych, ponieważ każde z nich przewyższa pozostałe w wybranym obszarze.
Tagi JavaScript powinny być brane pod uwagę jako główne narzędzie analizy danych na stronie internetowej. W obecnych czasach narzędzia tej klasy pozwalają na uzyskanie największej liczby informacji o użytkowniku i są dynamicznie rozwijane przez usługodawców. Dodatkowo wraz pojawieniem się darmowego narzędzia działającego w oparciu o tą technikę, jakim jest Google Analytics, zmniejszyły się drastycznie nakłady potrzebne na implementację narzędzia. Dzięki temu więcej środków finansowych można przeznaczyć na zasoby ludzkie, które są potrzebne do analizy danych i wyciągania wniosków. Ponadto Tagi JavaScrpt dają bardzo dużą swobodę w dostosowywaniu typu zbieranych danych do potrzeb organizacji.
Dzienniki serwerów są jedynym narzędziem, które daje możliwość śledzenia robotów wyszukiwarek, dlatego powinny być używane, aby optymalizować działania w sferze pozycjonowania w wyszukiwarkach internetowych. W polskich warunkach narzędzie to może jednak zostać pominięte, ponieważ Google udostępnia swoje własne, darmowe narzędzie zapewniające dostęp do wszystkich kluczowych informacji, które są potrzebne w ramach działań pozycjonowania. Mając na uwadze fakt, że wyszukiwarka ta jest monopolistą na polskim rynku z udziałami sięgającymi 93%, nie ma potrzeby ponoszenia dodatkowych kosztów na obsługę dzienników serwera.
Obrazy web beacon mogą być używane jako uzupełnienie do zbierania informacji za pomocą tagów JavaScript przy śledzenia kampanii mailingowych. Na dzień dzisiejszy stanowią one najlepszą formę śledzenia współczynnika otwarć, który jest stosunkiem otwartych e-maili do wszystkich wysłanych elektronicznych wiadomości i jest jednym ze wskaźników stanowiących o efektywności newslettera.
Korzystanie w przedstawiony wyżej sposób z opisanych narzędzi do zbierania danych ilościowych o użytkownikach zapewnia solidną podstawę do budowy strategii analityki strony internetowej i dobrania odpowiednich KPI.
Teraz Wasza kolej: jak Wy wykorzystujecie różne metody zbierania danych w swojej pracy?
Jeśli podobał Ci się ten post – subskrybuj kanał RSS Conversion blog



Polub naszą stronę na Facebooku
Daggerka said:
lip 29, 11 at 14:41Ciekawy i pomocny artykuł. Dzięki za rady!