Site icon Modrzewski

Not provided – jak wyrwać trochę informacji od Google

Pod koniec października 2011 Google wprowadziło możliwość większej prywatności dla użytkowników wyszukiwarki. Wystarczy posiadać konto Google (czyli jakikolwiek produkt Google) i być zalogowanym. Jeśli w tym czasie będziemy korzystać z wyszukiwarki dane dotyczące naszego wyszukiwania (słowa kluczowe) nie będą przekazywane do żadnego innego podmiotu. Nowa funkcjonalność zapewniająca więcej prywatności użytkowników wyszukiwarki, nie specjalnie przypadła do gustu wszystkim, którzy pracują nad pozycją w wynikach organicznych. Jakaś część informacji do analizy efektywności działań SEO została w końcu odebrana.  Zamiast słów kluczowych pojawiło się w Google Analytics w raporcie słów kluczowych nowe oznaczenie “not provided”.  W internecie pojawiło sie sporo komentarzy mówiących o tym, że Google zabiera narzędzia do analizy działań SEO, że niedługo znacząca część ruchu będzie właśnie “not provided”. Na Search Engine Land pojawiły się całkiem spore procenty ruchu zaliczanego do “Not provided” dochodzące do 17% całości ruchu w witrynie. Oznacza to, że właściwie nie wiem jakie intencje miało 17% osób, które pojawiły się na stronie. To bardzo zła wiadomość dla analityków webowych i SEMitów, którzy muszą cały czas optymalizować i poprawiać swoje działania w internecie.

Dodatkowo ostatnio przeglądarka Firefox ogłosiła, że zamierza wprowadzić kodowanie jako standard. W takim przypadku wszyscy użytkownicy FF będą mieli z automatu włączony protokół SSL, a co za tym idzie więcej wizyt będzie oznaczonych jako “not provided”. W tym samym czasie przeglądarka FF staje się bardziej “bezpieczna” niż Chrome czy Internet Explorer. Ciekawe jak długo te dwie przeglądarki pozostaną nie szyfrowane?

Czemu Google wprowadziło tą zmianę?

Google dba o bezpieczeństwo i prywatność swoich użytkowników. Robi to jednak wybiórczo pozostawiając obecnie kilka dużych luk w tym całym zabezpieczeniu prywatności. Jedno to tzw. refferer data czyli dane zawarte w adresach URL przekazywanych do stron z wyszukiwarki. Jeśli wpiszemy coś do wyszukiwarki nasze zapytanie się pojawi w adresie w pasku przeglądarki. Te dane mogą wyciekać. Innymi takimi niedoskonałościami systemu są linki sponsorowane i Narzędzie dla webmasterów.  Google AdWords – Google nadal udostępnia reklamodawcom informacje o wyszukiwanych hasłach. Druga to Narzędzie dla webmasterów gdzie otrzymujemy dane dotyczące wyszukiwania organicznego. Są to jednak dane ograniczone czasowo i uśrednione. Te dane nie są szyfrowane z przyczyn nieznanych oficjalnie.

Wracając jednak do raportów Google Analytics.

Musimy jednak szykować się na czasy, gdzie sporo danych będzie jednak nie dostępna dla nas jak do tej pory i ilość tych danych będzie rosnąć.

Od października systematycznie ruch “not provided” się zwiększał na witrynach, którymi się opiekuję. Zwłaszcza mój blog “cierpi” z tego powodu, gdyż obecnie “not provided” to najpopularniejsze słowo kluczowe w raporcie słów kluczowych. Dodatkowo, kolejne sygnały ze świata mówią, że “Not provided” będzie systematycznie rósł. W takiej sytuacji postanowiłem trochę podsumować to wyzwanie i przybliżyć sposoby interpretacji ruchu zaliczanego do “not provided”.

Czy “not provided” należy się w ogóle przejmować?

To dobre pytanie. Po pierwszym jak najbardziej negatywnym odebraniu wiadomości o nowej funkcji i wizji końca sensownych analiz w Google Analytics, podszedłem do tematu bardziej analitycznie i zadałem sobie dość ważne pytanie – Czy ten ruch jest duży i czy jest wartościowy, żeby się tym w ogóle przejmować?

Zerknijmy więc na raport dotyczący ilości i rodzaju ruchu, który generowany jest z oznaczeniem not provided. W tym celu musimy zrobić bardzo prosty segment dla tego rodzaju ruchu…

…i skorzystać za raportu “nowi a powracający”.

Jak widać, nie jest to jakiś znaczący ruch (4%), ale nie jest też to ilość mieszcząca się w błędzie statystycznym. Mimo to interesujący jest fakt, że więcej osób nowych pojawia się na moim blogu pierwszy raz jako “not provided” niż odwiedziny powracające. Mimo wszystko patrząc na oba te segmenty ruch ten na szczęście nie jest jeszcze tak duży, żeby strasznie zaburzał statystyki.

Jednak przy analizie już samego ruchu z wyszukiwarek jest to znacznie poważniejszy procent ruchu. Od dłuższego czasu “not provided” jest w w wielu serwisach jako najbardziej popularne słowo kluczowe w ruchu z wyników organicznych. Jak zatem dowiedzieć sie co mogli wpisać zalogowaniu użytkownicy odnajdujący moją stronę internetową?

Avinash Kaushik rekomenduje porównanie ruchu “not provided” do dwóch ważnych segmentów jakim są ruch ze słów “brandowych” i słów generycznych (czyli nie brandowych) i sprawdzenie do którego ruchu można dopasować zagadkowy ruch “not provided”. Bardzo słuszny pomysł.

Nie ma jakiejś super dokładnej korelacji, ale wygląda na to, że słowa w zbiorze “not provided” są raczej bliżej słów kluczowych nie związanych z marką. To już jakaś informacja 😉

Ten sam autor proponuje też analizę “not provided” pod kątem długiego ogona i fraz głównych. W przypadku jego przykładu okazało się, że ruch “not provided” jest w głównej mierze ruchem z długiego ogona, który teraz po prostu się silnie uwidocznił, gdyż wiele słów odpowiadających za kilka wizyt się zsumowało do jednego źródła jakim jest teraz słowo “not provided”. Warto to sprawdzić.

tutaj z kolei wyraźnie widać korelacje pomiędzy słowa z długiego ogona a słowami “not provided”. To także już coś mówi więcej o zaszyfrowanym ruchu.

Nadal nie wiadomo jednak jakie dokładnie słowa odpowiadają za wizyty zgromadzone w źródle “not provided”. Możemy jednak się czegoś domyślić.

Jak odszyfrować słowa kluczowe oznaczone jako “not provided”?

Jest kilka metod odszyfrowania informacji oznaczonych jako “not provided”. Jedne są bardziej skomplikowane, inne sprawdzają się dla osób szczególnie wnikliwie analizujących dane na potrzeby raportowania działań SEO.

Najłatwiejsze wyjście to analiza raportu dotyczącego stron docelowych. Avinash Kaushik zaproponował tą metodą wykorzystując segmenty zaawansowane. Ja podszedłem do sprawy trochę prościej. Wystarczy zobaczyć na jakie strony docelowe wchodzą odwiedzający ze zbioru “not provided”. Jak widać jest to kilka stron, które konsumują najwięcej ruchu przychodzącego z wyników organicznych.

Jest tych stron kilkanaście. Skupmy się na dwóch pierwszych. Pierwsza to strona docelowa dotycząca pozycjonowania w Google Maps, druga to strona główna.

Teraz przechodzimy do raporty “strony docelowe” i analizujemy słowa kluczowe, które najczęściej generują wejścia na strony najczęściej odwiedzane przez użytkowników “zaszyfrowanych”. Musimy wybrać konkretną stronę docelową i zmienić wymiar na słowa kluczowe.

Jak widać dla strony głównej (zaznaczonej w raporcie jako “/”) trudniejsze jest ustalenie dokładnej matrycy słów i tutaj skupiłbym się na analizie, którą zrobiliśmy wcześniej – czy dla strony głównej są to bardziej słowa brandowe czy raczej nie czy może jest to długi ogon?

Z kolei dla innych popularnych podstron tematycznych jest dużo prościej. Spokojnie mogę założyć, że słowa “not provided” w 99% procentach przypadków będą pokrywały się z którymś z tych słów kluczowych.

Wykorzystanie Narzędzia dla webmasterów

Innym bardzo ciekawym rozwiązaniem, trochę bardziej pracochłonnym, jest wykorzystanie drugiej sporej luki w prywatności czyli informacji z narzędzia dla webmasterów. Sposób przedstawiony na Search Engine Watch bazuje na porównaniu ilość kliknięć na konkretne słowa w narzędziu dla webmasterów i ilości wizyt na te słowa w Google Analytics. Różnica miałaby byś ilością zawartą w zbiorze “not provided”. Jest to sposób trochę dla mnie wątpliwy, gdyż jak łatwo zauważyć różnice w danych, które w tych narzędziach potrafią być całkiem duże. Dzieje sie tak ze względu na inny sposób zbierania danych w tych narzędziach. To powoduje, że ten sposób może dać nam jakieś informacje, ale nie będą to informacje obarczone mniejszym lub większym błędem.

Podsumowanie

Co do samej prywatności i danych  to prawda jest też taka, że dane pochodzące wyszukiwanych haseł są prawie nie możliwe do przypisania do konkretnych osób. Stąd ich prywatność jest też, powiedzmy delikatnie, dyskusyjna. Można je oczywiście połączyć z innymi danymi takimi jak IP (znowu nie są to precyzyjne dane) i np. z danymi cookies, ale to nie jest dalej tożsame z identyfikacja użytkownika poszukującego w wyszukiwarce. Zresztą my, co analizują dane, nie potrzebujemy wiedzieć kto konkretnie wpisał daną frazę do wyszukiwarki i wszedł na naszą stronę. Potrzebne nam to jest do analiz trendów i optymalizacji wysiłków SEO oraz optymalizacji oferty, użyteczności strony. Patrząc na luki, intencje wykorzystania danych przez właścicieli stron i wątpliwe zagrożenie prywatności, nie do końca rozumiem te działania. Z kolei jeśli bronić prywatności naprawdę to do końca wyłączając narzędzie dla webmasterów i wszystkie informacje z Google AdWords dotyczące wpisywanych haseł.

Zastanawiam się też, w którą to stronę pójdzie, ale na pewno jeśli Google zrobiło pierwszy krok, teraz przyłączył się FireFox to inne przeglądarki też będą włączały prywatność z automatu, tak jak do tej pory nasze przydatne ciastka (cookies) i ilość szyfrowanego ruchu będzie rosnąć.

Exit mobile version