Pod koniec października 2011 Google wprowadziło możliwość większej prywatności dla użytkowników wyszukiwarki. Wystarczy posiadać konto Google (czyli jakikolwiek produkt Google) i być zalogowanym. Jeśli w tym czasie będziemy korzystać z wyszukiwarki dane dotyczące naszego wyszukiwania (słowa kluczowe) nie będą przekazywane do żadnego innego podmiotu. Nowa funkcjonalność zapewniająca więcej prywatności użytkowników wyszukiwarki, nie specjalnie przypadła do gustu wszystkim, którzy pracują nad pozycją w wynikach organicznych. Jakaś część informacji do analizy efektywności działań SEO została w końcu odebrana. Zamiast słów kluczowych pojawiło się w Google Analytics w raporcie słów kluczowych nowe oznaczenie “not provided”. W internecie pojawiło sie sporo komentarzy mówiących o tym, że Google zabiera narzędzia do analizy działań SEO, że niedługo znacząca część ruchu będzie właśnie “not provided”. Na Search Engine Land pojawiły się całkiem spore procenty ruchu zaliczanego do “Not provided” dochodzące do 17% całości ruchu w witrynie. Oznacza to, że właściwie nie wiem jakie intencje miało 17% osób, które pojawiły się na stronie. To bardzo zła wiadomość dla analityków webowych i SEMitów, którzy muszą cały czas optymalizować i poprawiać swoje działania w internecie.
Dodatkowo ostatnio przeglądarka Firefox ogłosiła, że zamierza wprowadzić kodowanie jako standard. W takim przypadku wszyscy użytkownicy FF będą mieli z automatu włączony protokół SSL, a co za tym idzie więcej wizyt będzie oznaczonych jako “not provided”. W tym samym czasie przeglądarka FF staje się bardziej “bezpieczna” niż Chrome czy Internet Explorer. Ciekawe jak długo te dwie przeglądarki pozostaną nie szyfrowane?
Czemu Google wprowadziło tą zmianę?
Google dba o bezpieczeństwo i prywatność swoich użytkowników. Robi to jednak wybiórczo pozostawiając obecnie kilka dużych luk w tym całym zabezpieczeniu prywatności. Jedno to tzw. refferer data czyli dane zawarte w adresach URL przekazywanych do stron z wyszukiwarki. Jeśli wpiszemy coś do wyszukiwarki nasze zapytanie się pojawi w adresie w pasku przeglądarki. Te dane mogą wyciekać. Innymi takimi niedoskonałościami systemu są linki sponsorowane i Narzędzie dla webmasterów. Google AdWords – Google nadal udostępnia reklamodawcom informacje o wyszukiwanych hasłach. Druga to Narzędzie dla webmasterów gdzie otrzymujemy dane dotyczące wyszukiwania organicznego. Są to jednak dane ograniczone czasowo i uśrednione. Te dane nie są szyfrowane z przyczyn nieznanych oficjalnie.
Wracając jednak do raportów Google Analytics.
Musimy jednak szykować się na czasy, gdzie sporo danych będzie jednak nie dostępna dla nas jak do tej pory i ilość tych danych będzie rosnąć.
Od października systematycznie ruch “not provided” się zwiększał na witrynach, którymi się opiekuję. Zwłaszcza mój blog “cierpi” z tego powodu, gdyż obecnie “not provided” to najpopularniejsze słowo kluczowe w raporcie słów kluczowych. Dodatkowo, kolejne sygnały ze świata mówią, że “Not provided” będzie systematycznie rósł. W takiej sytuacji postanowiłem trochę podsumować to wyzwanie i przybliżyć sposoby interpretacji ruchu zaliczanego do “not provided”.
Czy “not provided” należy się w ogóle przejmować?
To dobre pytanie. Po pierwszym jak najbardziej negatywnym odebraniu wiadomości o nowej funkcji i wizji końca sensownych analiz w Google Analytics, podszedłem do tematu bardziej analitycznie i zadałem sobie dość ważne pytanie – Czy ten ruch jest duży i czy jest wartościowy, żeby się tym w ogóle przejmować?
Zerknijmy więc na raport dotyczący ilości i rodzaju ruchu, który generowany jest z oznaczeniem not provided. W tym celu musimy zrobić bardzo prosty segment dla tego rodzaju ruchu…
…i skorzystać za raportu “nowi a powracający”.
Jak widać, nie jest to jakiś znaczący ruch (4%), ale nie jest też to ilość mieszcząca się w błędzie statystycznym. Mimo to interesujący jest fakt, że więcej osób nowych pojawia się na moim blogu pierwszy raz jako “not provided” niż odwiedziny powracające. Mimo wszystko patrząc na oba te segmenty ruch ten na szczęście nie jest jeszcze tak duży, żeby strasznie zaburzał statystyki.
Jednak przy analizie już samego ruchu z wyszukiwarek jest to znacznie poważniejszy procent ruchu. Od dłuższego czasu “not provided” jest w w wielu serwisach jako najbardziej popularne słowo kluczowe w ruchu z wyników organicznych. Jak zatem dowiedzieć sie co mogli wpisać zalogowaniu użytkownicy odnajdujący moją stronę internetową?
Avinash Kaushik rekomenduje porównanie ruchu “not provided” do dwóch ważnych segmentów jakim są ruch ze słów “brandowych” i słów generycznych (czyli nie brandowych) i sprawdzenie do którego ruchu można dopasować zagadkowy ruch “not provided”. Bardzo słuszny pomysł.
Nie ma jakiejś super dokładnej korelacji, ale wygląda na to, że słowa w zbiorze “not provided” są raczej bliżej słów kluczowych nie związanych z marką. To już jakaś informacja 😉
Ten sam autor proponuje też analizę “not provided” pod kątem długiego ogona i fraz głównych. W przypadku jego przykładu okazało się, że ruch “not provided” jest w głównej mierze ruchem z długiego ogona, który teraz po prostu się silnie uwidocznił, gdyż wiele słów odpowiadających za kilka wizyt się zsumowało do jednego źródła jakim jest teraz słowo “not provided”. Warto to sprawdzić.
tutaj z kolei wyraźnie widać korelacje pomiędzy słowa z długiego ogona a słowami “not provided”. To także już coś mówi więcej o zaszyfrowanym ruchu.
Nadal nie wiadomo jednak jakie dokładnie słowa odpowiadają za wizyty zgromadzone w źródle “not provided”. Możemy jednak się czegoś domyślić.
Jak odszyfrować słowa kluczowe oznaczone jako “not provided”?
Jest kilka metod odszyfrowania informacji oznaczonych jako “not provided”. Jedne są bardziej skomplikowane, inne sprawdzają się dla osób szczególnie wnikliwie analizujących dane na potrzeby raportowania działań SEO.
Najłatwiejsze wyjście to analiza raportu dotyczącego stron docelowych. Avinash Kaushik zaproponował tą metodą wykorzystując segmenty zaawansowane. Ja podszedłem do sprawy trochę prościej. Wystarczy zobaczyć na jakie strony docelowe wchodzą odwiedzający ze zbioru “not provided”. Jak widać jest to kilka stron, które konsumują najwięcej ruchu przychodzącego z wyników organicznych.
Jest tych stron kilkanaście. Skupmy się na dwóch pierwszych. Pierwsza to strona docelowa dotycząca pozycjonowania w Google Maps, druga to strona główna.
Teraz przechodzimy do raporty “strony docelowe” i analizujemy słowa kluczowe, które najczęściej generują wejścia na strony najczęściej odwiedzane przez użytkowników “zaszyfrowanych”. Musimy wybrać konkretną stronę docelową i zmienić wymiar na słowa kluczowe.
Jak widać dla strony głównej (zaznaczonej w raporcie jako “/”) trudniejsze jest ustalenie dokładnej matrycy słów i tutaj skupiłbym się na analizie, którą zrobiliśmy wcześniej – czy dla strony głównej są to bardziej słowa brandowe czy raczej nie czy może jest to długi ogon?
Z kolei dla innych popularnych podstron tematycznych jest dużo prościej. Spokojnie mogę założyć, że słowa “not provided” w 99% procentach przypadków będą pokrywały się z którymś z tych słów kluczowych.
Wykorzystanie Narzędzia dla webmasterów
Innym bardzo ciekawym rozwiązaniem, trochę bardziej pracochłonnym, jest wykorzystanie drugiej sporej luki w prywatności czyli informacji z narzędzia dla webmasterów. Sposób przedstawiony na Search Engine Watch bazuje na porównaniu ilość kliknięć na konkretne słowa w narzędziu dla webmasterów i ilości wizyt na te słowa w Google Analytics. Różnica miałaby byś ilością zawartą w zbiorze “not provided”. Jest to sposób trochę dla mnie wątpliwy, gdyż jak łatwo zauważyć różnice w danych, które w tych narzędziach potrafią być całkiem duże. Dzieje sie tak ze względu na inny sposób zbierania danych w tych narzędziach. To powoduje, że ten sposób może dać nam jakieś informacje, ale nie będą to informacje obarczone mniejszym lub większym błędem.
Podsumowanie
Co do samej prywatności i danych to prawda jest też taka, że dane pochodzące wyszukiwanych haseł są prawie nie możliwe do przypisania do konkretnych osób. Stąd ich prywatność jest też, powiedzmy delikatnie, dyskusyjna. Można je oczywiście połączyć z innymi danymi takimi jak IP (znowu nie są to precyzyjne dane) i np. z danymi cookies, ale to nie jest dalej tożsame z identyfikacja użytkownika poszukującego w wyszukiwarce. Zresztą my, co analizują dane, nie potrzebujemy wiedzieć kto konkretnie wpisał daną frazę do wyszukiwarki i wszedł na naszą stronę. Potrzebne nam to jest do analiz trendów i optymalizacji wysiłków SEO oraz optymalizacji oferty, użyteczności strony. Patrząc na luki, intencje wykorzystania danych przez właścicieli stron i wątpliwe zagrożenie prywatności, nie do końca rozumiem te działania. Z kolei jeśli bronić prywatności naprawdę to do końca wyłączając narzędzie dla webmasterów i wszystkie informacje z Google AdWords dotyczące wpisywanych haseł.
Zastanawiam się też, w którą to stronę pójdzie, ale na pewno jeśli Google zrobiło pierwszy krok, teraz przyłączył się FireFox to inne przeglądarki też będą włączały prywatność z automatu, tak jak do tej pory nasze przydatne ciastka (cookies) i ilość szyfrowanego ruchu będzie rosnąć.
I oto przykład, ewolucji SEO. Google coś blokuje a seowcy kombinuj:)
Dziękuję za (kolejne) ciekawe spostrzeżenia. U nas duży przyrost “not provided” nastąpił 5 marca i utrzymuje się na poziomie kilkunastu-kilkudziesięciu procent (przykładowe dane: http://goo.gl/pFioy). Jak tak dalej pójdzie, trzeba będzie zmienić podejście do pozycjonowania długiego ogona :/
Na jednej z witryn działającej w branży budowlanej, ruch ‘not provided’ stanowi 8% łącznych odwiedzin. Dokładnie 32/416 świeżego okresu dla tego roku, występuje jako 4 hasło najczęściej odwiedzane.
Przeglądane strony 2 (w przybliżeniu),
śr. czas spędzony na witrynie 1min 20 sek. (w przybliżeniu),
84 procent nowych odwiedzin,
31,25 procent wynosi współczynnik odrzuceń.
Ruch z haseł oznaczonych jako ‘not provided’ na przestrzeni miesięcy cechuje się tendencją wzrostową. O czym to świadczy? Moim zdaniem nie jest to dobra wiadomość dla pozycjonerów analizujących ruch na stronie. Wiadomym jest, że aby osiągnąć najlepsze wyniki zadawalające nas i naszych klientów, nieustannie trzeba poprawiać swoje działania czy to poprzez optymalizację czy działania offline.
Tak jest to warto powtórzyć wg ostatnich nowinek przeglądarka Firefox ogłosiła, że będzie kodowała strony, co za tym idzie, włączany protokół SSL, spowoduje, że więcej wizyt będzie oznaczonych właśnie jako ‘not provided’.
No nic, znów pojawiają się jakieś utrudnienia, trzeba kombinować. Damy radę!
Pozdrawiam Mariusz
Moim zdaniem to złe podejście Google. Tym bardziej, że te dane gdzieś są – skoro Narzędzie Propozycji Słow Kluczowych je ma, dlaczego właściciel strony nie może miec do nich dostepu? Szykuje sie moim zdaniem coś ‘ciekawego” – i już niedługo zapewne o tym usłyszymy…
Tak jak mówiłem – są luki, których też nie do końca rozumiem z punktu widzenia ogólnej dbałości o użytkownika. Ta prywatność nie była specjalnie bardzo zagrożona w kwestii używania wyszukiwarki. Luki prywatności są dużo większe i bardziej niebezpieczne w kwestii zabezpieczeń samych komputerów, sieci itp. I tutaj bym szukał rozwiązań związanych z prywatnością. W kwestii przeglądarek to dla mnie sprawa jest pewna, że Chrome i IE także wprowadzą SSL w standardzie i ruch “not provided” będzie jeszcze większy. No cóż ale trzeba sobie radzić i człowiek nie jest taki, żeby się nie przystosował. Zakładam, że narzędzia analityczne także będą musiały uleć rewolucji bo inaczej będą mało przydatne.
Zdecydowanie nie fair, pozycja monopolisty sprawiła, że pozwalają sobie na takie rzeczy. Z przykrością stwierdzam, że na jednej z obserwowanych przeze mnie witryn not provided z tego roku to ponad 22% całego ruchu z wyszukiwarki. To już uważam, część tortu po jaką warto się schylić.
Google stoi przed problemem “jak zjeść jabłko i mieć jabłko” – czyli z jednej strony chronić prywatność użytkowników, walczyć z SEO, a z drugiej strony przyciągać webmasterów, którzy korzystając z GA dostarczają wielkiemu bratu mnóstwa ciekawych danych…
Rok temu, jak zaczynałem pozycjonować sklep znajomego na 16 tys odwiedzin 1 tys był not provided, obecnie na 20 tyś odwiedzin z wyników bezpłatnych mamy 8 tyś “not provided”. W większości wypadków wystarcza wspomniana przez autora opcja podglądnięcia stron docelowych.
Od wczoraj będziesz już 100% not provided: http://www.searchenginejournal.com/google-gone-100-provided-secure-search/70799/.
ogromnie atrakcyjny materiał, podoba mi się podstawy związany z szczegółami ślubnymi.
Ogólnie wszystko prezentuje się bardzo estetycznie
ciekae info