SEO spotyka GA: śledzenie odwiedzin botów w protokole pomiaru
Ostatnio uczestniczyłem (i miałem) w niektórych rozmowach na temat analizowania logów z perspektywy SEO (od @ David Sottimano na Nieoznaczona konferencja i Lino Uruñuela w czasie kolacji) i zdecydowałem się opublikować wtyczkę WordPress , nad którą zacząłem pracować kilka lat temu, i że ze względów zawodowych zostawiłem ją w szufladzie „Zrobię to” i nigdy nie wróciła moim zdaniem.
Pierwszą rzeczą, na którą muszę zwrócić uwagę, jest to, że jest to WTYCZKA BETA, więc należy uważać , aby używać go przy dużym obciążeniu lub w miejscu produkcji. Pracuję na tej stronie przez 4 dni bez żadnych problemów, ale to nie znaczy, że jest wolny od błędów. Rozważmy teraz tę wtyczkę jako dowód koncepcji .
Głównym zadaniem wtyczki jest zarejestrowanie odwiedzin botów wyszukiwania w naszej witrynie wordpress w Google Analytics, za pomocą protokołu pomiaru .
Przepływ roboczy wtyczki jest prosty, sprawdza tylko, czy bieżący odwiedzający Agent użytkownika pasuje do dowolnego znanego robota indeksującego i na podstawie tych informacji wysyłamy odsłonę do niektórych właściwości Google Analytics. Pamiętaj, że zaleca się korzystanie z nowej właściwości, ponieważ będziemy korzystać z wielu niestandardowych wymiarów, aby śledzić dodatkowe informacje obok odwiedzanych stron =)
Kiedyś miałem swój własny parser agentów użytkownika , ale skończyłem używając innej dobrze ustalonej (i na pewno bardziej niezawodnej) biblioteki. Kiedy coś działa, nie ma potrzeby wymyślania koła :). Więc ten plugin używa biblioteki PHP dla rdzeń uap projekt.
Zobaczmy prosty schemat działania wtyczki:
Jestem pewien, że to było łatwe do zrozumienia. Ale nie tylko chcę sprawdzić, jakie odsłony odwiedził bot wyszukiwania, ale nie idziemy dalej i będziemy śledzić następujące kwestie:
Na pewno możesz znaleźć odpowiedzi na wiele innych pytań, ponieważ używamy Google Analytics do śledzenia tych odwiedzin, będziemy w stanie przekroczyć dowolne wymiary na nasze potrzeby.
Kolejną fajną cechą śledzenia robotów indeksujących w protokole pomiaru jest to, że będziemy mogli oglądać, jak nasza strona jest indeksowana w raportach w czasie rzeczywistym ! 🙂
Ustawiać
Wystarczy pobrać plik ZIP wtyczki z następującego adresu URL i upuścić go w folderze Wtyczki WordPress i skonfigurować identyfikator właściwości Google Analytics tam, gdzie chcesz wysłać dane.
Używane niestandardowe wymiary
Być może zastanawiasz się, dlaczego powieliliśmy te same informacje dotyczące tego samego bota z innym zakresem, dlatego dlatego, jak wcześniej wyjaśniłem, używamy adresu IP bota do zbudowania identyfikatora klienta i identyfikatora użytkownika, i może się to zdarzyć że Google używa tego samego adresu IP dla różnych botów (np. dla komputerów stacjonarnych lub polecanych ). W ten sposób możemy również uzyskać informacje o poziomie trafienia w przypadku, gdy dane zakresu użytkownika zostaną zastąpione 🙂
Inną rzeczą, którą możemy chcieć zrobić, jest ustawienie limitu czasu sesji na 4 godziny w naszej konfiguracji profilu. Przeszukiwanie botów nie odbywa się tak samo, jak użytkownik nawiguje po stronie, a my możemy uzyskiwać 2 strony na godzinę, więc domyślny limit czasu 30 minut nie ma sensu.
Zobaczmy, jak będą wyglądały raporty w Google Analytics 🙂
Zużyta zawartość przez boty z godzinnym podziałem
Suma sesji i odsłon przez bota wyszukiwania
Strony, które zwróciły 404 i który bot je indeksował
Które strony przeszły dany bot (raport Eksploratora użytkowników)
Wtyczkę możesz pobrać z następującego repozytorium GitHub:
https://github.com/thyngster/wp-seo-ga
Jeśli nie możesz uruchomić wtyczki, prześlij mi komentarz do tego posta lub otwórz problem w GitHub, a ja spróbuję się temu przyjrzeć.
Wszelkie sugestie / ulepszenia będą bardzo mile widziane 🙂