Gemius zdecydował się (po jakiejś akcji z botami w USA) zmienić metodologię liczenia statystyk. (biuletyn)
Sprawę opisał już Adaś, który zwrócił uwagę, że odetnie to ludzi, którzy kasują ciastka po zamknięciu przeglądarki, oraz Quiris, który zdaje się uznawać, że wynikowa różnica jest dowodem celowego “fałszowania” statystyk przez użytkowników przeglądarek alternatywnych (Firefox, Opera, Safari, Konqueror itp.) poprzez celowe ustawianie kasowania ciastek po zamknięciu sesji, aby podbijać statystyki alternatywnych przeglądarek.
Chciałbym zwrócić uwagę, że problem naliczania statystyk jest czymś niesamowicie trudnym do rozwiązania. Każda metoda wymusza przekłamania. Już sam fakt liczenia na bazie ciastek odcina osoby mające wyłączone ciastka, odcięcie osób kasujących ciastka po zamknięciu przeglądarki, z jednej strony faktycznie usunie boty, automaty i osoby fałszujące, a z drugiej odetnie tych, którzy kasują ciastka ponieważ taka jest ich wola.
Aby zobrazować, że nie jest to margines, spójrzcie na nowoczesne przeglądarki oraz IE7. Wszystkie planują wprowadzać łatwo dostępną funkcję kasowania danych prywatnych, to chyba jasny sygnał, że użytkownicy mainstreamowi tego chcą.
Dodatkowo, aktualna metoda naliczania statystyk powoduje, ze jesli używam Firefoksa przez 95% czasu, ale raz na pare dni na sekundę odpalam IE, aby otworzyć stronę, która w Fx nie działa, to Gemius nalicza 50% dla Firefoksa i 50% dla IE.
Sądzę, że taki scenariusz nie jest rzadki, i gdyby udało się go włączyć do analizy, przeglądarki alternatywne mogłyby zyskać w statystykach (poprzez niezaliczanie tego odpalenia IE jako nowego użytkownika korzystającego z tej przeglądarki). Pytanie, czy jest to możliwe. Jeśli spróbujemy, to stracimy w wynikach osoby, które autentycznie korzystają z IE, ale bardzo rzadko w ogóle używają Internetu.
Pomijam już, choć może nie powinienem, fakt, że użytkownicy nowoczesnych przeglądarek często blokują Gemiusa, ponieważ łączenie do zewnętrznego serwera spowalania ładowanie strony…
Co począć? Przede wszystkim uważam, że trzeba sie uwolnić od ciastek. Póki statystyki liczone są na bazie ciastek, liczenie sesji i użytkowników zawsze będzie kulawe. Minimalnie pomoże pewnie popularyzacja , dzięki czemu statystyki nie będą spowalniać ładowania stron, ale nadal nie posiadamy mechanizmu, który zapewniałby możliwość śledzenia użytkowników, przy jednoczesnym zachowaniu ich anonimowości.
Update: Jedną z rzeczy, które bardzo chciałbym zobaczyć w systemach operacyjnych jest współdzielenie danych użytkownika przez aplikacje. Ciasteczka to MOJE dane, a nie przeglądarki. Dlatego logiczne byłoby, aby wszystkie przeglądarki współdzieliły moje ciastka. To samo tyczy się poczty, historii, haseł itp. To rozwiązałoby chociaż częściowo problem statystyk.
11 replies on “Zmiany w rankingu”
A gdyby systemy statystyk rejestrowały adresy MAC kart sieciowych (lub jakiś inny ID, który da się wyciągnąć np. ze sprzętu a który byłby jednoznaczny), z których wykonano połączenie w ciągu 24 godzin? Oczywiście pojawia się problem, gdy pod jednym adresem siedzi stadko użytkowników.
Ja się czesto zastanawiam, do czego w ogóle przyda nam się Gemiusowa informacja że z przeglądarka X ma tyle procent, Y tyle, a Z tyle?
Szczerze mówiąc, mało mnie interesuje, co jest najpopularniejsze. Dwa. Własne strony monitoruje za pomocą access.loga i takie informacje mi wystarczają.
A gemiusa tne 🙂
@Piotr: przydaje się np. po to, by wytykać bankom i portalom ignorowanie rosnącej grupy użytkowników non-IE.
@Piotr: przydaje się np. by wytykać webmasterom pewnych stron www (banki, portale, sklepy, biblioteki…) olewanie całkiem już sporej (i nadal rosnącej) grupy userów. Taki argument “widzicie, nie jestem jedyną osobą, która nie używa IE!”
…i też tnę gemiusa 🙂
A jak mozna wylaczyc tego Gemiusa?
Pryszczers: MACa karty sieciowej nie jesteś w stanie wyciągnąć poprzez internet
A nawet gdyby się dało to i tak MACa można zmienic w banalny sposób… generalnie pomysł z wyciąganiem jakiegokolwiem adresu fizycznego mija się z celem – każdy taki adres ta się zmienić.
…a gemiusa też tne 🙂
Zdaje się, że w ipv6 adresy ip mają być unikalne, wtedy pewnie byłoby dużo łatwiej monitorować.
Niezależnie od systemu i przeglądarki zwykle blokuję gemiusa, jeśłi tylko się da. Z prostego powodu, odwołania do Ich serwerów trwają “wieki”.
@Adrianer – Gemiusa tnie się bardzo łatwo, w FF używa się rozszerzenia AdBlock, w Operze wpisuje się odpowiednie adresy do pliku filter.ini. Po adresy, jakie wyciąć, zajrzyj np. do kodu paru stron (najlepiej duzych, jak gazeta.pl).
Oczywiście istnieje wiele innych serwerów statystyk, tnę wszystjko, co się rusza. 😉 Bo faktycznie spowalnia to łądowanie stron, zwłaszcza, jak ma się kiepściutkie łącze.
To przejscie na cookies co najmniej 24h nie zostalo i nie zostanie wprowadzone. Prawdopodobnie procentowe udzialy beda bazowaly na odslonach, nie cookies, przez co trudniej bedzie je falszowac (wczesniej wystarczylo wykonac jedna odslone z cookie, zeby zwiekszyc liczbe uzytkownikow o 1; w przypadku odslon trzeba bedzie ich wykonac tyle, ile srednio wykonuje uzytkownik z jednego cookie).