A kutatásmódszertan sarok mai epizódja a webAUDIENCE módszertanát boncolgatja
A webAUDIENCE esetében a gIA cookie/pop-up panelének megfeleltethető adatbázis alapját a webAUDIT mérésében részt vevő, regisztrációt igénylő site-ok közönsége adja. (Tehát nem a mérésben részt vevő összes site közönsége, mint a gIA esetében.) Ennek pontos részletei a nyilvános felületeken nem elérhetők. Tudomásom szerint az iWiW, Freemail, myVIP, Citromail stb. oldalakra belépő felhasználók alapvető demográfiai adatait (nem, kor, lakóhely, iskolai végzettség) cookie-val eltárolják, és abban az esetben használják fel, ha az egyes szolgáltatásokba belépve ezek az adatok nem mondanak ellent egymásnak. Ezek havi szinten kb. 1,5 millió felhasználót jelentenek, ami eléggé soknak tűnik az adatok egyezésének követelménye miatt. (Az adatgyűjtés anonim módon történik, így nem minősül adatkezelésnek, s ilyen aggályokat így nem vet fel.) Elég arra gondolni, hogy ha egy gépet többen használnak, akkor több logint használhatnak az egyes szolgáltatások esetében is egy gépről, egy böngészőből, így az adatok – értelemszerűen – nem fognak egyezni. A gIA esetében az a gond, hogy eleve nem számol azzal, hogy egy gépet többen is használhatnak.
A webAUDIT cookie policy-jére vonatkozóan sem találtam nyilvánosan elérhető adatokat. A mérés módszeréről viszont részletesen lehet tájékozódni a termékoldalon. A főbb pontok: a mérés mérőkóddal történik, amely 1×1 pixeles képet tölt le a webAUDIT szerveréről, amit szerver oldali naplófájl rögzít. A naplófájl alapján készülnek el a site-ok látogatottságára vonatkozó mérési eredmények, melyeket a webAUDIT saját szervere rögzít, s az adatokhoz értelemszerűen csak a webAUDIT munkatársai férhetnek hozzá. A webAUDIT nem méri azoknak az oldalaknak a forgalmát, amelyek letöltését nem a felhasználó kezdeményezte (automatikusan megnyíló ablakok, automatikus oldalfrissítés). A felhasználó által kezdeményezett egy oldalváltás csupán egyetlen mérőkód-letöltést eredményezhet. A mérési adatok nem tartalmazzák a robotok és más automatizmusok által generált találatokat.
A webAUDIT adatokat kb. 20 változó mentén fúzionálják a GfK offline kutatásának adataival, létrehozva így a webPROFILE 60 ezeres adatbázisát. A fúzióval kapcsolatban szintén érhetők el információk a termékoldalon, ezek azonban kevésbé részletesek, konkrét adatokat (változók száma, melyek szerint fúzionálnak, a fúziós adatbázis mérete stb.) nem tartalmaznak. A fúzió azon a gondolaton alapul, hogy a megrendelők igényeinek megfelelően minél több változót tartalmazzon egy adatbázis, ugyanakkor ne kelljen egy-egy válaszadót túl hosszú kérdőívvel terhelni, hiszen ez negatívan befolyásolja a válaszok és így a kutatás minőségét. “Az adatfúzió célja független adatállományokból származó, különböző információkat hordozó változók összekapcsolása az egyes esetek szintjén. Ezáltal adott a lehetőség különálló információk együttes elemzésére. (…) Az adatfúzió során a megfigyelt eseteket párosítjuk össze. A párosítás alapját azok a közös változók képezik, amelyek megtalálhatóak mind az ún. donor mind az ún. fogadó adatbázisban. (Ezek általában az objektumokat leíró demográfiai, attítűd, érdeklődési, stb. változók.) A párosítás a legközelebbi szomszéd (nearest neighbourhood) algoritmussal megy végbe. Az algoritmus minden fogadóhoz pontosan egy donort rendel, mégpedig azt a donort, amely a közös változók tekintetében a leginkább hasonlít a fogadóhoz.”
Kérdés azonban, hogy a regisztrációs site-okról nyert négy demográfiai változón túl mik jelentik a kapcsolódási pontokat a fúzió során. Valószínűnek tartom, hogy a többi változó site látogatáson alapszik (pl. 45 éves budapesti nő, felsőfokú végzettséggel, látogatta ezt, ezt és ezt az oldalt, ilyen és olyan gyakorisággal). Itt azonban felvetődik egy olyan kérdés, amit a VMR esetében is fel szoktak tenni: mennyire megbízhatóak az emlékezeten alapuló látogatottsági adatok, amelyekről az offline kutatásban résztvevők beszámolnak (erről részletesebben a VMR módszertanát boncolgató postban lesz szó). A fúzió során egyébként demográfiai és attitűd változókat szoktak kapcsolódási pontként használni, ebben az esetben az utóbbiak – tudomásom szerint – nem állnak rendelkezésre.
A szoftveres panel (webPANEL) tagjait elvileg minden esetben offline módon rekrutálják, azonban ennek ellentmondó adat érhető el a termékoldalon: “panelunk építésénél szigorúan ragaszkodunk a GfK azon elvéhez, hogy csak azt kérjük fel a panelba való regisztrációra, akikkel már „találkoztunk” személyes, telefonos vagy online felméréseink során, így biztosítva a lehető leghitelesebb eredményt”.
A paneltagok egy a GfK-Medián webPANEL számára fejlesztett mérőszoftvert telepítenek a számítógépükre, amely a böngészőforgalmukat naplózza és továbbítja egy szerverre. Ezt a naplófájlt dolgozzák fel a webPANEL adatainak előállításához, súlyozva a kérdőíves kutatások eredményeivel és a mérőkódos mérésből származó, cookie alapú számításokkal.
A paneltagok száma azonban jelenleg meglehetősen alacsony (1 ezer fő), így a panel tesztüzemmel működik. Talán ez az oka annak, hogy az adatfúzióban a Szondánál járatosabb GfK nem fúzionálja a webPROFILE és a webPANEL adatait.
A webPANEL – legalábbis egyelőre – csak otthoni internetezőket vizsgál, így természetesen ez sem reprezentatív a munkahelyi (és egyéb helyen) internetezőkre nézve. A termékoldalon azonban a következő szerepel: “az így kapott adatokat kérdőíves kutatások eredményeivel és cookie alapú számítások segítségével tesszük – a munkahelyi internethasználatot is figyelembe véve – reprezentatívvá, teljes-panelt létrehozva így, egyedülállóan a hazai internetes-forgalommérésben”.
A gIA-hoz hasonlóan itt is igaz, sőt a panel tagjainak alacsonyabb számából adódóan még inkább, hogy a mérőkóddal nem rendelkező kisebb site-ok közönségmérése nem pontos. A termék oldalán viszont a következőket olvashatjuk: “ezzel az eljárással már lehetőség nyílik nem auditált webhelyek mérésére is: úgy a kisebb magyar lapok esetében, mint a nem hazai oldalaknál”.
A módszertan sarok holnapi, befejező része a VMR kutatásról fog szólni.
Ha tetszett a bejegyzés, nyomj egy lájkot!
Kövesd a Rabbitblogot Facebookon, vagy iratkozz fel az rss/email értesítőre!
“Módszertan sarok, 3. rész – webAUDIENCE (wA)” bejegyzéshez 1 hozzászólás