P2P hálózatok vizsgálata Bodó Balázs, Halácsy Péter, Korsós Milán, Prekopcsák Zoltán, Szalai András 2007. szeptember 26.
Kitchen Budapest Medialab , www.kitchenbudapest.hu
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai)
HAZAI P2P HÁLÓZATOK Mára már senki nem vitatja, hogy a peer-to-peer hálózatokon zajló (sokszor illegális) fájlcsere a kulturális ökoszisztéma teljes jogú tagja. Csupán a fájlcserélők kulturális javak cseréjében, fogyasztásában betöltött szerepe kérdéses. Az eddig e kérdésben született tanulmányok sokszor egymásnak ellentmondó eredményre jutnak, ami egyáltalán nem meglepő annak fényében, hogy a mozifilmek, TV sorozatok, zenei alkotások, könyvek legális és illegális piacai közötti összefüggések egyszerre függnek • a terméktől, • a vizsgált fogyasztói szegmenstől, • a legális disztribúciós infrastruktúra minőségétől (mozihálózat, kölcsönzői- vagy zenebolt hálózat sűrűsége), • a piaci ártól, • a nyelvi különbségektől, • a méretgazdaságossági faktoroktól, • a digitális infrastruktúra fejlettségétől, • a jogvédelemre szánt erőforrások mennyiségétől, hogy csak a legfontosabbakat említsük. Más szóval könnyen előfordulhat az, hogy míg az egyik országban, annak egy jól meghatározott piacán az illegális piac a legális piac rovására létezik, addig egy másik ország másik piacán az illegális letöltés, másolás új keresletet teremt. A probléma nyilvánvaló: megfelelő adatok hiányában csupán nagyon rossz becslésekkel élhetünk arról, hogy mi is történik a digitális underground feketepiacain. Adatok hiányában tehát azt sem tudjuk megállapítani, hogy van-e és ha igen, milyen irányú korreláció az underground forgalom és a legitim piacokon tapasztalt kereslet között. Ebben a projektben a magyar hálózatokon zajló p2p fájlcsere mérésének első lépéseit tettük meg. Magyarországon eddig még nem készült átfogó vizsgálat a hazai p2p hálózatokról. Két hónapos pilot projectünkben azt a sejtésünket próbáltuk igazolni, hogy a hazai p2p hálózatokon lévő kereslet is van olyan nagy, hogy figyelmet kapjon. Példának okáért az egyik legnagyobb magyar torrent oldalon Rúzsa Magdolna tavalyi albumját eddig több mint 4500-an töltötték le. Figyelembe véve, hogy 7500 példány eladása már aranylemezt ér a Mahasznál, ez a szám nem elhanyagolható.
Módszertan A digitális undergroundban zajló forgalom mérésére vállalkozók nincsenek könnyű helyzetben. Ezek a hálózatok jó okkal rejtőzködnek a kutató tekintet elől. Sajátos, kívülállók számára nehezen megközelíthető nyelvi és gépi kóddal védik magukat az avatatlan szemek elől. A kutatás első lépése a résztvevő megfigyelés volt. A jelszóval védett, csak meghívókon keresztül bővülő fájlcsere közösségekbe a bejutás, a taggá válás a legnehezebb feladat. Ebben a lépcsőben megismertük azt az interfészt, melyen keresztül a vizsgálatra kiválasztott közösség tagjai kapcsolatot tartanak egymással. Ennek a lépcsőnek az eredményei később kulcsfontosságúak voltak a forgalmi adatok értelmezése során.
Hazai p2p hálózatok vizsgálata
1
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai) A második lépcsőben ki kellett alakítani azt a technológiát, mellyel a fájlcsere forgalom feltűnés nélkül megfigyelhető volt. Ez a feladat természetesen sokkal összetettebb és technológiailag bonyolultabb annál, hogy azt a pilot projekt pár hónapja alatt teljes körűen kivitelezhető lett volna. A vizsgált peer hálózatok (bittorrent és dc++) a nevük által sugallttal ellentétben korántsem központ-mentes hálózatok, hiszen mind a torrent tracker, mind a dc hub elengedhetetlen az egyes peerek-nél megtalálható állományok cseréje szempontjából. Az idő- és erőforrás korlátok figyelembe vételével végül úgy döntöttünk, hogy bár technológiailag megoldható a peer-ek között zajló forgalom megfigyelése a központ megkérdezése nélkül is, mégis a központokhoz fogunk információért fordulni. Mivel a peer-ek lekérdezése rövidtávon megoldhatatlan feladatnak bizonyult, ezért ezzel a döntéssel információt nyertünk, miközben persze rengeteg információt el is veszítettünk: a központok lekérdezése során figyelemmel kellett lennünk arra a tényre, hogy a túlságosan gyakori adatkérés gyanússá tett volna bennünket azok szemében, akik ezeket a központokat fenntartják, üzemeltetik. A pilot során begyűjtött adatok tehát ezt a kompromisszumot tükrözik. Minden, a központokon keresztül lekérhető adatot igyekeztünk megszerezni, de a mintavételi frekvencia nem haladhatta meg a még gyanút nem keltő 1 lekérdezés/nap gyakoriságot.
Továbblépési lehetőségek A továbblépés lehetőségei adják magukat. A peer-ek közvetlen lekérdezésével sokkal jobb minőségű adatokat lehet nyerni, ehhez azonban szükség van a megfigyelés eszközeinek fejlesztésére. Az így kapott adatokat a legitim piacról származó adatokkal szisztematikusan összevetve a mainál lényegesen erősebb kapcsolatot lehet és kell teremteni az underground és a legális piacok között. A cél ugyanis egyértelmű: ha az illegális fájlcserét megakadályozni nem lehet (és ezt semmilyen körülmények között nem is tekintjük célunknak, sőt másokat sem szeretnénk munkánkkal hozzásegíteni ehhez), akkor használjuk arra, amire viszont tökéletes: a legális piacokon tapasztalható kereslet előrejelzésére, az ottani kereslet, forgalom pontosabb megértésére.
Fontos! A kutatás során begyűjtött adatokat bizalmasan kezeljük és harmadik félnek semmilyen körülmények között nem szolgáltatjuk ki. Mindent megteszünk azért, hogy e hálózatok felhasználóiról ne derülhessen ki olyan információ, ami segítségével őket személyesen azonosítani lehessen. Mi magunk ezzel a képességgel nem rendelkezünk, és a jövőben sem szándékozunk ezzel foglalkozni.
Hazai p2p hálózatok vizsgálata
2
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai)
BITTORRENT HÁLÓZAT A torrent fájlok életútját az egyik magyar felhasználók körében népszerű (37000 regisztrált tag) torrent tracker nyomon követésével végeztük. Itt naponta lekérdeztük a trackert és feljegyeztük az elérhető torrentek adatait. Ez a lekérdezési gyakoriság nem teszi lehetővé, hogy perce pontosan nyomon tudjuk követni egy-egy tartalom forgalmának alakulását, ám pontos képet ad arról, hogy napról-napra hogyan alakult egy-egy tartalom népszerűsége, letöltése. Az alábbi ábrák hasonló képet mutatnak: a letöltők túlnyomó része az első pár napra koncentrálódik, utána radikálisan visszaesik az állomány forgalma.
Torrent fájl átlagos életciklusa 50.0
37.5
25.0
12.5
letöltés 0
1
10
20
30
40
seeder 50
60 feltöltés utáni napok száma
A torrent fájlok átlagos életciklusa. Látszik, hogy legtöbben az első pár napban töltik le, és az első hónapban seedelik a fájlokat..
Push média Az első és talán legfontosabb tanulság nem levonható a központi tracker interfészének ismerete nélkül. Minden nap több tucat, adott esetben több száz új állomány kerül fel a honlapra. Az adatbázisban természetesen lehet keresni, de az adatok arra engednek következtetni, hogy a letöltők zöme azokat a fájlokat kezdi letölteni, amik az alapállapotban a képernyőjén megjelenő, frissesség alapján rendezett listában számra láthatók. Más szóval: az és addig népszerű, ami és ameddig a toplista első képernyőjén látható. A felhasználók azt töltik le, ami az orruk elé kerül. A torrent tracker tehát egy push médium, ami bármit népszerűvé tud tenni (ide értve Jancsó Miklós Szegénylegények című filmjét is), de csak addig, amíg az a legfrissebb 100 között megtalálható. Talán csak a relatív alacsony felhasználószámnak, s így a kritikus tömeg hiánynak tudható be, hogy a megfigyelt trackernél alig találtunk arra jelet, hogy az archívumként működne, azaz hosszú távon, stabilan elérhetővé tenne a közösség által értékesnek gondolt tartalmakat. A legfontosabb kivételt e szabály alól a szoftverek között találtunk, ahol a hasznosnak gondolt programok iránti kereslet állandóan magas, annak köszönhetően, hogy a sorozatos operációs rendszer újrainstallálások stabil keresletet generálnak a korábbi letöltők között is.
Hazai p2p hálózatok vizsgálata
3
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai) Megvizsgáltuk négy aktuális (jelenleg mozikban futó) film letöltésszámát a trackeren, és ezt ábrázoltuk, bejelölve a premiert is. Látszik, hogy ugyanaz az alkotás többször is kiugróan népszerű lehet akkor, ha újabb és újabb verziók kerülnek fel a központi honlapra.
A Vigyázz, kész, szörf!, az Even, a Mindenható, A Simpsons család - A Film és a Törés filmek letöltésszámának az alakulása a vizsgált bittorrent hálózaton.
A fenti ábrákról az is nyilvánvaló, hogy a felhasználók nem annyira kedvelik a gyenge, moziban, kamerával felvett filmeket, és díjazzák a jobb (legalább DVD) minőséget. Továbbá látszik az is, hogy a magyar nyelvű szinkron, vagy felirat nélkül a filmek nem válhatnak túlságosan népszerűvé. A jobb oldalon azt látjuk, hogy egy film mennyire sikeres a torrent trackeren a saját mozisikeréhez viszonyítva.
Hazai p2p hálózatok vizsgálata
4
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai)
Kapcsolat a legális és illegális piacok között Az illegális keresletet a legális forgalmazással összevetve látható, hogy a külföldi piacokon elköltött marketing és PR dollárok Magyarországon is dolgozni kezdenek, és hetekkel, hónapokkal a magyarországi premier előtt is szignifikáns keresletet képesek generálni. Ahhoz sajnos nem áll elég adat a rendelkezésünkre, hogy korrelációt tudjunk számolni a hivatalos és illegális kereslet között, de az adatok alapján sejteni lehet, hogy létezik ilyen korreláció és az iránya pozitív.
A bal oldali grafikonon a tracker napi letöltéseinek a számát láthatjuk. Tisztán látszik, hogy a “free-leach” héten megugrott a letöltések száma, a szeptemberi iskolakezdéssel pedig lecsökkent. A jobb oldali grafikonon a mozik látogatottsági statisztikáit látjuk, amin látszik, hogy a moziünnep hetében jelentősen megugrott a látogatottság. A vizsgált filmek mozibeli és illegális forgalmát végigkísérve azt az érdekes de várható tényt figyelhetjük meg, hogy a költségek szorosan összefüggnek a kereslettel. A moziünnep hétvégéjének olcsóbb jegyárai ugyanúgy extra keresletet generáltak, mint a torrent tracker által szervezett promóciós időszak, amikor is a letöltések nem számolódtak bele az egyes felhasználók a letöltés és feltöltés egyensúlyát előíró kvótájába. Ha megnézzük, hogy hogyan viselkedik az átlagos torrent állomány, akkor a máshonnan már ismert power law eloszlást követ. A forgalom túlnyomó része az állomány életének első pár napjára koncentrálódik, arra az időszakra tehát, amíg az a felhasználók képernyőjén alapállapotban megjelenő legfrissebb állományok között megtalálható. Egy kis felhasználószámú, viszonylag kevés (tehát követhető mennyiségű) újdonságot kínáló torrent tracker tehát inkább TV szerűen működik, mint máshogy, és szükségszerűképpen gyengébben fog teljesíteni a „long tail”-be tartozó, archív tartalmak terén. Ezzel szemben a DC hálózat, ahol a megosztott könyvtárban gyűlő állományokról nincs ilyen toplista, sokkal inkább archívum, mint bármi más, annak ellenére, hogy a keresőkifejezések alapján itt is dominálnak a kurrens tartalmak. További vizsgálatok szükségesek a fenti állítások pontosításához, árnyalásához. A letöltési toplisták alapján nyilvánvaló, hogy nagyon másképpen viselkednek a mozifilmek, a zenei albumok és a TV sorozatok.
Hazai p2p hálózatok vizsgálata
5
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai)
DC HÁLÓZAT Az illegális fájlcsere elvileg nem kellene, hogy helyi szinten szerveződjön. Sőt, a peer elv, és a hálózati hatás miatt az első gondolatunk az lenne, hogy néhány nagy, globális csomópont fogja ezeket a hálózatokat szervezni, hiszen minél több ember cserél információt ugyanazon a ponton keresztül, annál valószínűbb, hogy gyorsan, jó minőségben elérhető bármilyen tartalom. Ezzel szemben a tapasztalat az, hogy számos, regionális, esetleg nemzeti hub és tracker szolgálja ki a helyi közösségeket. Ennek a magyarázata a magyar nyelvi környezetben kézenfekvő: a lokális központokon keresztül érhetők el a lokalizált, lefordított, szinkronizált tartalmak. A magyar nyelvre lefordított külföldi tartalmakat forgalmazó lokális hubok léte és népszerűsége a magyar idegennyelv tudás szomorú állapotára is felhívja a figyelmet. A project során 10 napon keresztül (július 19-29.) figyeltük a három, magyar felhasználók között legnépszerűbb dc hubon a kereséseket. A meghekkelt dc kliens elmentett minden keresőkifejezést és a felhasználói IP-t, ami a hubra érkezett. Az IP-ket az interneten mindenki által elérhető eszközökkel lokalizáltuk, és ebből készítettük a Magyarország térképet, valamint a város és ország toplistákat. A keresési kifejezéseket összegeztük és a 100 leggyakoribb kifejezésből szófelhőt generáltunk.
DC hálózatokon keletkező igények
Keresési kifejezések a legnagyobb magyar dc hubokon 2007 júliusában.
Hazai p2p hálózatok vizsgálata
6
Kitchen Budapest Medialab (Bodó, Halácsy, Korsós, Prekopcsák, Szalai) A vizsgált DC hubokra érkező keresőkifejezések elemzése nyomán pontosan kirajzolódik a vizsgált időszak „kulturális buzz”-ja. Az eredmények legalább annyira előre jelezhetők, mint amennyire váratlanok. Látható, hogy azok a legkeresettebb tartalmak, amik egyébként is jelen vannak a hagyományos marketing és kommunikációs csatornákon. Az új Harry Potter vagy Die Hard film marketingje a feketepiaci keresletet is alapvetően meghatározza. Ezen túl azonban ott látjuk azokat a termékeket, amik a hagyományos mainstream médiumokban népszerűek (Rihanna, Nelly Furtado, Madonna) vagy még (esetleg már) ott sem (Hofi, Edda, Kárpátia). A top 100 keresőszóból készített szófelhő tehát egyszerre jelzi, hogy az underground és a mainstream hasonlóságát, és azt, hogy melyek azok a tartalmak, amik a mainstream médiában éppen nem aktuálisak, de stabil, hosszú távú rajongótáboruk van, mely folyamatos (még ha alacsony intenzitású) keresletet támaszt bizonyos javak iránt.
DC felhasználók földrajzi elhelyezkedése
Ezen a Magyarország térképen a kék pontok a DC keresések számát jelöli. A magyar felhasználók körében népszerű DC hubok felhasználóinak földrajzi elhelyezkedése szinte tökéletesen kirajzolja a magyar nyelvi közösség határait a Kárpát medencében. E térkép másik fontos tanulsága az, hogy a fájlcsere nem a budapesti kulturális elit játékszere, azaz nem feltétlenül csak a kulturálisan egyébként is jól ellátott fogyasztói réteg van jelen a feketepiacon. A kisvárosi, falusi felhasználók erős jelenléte arra enged következtetni, hogy az egyébként kurrens kulturális javakat forgalmazó hálózatok felhasználói között sokan vannak olyanok, akiket nem fed le a hagyományos és legális ellátórendszer: messze vannak a moziktól, kölcsönzőktől, zeneboltoktól.
Hazai p2p hálózatok vizsgálata
7