MTA SZTAKI
KOPI
K+f projektek
Department of Distributed Systems
World WideDSD Web Government Portals
SZTAKI Szótár
Infrawebs MTA SZTAKI DSD Department of Distributed Systems
KOPI
Brein E-VOTING E-ADMINISTRATION
KOPI Plágiumkeresés
Web4Groups Workflow Dr. Pataki Máté
Digitális Könyvtárak
GeneSyS StreamOnTheFly
EUTIST-AMI Abilities
Promóció
CORES
HEKTÁR
AQUA DELOS NoE 1
DELOS ORG
DELOS NoE 2
Forum Collaborative Filtering Select Rating
Csoportmunka 3
MTA SZTAKI
Department of Distributed Systems
n n n n n
n
MTA SZTAKI DSD
MTA SZTAKI
Department of Distributed Systems
MTA SZTAKI Elosztott Rendszerek Osztály DSD 1995. óta létezik 13 teljes állású munkatárs, és diákok Kutatás, fejlesztés, (online) szolgáltatások Munkák eloszlása: n 80% EU-s k+f pályázatok n 15% Hazai pályázatok n 5% Belső projektek és szolgáltatások Három fő terület: n Digitális könyvtárak és archívumok n Csoportmunkát támogató technológiák n Webes rendszerek
n
2
Probléma
A plágium DSD probléma a n Felsőoktatás területén n Középiskolában is egyre inkább n Tudományos életben n Digitális könyvtárak számára n Könyvkiadóknak n Cégek esetében is (pl. honlapok tartalma) n Wikipedia
4
MTA SZTAKI
MTA SZTAKI
Department of Distributed Systems
n
Probléma
Department of Distributed Systems
Miért probléma DSD a plágium?
n n n
Probléma
Túl sok diploma, DSD cikk, dokumentum, internetes oldal, senki se ismerheti mindnek a tartalmát Nem elég érezni, hogy az adott mű plágium, be is kell bizonyítani Védekezés n Másolás megakadályozása,másolásvédelem n Másolás felderítése, plágiumkeresés
Dr. Zoe D. Katze, Ph.D., C.Ht. Forrás: http://studio5.ksl.com/index.php?sid=14220824&nid=127
7
5
MTA SZTAKI
Department of Distributed Systems
n
Probléma
MTA SZTAKI
Department of Distributed Systems
Miért probléma DSD a plágium? n Diplomák, szakdolgozatok értéke n Mennyit ér egy diploma? n Intézmények hírneve n Személyek hírneve, karrierje n Anyagi kár
n
n
6
Másolásvédelem
Előnyei DSD n Megnehezíti, és körülményessé teszi a másolást n A mű útja és felhasználása is nyomon követő (DRM) n Nagyobb bevétel a szerzőknek és eladóknak Hátrányai n Megnehezíti a legális felhasználást is n Nem nyújt teljes védelmet n Esetenként a legális felhasználáshoz is meg kell kerülni n Nem minden esetben legális a használata (szoftver) n Személyiségi jogokat sérthet (DRM) n Gátolja a műnek, illetve ismertségének a terjedését n Keresőrendszerek se férnek hozzá 8
MTA SZTAKI
Department of Distributed Systems
n n
n n n
Másolásvédelem Szöveges dokumentumok esetében
MTA SZTAKI
Department of Distributed Systems
PDF, DOC… védelem DSD n Egyszerűen és automatizálva megkerülhető Csak online, speciális felületen érhető el n Erősen szűkíti a felhasználást n Nehezebben, de megkerülhető Nem szabványos formátum használata n Csökkenti a felhasználók számát (ebook olvasó) Hozzáférés korlátozása n Ha egyszer kikerült a rendszerből már semmi se védi Semmi se véd legépelés, fényképezés + karakterfelismerés ellen n Esetleg a fiókba való bezárás
KOPI Plágiumkereső DSD
9
11
MTA SZTAKI
Department of Distributed Systems
Plágiumkereső rendszerek
n
Vízjel vagy ellenőrzőösszeg (PDF) DSD Írás stílusa alapján azonosítja a szerzőt (authorship attribution, JGAAP) Nyílt keresőszolgáltatások (pl. google) Szöveges összehasonlítás (MS Word) Tesztet generál a dolgozatból (Glatt) Ismeretlen működésű keresők
n
Szövegdarabolással működő rendszerek (KOPI)
n n n n n
MTA SZTAKI
Department of Distributed Systems
n
10
KOPI Védelem
A KOPI Rendszerbe feltöltött dokumentumok DSD n A plagizálás gyorsan kiderül n A forrás(oka)t is megjelöli n Kisebb – akár egy-két mondatnyi – rész egyezőségét is kijelzi n Megkerülése nehézkes és nem automatizálható n A lebukás kockázata jelentősen megnő n Másolásvédelemmel együtt is használható
12
MTA SZTAKI
Department of Distributed Systems
n
n
KOPI Védelem
MTA SZTAKI
Department of Distributed Systems
A mű szabadon DSDterjeszthető n Nem kell másolásvédelemmel foglalkozni n A keresőrendszerek is hozzáférnek (google) n Több ember olvashatja n Több ember fog rá hivatkozni Jelenlegi rendszer hátrányai n egy egységes rendszert érdemes használnia mindenkinek n fel kell tölteni a védeni kívánt dokumentumokat a rendszerbe, vagy elérhetővé kell tenni
SZTAKI KOPI Felülete DSD
13
15
MTA SZTAKI
Department of Distributed Systems
SZTAKI KOPI Felülete
MTA SZTAKI
Department of Distributed Systems
DSD
SZTAKI KOPI Felülete DSD
14
16
MTA SZTAKI
Department of Distributed Systems
SZTAKI KOPI Felülete
MTA SZTAKI
Department of Distributed Systems
DSD
SZTAKI KOPI Felülete DSD
17
19
MTA SZTAKI
Department of Distributed Systems
SZTAKI KOPI Felülete
MTA SZTAKI
Department of Distributed Systems
DSD
Hasonlóság és plágiumkereső DSD
18
20
MTA SZTAKI
MTA SZTAKI
Department of Distributed Systems
Mekkora hasonlóságot várunk el?
Department of Distributed Systems
n
DSD
n
0% nincs idézet
100% n
à
plágium n
Amit ma nem találunk…
2003: állami támogatással elkezdődött a DSD KOPI Portál fejlesztése (MTA SZTAKI Elosztott Rendszerek Osztály ITEM pályázat: IHM-OM) 2004: elindult a publikus plágiumkereső szolgáltatás magyar és angol nyelven 2006: számos tanár elkezdi használni a szolgáltatást, több mint 1000 felhasználó 2007: fejlesztések az első három év tapasztalatai alapján 23
21
MTA SZTAKI
Department of Distributed Systems
n
n n n
Amit ma nem találunk…
1. század: plagiarius (lat.) DSD n emberrabló, gyermekrabló n kézi összehasonlítás 90-es évek: dokumentumpárok összehasonlítása 2000- : dokumentum összehasonlítása adatbázissal 2001: elkezdődtek az alapkutatások, hogy miként lehetne egy nyelvfüggetlen, magyar nyelven is jól működő egynyelvű plágiumkeresőt elkészíteni (BME)
MTA SZTAKI
Department of Distributed Systems
n
n
n
n 22
Amit ma nem találunk…
2009: felhasználóink száma már több mint DSD 10 000, egyes egyetemi karok használják már a KOPI Plágiumkeresőt rendszeresen 2010: új kutatásba kezdtünk, hogy miként lehetne fordítási plágiumokat felismerni és megtalálni 2011: a világon elsőként beépítettük a KOPI Plágiumkeresőbe fordítási plágiumok megtalálására képes algoritmust, amely a teljes angol Wikipédiában keres 2012: nagy érdeklődés 24
MTA SZTAKI
MTA SZTAKI
Department of Distributed Systems
n n n n
Amit ma nem találunk…
Department of Distributed Systems
beágyazott képek DSD belső plágiumkeresés szerző azonosítása gondolatolvasás?
DSD
Köszönöm a figyelmüket!
Web: http://dsd.sztaki.hu Email:
[email protected]
…azt holnap megtalálhatjuk 25
MTA SZTAKI
Department of Distributed Systems
KOPI Portal DSD
http://kopi.sztaki.hu
26
27