D I G I TA L I Z Á L J U N K
EGYÜTT!
TELJESKÖRŰ DIGITALIZÁLÁS A TERVEZÉSTŐL A KIADÁSIG Az Arcanum Adatbázis Kft. Magyarország vezető tartalomszolgáltatója. Munkatársaink tudása, elkötelezettsége, eszközeink mennyisége és minősége, valamint stabil pénzügyi helyzetünk biztosítja, hogy eredményesen és hatékonyan valósítsunk meg tömeges digitalizálási projekteket. Képesek vagyunk a legkülönfélébb dokumentumtípusokat digitalizálni, feldolgozni és akár az interneten vagy belső hálózaton, akár lemezes formában, DVD-n, Blu-ray lemezen közreadni. Készek vagyunk a projektek közös finanszírozására is.
Közgyűjtemények digitalizálása lépésről lépésre Mivel több, mint 10 éve foglalkozunk közgyűjteményi anyagok tömeges digitalizálásával, egyedülálló tapasztalatokra tettünk szert e területen. Ismerjük és értjük az igen különböző típusú dokumentumok sajátosságait és az intézmények speciális elvárásait. Folyamatos fejlesztéseink révén igyekszünk világszínvonalú szolgáltatásokkal kielégíteni az intézmények igényeit. A digitalizálás a gyűjtemény felmérésével kezdődik. Ennek során a gyűjteményvezetővel közösen kialakítjuk a koncepciót, meghatározzuk a feladatokat és az elérendő célt.
A digitális állományokat a kívánt formátumokban és adathordozókon átadjuk a megrendelőnek. Az anyagokat a legmegfelelőbb programmal ellátva adatbázisba építjük.
Mindig olyan megoldást ajánlunk, amely már a gyakorlatban is megvalósult, van róla tapasztalatunk, így elkerülhető a végeláthatatlan, költséges és bizonytalan kimenetelű fejlesztés.
Az elkészült adatbázisokat minden igényt kielégítő keresőprogrammal akár az interneten, akár lemezen publikáljuk a nagyközönség felé.
Nagyvolumenű munka esetén próbadigitalizálást végzünk a teljes anyagnak egy jelentős, jellegzetes részén, így a megbízóval együtt tesztelhetjük a választott módszert.
A publikálás kezdettől fogva nagy hangsúlyt kapott az Arcanumnál, így biztosítjuk, hogy a kiadványok értékesítési csatornáinkon a potenciális hazai érdeklődőkhöz eljussanak.
A digitalizálást igény esetén a helyszínen végezzük a feladathoz legjobban illeszkedő eszközökkel, akár a gyűjteménykezelő felügyelete alatt.
DigiegyuttProsiHun_2010_6A4.indd 1
2010.06.23. 16:10:42
Tömeges dokumentum-digitalizálás, publikálás A tömeges szövegdigitalizálás egy új technológia az ún. kétrétegű PDF alkalmazásával lehetséges. Ennek segítségével immár szinte korlátlan men�nyiségű dokumentumot tudunk publikálni. A világban egyre szélesebb körben terjedő technológia lényege, hogy az eredeti dokumentum (könyv, folyóirat, stb.) képként kerül digitalizálásra, azaz beszkenneljük, majd automatikus karakterfelismerő program (OCR) segítségével a képből szöveget állítunk elő. Az előállított dokumentum felső, látható rétegét a kép alkotja, az alsó, láthatatlan rétegét pedig a szöveg. A szöveg és a kép teljesen fedésben van egymással, a szavak, a betűk képe és alatta a szöveg milliméterre pontosan ugyanazon a helyen találhatók. A szöveg előállításának minősége még a régi (19. századi) dokumentumoknál is eléri a 98-99%-ot, jobb minőségű dokumentumoknál azt meg is haladja. Az így létrehozott állományok egyrészt alkalmasak a dokumentum hite Parlamenti Könyvtár: Parlamenti Napló és irományok 1918– 1990, 800.000 oldal. http://mpgy.ogyk.hu
les megjelenítésére, hiszen egy az egyben az eredeti dokumentum képét látjuk, másrészt lehetővé teszik a szöveges kezelést, keresést is. Ez utóbbi legfontosabb eleme a teljes szövegű keresőrendszer, amely lehetővé teszi, hogy tetszőleges szóra, kifejezésre kereshessünk. A másik fontos eleme, hogy lehetőségünk van a szöveg kiemelésére, azt szövegszerkesztőnkbe beilleszthetjük, átemelhetjük.
Partnereink és projektjeink
Magyar Digitális Múzeumi Könyvtár múzeumi honlap: 48 intézmény (megyei, országos és szakmúzeumok) kiadványai, mintegy 900.000 oldal.
Budapest Főváros Levéltára gondozásában a levéltárak közös honlapja: Levéltári kiadványok, levéltári adatbázisok (XML), georeferált történelmi térképek (1.000.000 oldal, 800.000 rekord).
http://muzeum.arcanum.hu/kiadvanyok
http://archivportal.arcanum.hu/mltk
Arcanum PDF keresőprogram A hatékony keresés érdekében kifejlesztettünk egy saját keresőprogramot, amely az ACROBAT program keresési funkcióinál lényegesen hatékonyabb, gyorsabb és megbízhatóbb keresést biztosít. Nagy előnye, hogy szemben az ACROBAT-tal, nemcsak lokálisan, hanem Interneten is működik, így lehetőségünk van az anyagunkat Interneten publikálni. Offline kiadványainkban a felhasználó választhat a két program között. A program tulajdonságai: Tetszőleges méretű (akár több millió oldalt tartalmazó) adatbázis kezelése Igen nagy sebességű keresés, akár többszázezer találat egyetlen másodperc alatt Csonkolás jobbról, balról, vagy akár a szó közepén
DigiegyuttProsiHun_2010_6A4.indd 2
Betekintés a kereshető szavak közé, így már a keresés előtt tájékozódhatunk a lehetséges kereső kifejezésekről, azok előfordulási gyakoriságáról, az esetlegesen hibásan felismert szavakról Logikai operátorok (AND, OR, NOT) mellett közelségi (pl. legyen két szó 2 szó távolságra) operátorok használata Találatok kivilágítása, mind a találati listában, mind az eredeti dokumentumban A könyvjelzők intelligens használata mind a keresésben, mind a megjelenítésben Az adatbázis publikálása egyaránt történhet interneten, vagy offline módon (DVD, Blu-ray).
2010.06.23. 16:10:44
Magyar Szabadalmi Hivatal PIPACS rendszere, amely a teljes magyar iparjogvédelmi rendszer bibliográfiai adatait tartalmazza a kezdetektől (1896). Elindult a teljes szabadalmi leírásanyag digitalizálása, jelenleg mintegy 500.000 oldal szabadalmi leírás férhető hozzá. http://pipacsweb.hpo.hu
Magyar Országos Levéltár: Mohács előtti oklevelek gyűjteménye, melyek a magyar történelem legfontosabb és legféltettebb kincsei (108.000 oklevél). Csaknem 500.000 képet publikáltunk az interneten, metaadatokkal http://mol.arcanum.hu/dldf
Térképes projektjeink Az elmúlt időszakban gyakorlatilag a teljes magyar történelmi térképállományt digitalizáltuk. A hatékony és színvonalas publikáláshoz egy saját fejlesztésű térinformatikai rendszert (Arcanum Map) használunk, amely kifejezetten a régi térképek által támasztott igényeket elégíti ki. A történelmi térképeket georeferáljuk, így alkalmasakká válnak arra, hogy más térinformatikai rendszerbe illesszük azokat. Így lehetővé válik, hogy térképeinket más történeti térképekkel, vagy akár mai térképekkel vessük össze. HM Hadtörténeti Intézet térképtára 1., 2., 3. katonai felmérés 20,000 darab Budapest Főváros Levéltára összes térképe 15,000 darab Országos Széchényi Könyvtár teljes kéziratos térképállománya 5,000 darab Magyar Országos Levéltár kéziratos térképgyűjteménye 20,000 darab A Magyar Országos Levéltár és a megyei levéltárak kataszteri térképei 80,000 darab
DigiegyuttProsiHun_2010_6A4.indd 3
Arcanum Map
A szoftver jellemzői: Igen nagy sebesség, akár több ezer szelvényt tartalmazó mozaikok gyors megjelenítése Georeferált történelmi térképek geokódokkal való megjelenítése Akár különböző vetületi rendszerű és méretű térképek szinkronizált megjelenítése A mozaik mellett az eredeti szelvény megjelenítése duplikálás nélkül, így megjeleníthetjük a térképi tartalmon kívüli, fontos információt hordozó részeket is Régi és mai vetületi rendszerek közötti konvertálás Pozicionálás tetszőleges (földrajzi, vetületi, régi, mai) kordináta alapján Konvertálás más formátumokba (GeoTIFF, JPEG2000), akár más vetületekbe
2010.06.23. 16:10:47
ESZKÖZEINK: ROBOTSZKENNER Az RBS Pro TT robotszkenner legfontosabb jellemzői
garantálja a biztos oldal elkülönítést és a teljesen automatikus lapozást A könyvek komplett feldolgozása: egyedülálló lehetőség a borítók, a belívek, a kötésből esetlegesen kiszakadt lapok, a kihajtott oldalak egyetlen munkamenetben való digitalizálására Kimeneti fájlformátumok: JPEG, JPEG2000, TIFF,
TIFF G4, GIF, PDF, PDF layered OCR, XML, RAW Könyvszkennelő robot a nagytömegű minőségi digitalizáláshoz 2 az 1-ben eszköz: teljesen automata mód (2000 oldal/ óra teljesítmény); manuális, félautomata mód (900 oldal/óra)
QiSoft programcsomag: képfeldolgozás, minőség ellenőrzés, formátum-konverzió, munkafolyamat irányítás, OCR, metaadatok 2 csúcskategóriás PC fogadja és dolgozza fel a kamerák adatait
Szabadalmaztatott lapozó megoldás: bionikus ujj Gyökeresen új könyvtartó rendszer Mindössze 80°-os nyílásszög Csúcs képminőség, 300-400 dpi felbontás Színfokozatok: 24-bites színes, 8-bites szürke, 1-bites ff Megvilágítás: hideg fényű LED rendszer, (60.000 óra MBF) Feldolgozható könyv méretek: minimum 8 x 12 x 0,05 cm, maximum 25 x 37 x 10 cm Papír minőség: 40-300 g/m2 Biztonság és megbízhatóság: az integrált duplalapozás ellenőrzés
Asztali kivitel: kompakt, hordozható, gazdaságos Méretek: 70 cm x 100 cm x 120 cm Súly: 65 kg Támogatott kamerák:: CANON EOS DSLR ( 24bit színes / 8bit szürke / 1bit ff) EOS 500D (15.1 mpix = 300 dpi); EOS 5D Mark II (21.1 mpix = 400 dpi)
Arcanum Adatbázis Kft. 1115 Budapest, Fejér Lipót utca 12. (A Tétényi úti, Szent Imre Kórház mögött, bejárat a Halmi utca felől) Telefon/fax: 481–0900 • E-mail:
[email protected] • Internet: www.arcanum.hu
DigiegyuttProsiHun_2010_6A4.indd 4
2010.06.23. 16:10:48
ESZKÖZEINK
KÖN Y V SZ K E N N E R E K
A könyvszkennereket nagyméretű és különösen védett dokumentumok nagytömegű, kiváló minőségű digitalizálásához használjuk, úgymint oklevelek; régi, értékes könyvek; metszetek; aprónyomtatványok (kivéve térképek). A dokumentum szkennelése mechanikai behatás nélkül történik, egyedülállóan kíméletes, UV-mentes, nagyfrekvenciás hidegfényű lámpákkal, ami a gyors szkennelésnek köszönhetően csupán néhány másodpercig világítja meg a felületet. A szkennerek precízen állítható könyvbölcsői lehetővé teszik a vastag, nagyon rossz állapotban lévő könyvek sérülésmentes digitalizálását is.
• BookEye 3 A1 color
DOKUMENTUM SZKENNEREK
Rendkívül gyors és igen kíméletes eszközök, elsősorban nagytömegű, lapokra szedett szöveges dokumentumok digitalizálásához. Szinte korlátlan (60,000 kétoldalas lap/nap) kapacitásuknál fogva, alkalmasak eddig beláthatatlan méretű könyvsorozatok, folyóira tok, sőt napilapok feldolgozására! Az általunk kifejlesztett program segítségével az így digitalizált dokumentumok korlátlan méretben kerülhetnek kereshető módon publikálásra Interneten, vagy offline módon.
• Canon imageFORMULA DR-X10C • Canon imageFORMULA DR-9080C Maximális felbontás 600 DPI Maximális méret A3 (1m)
• Zeutschel OMNISCAN 12000
Kétoldalas szines szkennelés Ultrahangos lapleválogatás Öntisztító funkció a folyamatos működésért Üres lap kiválogatás Szkennelés sebessége: színes 100 lap/perc (X10C 128 lap/ perc!); szürke, vagy fekete-fehér 128 lap/perc Kapacitás: 60,000 oldal/nap Rendkívül kíméletes szkenneléséhez is!
A1 (60×80 cm) és A2-es méret
görgő
mechanika,
akár
fotók
36 -bites színmélység, felbontás 100-600 DPI A szkennelés ideje: 1 mp szürke, 4 mp színes Könyvtartó: 100 mm-es könyvgerinc vastagságig A megvilágítás UV mentes, LED-es fényforrással A felhasználót zavaró fényhatás nincs Automatikus oldal szétválasztás Oldalhajlások automatikus kiegyenlítése A dokumentumot csak a szkennelés idealatt éri megvilágítás
DigiegyuttProsiHun_2010_6A4.indd 5
je
2010.06.23. 16:10:52
ESZKÖZEINK
TÉ R K É P SZ K E N N E R E K
A térképszkennereket nagyméretű térképek, tervrajzok, plakátok nagytömegű, kiváló minőségű digitalizálásához használjuk. Egyedülálló képminőségüknek köszönhetően a nagyon apró méretű szövegeket is élesen jelenítik meg. Kíméletes, precíziós görgő-mechanizmus segítségével még a pausz vékonyságú dokumentumokat is sérülésmentesen szkennelik be. A térképszkennerek megvilágítási technikája úgy lett kialakítva, hogy a dokumentumokat nem éri káros folyamatokat elindító fényhatás, és a megvilágítás is rendkívül rövid ideig tart, a gyors képalkotó szenzoroknak köszönhetően.
VIDAR SELECT P42 PLUS SCANNER Maximális felbontás 600 DPI Maximális dokumentum szélesség: 106 cm Maximális hosszúság: korlátlan Állítható dokumentumvastagság Színmélység: 42 bit/24 bit 3db egyenként 4 színcsatornás CCD (22,5 megapixel) Precíz színkalibrálás, tökéletes színhűség, torzítás- és zajmentes kép Megvilágítás: nagyfrekvenciás hideg fénycső Számítógép által folyamatosan kontrollált kíméletes görgő mechanizmus 400 megabit/sec adatátviteli sebesség
Arcanum Adatbázis Kft. 1115 Budapest, Fejér Lipót utca 12. (A Tétényi úti, Szent Imre Kórház mögött, bejárat a Halmi utca felől) • Tel./fax: 481–0900 • E-mail:
[email protected] • Internet: www.arcanum.hu
DigiegyuttProsiHun_2010_6A4.indd 6
2010.06.23. 16:10:57