ReadirisTM Corporate 12 Felhasználói útmutató
ReadirisTM Corporate 12 – Felhasználói útmutató
Tartalomjegyzék Szerzői jogok ...................................................................................... 5
1. fejezet A Readiris bemutatása .............................................. 7 Spóroljon az idejével, ne gépelje be újra........................... 7 A Readiris sorozat ........................................................... 10 2. fejezet A Readiris telepítése ................................................ 15 Rendszerkövetelmények ................................................. 15 Szoftvertelepítés.............................................................. 16 A szoftver eltávolítása..................................................... 17 A szoftver regisztrálása ................................................... 18 Terméktámogatás ............................................................ 18 3. fejezet Kezdő lépések .......................................................... 21 A Readiris elindítása ....................................................... 21 Az OCR varázsló használata ........................................... 21 Felhasználói felület ......................................................... 23 A felhasználói felület nyelvének módosítása .................. 26 4. fejezet Readiris SmartTask funkciók ................................ 27 A Readiris SmartTask funkciók használata..................... 27 5. fejezet Dokumentumok beolvasása .................................... 33 A dokumentumtípus kiválasztása .................................... 33 A beállítások megadása................................................... 34 1
Tartalomjegyzék
Képfájlok megnyitása ..................................................... 35 Nyomtatott dokumentumok beolvasása .......................... 37 6. fejezet Beolvasott dokumentumok igazítása ..................... 43 7. fejezet Dokumentumok mentése képfájlként .................... 49 8. fejezet Dokumentumok ablakozása ................................... 51 Dokumentumok automatikus ablakozása ........................ 51 Dokumentumok kézi ablakozása..................................... 53 Ablakozási sablonok használata ...................................... 58 9. fejezet Felhasználói index készítése.................................... 61 10. fejezet Dokumentumok felismerése ................................. 63 Bevezetés ........................................................................ 63 A dokumentum nyelvének kiválasztása .......................... 64 Felhasználói lexikonok használata .................................. 67 A dokumentum jellemzőinek megadása.......................... 70 Az interaktív tanulás használata ...................................... 71 Betűkészlet szótárak használata ...................................... 74 11. fejezet Dokumentumok formázása és mentése ................ 77 Dokumentumok formázása ............................................. 77 Szöveges dokumentumok formázása .............................. 79 Táblázatos dokumentumok formázása ............................ 83 PDF dokumentumok létrehozása .................................... 87 2
ReadirisTM Corporate 12 – Felhasználói útmutató
A PDF beállítások megadása .......................................... 88 PDF dokumentumok iHQC tömörítése ........................... 89 PDF dokumentumok jelszavas védelme ......................... 91 PDF dokumentumok digitális aláírása ............................ 92 PDF dokumentumok átalakítása ..................................... 93 XPS dokumentumok létrehozása .................................... 94 Az XPS beállítások megadása......................................... 96 XPS dokumentumok iHQC tömörítése ........................... 96 A grafikus beállítások megadása ..................................... 97 12. fejezet Beállítások mentése és betöltése ......................... 101 13. fejezet Többoldalas dokumentumok felismerése .......... 103 Egyszerre több képfájl megnyitása és felismerése ........ 103 Többoldalas dokumentumok beolvasása és felismerése 105 Többoldalas dokumentumok szerkesztése .................... 106 14. fejezet Beolvasott képek felismerése nagy tételben ....... 109 Kötegelt OCR indítása .................................................. 109 Figyelt mappa beállítása ............................................... 111 15. fejezet Dokumentumkötegek szétválasztása és indexelése 113 Dokumentumkötegek szétválasztása ............................. 113 Dokumentumkötegek indexelése .................................. 116 3
Tartalomjegyzék
16. fejezet Nyomtatott kézírásos szöveg felismerése ........... 119 Nyomtatott kézírás szabályok ....................................... 120 17. fejezet Vonalkódok felismerése ...................................... 123 A vonalkódolvasás bemutatása ..................................... 123 18. fejezet Névjegykártyák felismerése ................................ 127 A névjegykártya-olvasás bemutatása ............................ 127 Tárgymutató ........................................................................... 131
4
ReadirisTM Corporate 12 – Felhasználói útmutató
Szerzői jogok ReadirisCorporate12-dgi-090212-01
Copyrights © 1987-2009 I.R.I.S. Minden jog fenntartva. A Readiris szoftver, az online súgórendszer és a dokumentáció szerzői jogainak birtokosa az I.R.I.S. cég. Az ebben a dokumentumban lévő információk az I.R.I.S. cég tulajdonát képezik. Tartalma bármikor, értesítés nélkül megváltozhat, és nem jelent kötelezettséget az I.R.I.S. cégre nézve. A dokumentumban leírt szoftver használatának feltételeit licencszerződés szabályozza. A szoftver csak annak a szerződésnek a feltételei szerint használható vagy másolható. A dokumentáció vagy annak része nem reprodukálható, nem továbbítható, nem tárolható adatbázisban, és nem fordítható más nyelvre az I.R.I.S. cég előzetes írásbeli hozzájárulása nélkül. A felhasználói útmutató kitalált neveket tartalmaz demonstrációs célokkal. A valós személyekkel, vállalatokkal vagy szervezetekkel történő esetleges egybeesés kizárólag a véletlen műve.
Védjegyek A Readiris logó, a Readiris és az IRISCard az Image Recognition Integrated Systems S.A. védjegye. OCR, ICR és vonalkód-technológia: I.R.I.S. AutoFormat és nyelvi technológia: I.R.I.S. BCR és mezőelemző technológia: I.R.I.S. iHQC tömörítési technológia: I.R.I.S. Az XML szintaktikus elemző az Apache fejlesztése. A termék tartalmaz az Apache Software Foundation által fejlesztett szoftvert. A felhasználói útmutatóban szereplő minden egyéb termék a megfelelő tulajdonosok védjegye vagy bejegyzett védjegye.
5
ReadirisTM Corporate 12 – Felhasználói útmutató
1. FEJEZET A READIRIS BEMUTATÁSA SPÓROLJON AZ IDEJÉVEL, NE GÉPELJE BE ÚJRA Gratulálunk Readiris programjához! Ez a szoftvercsomag kétségtelenül nagy segítségére lesz a következők felismerésében: szövegek, táblázatok, grafikák, vonalkódok és nyomtatott kézírásos szövegek. Először be kell vinni a számítógépekbe az információkat, mégpedig a lehető leghatékonyabban. Ha valaki már gépelt be papírról egy 15 oldalas jelentést vagy egy számokkal teleírt, nagy táblázatot, az tudja, hogy ez milyen unalmas és időrabló tud lenni. Ez a csúcsminőségű OCR szoftvercsomag képes a nyomtatott dokumentumok vagy a beolvasott képek automatikus konvertálására kereshető szöveges, szerkeszthető dokumentumokká, melyeket azután lehet archiválni vagy közzétenni. A programnak két felismerési módja van: az egyik a maximális sebességet, a másik a lehető legjobb karakterfelismerési pontosságot biztosítja. Olvasson be egy nyomtatott vagy gépelt dokumentumot, adja meg, hogy a Readiris milyen zónákban keresse a felismerendő információkat – vagy hagyja, hogy ezt a program magától érzékelje, – indítsa el a karakterfelismerést, majd a kész dokumentumot exportálja a szövegszerkesztő programnak. A többoldalas dokumentumok teljes egészükben feldolgozhatók egyetlen menetben. Néhány egérkattintással hosszú órák munkáját lehet megtakarítani azáltal, hogy a Readiris a nyomtatott dokumentumokat szerkeszthető számítógépes fájlokká alakítja: akár 40-szer olyan gyors lehet, mint a kézi begépelés. 7
1. fejezet - A Readiris bemutatása
A varázsló végigvezeti a Readiris használatához szükséges beállítások megadásának folyamatán, így gyorsan és könnyen használatba veheti a programot. A SmartTask funkciókkal az eljárás még jobban felgyorsítható. A beolvasás eredménye továbbküldhető közvetlenül szövegszerkesztőnek, táblázatkezelőnek, archiválható PDF vagy XPS fájlként stb. Faxok felismeréséhez és PDF dokumentumokká alakításához a Windows Intézőből át is húzhatja a képfájlokat a Readiris program ablakába.A képeket a helyi menü parancsával is elküldheti a Readiris programnak. A Readiris a táblázatos formába rendezett adatokat is felismeri, és táblázatkezelő programmal megnyitható munkalappá vagy szövegszerkesztővel megjeleníthető táblázat objektummá alakítja, így a numerikus adatokkal közvetlenül lehet tovább dolgozni. A Readiris a legfejlettebb felismerési technológiákat alkalmazza. A betűkészlettől független szövegfelismerést automatikus tanulási technológia egészíti ki. A szoftver a kontextuális és nyelvi elemzésnek köszönhetően képes új karakterek és szavak megtanulására. Ez azt jelenti, hogy idővel a karakterfelismerés pontossága egyre jobb lesz. A Readiris akár 128 nyelvet is támogat: támogat minden amerikai és európai nyelvet, beleértve a közép-európai, a balti és a cirill betűs nyelveket, továbbá a görögöt és a törököt. Opcionálisan a Readiris képes arab, fárszi és héber dokumentumok, illetve négy ázsiai nyelven (japán, egyszerűsített kínai, hagyományos kínai és koreai) írt dokumentumok beolvasására. A Readiris kevert ábécét használó szövegekkel is boldogul. A szoftver érzékeli a görög, cirill betűs, arab, héber és ázsiai nyelvű dokumentumokban megbújó nyugati jelekkel írt „nyugati” szavakat – ezek általában lefordíthatatlan tulajdonnevek, márkanevek stb. A Readiris nyelvi technológiát alkalmaz a felismerés alatt (nem utána). Ennek eredményeképpen a Readiris kiemelkedően pontosan ismeri fel a szöveget mindenféle dokumentumban, még gyenge minőségű dokumentumokban, faxokban és pontmátrix nyomtatású dokumentumokban is. Gyönyörűen megbirkózik a rosszul 8
ReadirisTM Corporate 12 – Felhasználói útmutató
beolvasott vagy másolt, túl világos vagy sötét karaktereket tartalmazó dokumentumokkal is. Az összefolyt karaktereket a program szétválasztja, a hiányos karaktereket – például a pontmátrix nyomtatású jeleket – helyreállítja. A Readiris rendelkezik továbbá egy (opcionális) felhasználó általi ellenőrzés funkcióval. Ha a felhasználó általi ellenőrzés funkció engedélyezve van, ("interaktív tanulás") akkor a felismerő rendszer nemcsak megjelöli a bizonytalan karaktereket, hanem lehetővé teszi a rendszer pontosságának növelését is. A jóváhagyott megoldásokat a szoftver memorizálja, ami növeli a rendszer sebességét és megbízhatóságát, és idővel a rendszer egyre intelligensebbé válik. Ez a hatásos önfejlesztő eszköz lehetővé teszi, hogy megtanítsa a Readiris szoftvert különleges karakterekre is, például matematikai szimbólumokra, grafikai elemekre, illetve torz karakterek kezelésére. A termelékenységet tovább növeli, hogy a Readiris nemcsak felismeri a szöveget, hanem formázni is tudja. A formázás különféle szinteken lehetséges. Automatikusan formázásnál a Readiris mintegy másolatot készít a beolvasott dokumentumról: megtartja az eredeti dokumentum szavainak, a bekezdéseinek és oldalainak formázását. Hasonló betűtípust használ, a forrásdokumentum betűmérete és a betűformázása is végig megmarad. Az oszlopok, szövegblokkok és grafikák elhelyezése megfelel az eredeti dokumentuménak. A Readiris a beolvasott oldalt háttérfényképként is el tudja menteni a felismert dokumentumba. Mivel a Readiris programmal erőfeszítés nélkül olvashat be szürkeárnyalatos és színes anyagokat, bármilyen grafika karaktereit fel lehet vele ismerni, legyen az vonalas grafika, fekete-fehér fénykép vagy színes illusztráció. Ha a dokumentum táblázatot tartalmaz, a Readiris az eredetinek megfelelő cellákba rendezi az adatait, és még a cellaszegélyeket is az eredetinek megfelelően formázza. Más szavakkal a Readiris lehetővé teszi, hogy a dokumentumokról egy valódi másolatot készítsen, amely egy szerkeszthető, tömör szövegfájl, nem csak egy beolvasott kép. 9
1. fejezet - A Readiris bemutatása
A beolvasott oldalakon lévő vonalkódokat is fel tudja ismerni, és ugyanez érvényes a nyomtatott kézírásos szövegre, ha az egymástól kellő távolságra lévő nyomtatott nagybetűkből áll. A Readiris program még a névjegykártyák szövegét is felismeri: a névjegykártyák beolvashatók, tartalmuk felismerhető, majd címadatbázisba konvertálható. A program a névjegykártyák adatait a képből automatikusan kinyeri, majd a felismerés eredményét a megfelelő adatbázismezőkbe helyezi. A Readiris széles körű ismeretadatbázisa révén meg tudja különböztetni egymástól a keresztneveket és a vezetékneveket, a városok és megyék nevét, a telefon- és faxszámokat stb. Az eredményül kapott adatokat tovább lehet küldeni közvetlenül egy névjegyalbum-kezelő programnak, például a Microsoft Outlook (Express) programnak vagy egy vCard-kompatibilis alkalmazásnak. A Readiris Twain-kompatibilis, és támogat szinte minden síkágyas és lapbehúzós szkennert, multifunkciós készüléket (MFP – Multifunctional Peripheral) és digitális fényképezőgépet. Az intervallumos beolvasás funkció lehetővé teszi, hogy dokumentumadagoló nélküli szkennerrel is hatékonyan olvasson be többoldalas dokumentumokat. A Readiris a nagysebességű szkennereket is támogatja, és a kötegelt OCR funkcióval egyszerre sok képen is tud karakterfelismerést végezni: üres oldalakkal elválaszthatók egymástól külön dokumentumokká a beolvasott kötegek, az automatikus vonalkódolvasás pedig biztosítja a felismert dokumentumok megfelelő indexelését.
A READIRIS SOROZAT Az alábbi táblázat áttekintést ad az egyes verziókról: 10
ReadirisTM Corporate 12 – Felhasználói útmutató
Readiris Home 12 Korlátozott funkciók 25 nyelv felismerése Támogatott képek: PDF, DCX, DJV, DJVU, JPG, JPEG, J2C, J2K, JP2, PNG, TIF, TIFF, BMP, PCX Kimenet: PDF kép-szöveg, DOCX, ODT, WordML, SpreadsheetML. RTF, HTM, XML, TXT, TIFF kimenet
Readiris Pro 12
Readiris Corporate 12
Alapfunkciók
Alapfunkciók
128 nyelv felismerése
128 nyelv felismerése
Támogatott képek: PDF, DCX, DJV,
Támogatott képek: PDF, DCX, DJV,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
TIF, TIFF, BMP, PCX
TIF, TIFF, BMP, PCX
Kimenet: négyféle PDF fájl, PDF-iHQC
Kimenet: négyféle PDF fájl, PDF-iHQC
(level I), négyféle XPS fájl, XPS-iHQC
(level I-III), PDF/A, négyféle XPS fájl,
(level I), DOCX, ODT, XLS, WordML,
XPS-iHQC (level I), DOCX, ODT, XLS,
SpreadsheetML, RTF, HTM, XML, TXT,
WordML, SpreadsheetML, RTF, HTM,
TIFF stb.
XML, TXT, TIFF stb. Felismerés nagy tételben Automatizált feldolgozás Dokumentumindexelés Névjegykártya-felismerés
11
1. fejezet - A Readiris bemutatása
Readiris Pro 12 Asian
Readiris Corporate 12 Asian
Alapfunkciók
Alapfunkciók
128 nyelv felismerése
128 nyelv felismerése
Támogatott képek: PDF, DCX, DJV,
Támogatott képek: PDF, DCX, DJV,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
TIF, TIFF, BMP, PCX
TIF, TIFF, BMP, PCX
Kimenet: négyféle PDF fájl, PDF-iHQC
Kimenet: négyféle PDF fájl, PDF-iHQC
(level I), négyféle XPS fájl, XPS-iHQC
(level I-III), PDF/A, négyféle XPS fájl,
(level I), DOCX, ODT, XLS, WordML,
XPS-iHQC (level I), DOCX, ODT, XLS,
SpreadsheetML, RTF, HTM, XML, TXT,
WordML, SpreadsheetML, RTF, HTM,
TIFF stb.
XML, TXT, TIFF stb.
Hagyományos és egyszerűsített kínai
Hagyományos és egyszerűsített kínai
felismerése
felismerése
Japán felismerés
Japán felismerés
Koreai felismerés
Koreai felismerés Felismerés nagy tételben Automatizált feldolgozás Dokumentumindexelés Névjegykártya-felismerés
Readiris Pro 12 Middle-East*
Readiris Corporate 12 Middle-East*
Alapfunkciók
Alapfunkciók
128 nyelv felismerése
128 nyelv felismerése
Támogatott képek: PDF, DCX, DJV,
Támogatott képek: PDF, DCX, DJV,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
DJVU, JPG, JPEG, J2C, J2K, JP2, PNG,
TIF, TIFF, BMP, PCX
TIF, TIFF, BMP, PCX
Kimenet: négyféle PDF fájl, PDF-iHQC
Kimenet: négyféle PDF fájl, PDF-iHQC
12
ReadirisTM Corporate 12 – Felhasználói útmutató
(level I), négyféle XPS fájl, XPS-iHQC
(level I-III), PDF/A, négyféle XPS fájl,
(level I), DOCX, ODT, XLS, WordML,
XPS-iHQC (level I), DOCX, ODT, XLS,
SpreadsheetML, RTF, HTM, XML, TXT,
WordML, SpreadsheetML, RTF, HTM,
TIFF stb.
XML, TXT, TIFF stb.
Arab és fárszi felismerés
Arab és fárszi felismerés
Héber felismerés
Héber felismerés Felismerés nagy tételben Automatizált feldolgozás Dokumentumindexelés Névjegykártya-felismerés
(*) Nincs Mac verzió belőle.
13
ReadirisTM Corporate 12 – Felhasználói útmutató
2. FEJEZET A READIRIS TELEPÍTÉSE RENDSZERKÖVETELMÉNYEK A Readiris használatához szükséges minimális rendszerkonfiguráció a következő: 486-os alapú Intel számítógép vagy ezzel kompatibilis. Pentium alapú számítógép ajánlott. 256 MB RAM. 120 MB szabad lemezterület. (105 MB lemezterület elég, ha a mintafájlokat nem telepíti.)
Windows Vista, Windows XP vagy Windows 2000 operációs rendszer. Megjegyzés: A Readiris Corporate minimum 1024 x 768 képpontos képernyőfelbontásra van optimalizálva. Megjegyzés: előfordulhat, hogy néhány szkennerillesztő-program nem működik a legfrissebb Windows verziókkal. A támogatott platformokat megtalálja a szkenner dokumentációjában.
15
2. fejezet - A Readiris telepítése
SZOFTVERTELEPÍTÉS A Readiris telepítése: A szoftver telepítéséhez jelentkezzen be a Windows rendszerbe rendszergazdaként vagy rendszergazdai jogokkal rendelkező felhasználóként. Csatlakoztassa a szkennert a számítógéphez, és telepítse a kapott szoftvert. Próbálja ki a szkennert. Ha valamilyen problémát tapasztal, forduljon a szkenner gyártójához. Helyezze be a Readiris CD-ROM-ot a CD-ROM-meghajtóba, és a képernyőn megjelenő utasításokat követve telepítse a szoftvert. A telepítés elindításához kattintson a Readiris lehetőségre (felajánlott egyéb szoftvertermékek: Copernic Desktop Search Home Edition és Cardiris 4 LE). Válassza ki a telepítés nyelvét, és kattintson az OK gombra. Fogadja el a licencszerződés feltételeit. Választhat a teljes és az egyéni telepítési csomag között. Adja meg a szükséges beállításokat, és ha kész, a Tovább gombra kattintva mindig lépjen a következő képernyőre. Alapértelmezés szerint az összes lexikon és mintakép telepítve lesz, továbbá az elektronikus felhasználói útmutató és egy online súgó. A telepítés befejezéséhez kattintson a Befejezés gombra. A telepítőprogram automatikusan létrehozza az I.R.I.S. Applications - Readiris almenüt a Windows Programok menüjében.
16
ReadirisTM Corporate 12 – Felhasználói útmutató
A telepítőprogram a Windows asztalon is létrehoz egy parancsikont a Readiris alkalmazáshoz.
Ismételje meg a telepítést, ha a CD-ről egyéb szoftvereket is telepíteni akar.
A SZOFTVER ELTÁVOLÍTÁSA A Readiris megfelelő eltávolítása egyetlen módon lehetséges: a Windows programtelepítő/-eltávolító varázslójával. Nyomatékosan ajánljuk, hogy ne próbálja meg a Readiris programot vagy bármelyik szoftvermodulját kézzel eltávolítani (a fájlok törlésével). A Readiris eltávolítása: Zárja be az alkalmazást. Kattintson a Start menü Vezérlőpult parancsára. A Programok mappában kattintson a Program eltávolítása lehetőségre. A listában jelölje ki a Readiris elemet, és kattintson az Eltávolítás gombra. Kövesse a képernyőn megjelenő utasításokat.
17
2. fejezet - A Readiris telepítése
A SZOFTVER REGISZTRÁLÁSA A Readiris Corporate használatához regisztrálni kell. Cserében a következő kedvezményekben részesül: tájékoztatást kap a termékfejlesztésekről, illetve a kapcsolódó I.R.I.S. termékekről; jogosulttá válik ingyenes terméktámogatásra; I.R.I.S. termékekkel kapcsolatos különleges ajánlatokra is jogosult lesz. A regisztráció módja: Használja a Regisztráció menü Regisztrációs varázsló parancsát. Kövesse a képernyőn megjelenő utasításokat.
TERMÉKTÁMOGATÁS Ha regisztrálta a terméket, akkor jogosulttá válik az I.R.I.S. terméktámogatásra minden alapvetőszoftverfunkció tekintetében. Kapcsolatfelvétel az I.R.I.S. céggel: Európa:
[email protected] Tel: +32 10 45 13 64 USA:
[email protected] Tel: +1 800 447 4744 Ázsiai-Csendes-óceáni térség:
[email protected] Tel: +852 22646133
18
ReadirisTM Corporate 12 – Felhasználói útmutató
I.R.I.S. szoftverkarbantartási és támogatási szolgáltatások Az I.R.I.S. szoftverkarbantartási és támogatási szolgáltatások program keretében a Readiris Corporate biztosítja a jelentős szoftverfrissítéseket. Ha szeretne a programban részt venni, kérjen jelentkezési lapot az I.R.I.S. cégtől a következő e-mail címen:
[email protected]
19
ReadirisTM Corporate 12 – Felhasználói útmutató
3. FEJEZET KEZDŐ LÉPÉSEK A READIRIS ELINDÍTÁSA A Readiris futtatása: Kattintson a Readiris ikonra a Windows Start menüben, vagy kattintson duplán az ikonra az asztalon.
A Readiris Corporate verzió esetében a program meg fogja kérni, hogy regisztráljon. A Readiris használatának megkezdéséhez kattintson az indítóképernyőre. Automatikusan megnyílik az OCR varázsló.
AZ OCR VARÁZSLÓ HASZNÁLATA Az OCR varázslóval gyorsan megadhatók a Readiris használatához szükséges beállítások. A Readiris használatának megkezdésekor kattintson az indítóképernyőre, utána elindul az OCR varázsló. 21
3. fejezet - Kezdő lépések
1. lépés Válassza ki a felismerni kívánt dokumentum típusát. A Readiris a következő típusokat különbözteti meg: szöveges oldalak, névjegykártyák és több névjegykártya egyetlen beolvasással. További információkat A dokumentumtípus kiválasztása fejezetben talál.
A Tovább gombra kattintva ugorjon a következő lépésre. 2. lépés Válassza ki a képforrást. Ez lehet akár szkennerrel beolvasott kép, de lehet megnyitott képfájl is. Adja meg a kívánt elforgatási és ferdeségkorrekciós beállításokat. További információkat a Beállítások megadása fejezetben talál. A Readiris programmal való ismerkedéskor használhatja a szoftverrel kapott mintaképeket is. Ezek a Readiris CD-ROM lemezen, illetve a Samples almappában, a Readiris telepítési mappáján belül találhatók.
A Tovább gombra kattintva ugorjon a következő lépésre. 3. lépés Ha már kiválasztotta a szkennert, a Módosítás gombra kattintva megadhatja a kívánt beolvasási beállításokat. A beolvasási beállításokról további információkat a Nyomtatott dokumentumok beolvasása fejezetben talál.
A beállítások mentéséhez kattintson az OK gombra. A Tovább gombra kattintva ugorjon a következő lépésre. 4. lépés A dokumentum nyelvének módosításához kattintson a Módosítás gombra. Alapértelmezés szerint a dokumentum nyelve amerikai angol. Válassza ki a kívánt nyelvet vagy nyelvkombinációt és másodlagos 22
ReadirisTM Corporate 12 – Felhasználói útmutató
nyelveket a listából, és kattintson az OK gombra. A csúszkával állítsa be a kívánt Sebesség-Pontosság arányt. További információkat A dokumentum nyelvének kiválasztása fejezetben talál.
A beállítások mentéséhez kattintson az OK gombra. A Tovább gombra kattintva ugorjon a következő lépésre. 5. lépés A célalkalmazás kimeneti formátumának módosításához kattintson a Módosítás gombra. Az alapértelmezett célalkalmazás a Microsoft Word. Válassza ki a kívánt kimeneti formátumot vagy alkalmazást a Küldés ide vagy a Külső fájl listából. Kattintson az egyes fülekre, és adja meg a kívánt beállításokat. A választott formátum vagy alkalmazás esetében nem választható beállítások szürkén jelennek meg. További információkat a Dokumentumok formázása fejezetben talál.
A beállítások mentéséhez kattintson az OK gombra. A Tovább gombra kattintva ugorjon a következő lépésre. 6. lépés A dokumentum megnyitásához/beolvasásához és felismeréséhez kattintson az Indítás gombra.
FELHASZNÁLÓI FELÜLET A Readiris felület eléréséhez kattintson a Readiris indítóképernyőre, majd az OCR varázsló megjelenő panelén kattintson a Mégse gombra. Megjelenik az üres Readiris felület. 23
3. fejezet - Kezdő lépések
A Readiris felület a következőkből áll: SmartTask funkciók (középen) A SmartTask funkciókkal egyetlen gombnyomással, automatikusan futtathatók egymás után a leggyakoribb Readiris parancsok. A SmartTask funkciókkal csak ki kell választani a kívánt célalkalmazást vagy kimeneti formátumot, és a program gondoskodik a dokumentumok beolvasásáról, felismeréséről és továbbküldéséről. A SmartTask funkciókra az alapértelmezett beállítások vonatkoznak, de ezeket egyszerű beállítani: csak egy kattintás a jobb gombbal, és megadhatók az egyedi igények. a fő eszköztár (a bal oldali eszköztár)
24
ReadirisTM Corporate 12 – Felhasználói útmutató
A fő eszköztár parancsai és beállításai a dokumentumok kézi beolvasására és felismerésére vonatkoznak. Az OCR varázsló ezeknek a műveleteknek az ajánlott sorrendjében segít. a kép eszköztár (a jobb oldali eszköztár) A kép eszköztár gombjainak segítségével szerkeszthetők a Readiris felületen megjelenő dokumentumok. Ha az egérmutatót egy gomb fölött megpihenteti, megjelenik az eszközleírása. Ha a Readiris programmal egy dokumentum meg lett nyitva vagy be lett olvasva, három fő zóna adódik a felülethez: az oldal eszköztár (a fő eszköztártól jobbra) Az oldal eszköztáron jelennek meg az oldalak miniatűrjei. Ha ezekre rámutat, előugranak a beállítási információk. a kép ablak (középen) a dokumentumpanel (alul) A dokumentumpanel statisztikai adatokat jelenít meg a Readiris programban megnyitott dokumentumokról, például a beolvasás és a karakterfelismerés idejét, a felbontást, a dokumentum szélességét és magasságát stb.
25
3. fejezet - Kezdő lépések
A FELHASZNÁLÓI FELÜLET NYELVÉNEK MÓDOSÍTÁSA A Readiris felhasználói felülete többféle nyelven is megjeleníthető. A felhasználói felület nyelvének módosítása: Kattintson a Beállítások menü Felhasználói felület nyelve parancsára. A Nyelvlistából válassza ki a kívánt nyelvet, majd a nyugtázáshoz kattintson az OKgombra. Megjegyzés: Ha véletlenül rossz nyelvet választott, nyomja meg a Ctrl+U kombinációt. Megnyílik ismét a Nyelv párbeszédpanel, és másik nyelvet választhat a listából.
26
ReadirisTM Corporate 12 – Felhasználói útmutató
4. FEJEZET READIRIS SMARTTASK FUNKCIÓK A READIRIS SMARTTASK FUNKCIÓK HASZNÁLATA A Readiris indításakor kattintson a Readiris indítóképernyőre, majd az OCR varázsló megjelenő panelén kattintson a Mégse gombra. Megjelennek a Readiris SmartTask funkciók. A SmartTask funkciókkal egyetlen gombnyomással, automatikusan futtathatók egymás után a leggyakoribb Readiris parancsok.
27
4. fejezet - Readiris SmartTask funkciók
A különféle SmartTask funkciógombokkal a következők végezhetők el: 1. dokumentumok beolvasása, felismerése és továbbküldése közvetlenül a Word szövegszerkesztő programnak; Az alapértelmezett célalkalmazás a Microsoft Word. A választható alkalmazásokról további információkat a Szöveges dokumentumok formázása fejezetben talál.
2. dokumentumok beolvasása, felismerése és továbbküldése közvetlenül az OpenOffice szövegszerkesztő programnak; Az alapértelmezett célalkalmazás az OpenOffice.org Writer. A választható alkalmazásokról további információkat a Szöveges dokumentumok formázása fejezetben talál.
3. táblázatok beolvasása, felismerése és továbbküldése közvetlenül az Excelnek vagy egyéb táblázatkezelő programnak; 28
ReadirisTM Corporate 12 – Felhasználói útmutató
Az alapértelmezett célalkalmazás az Excel. További információkat a Táblázatos dokumentumok formázása fejezetben talál.
4. dokumentumok beolvasása, felismerése és archiválása PDF fájlként; Az alapértelmezett kimeneti formátum az Adobe Acrobat PDF képszöveg. A választható formátumokról további információkat a PDF dokumentumok létrehozása fejezetben talál.
5. dokumentumok beolvasása, felismerése és archiválása XPS fájlként; Az alapértelmezett kimeneti formátum az XPS kép-szöveg. A választható formátumokról további információkat az XPS dokumentumok létrehozása fejezetben talál.
6. dokumentumok beolvasása, felismerése és továbbküldése közvetlenül e-mailben; Alapértelmezés szerint a program a dokumentumokat PDF kép-szöveg formátumban továbbítja az alapértelmezett levelezőprogramnak. A választható formátumokról további információkat a Dokumentumok formázása fejezetben talál.
7. névjegykártyák beolvasása és felismerése; Alapértelmezés szerint a program vCard formátumban továbbítja a dokumentumokat. A választható formátumokról további információkat a Névjegykártyák felismerése fejezetben talál.
8. dokumentumkötegek beolvasása és felismerése, a dokumentumok leválogatási és indexelési beállításainak megadása. Az alapértelmezett kimeneti formátum a TIFF. További információkat a Dokumentumkötegek szétválasztása és a Dokumentumkötegek indexelése fejezetben talál.
29
4. fejezet - Readiris SmartTask funkciók
A Readiris első használatakor be kell állítani a SmartTask funkciókat. A SmartTask funkciók beállítása: Kattintson a jobb gombbal a használni kívánt SmartTask funkcióra. Válassza ki képforrásként a Szkennervagy a Képfájlok lehetőséget. o A Szkenner kiválasztása esetén a Readiris elindítja a szkennert, ha egy SmartTask funkcióra kattint. A beolvasott dokumentumokat a program megjeleníti a felületen, feldolgozza és elmenti. A SmartTask funkciók működéséhez a szkennert megfelelően be kell állítani. Ennek módja: Kattintson a fő eszköztáron a Szkenner gombra. A Szkennertípus listából válassza ki a használt szkennert. Ha a használt szkenner típusát nem találja a listában, válassza a Twain other models lehetőséget.
Ha kell, kattintson a Beállítás gombra, és jelölje ki a Twain-forrást. Ezután a beállítások mentéséhez kattintson az OK gombra. A beolvasási beállításokról és a nyomtatott dokumentum beolvasásáról további információkat a Nyomtatott dokumentumok beolvasása fejezetben talál.
30
ReadirisTM Corporate 12 – Felhasználói útmutató
o Ha a Képfájlok lehetőséget választotta, és egy SmartTask funkcióra kattint, a Readiris megnyitja a Bemenet párbeszédpanelt, ahol kijelölheti a feldolgozni kívánt képfájlokat. A képfájlok megnyitásáról további információkat a Képfájlok megnyitása fejezetben talál.
A Beállítás gombra kattintva módosíthatja a kimeneti formátumot és annak beállításait. Megjegyzés: a választható kimeneti formátumokat a kiválasztott SmartTask funkció határozza meg. A választható formátumokról és a beállításokról további információkat a Dokumentumok formázása fejezetben talál.
A Névjegykártya-felismerés funkció használatakor adja meg a kártyastílust és a kimeneti formátumot. További információkat a Névjegykártyák felismerése fejezetben talál.
A Dokumentumok leválogatása és indexelése funkció használatakor a Dokumentum feldolgozása parancsra kattintva adja meg a leválogatási és indexelési beállításokat. További információkat a Dokumentumkötegek szétválasztása és indexelése fejezetben talál.
Ha beállította a SmartTask funkciót, a fő eszköztár gombjaival adja meg a nyelvi beállításokat, a képjavító beállításokat, és ha kell, a szkennerbeállításokat.
31
4. fejezet - Readiris SmartTask funkciók
A fenti beállításokkal kapcsolatban további információkat a következő fejezetekben talál: Beállítások megadása,Nyomtatott dokumentumok beolvasása és A dokumentum nyelvének kiválasztása.
Végül kattintson a használni kívánt SmartTask funkcióra. A Readiris automatikusan elvégzi a teljes felismerési eljárást.
32
ReadirisTM Corporate 12 – Felhasználói útmutató
5. FEJEZET DOKUMENTUMOK BEOLVASÁSA A DOKUMENTUMTÍPUS KIVÁLASZTÁSA Mielőtt a Readiris Corporate programmal dokumentumokat olvasna be vagy képfájlokat nyitna meg, ki kell választani a dokumentumtípust. A Readiris a következő típusokat különbözteti meg: Szöveges oldalak, Névjegykártyák és Több névjegykártya egyetlen beolvasással. Művelet A fő eszköztáron kattintson a Dokumentumtípus gombra, majd válassza ki a dokumentumtípust.
Ha megadott minden beállítást (Szkenner, Dokumentumtípus, Beállítások), a beolvasáshoz kattintson a Beolvasás gombra, illetve a képfájlok megnyitásához kattintson a Megnyitás gombra.
33
5. fejezet - Dokumentumok beolvasása
A BEÁLLÍTÁSOK MEGADÁSA Mielőtt a Readiris Corporate programmal nyomtatott dokumentumokat olvasna be vagy képfájlokat nyitna meg, megadhat többféle képjavító beállítást. Az engedélyezett beállítások a dokumentumok megnyitásakor és beolvasásakor lépnek érvénybe. Művelet A fő eszköztáron a Beállítások gombra kattintva választhat a képjavító beállítások közül.
o Az Oldalferdeség korrekciója funkcióval korrigálhatók a ferdén beolvasott oldalak. o Ha az Elforgatás pontra mutat, akkor kiválaszthatja, hogy a Readiris hogyan forgassa el az oldalakat: automatikusan, 90 fokkal balra, 90 fokkal jobbra vagy 180 fokkal. Megjegyzés: ez a két beállítás valamennyire lassítja a beolvasást. Csak akkor válassza őket, ha szükségesek.
o A Gyors binarizálás funkcióval felgyorsítható a felismerés. Nagysebességű szkennerek esetében érdemes használni a Gyors binarizálás opciót. Ez a beállítás jelentősen megnöveli a feldolgozás sebességét.
o Alapértelmezés szerint az Oldalelemzés engedélyezett.
34
ReadirisTM Corporate 12 – Felhasználói útmutató
Ilyenkor a beolvasott vagy megnyitott képeket a program az ablakokban automatikusan szétdarabolja. Ha az oldalelemzés eredményét módosítani szeretné, vagy kézzel akarja a dokumentumokat ablakozni, akkor használja a kép eszköztár ablakozó eszközeit. További információkat a Dokumentumok kézi ablakozása fejezetben talál.
Ha megadott minden beállítást (Szkenner, Dokumentumtípus, Beállítások), a dokumentumok beolvasáshoz vagy a képfájlok megnyitásához kattintson a Beolvasás vagy a Megnyitás gombra. Megjegyzés: a fenti beállítások a Beállítások menüből is elérhetők.
KÉPFÁJLOK MEGNYITÁSA A Readiris programmal szkennerrel beolvasott nyomtatott dokumentumok vagy már meglévő, különféle formátumú képfájlok karakterei ismerhetők fel. Meglévő képfájlok megnyitása: A Megnyitás gombrakattintva válassza ki a képfájlokat.
35
5. fejezet - Dokumentumok beolvasása
Tipp: át is húzhatja a megnyitandó képfájlokat a Readiris képablakába. Tipp: Kattintson a jobb gombbal a megnyitni kívánt képfájlra, mutasson a Társítás pontra, majd kattintson az IOCR application parancsra. Megnyílik a Readiris program, és megjeleníti a képet. Tipp: többoldalas képfájlok (TIFF képek és DCX faxok) és PDF dokumentumok betöltésekor meg lehet adni a kívánt oldaltartományt (arra az esetre, ha például egy dokumentumnak csak egy bizonyos fejezete kell). Ehhez kattintson a fő eszköztáron a Megnyitás gombra. Az Oldaltartomány területen válassza az Oldal gombot, és adja meg a betölteni kívánt oldalakat. Lásd még: Egyszerre több képfájl megnyitása és felismerése. Tipp:ha szeretné a betöltést felgyorsítani, akkor PDF dokumentumok feldolgozásakor, a Megnyitás gombra kattintás után törölje a jelölést a PDF-dokumentumok betöltése színesben négyzetből.
36
ReadirisTM Corporate 12 – Felhasználói útmutató
Tipp: sok kép betöltése esetén válassza a Gyors binarizálás lehetőséget. Ez a beállítás jelentősen felgyorsítja a műveletet. Gyenge minőségű képek esetében azonban nem tanácsos a beállítás használata.
A Readiris a következő grafikus formátumokat támogatja:
Jelölje ki a kívánt képfájlt, és kattintson a Megnyitás gombra. Megjegyzés: a Bemenet párbeszédpanel beállításai a dokumentumok szkennelésére is vonatkoznak. Bővebb ismertetést a Nyomtatott dokumentumok beolvasása fejezetben talál.
NYOMTATOTT DOKUMENTUMOK BEOLVASÁSA A Readiris programmal szkennerrel beolvasott nyomtatott dokumentumok vagy már meglévő, különféle formátumú képfájlok karakterei ismerhetők fel. Nyomtatott dokumentumok feldolgozásakor a Readiris elindítja a szkennert, ha a Beolvasás gombra kattint, és megjeleníti a beolvasott dokumentumot a képernyőn. Dokumentumok beolvasása: A Szkenner gombra kattintva adja meg a szkennerbeállításokat.
37
5. fejezet - Dokumentumok beolvasása
Megjegyzés: a Szkenner párbeszédpanel több beállítása a Megnyitás párbeszédpanelen is megtalálható.
Válassza ki a megfelelő szkennertípust. Ha a használt szkenner típusát nem találja a listában, válassza a Twain other models lehetőséget, és kattintson az OK gombra.
A Readiris szinte minden jelenleg használt síkágyas és lapbehúzós szkennert, "multifunkciós " készüléket ("MFP" "Multifunctional Peripheral"), digitális fényképezőgépet és szkennerszabványt támogat. A Readiris Twain-kompatibilis. A Beállítás gomb csak akkor jelenik meg, ha szükség lehet rá. Kattintson rá, és jelölje ki a Twain-forrást.
Adja meg a szkennerbeállításokat.
38
ReadirisTM Corporate 12 – Felhasználói útmutató
Formátum és felbontás A Readiris sokféle papírformátumot és felbontást támogat. Megjegyzés: a beolvasáshoz ajánlott felbontás 300 dpi. 400 dpi felbontás ajánlott névjegykártyák,ázsiai szöveg vagy nagyon apró betűk felismerése esetén. Színmód A Readiris a dokumentumokat beolvasni és a képfájlokat megnyitni színesben, fekete-fehérben és szürkeárnyalatosan tudja. Kontraszt és fényerősség A csúszkával adja meg a lehető legjobb beolvasási eredményt adó fényerő- és kontrasztbeállításokat. Felbontás optimalizálása OCR-hez A Felbontás optimalizálása OCR-hez beállítással korrigálható a túl finoman beolvasott (600 dpi feletti) képek felbontása. A Readiris csökkenti a felbontást. Megjegyzés: ezzel a beállítással nem lehet a túl durván beolvasott képek felbontását megnövelni.
Többoldalas dokumentumok beolvasása Többoldalas dokumentumok beolvasása, illetve dokumentumadagolós szkenner használata esetén válassza az ADF (automatikus dokumentumadagoló) lehetőséget. Helyezze a beolvasni kívánt oldalakat az adagolóba, és indítsa el a beolvasást. Síkágyas szkennerek esetében használja az Intervallumos beolvasás beállítást: válassza az Utána következő oldal beolvasásalehetőséget, és adja meg, hogy a Readiris hány másodpercet várjon a következő oldal beolvasásáig. 39
5. fejezet - Dokumentumok beolvasása
További információkat a Többoldalas dokumentumok beolvasása és felismerése fejezetben talál. Fontos: a választott szkenner esetében nem választható beállítások szürkén jelennek meg.
Fekvő képek beolvasása Fekvő tájolású képek esetében válassza a Fekvő lehetőséget. Automatikus expozíció Egyes szkennerek esetében alapértelmezés szerint ki van jelölve az Automatikus expozícióbeállítás. Ezzel a beállítással a kívánt kontraszt és fényerősség megadása automatikusan történik. Invertált képek beolvasása Invertált fekete-fehér képek beolvasása esetén válassza az Invertálás lehetőséget. Digitális fényképezőgép használata Ha a beolvasási forrás digitális fényképezőgép, válassza a Digitális fényképezőgép lehetőséget. A digitális fényképezőgéppel készült képek feldolgozásához a Readiris speciális felismerési rutinokat használ. Tippek arra az esetre, ha digitális fényképezőgép a beolvasási forrás: Egy fehér dokumentum lefényképezésével kalibrálja be a digitális fényképezőgépet. Válassza a lehető legnagyobb képfelbontást. Engedélyezze a közeli felvételekhez való makró (macro) módot, ha van ilyen a digitális fényképezőgépen. Csak optikai zoomot, használjon, digitális zoomot ne.
40
ReadirisTM Corporate 12 – Felhasználói útmutató
Tartsa a digitális fényképezőgépet közvetlenül a dokumentum felett. Lehetőleg ne oldalról fényképezze a dokumentumot. Ne legyen a kép elmosódott. Ha kell használjon állványt. Ha a papír fényes, ne használjon vakut. A digitális fényképezőgép tömörített képeit lehetőleg ne nyissa meg. Állítsa be a Readiris programban a fényerősséget és a kontrasztot a környezethez (napfény, izzólámpa, neonfény).
Válassza ki a színmódot: színes vagy szürkeárnyalatos. Feldolgozás 300 dpi felbontással Helytelen vagy ismeretlen felbontású képek feldolgozása esetén válassza a Feldolgozás: 300 dpi lehetőséget. A program ilyenkor úgy kezeli a képeket, mintha a felbontásuk 300 dpi lenne. A digitális fényképezőgéppel készült képek felbontása szinte mindig ismeretlen.
Színes képek simítása Ez a beállítás alapértelmezés szerint engedélyezett, mert egyes szkennerek esetében csak a képek simításával lehet megfelelően felismerni a színes és a szürkeárnyalatos képeket. Nagy sebességű és kétoldalas beolvasás Kétoldalas szkenner esetében megjelenik a Kétoldalas beolvasás beállítás is. Ha bejelöli, akkor a hátoldalt is felismeri a program. Gyors binarizálás Nagysebességű szkennerek esetében érdemes használni a Gyors binarizálás opciót. Ez a beállítás jelentősen megnöveli a feldolgozás sebességét. Gyenge minőségű dokumentumok esetében azonban nem tanácsos a beállítás használata. 41
5. fejezet - Dokumentumok beolvasása
Ha megadott minden beállítást (Szkenner, Dokumentumtípus, Beállítások), a dokumentumok beolvasásához kattintson a Beolvasás gombra. Megjegyzés: ügyeljen a sorok párhuzamosságára. A 0,5°-nál nagyobb sorferdülés növeli a karakterfelismerési hibákat.
42
ReadirisTM Corporate 12 – Felhasználói útmutató
6. FEJEZET BEOLVASOTT DOKUMENTUMOK IGAZÍTÁSA Rendkívül világos vagy rendkívül sötét tónusú szürkeárnyalatos vagy színes képek megnyitása vagy beolvasása esetén szükséges lehet a megfelelő OCR eredmény érdekében a felismerés indítása előtt a képek módosítása. Képek igazítása: Nyissa meg vagy szkennelje be a színes vagy szürkeárnyalatos dokumentumot. Ellenőrizze, hogy helyesek-e a szkennerbeállítások. Fontos: a szkennerbeállítások és az igazítási beállítások azonosnak tűnnek, de tudni kell, hogy a két beállításcsoport a beolvasási/felismerési folyamat más szakaszára hat.
Kattintson a Feldolgozás menü Kép igazítása parancsára. A Readiris intelligens binarizálási rutinjai a színes/szürkeárnyalatos képeket olyan fekete-fehér képekké alakítják, amelyekkel az OCR funkció dolgozni tud.
o A Színes kép simítása funkcióval kiegyenlíthető a kép. Ez a beállítás csökkenti az intenzitásbeli különbségeket, így a szürkeárnyalatos és színes képek homogénebbek lesznek. Ennek eredményeképpen erősebb lesz a kontraszt az előtér (szöveg) és a háttér (illusztráció) között.
43
6. fejezet - Beolvasott dokumentumok igazítása
Megjegyzés: néha csak simítással lehet a szöveget elválasztani a színes háttértől.
(Eredeti kép)
(Binarizált fekete-fehér kép)
(Simított kép)
o A Gyors binarizálás funkcióval felgyorsítható a folyamat. Ebben az esetben a Fényerősség és a Kontraszt beállítás nem érhető el. Ez a beállítás gyenge minőségű dokumentumok beolvasásakor csökkentheti az OCR funkció pontosságát.
o A csúszkával növelhető vagy csökkenthető a Fényerősség. A Fényerősség beállítás határozza meg a kép általános fényerősségét. Ezekkel a beállításokkal sötétíthető vagy világosítható a kép, ha a szöveg olvashatatlan. 1. példa: sötét kép világosítása az oldalháttér kiküszöbölése érdekében.
44
ReadirisTM Corporate 12 – Felhasználói útmutató
(Színes kép)
(Binarizált kép. Az alapértelmezett binarizációs beállítások fekete képet adnak.)
(A világosított kép kielégítő felismerési eredményt ad.) 2. példa: egy kép sötétítése, ha a szöveg olyan világos, hogy a binarizált képen nem is látható.
(Színes kép)
(Binarizált kép. Az alapértelmezett fényerősség beállítások hiányos karaktereket adnak.)
45
6. fejezet - Beolvasott dokumentumok igazítása
(A sötétített kép kielégítő felismerési eredményt ad.)
o A csúszkával növelhető vagy csökkenthető a Kontraszt. A Kontraszt beállítás határozza meg a kép sötétebb és világosabb zónái közötti kontrasztot. Ezekkel a beállításokkal a karakterek kiemelhetők egy színes háttérből.
(Színes kép)
(Az alapértelmezett kontraszt beállítások töredékes karaktereket adnak.)
(A fokozott kontraszt kielégítő felismerési eredményt ad.)
o A csúszkával növelhető vagy csökkenthető a Foltmentesítés. A foltmentesítés eltávolítja a fekete-fehér képekről a foltokat.
Az Alkalmaz gombra kattintva megtekinthető a funkció hatásának előnézete.
46
ReadirisTM Corporate 12 – Felhasználói útmutató
Ha az eredménnyel elégedett, kattintson az OK gombra. Ha nem, módosítsa újra a beállításokat. A Felismerés + Mentés gombra kattintva elindítható a dokumentum felismerése.
47
ReadirisTM Corporate 12 – Felhasználói útmutató
7. FEJEZET DOKUMENTUMOK MENTÉSE KÉPFÁJLKÉNT A programmal beolvasott nyomtatott dokumentumok karaktereit nem kötelező azonnal felismerni. Elmenthetők képfájlként. Ennek módja: Olvassa be a dokumentumot. A Fájl menüben kattintson valamelyik parancsra: A teljes oldal mentése képként vagy Minden oldal mentése képként. Később azután megnyithatja az elmentett képfájlt, és elvégezheti a felismerést. Csak grafika mentése Arra is van lehetőség, hogy csak a grafikaablakokat mentse el, a dokumentum szövege nélkül. Ennek módja: Olvassa be vagy nyissa meg a dokumentumot. A Fájl menüben kattintson a Grafika mentése parancsra. A program elmenti egyetlen fájlba a dokumentumban található összes grafikát.
49
ReadirisTM Corporate 12 – Felhasználói útmutató
8. FEJEZET DOKUMENTUMOK ABLAKOZÁSA DOKUMENTUMOK AUTOMATIKUS ABLAKOZÁSA Dokumentumok beolvasásakor vagy megnyitásakor a Readiris automatikusan oldalelemzést végez, amivel a dokumentumokat ablakokra tagolja. Alapértelmezés szerint az Oldalelemzés beállítás engedélyezett. Ha ki akarja kapcsolni az automatikus oldalelemzést, kattintson a Beállítások gombra, és tiltsa le az Oldalelemzés funkciót. Az automatikus oldalelemzés után az oldalelemzés eredményét kézzel módosítani lehet. További információkat a Dokumentumok kézi ablakozása fejezetben talál.
51
8. fejezet - Dokumentumok ablakozása
Ablaktípusok A Readiris ötféle ablaktípust használ: szövegblokkok, grafikazónák, táblázatok,vonalkódzónák és nyomtatott kézírás zónák. Az oldalelemzés a szöveget, a grafikát és a táblázatot tartalmazó zónákat automatikusan felderíti. A vonalkódzónákat és a nyomtatott kézírás zónákat kézzel kell megrajzolni. További információkat a Dokumentumok kézi ablakozása fejezetben talál.
Minden ablaktípusnak megvan a színkódja: a szövegablakok narancssárgák, a grafikaablakok lilák, a táblázatablakok rózsaszínűek.a vonalkódzónák zöldek, a nyomtatott kézírás zónák kékek. Az ablakok rendezése felülről lefelé, balról jobbra történik. A számok az ablakok rendezésének sorrendjét jelölik. Az ablaksorrend és az ablaktípus módosítható. További információkat a Dokumentumok kézi ablakozása fejezetben talál. Az oldalszéleken lévő szövegzónák figyelmen kívül hagyása Ha a szkenner fekete kereteket érzékel a beolvasott kép körül, akkor az oldalelemzés hajlamos ott is zónákat találni, ahol csak képzaj van. Ennek megelőzése érdekében kattintson a Ne érzékelje a kereteken lévő ablakokat parancsra a Beállítások menüben, és olvassa be újra a dokumentumot. A külső zóna figyelmen kívül hagyása A dokumentumok automatikus ablakozása helyett A külső zóna figyelmen kívül hagyása beállítás is használható. Ez a funkció olyankor hasznos, ha csak egyetlen területet kell a
52
ReadirisTM Corporate 12 – Felhasználói útmutató
dokumentumoldalakon kijelölni, és a program csak ezen belül végez karakterfelismerést. A külső zóna figyelmen kívül hagyása funkció aktiválásához kattintson a kép eszköztáron a megfelelő gombra.
Rajzoljon keretet az oldalrészlet köré, amelyet a Readiris programnak fel kell ismernie. A kijelölt oldalrészletet a program automatikusan elemzi. A program meg fogja kérdezni, hogy figyelmen kívül hagyja-e az oldalelemzésnél a zónán kívül eső részt a dokumentum minden oldalán.
DOKUMENTUMOK KÉZI ABLAKOZÁSA A dokumentumok automatikus ablakozása mellett (az Oldalelemzés funkcióval) a Readiris lehetővé teszi a dokumentumok kézi ablakozását is. A kézi ablakozás akkor jön jól, amikor módosítani kell az automatikus oldalelemzés eredményét. Ablakozási sablonok létrehozása esetén is hasznos. Az ablakozási sablonokról további információkat az Ablakozási sablonok használata fejezetben talál. Megjegyzés: a vonalkódzónákat és a nyomtatott kézírás zónákat mindig kézzel kell ablakozni.
53
8. fejezet - Dokumentumok ablakozása
Művelet Egy dokumentum kézi ablakozásához előbb kattintson a Beállítások gombra, és törölje a jelölést az Oldalelemzés lehetőség mellől. Nyissa meg vagy olvassa be a dokumentumot: kattintson a Beolvasás vagy a Megnyitás gombra.
Válassza ki a helyes ablaktípust: kattintson a kép eszköztáron a megfelelő ablaktípus gombra. A Readiris ötféle ablaktípust használ: szövegblokkok, grafikazónák, táblázatok,vonalkódzónák és nyomtatott kézírás zónák.
Rajzoljon egy keretet az ablakozni kívánt szövegblokkok, grafikák, táblázatok, vonalkód- és nyomtatott kézírás zónák köré. A vonalkódok és a nyomtatott kézírás felismerésével kapcsolatban további információkat a Vonalkódok felismerése és a Nyomtatott kézírásos szöveg felismerése fejezetben talál.
Ha kész a dokumentum ablakozása, a felismerés elindításához kattintson a Felismerés + Mentés gombra.
54
ReadirisTM Corporate 12 – Felhasználói útmutató
Ablakok rendezése Ha módosítani akarja az ablakok sorrendjét, kattintson a kép eszköztáron a Rendezés gombra, majd a kívánt sorrendben egyenként az ablakokra.
Ha kész van, a felismerés elindításához kattintson a Felismerés + Mentés gombra. Ha egy ablakra nem kattintott rá, azt a program figyelmen kívül hagyja a felismeréskor.
Sokszögek rajzolása Dokumentumok kézi ablakozásakor nem csak négyszögeket lehet rajzolni. A négyszög alakú ablakok egyesítésével sokszög alakúakat is létre lehet hozni. Ha két azonos típusú ablak fedésbe kerül, akkor automatikusan sokszöggé olvadnak össze.
Automatikus oldalelemzés Ha az aktuális oldal kézi ablakozása túl bonyolult lenne, kattintson a kép eszköztáron az Oldal elemzése gombra, és a program automatikusan beablakozza az oldalt.
55
8. fejezet - Dokumentumok ablakozása
Megjegyzés: a vonalkódzónákat és a nyomtatott kézírás zónákat mindig kézzel kell megrajzolni.
Az ablaktípus módosítása Ha módosítani akarja egy ablak típusát, kattintson a jobb gombbal az ablakra, mutasson az Ablak, majd a Típus pontra, végül kattintson a kívánt ablaktípusra. Egyszerre több ablak típusa is módosítható. o
o
o
Kattintson a kép eszköztáron az egérmutató gombra.
Ha most a Shift billentyűt lenyomva tartja, akkor több ablakot is kiválaszthat. Kattintson a jobb gombbal bármelyik kijelölt ablakra, mutasson az Ablak, majd a Típus pontra, végül kattintson a kívánt ablaktípusra.
Az ablakméret módosítása Kattintson a módosítani kívánt ablakra. Vigye az egérmutatót egy jelölő fölé (az ablakok sarkaiban és oldalán). Kattintson a jelölőre, és az egér mozgatásával állítsa be a kívánt ablakméretet. Ablakok áthelyezése Jelölje ki az áthelyezni kívánt ablakot. Kattintson az ablakon belülre, és az egér mozgatásával húzza a kívánt helyre az ablakot.
56
ReadirisTM Corporate 12 – Felhasználói útmutató
Egy ablak felismerése külön Kattintson a jobb gombbal a felismerni kívánt ablakra, majd a Másolás szövegként parancsra. Az eredményeket a program szövegtörzsként a vágólapra küldi. Ez nyomtatott kézírás esetében is működik. A grafikaablakok és a vonalkódablakok is a vágólapra másolhatók.
Ablakok törlése Jelölje ki a törölni kívánt ablakokat, illetve az összes ablak kijelöléséhez válassza az Összes kijelölése parancsot a Szerkesztés menüben. A Szerkesztés menü Kivágás vagy Törlés parancsával vágja ki vagy törölje az ablakokat. vagy Kattintson a jobb gombbal a kijelölt ablakokra, mutasson az Ablak pontra, majd kattintson a Törlés parancsra. Kis ablakok törlése Egyes dokumentumokon – például faxokon – "kóbor" pöttyök vannak, ami miatt a Readiris fölösleges, szöveget nem tartalmazó ablakokat hoz létre. Ha törölni akarja a kis ablakokat, csak kattintson a Kis ablakok törlése parancsra a Szerkesztés menüben. Ez a funkció törli az összes 1,3 cm-nél (0,5") kisebb ablakot, és újrarendezi a megmaradt zónákat.
57
8. fejezet - Dokumentumok ablakozása
ABLAKOZÁSI SABLONOK HASZNÁLATA Ha több, hasonló oldalelrendezésű dokumentum karaktereit szeretné felismerni, akkor hasznos lehet az ablakozási sablonok használata az automatikus oldalelemzés helyett. Ilyenkor a program ugyanazt az ablakstruktúrát alkalmazza minden beolvasott vagy megnyitott dokumentumra, ami felgyorsítja a műveletet. Művelet A kép eszköztár gombjainak segítségével ablakozza be a dokumentum első oldalát kézzel. További információkat a Dokumentumok kézi ablakozása fejezetben talál.
Kattintson a Fájl menü Elrendezés mentése parancsára. Nyissa meg vagy olvassa be a dokumentum többi oldalát: kattintson a fő eszköztáron a Megnyitás vagy a Beolvasás gombra. Kattintson a Fájl menü Elrendezés betöltése parancsára. Válassza ki az elmentett elrendezésfájlt. Ha az elrendezést az összes megnyitott vagy beolvasott dokumentumra alkalmazni kívánja, akkor válassza Az elrendezés alkalmazása minden oldalra lehetőséget az Elrendezésfájl párbeszédpanelen. AMegnyitás gombra kattintva töltse be az elrendezésfájlt. Megjegyzés: ha a Readiris újabb dokumentumot nyit meg, akkor újra be kell tölteni az elrendezésfájlt, mert alapértelmezés szerint az oldalelemzés van engedélyezve.
58
ReadirisTM Corporate 12 – Felhasználói útmutató
A külső zóna figyelmen kívül hagyása Az ablakozási sablonok helyett A külső zóna figyelmen kívül hagyása beállítás is használható. Ilyenkor egyetlen területet lehet az oldalon kijelölni, és a program csak ezen belül végez karakterfelismerést. A OCR területen kívül eső adatokat a program figyelmen kívül hagyja a felismeréskor. Művelet A külső zóna figyelmen kívül hagyása funkció aktiválásához kattintson a kép eszköztáron a megfelelő gombra.
Rajzoljon keretet az oldalrészlet köré, amelyet a Readiris programnak fel kell ismernie. A kijelölt oldalrészletet a program automatikusan elemzi. A program meg fogja kérdezni, hogy figyelmen kívül hagyja-e a zónán kívül eső részt a dokumentum minden oldalán. Ha vissza akarja vonni ezt a funkciót, futtassa újra az oldalelemzést: kattintson a kép eszköztáron az Oldal elemzése gombra.
A Felismerés + Mentés gombra kattintva elindítható a felismerés.
59
ReadirisTM Corporate 12 – Felhasználói útmutató
9. FEJEZET FELHASZNÁLÓI INDEX KÉSZÍTÉSE Mielőtt a Readiris programmal felismerné és elmentené a dokumentumokat, létrehozhat egy felhasználói indexet minden dokumentumhoz. A Readiris felhasználó indexek lehetővé teszik a kimeneti fájlok hatékony rendezését almappa, fájlnév, tárgy és kulcsszavak alapján. Felhasználói index létrehozása: Olvassa be a dokumentumokat, illetve nyissa meg a képfájlokat, amelyek karaktereit a Readiris programmal fel szeretné ismerni. Kattintson a fő eszköztáron a Felhasználói index gombra.
Megjelennek a felhasználói indexelés beállításai.
61
9. fejezet - Felhasználói index készítése
Kattintson a Tallózás gombra, és válassza ki a kívánt kimeneti mappát. Kattintson a használni kívánt indexmezőre (almappa, fájlnév, tárgy és kulcsszavak). Ezután rajzoljon egy keretet az indexelemként használni kívánt szöveg köré. A szöveget a program fel fogja ismerni, és beszúrja az indexmezőbe.
Az OK gombra kattintva lépjen ki a felhasználói index beállításaiból, majd a dokumentum felismeréséhez kattintson a Felismerés + Mentés gombra. A program elmenti a dokumentumokat a megadott fájlnéven és mappába. A kiválasztott kimeneti formátumtól függően a kimeneti dokumentumok dokumentumtulajdonságai tartalmazhatják a tárgyat és kulcsszavakat.
Megjegyzés: a felhasználó index beállításai a Kimeneti fájl párbeszédpanelen is megtalálhatók, amelyet a Felismerés + Mentés gombra kattintva lehet megnyitni.
62
ReadirisTM Corporate 12 – Felhasználói útmutató
10. FEJEZET DOKUMENTUMOK FELISMERÉSE BEVEZETÉS A dokumentumok felismeréséhez a Readiris nyelvi technológiát alkalmaz. Ennek eredményeképpen a Readiris felismeri a szöveget, táblázatokat, grafikákat, vonalkódokat és a kézírásos szöveget mindenféle dokumentumban. A Readiris ezen túlmenően képes bonyolult hasábos elrendezésű dokumentumok, gyenge minőségű dokumentumok, faxok, pontmátrix nyomtatású dokumentumok, rosszul beolvasott vagy másolt, túl világos vagy sötét karaktereket tartalmazó dokumentumok kezelésére is. A Readiris 128 nyelvet támogat: támogat minden amerikai és európai nyelvet, beleértve a közép-európai, a balti és a cirill betűs nyelveket, továbbá a görögöt és a törököt. Opcionálisan a Readiris képes arab, fárszi és héber dokumentumok, illetve négy ázsiai nyelven (japán, egyszerűsített kínai, hagyományos kínai és koreai) írt dokumentumok beolvasására. A Readiris kevert ábécét használó szövegekkel is boldogul. A szoftver érzékeli a görög, cirill betűs, arab, héber és ázsiai nyelvű dokumentumokban megbújó nyugati jelekkel írt „nyugati” szavakat – ezek általában lefordíthatatlan tulajdonnevek, márkanevek stb. A Readiris a legfejlettebb felismerési technológiákat alkalmazza. A betűkészlettől független szövegfelismerést automatikus tanulási technológia egészíti ki. A szoftver a kontextuális és nyelvi elemzésnek köszönhetően képes új karakterek és szavak megtanulására. Ez azt jelenti, hogy idővel a karakterfelismerés pontossága egyre jobb lesz. 63
10. fejezet - Dokumentumok felismerése
A Readiris rendelkezik továbbá egy (opcionális) felhasználó általi ellenőrzés funkcióval. Ha a felhasználó általi ellenőrzés funkció engedélyezve van (interaktív tanulás), akkor a felismerő rendszer nemcsak megjelöli a bizonytalan karaktereket, hanem lehetővé teszi a rendszer pontosságának növelését is. A jóváhagyott megoldásokat a szoftver ideiglenesen, a felismerés idejére memorizálja, ami növeli a rendszer sebességét és megbízhatóságát, és idővel a rendszer egyre intelligensebbé válik. Ez a hatásos önfejlesztő eszköz lehetővé teszi, hogy megtanítsa a Readiris szoftvert különleges karakterekre is, például matematikai szimbólumokra, grafikai elemekre, illetve torz karakterek kezelésére. Az interaktív tanulás eredménye tartósan is tárolható a betűkészlet szótárakban későbbi felhasználás céljából. A felismerési pontosság növelésének másik eszköze lehet a felhasználói lexikonok használata. Létrehozhat egyéni felhasználói lexikonokat, amelyek azt a speciális terminológiát tartalmazzák, amit a Readiris programnak fel kell ismernie.
A DOKUMENTUM NYELVÉNEK KIVÁLASZTÁSA A Readiris 128 nyelven támogatja a karakterfelismerést. A Readiris támogat minden amerikai és európai nyelvet, beleértve a középeurópai, a cirill betűs és a balti nyelveket, továbbá a görögöt és a törököt. A Readiris Pro Asian és a Readiris Corporate Asian emellett képes a japán, egyszerűsített kínai, hagyományos kínai és koreai nyelven írt dokumentumok felismerésére is. A Readiris Pro Middle-East és a Readiris Corporate Middle-East emellett képes az arab, fárszi és héber nyelven írt dokumentumok felismerésére is.
64
ReadirisTM Corporate 12 – Felhasználói útmutató
Ahhoz, hogy a Readiris felismerje a dokumentumot, meg kell adni a dokumentum nyelvét. Ennek módja: A fő eszköztáron a földgömb gombra kattintva válassza ki a kívánt nyelvet a legördülő listából.
Az utoljára kiválasztott 5 nyelv mindig a nyelvek listájának élére kerül. Fontos: arab, héber és ázsiai nyelvű dokumentumok esetében a dokumentum nyelvét az oldalelemzés előtt kell kiválasztani. A program ezekhez a dokumentumokhoz speciális oldalelemző rutinokat használ. A felismerés numerikus karakterkészletre is korlátozható, javítva a táblázatok és számsorok felismerésének pontosságát. Ebben az esetben a Readiris csak a számjegyeket (0–9) ismeri fel, továbbá a következő szimbólumokat:
65
10. fejezet - Dokumentumok felismerése
+ pluszjel
* csillag
/ perjel
% százalékjel
, vessző
. pont
( nyitó zárójel
) záró zárójel
kötőjel
= egyenlőségjel
$ dollárjel
£ fontjel
€ eurójel
¥ jenjel
A numerikus mód engedélyezéséhez válassza a Numerikus lehetőséget a Nyelv párbeszédpanelen.
Vegyes nyelvű dokumentumok felismerése A Readiris képes vegyes karakterkészletű szöveg kezelésére is. Ilyenkor a Readiris automatikusan nyelvet vált egy mondat közepén, és felismeri a "nem angol" nyelvű szövegbe ékelődött angol szavakat (tulajdonnevek, márkanevek stb). A fő eszköztáron a földgömb gombra kattintva válassza ki a kívánt nyelvkombinációt a nyelvválasztó listából. Megjegyzés: ázsiai és héber dokumentumok feldolgozásakor a program automatikusan vegyes karakterkészletet használ. Másodlagos nyelvek felismerése Az elsődleges nyelv vagy nyelvkombináció mellett a Readiris lehetővé teszi, hogy akár 4 másodlagos nyelvet is kijelöljön ugyanabból a nyelvcsoportból. Ez többnyelvű dokumentumok felismerése esetén hasznos. Megjegyzés: ne jelöljön ki olyan nyelveket, amelyekre nincs szükség, mert minél nagyobb a karakterkészlet, annál lassabb a felismerés, és úgy nő a karakterfelismerési hibák esélye. Arab dokumentumok beolvasásakor csak az angol nyelv választható másodlagos nyelvként.
66
ReadirisTM Corporate 12 – Felhasználói útmutató
Sebesség – Pontosság Adja meg a karakterfelismerés sebességének és pontosságának kívánt arányát.
Ez az arány a latin, a cirill betűs és a görög ábécé esetében állítható be. Tipp: ha a képminőség gyengébb, húzza a pontosság felé.
FELHASZNÁLÓI LEXIKONOK HASZNÁLATA A felismerés során a Readiris nyelvi adatbázist épít a szöveg helyes felismerése érdekében. Ezek a nyelvi adatbázisok szabványos lexikonok, melyek minden támogatott nyelvhez megvannak. Ezek a szabványos lexikonok nagyon hatékonyak, de testre szabott felhasználói lexikonokkal még tovább javítható a felismerés pontossága. A felhasználói lexikonok segítségével a Readiris képes felismerni az olyan műszaki, tudományos vagy éppen cégspecifikus kifejezéseket, melyek egyébként nehézségeket okoznának. Felhasználói lexikon létrehozása és használata: Kattintson a Beállítások menü Felhasználói lexikon szerkesztése parancsára. A Felhasználói lexikon szerkesztő a Windows Programok menüjéből is elérhető.
67
10. fejezet - Dokumentumok felismerése
Szúrja be azokat szavakat, amelyeket a Readiris programnak fel kell ismernie, és kattintson a Hozzáadás gombra. Más fájlokból is beilleszthet szövegrészeket, illetve importálhat és szerkeszthet meglévő szövegfájlokat. Tipp: a cégdokumentumok vagy szójegyzékek importálása a leggyorsabb módja a cégspecifikus terminológiát tartalmazó felhasználói lexikon létrehozásának. A bevitt kifejezéseket a program ábécérendben tárolja. A többször szereplő szavakat automatikusan kizárja.
Kattintson a Mentés gombra, és mentse el a .txt fájlt a kívánt mappába. Mutasson újra a Beállítások menü Felhasználói lexikon parancsára.
68
ReadirisTM Corporate 12 – Felhasználói útmutató
Kattintson a Fájl használata parancsra, és a párbeszédpanelen válassza ki a kívánt felhasználói lexikont. A Megnyitás gombra kattintva nyissa meg a felhasználói lexikont. Ahhoz, hogy a Readiris felismerje a felhasználói lexikon szavait, meg kell adni a nyelvet is. Ehhez kattintson a fő eszköztáron a földgömb gombra. A program nem fogja jól felismerni azokat a szavakat, amelyek olyan karaktereket tartalmaznak, amelyek a kiválasztott nyelvben nincsenek.
A Felismerés + Mentés gombra kattintva elindítható a felismerés.
Szintaktikai szabályok A terminológia megadásakor számos szintaktikai szabály érvényesül: A kis- és nagybetűk különbözőnek számítanak. Példa: az IRISCard marad IRISCard
A program automatikusan kiszűri a szavak előtt és mögött álló írásjeleket és különleges karaktereket. A szavakon belüli kötőjelek megmaradnak. Példa: a Notre-Dame-de-Paris marad Notre-Dame-de-Paris Tipp: ügyeljen a sorvégi elválasztó kötőjelekre, ha szövegfájlokat importál vagy többsoros szövegrészt illeszt be.
A számokat kizárja. Számjegyek ugyanakkor előfordulhatnak terméknevekben, ezeket megtartja. Példa: a FAT32 marad FAT32.A Systolic 150 tárolt alakja: Systolic
69
10. fejezet - Dokumentumok felismerése
A DOKUMENTUM JELLEMZŐINEK MEGADÁSA A dokumentum nyelve mellett egyéb dokumentumjellemzőket is meg lehet adni, például Betűtípus és a Karaktersűrűség fontos szerepet játszik a felismerésben.
Betűtípus A Readiris különbséget tesz a "szokásos" és a pontmátrix nyomtatott dokumentumok között. A (9 tűs) pontmátrix szimbólumok egymástól elkülönülő pontokból állnak. A pontmátrix dokumentumok felismeréséhez különleges szegmentálási és felismerési technikák szükségesek, melyeket engedélyezni kell.
A betűtípus kiválasztása: Kattintson a Beállítások menü Betűtípus parancsára. Alapértelmezés szerint a betűtípus Automatikus. Ilyenkor a Readiris felismeri a "25 tűs" vagy "NLQ" (Near Letter Quality) pontmátrix szöveget, illetve az egyéb, "normál" nyomtatott szöveget.
Csak pontmátrix nyomtatású dokumentumok felismerés esetén válassza a Pontmátrix beállítást. A Readiris ilyenkor felismeri az úgynevezett "piszkozat" vagy "9 tűs" pontmátrix nyomtatású dokumentumokat is.
70
ReadirisTM Corporate 12 – Felhasználói útmutató
Karaktersűrűség A karaktersűrűség egy betűtípus hüvelykenkénti karakterszámát jelenti. A karaktersűrűség lehet rögzített (minden karakter szélessége ugyanakkora) vagy arányos (a különböző karakterek szélessége eltérő). A karaktersűrűség kiválasztása: Kattintson a Beállítások menü Karaktersűrűség parancsára. Alapértelmezés szerint a karaktersűrűség Automatikus. Ha minden karakter szélessége ugyanakkora, kattintson a Rögzített lehetőségre. A régi írógéppel készült dokumentumok esetében általában ez a helyzet. Ha minden karakter szélessége más, kattintson az Arányos lehetőségre. Lényegében az újságok, magazinok és könyvek betűkészlete mind arányos.
Fontos: ezek a dokumentumjellemzők nem vonatkoznak az ázsiai, héber és arab nyelvű dokumentumokra.
AZ INTERAKTÍV TANULÁS HASZNÁLATA A Readiris rendelkezik egy ún. interaktív tanulás funkcióval. Az interaktív tanulás funkcióval betanítható a felismerő rendszer betűkészletekre, karakterformákra, így szükség esetén korrigálni tudja a karakterfelismerés eredményét. Az interaktív tanulás során a felismerő rendszer által biztosan nem azonosított karakterek 71
10. fejezet - Dokumentumok felismerése
megjelennek az előnézet ablakban, mellettük a forrásszó és a javasolt megoldás. Az interaktív tanulás jelentősen javítja a felismerő rendszer pontosságát, és különösen hasznos torz, alaktalan karakterek felismerésekor. Az interaktív tanulás lehetővé teszi, hogy megtanítsa a Readiris szoftvert különleges, eredetileg nem felismert karakterekre is, például matematikai és tudományos szimbólumokra vagy grafikai elemekre. Az interaktív tanulás engedélyezése: A Tanulás menüben kattintson az Interaktív tanulás parancsra. Adja meg a kívánt beállításokat, és a dokumentum felismeréséhez kattintson a Felismerés + Mentés gombra. A felismerés után a Readiris interaktív tanulási módra vált. Megjelennek a felismerő rendszer által biztosan nem azonosított karakterek.
Ha az eredmény helyes: o
72
Kattintson a Tanulás gombra, és mentse el a jóváhagyott eredményt.
ReadirisTM Corporate 12 – Felhasználói útmutató
A tanulás eredménye átmenetileg, a felismerés időtartamára tárolódik a számítógép memóriájában. A dokumentum többi részének a felismerése alatt a Readiris már nem jeleníti meg a megtanult karaktereket. Új dokumentum felismerésekor a tanulás eredménye elveszik. A tanulás eredményének mentéséhez betűkészlet szótárt kell használni. További információkat a Betűkészlet szótárak használata fejezetben talál. o
A Befejezés gombra kattintva elmentheti a program által ajánlott megoldásokat.
Ha az eredmény helytelen: o
Írja be a helyes karaktereket, és kattintson a Tanulás gombra.
vagy o
Kattintson a Ne tanuljon gombra, ha az eredményt bizonytalannak találja, és nem akarja menteni. Ezt a parancsot érdemes használni sérült karakterek esetében, amelyek megtanulás esetén összekeverhetők lennének más karakterekkel. Ilyen lehet például az egyes (1) és az L betű (I), amelyek sok betűkészletben teljesen egyformák.
o
Ha egy karaktert törölni akar a kimenetből, kattintson a Törlés gombra. Ezzel a gombbal megelőzhető, hogy a dokumentum zaja (képhibái) megjelenjenek a kimeneti fájlban.
o
Ha hibázott, kattintson a Visszavonás gombra. A Readiris megjegyzi az utolsó 32 műveletet.
o
Ha meg akarja szakítani az interaktív tanulást, kattintson a Megszakítás gombra. A tanulás eredménye törlődik. Ha újból a Felismerés + Mentés gombra kattint, ismét elindul az interaktív tanulás.
73
10. fejezet - Dokumentumok felismerése
BETŰKÉSZLET SZÓTÁRAK HASZNÁLATA Logikus, hogy ha ugyanolyan típusú, betűkészletű és nyomtatási minőségű dokumentumokat olvasunk be, akkor ne kelljen a tanítást mindig elölről kezdeni. Erre találták ki a betűkészlet szótárakat. A betűkészlet szótárak az interaktív tanulás során szerzett betűkészlet-információkat tartalmazzák, és jelentősen javíthatják a felismerési eredményeket. A betűkészlet szótárak 500 karakterre vannak korlátozva. Ajánlatos a konkrét alkalmazási területekre speciális szótárakat létrehozni. Új betűkészlet szótár létrehozása: A Tanulás menüben kattintson az Új betűkészlet szótár parancsra. Alapértelmezés szerint a Readiris a Readiris.dus szótárt nyitja meg. Módosítsa a fájlnevet, és a Mentés gombra kattintva mentse el új szótárként.
Aktiválni a Tanulás menü Interaktív tanulás parancsával lehet. A Felismerés + Mentés gombra kattintva elindítható a dokumentum felismerése. A Readiris interaktív tanulási módra vált. A párbeszédpanelen gombjaira kattintva mentse el a karaktereket a betűkészlet szótárba. Meglévő betűkészlet szótár használata: A Tanulás menüben kattintson a Betűkészlet szótár parancsra. Jelölje ki a használni kívánt szótárt, és kattintson a Megnyitás gombra.
74
ReadirisTM Corporate 12 – Felhasználói útmutató
A Tanulás menüben kattintson a Betűkészlet szótár hozzáfűzése vagy a Betűkészlet szótár olvasása parancsra. A Betűkészlet szótár hozzáfűzése funkció választása esetén engedélyezze az Interaktív tanulás funkciót is. A Readiris ennek hatására interaktív tanulással felismeri a szótárban tárolt karaktereket, lehetővé téve az új információk eltárolását a szótárba. A Betűkészlet szótár olvasása funkcióval a Readiris felismeri a szótárban tárolt karaktereket, de a szótárt nem bővíti, még akkor sem, ha az Interaktív tanulás engedélyezett. Megjegyzés: ilyenkor is hasznos az Interaktív tanulás funkció használata a felismerési eredmények ellenőrzésére és pontosítására, csak ezek a módosítások nem kerülnek bele a betűkészlet szótárba. Vigyázat: ne kattintson a Tanulás menü Betűkészlet szótár parancsára, és ne nyisson meg meglévő szótárt, ha a program Új szótár szótármódban van. Ellenkező esetben elveszik a meglévő betűkészlet szótár tartalma.
A Felismerés + Mentés gombra kattintva elindítható a dokumentum felismerése.
75
ReadirisTM Corporate 12 – Felhasználói útmutató
11. FEJEZET DOKUMENTUMOK FORMÁZÁSA ÉS MENTÉSE DOKUMENTUMOK FORMÁZÁSA A Readiris programmal karakterfelismert dokumentumok különféle kimeneti formátumokban menthetők. A Readiris az OCR eredményeket a következő formátumokban képes menteni: Adobe Acrobat PDF fájlokba, Microsoft XPS fájlokba, Word, WordML, RTF és OpenDocument szövegfájlokba, HTML és XML fájlokba, SpreadsheetML munkalapokba, illetve Ansi és Unicode szövegfájlokba. Emellett a Readiris az eredményeket exportálni is tudja közvetlenül olyan célalkalmazásoknak, mint a Microsoft Word és Excel, az Adobe Reader, a Microsoft XPS Viewer megjelenítő, a népszerű webböngészők és levelezőszoftverek stb. Megjegyzés: A Readiris által létrehozott RTF fájlok olyan webalapú irodai alkalmazásokban is megnyithatók, mint az AjaxWrite, a ThinkFree, a Zoho Writer és a Google Writely (amelyekkel RTF és HTML dokumentumok is megnyithatók). Ilyen alkalmazások használata esetén ügyeljen rá, hogy az elrendezési beállítás Szavak és bekezdések formázásának megőrzése legyen.
A választható kimeneti formátumokat és alkalmazásokat a kiválasztott dokumentumtípus határozza meg.
77
11. fejezet - Dokumentumok formázása és mentése
Művelet A fő eszköztáron a Formázás gombra kattintva válassza ki a kimeneti módot. A Readiris vagy: o elküldi a dokumentumot egy alkalmazásnak, amely automatikusan megnyitja, vagy; o külső fájlként elmenti a dokumentumokat. A Küldés e-mailben funkció egy új e-mail üzenetet hoz létre, és a felismert dokumentumot az üzenethez csatolja mellékletként.
Adja meg a vezérlőkkel a kívánt beállításokat. A választott kimeneti formátum esetében nem választható beállítások szürkén jelennek meg. Az alábbiakban ismertetjük a leggyakrabban használt kimeneti fájlformátumokat és beállításaikat.
A Felismerés + Mentés gombra kattintva elindíthatja a szövegfelismerést, és elmentheti a kész dokumentumokat. Az OCR eredményeket a felismerés megismétlése nélkül, többször is lehet exportálni. Kattintson ismét a Formázás gombra, és ha kell,
78
ReadirisTM Corporate 12 – Felhasználói útmutató
módosítsa a szövegformátumot és a formázási beállításokat. Kattintson újra a Felismerés + Mentés gombra. Keresési és rendezési szempontok miatt a Readiris lehetővé teszi a PDF, XPS, Word, RTF, WordML, SpreadsheetML és HTML kimenet dokumentumtulajdonságainak megadását. Egy dokumentum tulajdonságainak megadásához kattintson a Dokumentumtulajdonságok parancsra a Fájl menüben. A dokumentumtulajdonságok beállításai a Kimeneti fájl párbeszédpanelen is megtalálhatók, amelyet a Felismerés + Mentés gombra kattintva lehet megnyitni. Ha többoldalas dokumentumot mentünk külső fájlként, akkor a Readiris el tudja menteni az egyes oldalakat külön kimeneti fájlokba, illetve el tudja menteni a dokumentum összes oldalát egyetlen kimeneti fájlba. Egyszerűen kattintson a kívánt beállításra a Kimeneti fájl párbeszédpanelen: Egy fájl létrehozása oldalanként vagy Egy fájl létrehozása dokumentumonként. Az Egy fájl létrehozása oldalanként és az Egy fájl létrehozása dokumentumonként beállítás csak akkor választható, ha külső fájlként mentünk dokumentumot. Ha célalkalmazás nyitja meg a dokumentumot, akkor nem választható.
SZÖVEGES DOKUMENTUMOK FORMÁZÁSA A Readiris programmal többféle szöveges kimeneti formátum hozható létre. A Readiris tudja kezelni többek között a Word,WordML, RTF, txt és OpenDocument Text kimeneti formátumot. Szöveges kimeneti fájlok létrehozása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt kimeneti formátumot a Küldés ide vagy a Külső fájl legördülő listából.
79
11. fejezet - Dokumentumok formázása és mentése
A kiválasztott szöveges formátum függvényében többféle formázási beállítás választható. A választott szövegformátum esetében nem választható beállítások szürkén jelennek meg.
Elrendezési beállítások
A Szövegtörzs létrehozása beállítás hatására a Readiris nem végez semmilyen szövegformázást. A Readiris egy folytonos, összeolvadó szöveget hoz létre.
A Szavak és bekezdések formázásának megőrzése átmenetet képez a szövegtörzs és az automatikus formázás között. A betűtípust, a betűméretet és a betűstílust a felismerés megőrzi. A tabulálást és a blokkok igazítását a program létrehozza újból. A szövegblokkokat és oszlopokat a program nem hozza létre újból, a bekezdések egymást követik. A táblázatokat a program helyesen felismeri.
A Forrásdokumentum létrehozása újból beállítás lényegében egy fénymásolatot készít az eredeti dokumentumról.
80
ReadirisTM Corporate 12 – Felhasználói útmutató
A Readiris a forrásdokumentumról egy valódi másolatot készít, nem csak egy szkennelt képet. A Readiris az e-mail címeket és a webhelyek címeit hivatkozásokká alakítja.
A Hasábok használata keretek helyett beállítás hasábos elrendezésű dokumentumokat hoz létre. A hasábos elrendezésű szövegeket könnyebb szerkeszteni, mint a kereteket tartalmazó dokumentumokat: a szöveg természetesen folyik át egyik hasábból a másikba. Megjegyzés: ha a program nem érzékel hasábokat a forrásdokumentumban, akkor ez a formázási mód mégiscsak kereteket fog használni.
A Hasábtörések beszúrása beállítás kemény hasábtöréseket szúr be minden hasáb mögé. Minden szerkesztett, hozzáadott vagy törölt szöveg a hasábon belül marad; szöveg nem folyhat át automatikusan a hasábtörésen keresztül. Tipp: hasábos elrendezésű szövegtörzs esetén tiltsa le ezt a beállítást. Így a szöveg természetesen átfolyik majd egyik hasábból a másikba.
A Kép hozzáadása oldalháttérként beállítás a beolvasott képet oldalháttérként a felismert szöveg alá helyezi. Ez a beállítás jelentősen megnöveli a kimeneti fájlok méretét. A PDF szöveg-kép formátum hasonló eredménnyel jár a PDF fájlok esetében. A Beállítások panellapon lévő Háttér színeinek megőrzése beállítás egy kevésbé drasztikus, tömörebb alternatíva.
Általános beállítások Az általános beállítások a Beállítások panellapon érhetők el:
81
11. fejezet - Dokumentumok formázása és mentése
A Sorok egyesítése bekezdésekké beállítás engedélyezi az automatikus bekezdésérzékelést. A Readiris automatikusan átemeli a felismert szöveg szavait a következő sor elejére a következő bekezdés elejéig, és "összerakja” a sorok végén elválasztott szavakat.
A Grafikát is beállítás hatására a grafikák is bekerülnek az automatikusan formázott fájlokba. Ez elengedhetetlen, ha hiteles másolat kell egy dokumentumról. A Grafika panellap grafikus beállításaival megadható a kimeneti fájlokban tárolt grafikák színmódja és felbontása.
A Szöveg színeinek megőrzése beállítás megtartja a szöveg eredeti színeit a felismerés során. A Háttér színeinek megőrzése beállítás megtartja a háttérfoltok színeit a felismerés során. Az egyes bekezdéseken belül a kimeneti fájlban a háttérszínek egységesek lesznek.
Papírméretek A kiválasztott formátum függvényében meg lehet adni a kívánt papírméreteket:
82
ReadirisTM Corporate 12 – Felhasználói útmutató
Kattintson a Papírméret fülre, és a nyílgombokkal adja meg az alkalmazható és a kizárt papírméreteket. A Readiris a megadott sorrendben megy végig az aktív papírméreteken, és az első olyan papírméretet fogja használni, amelyiken elfér a beolvasott dokumentum.
TÁBLÁZATOS DOKUMENTUMOK FORMÁZÁSA A Readiris képes a táblázatos formába rendezett adatokat átadni táblázatkezelőknek szövegszerkesztőknek és webböngészőknek: a táblázatokat celláról cellára helyreállítja, és táblázat objektumként szövegszerkesztőkkel megnyitható fájlokba szúrja be. A Readiris képes felismerni a rácshálós és a rácsháló nélküli táblázatokat is.
(rácshálós)
(rácsháló nélküli)
Táblázatos dokumentumok létrehozása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt kimeneti formátumot a Küldés ide vagy a Külső fájl legördülő listából. Adja meg a kívánt elrendezési beállításokat.
83
11. fejezet - Dokumentumok formázása és mentése
A formázási beállításokról további információkat a Szöveges dokumentumok formázása fejezetben talál.
SpreadsheetML beállítások Ha a kiválasztott célalkalmazás a Microsoft Excel 2002/2003, speciális SpreadsheetML beállítások választhatók. A megjelenítésükhöz kattintson a SpreadsheetML beállítások fülre: A Forrásdokumentum létrehozása újból beállítás ennél a formátumnál nem választható.
A táblázatokon kívüli szövegek figyelmen kívül hagyása beállítás elmenti a táblázatokat és figyelmen kívül hagy minden egyéb felismerési eredményt. A táblázatokon belüli adatokat a program beolvassa, a táblázatokon kívülieket nem.
84
ReadirisTM Corporate 12 – Felhasználói útmutató
A Számjegyek számokká alakítása funkció a felismert számneveket számjegyekké alakítja. Ennek eredményeként aritmetikai műveleteket lehet végezni azokban a cellákban. A szöveges cellák (ha vannak a táblázatban) szövegesek maradnak. A program csak a táblázatokban lévő számneveket alakítja számjegyekké. Az Excel csak a számjegyekkel bevitt adatokon tud matematikai műveleteket végezni.
Az Oldalanként egy munkalap létrehozása hatására minden beolvasott oldal egy külön munkalapra kerül. Ha az oldal táblázatokat és szöveget is tartalmaz, minden ugyanarra a munkalapra kerül.
A Táblázatonként egy munkalap létrehozása minden egyes táblázatot külön munkalapra helyez, és a felismert szöveget (a táblázatokon kívül esőt) másik munkalapon helyezi el. Ha a felismert dokumentum több oldalt tartalmaz, akkor ez a rendszer ismétlődik oldalanként.
Általános beállítások Az általános beállítások a Beállítások panellapon érhetők el: 85
11. fejezet - Dokumentumok formázása és mentése
A Sorok egyesítése bekezdésekké beállítás engedélyezi az automatikus bekezdésérzékelést. A Readiris automatikusan átemeli a felismert szöveg szavait a következő sor elejére a következő bekezdés elejéig, és "összerakja” a sorok végén elválasztott szavakat.
A Háttér színeinek megőrzése beállítás létrehozza újból az egyes cellák háttérszínét.
Papírméretek A kiválasztott formátum függvényében meg lehet adni a kívánt papírméreteket: Kattintson a Papírméret fülre, és a nyílgombokkal adja meg az alkalmazható és a kizárt papírméreteket. A Readiris a megadott sorrendben megy végig az aktív papírméreteken, és az első olyan papírméretet fogja használni, amelyiken elfér a beolvasott dokumentum.
86
ReadirisTM Corporate 12 – Felhasználói útmutató
PDF DOKUMENTUMOK LÉTREHOZÁSA A Readiris négyféle PDF kimenetet állít elő: szöveg,szöveg-kép, kép-szöveg és kép. PDF kimenet létrehozása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt PDF típust a Küldés ide vagy a Külső fájllegördülő listából: PDF kép PDF kép választása esetén a Readiris csak képet tartalmazó PDF dokumentumokat hoz létre, karakterfelismerés nem történik. PDF kép-szöveg PDF kép-szöveg választása esetén a Readiris felismeri a szöveget, és olyan, kereshető PDF fájlokat hoz létre, amelyek az oldal képét és a felismert szöveget is tartalmazzák. Az oldal képe a szöveg fölé kerül. Ez a formátum megőrzi az eredeti dokumentumot (ahogy be lett olvasva), ugyanakkor a kép alatt lévő felismert szövegben is lehet keresni, másolni belőle, vagy beilleszteni. Emiatt ez a formátum hasznos archiválási célokra. PDF szöveg PDF szöveg választása esetén a Readiris felismeri a szöveget, és kereshető PDF fájlokat hoz létre. Ezek az egyrétegű PDF fájlok az oldal képét nem tartalmazzák.
87
11. fejezet - Dokumentumok formázása és mentése
PDF szöveg-kép PDF szöveg-kép választása esetén a Readiris felismeri a szöveget, és olyan, kereshető PDF dokumentumokat hoz létre, amelyek az oldal képét és a felismert szöveget is tartalmazzák. Az oldal képe a szöveg alá kerül.
A PDF BEÁLLÍTÁSOK MEGADÁSA A PDF beállítások megadása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt PDF típust a Küldés ide vagy a Külső fájl legördülő listából. A kiválasztott PDF típus függvényében többféle formázási beállítás választható. A megjelenítésükhöz kattintson a PDF beállítások fülre.
88
ReadirisTM Corporate 12 – Felhasználói útmutató
Könyvjelzők létrehozása A Könyvjelzők létrehozása beállítás az Adobe Acrobat PDF fájlokban található minden szövegblokkhoz, grafikához és táblázathoz könyvjelzőket hoz létre. Betűkészletek beágyazása A Betűkészletek beágyazása funkció a betűkészleteket beágyazza az Adobe Acrobat PDF fájlokba. A betűkészletek beágyazásával megelőzhető a betűtípusok megváltozása, és biztosítható, hogy a használt számítógépkonfigurációtól függetlenül az olvasók egyformának, eredeti betűtípussal lássák a szöveget. A betűkészletek beágyazása kis mértékben növeli a felismert dokumentumok fájlméretét. PDF/A dokumentumok A "szokásos" PDF dokumentumok létrehozásán kívül a Readiris PDF/A fájlokat is elő tud állítani. Csak válassza a PDF/A kompatibilis fájlok létrehozása beállítást. A PDF/A fájlok hosszú távú archiválásra jók, és szigorúan csak azt tartalmazzák, ami a megnyitásukhoz és megtekintésükhöz szükséges.
PDF DOKUMENTUMOK IHQC TÖMÖRÍTÉSE A "szokásos" PDF kimeneteken kívül a Readiris iHQC tömörítésű PDF kimenetet is elő tud állítani: A kép-szöveg és a kép típusú PDF dokumentumok hipertömöríthetők az iHQC technológiával, anélkül hogy romlana a képminőség.
89
11. fejezet - Dokumentumok formázása és mentése
Az iHQC az intelligent High-Quality Compression, az I.R.I.S. szabadalmazott, hatékony tömörítési technológiájának a rövidítése. Az iHQC olyasmi a képeknél, mint az MP3 a zenében vagy a DivX a filmeknél. iHQC tömörítésű PDF kimenet létrehozása: A fő eszköztáron a Formázás gombra kattintva válassza a két kimeneti mód egyikét. A Küldés ide vagy a Külső fájl listából válassza ki a kívánt PDF típust: PDF kép-szöveg vagy PDF kép. A PDF beállítások panellapon válassza ki a kívánt tömörítési fokozatot. A Readiris Pro által támogatott tömörítési fokozatok a következők: Level I - Kis méret, Level I - Jó minőség. A Readiris Corporate által támogatott további tömörítési fokozatok a következők: Level II és III - Kis méret, Jó minőség, illetve az Egyéni fokozat. A Level II tömörítési fokozat esetében a Szimbólumok tömörítése funkciót a szoftver automatikusan engedélyezi, hogy a szöveg tömörítése megfelelő legyen. A Level III tömörítési fokozat esetében a Hullámtömörítés funkciót a szoftver automatikusan engedélyezi, hogy a grafikák tömörítése megfelelő legyen. Ha az Egyéni tömörítést választja, akkor ezeket a beállításokat egymástól függetlenül engedélyezheti vagy letilthatja. A Kis méret - Jó minőség arányt a csúszkával is be lehet állítani.
90
ReadirisTM Corporate 12 – Felhasználói útmutató
A Felismerés + Mentés gombra kattintva elindíthatja a szövegfelismerést, és elmentheti az eredményt iHQC tömörítésű PDF fájlként.
PDF DOKUMENTUMOK JELSZAVAS VÉDELME A Readiris lehetővé teszi, hogy jelszó beállításával korlátozza a PDF-kimenethez történő hozzáférést. Megadhat egy dokumentummegnyitási jelszót, amely a dokumentum megnyitásához szükséges, és beállíthat egy engedélymódosítási jelszót, amellyel a dokumentum nyomtatása és módosítása korlátozható. Figyelmeztetés: az elfelejtett jelszavakat csak egy külön jelszóhelyreállító programmal lehet esetleg pótolni.
Jelszavas védelem alkalmazása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt PDF típust a Küldés ide vagy a Külső fájl legördülő listából. Kattintson a Jelszó fülre, és adja meg a kívánt biztonsági beállításokat.
91
11. fejezet - Dokumentumok formázása és mentése
Dokumentummegnyitási jelszó beállítása esetén a program meg fogja kérni, hogy írja be a készülő PDF-fájl megnyitásához szükséges jelszót. Engedélymódosítási jelszó beállítása esetén csak a biztonsági beállításokkal megadott műveletek végezhetők a dokumentummal. Ha módosítani kívánja valaki ezeket a beállításokat, meg kell adnia az engedélymódosítási jelszót. A Readiris biztonsági beállításai hasonlók az Adobe Acrobat szokásos védelmi funkcióihoz. A Readiris esetében azonban a dokumentummegnyitási jelszó és az engedélymódosítási jelszó nem lehet egyforma. Ha egy PDF dokumentum mindkét jelszófajtával védve van, akkor a megnyitásához bármelyik jelszó használható.
PDF DOKUMENTUMOK DIGITÁLIS ALÁÍRÁSA A Readiris lehetővé teszi a PDF, PDF/A és PDF iHQC tömörítésű dokumentumok digitális aláírását. 92
ReadirisTM Corporate 12 – Felhasználói útmutató
A digitális aláírás azonosítja a PDF dokumentum létrehozóját; bizonyítja a szerző személyazonosságát, hitelesíti a dokumentumot, és segít a PDF dokumentumok nem kívánt módosításának megakadályozásában. Digitálisan aláírt dokumentumok létrehozása: Kattintson a fő eszköztáron a Formázás gombra. Válassza ki a kívánt PDF típust a Küldés ide vagy a Külső fájl legördülő listából. Az Aláírás panellapon megadhatja az aláírási beállításokat. o A Részletek gombra kattintva megjeleníthető az aktuális aláírás minden információja. o A Kezelés gombra kattintva szerkeszthetők, eltávolíthatók és exportálhatók a számítógépre telepített digitális aláírások. Egy PDF dokumentum aláírásához előbb digitális azonosítót kell kérni egy aláírás-kezelő harmadik féltől, vagy saját digitális azonosítót kell létrehozni az Adobe Acrobat programban. További információkat az Acrobat dokumentációban talál.
A szerző aláírása az Adobe Acrobat és az Adobe Reader Aláírások panellapján jelenik meg.
PDF DOKUMENTUMOK ÁTALAKÍTÁSA A PDF dokumentumok létrehozásán kívül a Readiris a PDF fájlokat át is tudja alakítani. A Readiris a képet tartalmazó PDF-fájlokat szöveges PDF-fájlokká vagy bármilyen más támogatott szövegformátumba tudja alakítani, feloldva a csak olvasható PDFtartalom zárolását. 93
11. fejezet - Dokumentumok formázása és mentése
Figyelmeztetés: A Readiris nem nyitja meg a dokumentummegnyitási jelszóval védett PDF dokumentumokat.
Művelet A fő eszköztáron a Megnyitás gombra kattintva válassza ki az átalakítani kívánt PDF-fájlt.
A párbeszédpanel Oldaltartomány területén válassza az Oldal gombot, és adja meg a megnyitni kívánt oldalakat.
A párbeszédpanelen a Megnyitás gombra kattintva nyissa meg a kívánt PDF-fájlt. A fő eszköztáron a Formázás gombra kattintva válassza ki a kívánt PDF típust. A PDF típusokról további információkat a PDF dokumentumok létrehozása fejezetben talál.
A Felismerés + Mentés gombra kattintva elindítható a dokumentum átalakítása.
XPS DOKUMENTUMOK LÉTREHOZÁSA A Readiris négyféle XPS fájlt állít elő: szöveg, szöveg-kép, képszöveg és kép. Az XPS a Microsoft által fejlesztett, rögzített elrendezésű formátumot leíró XML Paper Specification szabvány rövidítése. XPS kimenet létrehozása:
94
ReadirisTM Corporate 12 – Felhasználói útmutató
Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt XPS típust a Küldés ide vagy a Külső fájllegördülő listából: XPS kép XPS kép választása esetén a Readiris csak képet tartalmazó XPS dokumentumokat hoz létre, karakterfelismerés nem történik. XPS kép-szöveg XPS kép-szöveg választása esetén a Readiris felismeri a szöveget, és olyan, kereshető XPS fájlokat hoz létre, amelyek az oldal képét és a felismert szöveget is tartalmazzák. Az oldal képe a szöveg fölé kerül. Ez a formátum megőrzi az eredeti dokumentumot (ahogy be lett olvasva), ugyanakkor a kép alatt lévő felismert szövegben is lehet keresni, másolni belőle, vagy beilleszteni. Emiatt ez a formátum hasznos archiválási célokra. XPS szöveg XPS szöveg választása esetén a Readiris felismeri a szöveget, és kereshető XPS fájlokat hoz létre. Ezek az egyrétegű XPS fájlok az oldal képét nem tartalmazzák. XPS szöveg-kép XPS szöveg-kép választása esetén a Readiris felismeri a szöveget, és olyan, kereshető XPS dokumentumokat hoz létre, amelyek az oldal képét és a felismert szöveget is tartalmazzák. Az oldal képe a szöveg alá kerül.
95
11. fejezet - Dokumentumok formázása és mentése
AZ XPS BEÁLLÍTÁSOK MEGADÁSA Az XPS beállítások megadása: Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt XPS típust a Küldés ide vagy a Külső fájl legördülő listából. A kiválasztott XPS típus függvényében többféle formázási beállítás választható. A megjelenítésükhöz kattintson az XPS beállítások fülre.
Könyvjelzők létrehozása A Könyvjelzők létrehozása beállítás a Microsoft XPS fájlokban található minden szövegblokkhoz, grafikához és táblázathoz könyvjelzőket hoz létre.
XPS DOKUMENTUMOK IHQC TÖMÖRÍTÉSE A "szokásos" XPS kimeneteken kívül a Readiris iHQC tömörítésű XPS kimenetet is elő tud állítani: A kép-szöveg és a kép típusú XPS dokumentumok hipertömöríthetők az iHQC technológiával. 96
ReadirisTM Corporate 12 – Felhasználói útmutató
Az iHQC az intelligent High-Quality Compression, az I.R.I.S. szabadalmazott, hatékony tömörítési technológiájának a rövidítése. Az iHQC olyasmi a képeknél, mint az MP3 a zenében vagy a DivX a filmeknél. iHQC tömörítésű XPS kimenet létrehozása: A fő eszköztáron a Formázás gombra kattintva válassza a két kimeneti mód egyikét. A Küldés ide vagy a Külső fájl listából válassza ki a kívánt XPS típust: XPS kép-szöveg vagy XPS kép. Az XPS beállítások panellapon válassza ki a kívánt tömörítési fokozatot. A Readiris által támogatott tömörítési fokozatok a következők: Level I - Kis méret, Level I - Jó minőség.
A GRAFIKUS BEÁLLÍTÁSOK MEGADÁSA A kiválasztott kimeneti formátumtól és célalkalmazástól függően speciális grafikus beállítások is megadhatók. A grafikus beállításokkal a képminőség és a felbontás változtatható. A grafikus beállítások elérése:
97
11. fejezet - Dokumentumok formázása és mentése
Kattintson a fő eszköztáron a Formázás gombra, és válassza a kívánt kimeneti formátumot a Küldés ide vagy a Külső fájl legördülő listából. A beállítások megjelenítéséhez kattintson a Grafika fülre.
Színmód Alapértelmezés szerint a Readiris színesben menti a grafikákat. Ha a grafikákat fekete-fehérben kívánja menteni, válassza a feketefehér lehetőséget. Felbontás A Readiris alapértelmezés szerinti beállítása a beolvasási felbontás megőrzése. A felbontás csökkentése is választható. Tipp: Ha a dokumentumokat egy webhelyre szeretné feltölteni, ezért HTML formátumban menti, akkor csökkentse a felbontást 70 dpi értékre (képernyő felbontás).
JPEG minőség A PDF, XPS, Word és RTF dokumentumokban tárolt grafikák formátuma JPEG.
98
ReadirisTM Corporate 12 – Felhasználói útmutató
A csúszkával állítsa be a JPEG minőséget. JPEG 2000 tömörítés Ha a fájlokat PDF vagy XPS formátumban menti, akkor a Readiris JPEG 2000 tömörítést alkalmazhat a fájlokban tárolt színes/szürkeárnyalatos képeken. A JPEG 2000 a JPEG szabvány legújabb, legnagyobb tömörítési fokot biztosító változata.
Ha használni kívánja, válassza a JPEG 2000 tömörítés lehetőséget.
99
ReadirisTM Corporate 12 – Felhasználói útmutató
12. FEJEZET BEÁLLÍTÁSOK MENTÉSE ÉS BETÖLTÉSE A Readiris programban a megadott beállítások a program bezárása után is megmaradnak. Ha vissza akarja állítani a gyári beállításokat, kattintson a Fájl menüben a Gyári beállítások visszaállítása parancsra. Ha különféle dokumentumok csoportjait olvassa be, melyek mind eltérő beállításokat igényelnek, akkor érdemes minden csoporthoz egy külön beállításfájlt elmenteni. Művelet Jelölje ki az adott dokumentumcsoport esetében használni kívánt beállításokat. A Fájl menüben kattintson a Beállítások mentése parancsra. Ha később egy ugyanilyen csoportba tartozó dokumentumot olvas be vagy nyit meg, kattintson a Fájl menüben a Beállítások betöltése parancsra. Jelölje ki a megfelelő beállításfájlt, és kattintson a Megnyitás gombra. A Felismerés + Mentés gombra kattintva elindíthatja a szövegfelismerést a kívánt beállításokkal. Megjegyzés: a Fájl menü Információ parancsa áttekintést ad az érvényben lévő legfontosabb beállításokról.
101
ReadirisTM Corporate 12 – Felhasználói útmutató
13. FEJEZET TÖBBOLDALAS DOKUMENTUMOK FELISMERÉSE EGYSZERRE TÖBB KÉPFÁJL MEGNYITÁSA ÉS FELISMERÉSE A Readiris képes egyszerre több képfájl feldolgozására. Egyszerre több képfájl megnyitása: Kattintson a fő eszköztáron a Megnyitás gombra.
Válassza ki a megnyitni kívánt képfájlokat. o Jelölje ki az első képfájlt, majd a Ctrl billentyűt lenyomva tartva jelölje ki a többi kívánt képet, vagy; o A képfájlok egy folyamatos tartományát kijelölheti úgy is, hogy az első képre kattint, és lenyomva tartja a Shift billentyűt, amíg a kijelölés el nem érte az utolsó képet. Megjegyzés: ha egy olyan fájlt nyit meg, amely több oldalt tartalmaz, pl. egy többoldalas TIFF-fájlt vagy egy PDF dokumentumot, akkor meg lehet adni a kívánt oldaltartományt. A párbeszédpanel Oldaltartomány területén válassza az Oldal gombot, és adja meg a felismerni kívánt oldalakat.
103
13. fejezet - Többoldalas dokumentumok felismerése
Ha jelezni akarja, hogy egy dokumentumnak hol van a vége, és hol kezdődik egy másik, szúrjon be egy üres lapot a két dokumentum közé, és adja meg a Dokumentum feldolgozása beállításokat. A Readiris a dokumentumokat ábécérendben dolgozza fel, tehát az üres fájlnak közvetlenül a dokumentum utolsó fájlja után következnie. További információkat a Dokumentumkötegek szétválasztása fejezetben talál.
A Megnyitás gombra kattintva nyissa meg a kép(ek)et. Megjegyzés: A Windows Intézőből át is húzhatja a megnyitandó képfájlokat a Readiris képablakába.
Az oldal eszköztáron megjelennek a megnyitott képfájlok. Tipp: ha egy oldal miniatűrje felett megpihenteti az egérmutatót, akkor megjelennek az oldal beállítási információi. Az oldal eszköztár a többoldalas dokumentumok szerkesztésére használható. További információkat a Többoldalas dokumentumok szerkesztése fejezetben talál.
Ha megtekintette a felismerési beállításokat, a felismerés indításához kattintson a Felismerés + Mentés gombra. Ha az aktuális dokumentumhoz még további képeket kíván megnyitni vagy beolvasni, kattintson a fő eszköztáron a Beolvasás vagy a Megnyitás gombra. 104
ReadirisTM Corporate 12 – Felhasználói útmutató
A program meg fogja kérdezni, hogy törölni akarja-e az aktuális dokumentumot. Ha törölni akarja az aktuális dokumentumot, és újat akar kezdeni, akkor kattintson az Igen gombra, ha újabb oldalakat szeretne az aktuális dokumentumhoz adni, kattintson a Nem gombra.
Megjegyzés: ha már beolvasott dokumentumokat nagy tételben akar feldolgozni, akkor használja a Kötegelt OCR vagy a Figyelt mappa funkciót.
TÖBBOLDALAS DOKUMENTUMOK BEOLVASÁSA ÉS FELISMERÉSE A Readiris képes a több oldalt tartalmazó dokumentumok feldolgozására is. A Readiris Home és a Readiris Pro legfeljebb 50 oldalt tartalmazó dokumentumok feldolgozására képes. A Readiris Corporate korlátlan oldalszámú dokumentumok feldolgozására képes.
Ha többoldalas dokumentumot olvas be, akkor lapbehúzós szkenner esetében használhatja a Readiris automatikus dokumentumadagoló funkcióját, síkágyas szkennerek esetében pedig használhatja az intervallumos beolvasás funkciót. Többoldalas dokumentum beolvasása dokumentumadagolóval (lapbehúzós szkenner) A fő eszköztáron kattintson a Szkenner gombra, majd válassza az ADF (automatikus dokumentumadagoló) lehetőséget. Helyezze az oldalakat a szkenner dokumentumadagolójába, és a Beolvasás gombra kattintva indítsa el a beolvasást.
105
13. fejezet - Többoldalas dokumentumok felismerése
A Felismerés + Mentés gombra kattintva elindítható a dokumentumok felismerése. Ha jelezni akarja, hogy egy dokumentumnak hol van a vége, és hol kezdődik egy másik, szúrjon be egy üres oldalt vagy egy vonalkódos oldalt a két dokumentum közé, és adja meg a Dokumentum feldolgozása beállításokat. További információkat a Dokumentumkötegek szétválasztása fejezetben talál.
Többoldalas dokumentum beolvasása intervallumos beolvasással (síkágyas szkenner) Kattintson a fő eszköztáron a Szkenner gombra. Válassza az Utána következő oldal beolvasása lehetőséget, és a nyílgombokkal adja meg a kívánt várakozási időt. A megadott számú másodperc elteltével a szkenner automatikusan beolvassa a következő oldalt, anélkül hogy minden alkalommal a Beolvasás gombra kellene kattintani. Ha le akarja állítani az automatikus beolvasást, akkor kattintson a Megszakítás gombra az intervallumos beolvasás párbeszédpanelen, vagy nyomja meg a billentyűzeten az ESC billentyűt. Ha fel akarja függeszteni az automatikus beolvasást, akkor kattintson a Szünet gombra az intervallumos beolvasás párbeszédpanelen, vagy nyomja meg a billentyűzeten a szóköz billentyűt. Ha folytatni szeretné, kattintson a Folytatás gombra .
TÖBBOLDALAS DOKUMENTUMOK SZERKESZTÉSE Többoldalas dokumentumok megnyitásakor vagy beolvasásakor a Readiris oldal eszköztárján megjelenik az oldalak miniatűrje. Az oldal eszköztár miniatűrje használható a többoldalas dokumentumok szerkesztésére.
106
ReadirisTM Corporate 12 – Felhasználói útmutató
Egy oldal áthelyezése a dokumentumon belül: Kattintson a jobb gombbal az áthelyezni kívánt oldalra, majd az Oldal kijelölése parancsra. Húzza az oldalt a megfelelő helyre. Másik módszer, hogy kattintson a jobb gombbal az oldalra, majd a Feljebb helyez vagy a Lejjebb helyez parancsra. Oldal törlése: Kattintson a jobb gombbal a törölni kívánt oldalra, majd az Oldal törlése parancsra. Másik módszer, hogy jelölje ki a kívánt oldalt, majd nyomja meg a billentyűzeten a Delete billentyűt.
107
13. fejezet - Többoldalas dokumentumok felismerése
Egy oldal kizárása a felismerésből: Kattintson a jobb gombbal a kizárni kívánt oldalra, majd Az oldal nélkül parancsra. Másik módszer, hogy törölje a jelölést a dokumentumpanelen az oldalszám melletti négyzetből. Az oldal eszköztáron a kizárt oldalak áthúzva jelennek meg.
Az oldalkizárásokat a program figyelmen kívül hagyja a beolvasott képek nyomtatásakor, illetve a beolvasott dokumentumok többoldalas képfájlokba mentésekor.
Tipp: a Minden oldallal és Minden oldal nélkül parancs a Szerkesztés menüben egyidejűleg minden oldalra hatással van.
Egy oldal használata fedőlapként: Kattintson a jobb gombbal a fedőlapként használni kívánt oldalra, majd a Fedőlap parancsra. A miniatűr képe fedőlappá alakul.
108
ReadirisTM Corporate 12 – Felhasználói útmutató
14. FEJEZET BEOLVASOTT KÉPEK FELISMERÉSE NAGY TÉTELBEN KÖTEGELT OCR INDÍTÁSA A Readiris nagy teljesítményű funkciói révén a beolvasott képeket kötegekben is képes felismerni: Kötegelt OCR. A Kötegelt OCR funkció egy adott mappa összes beolvasott képét felismeri. Csak meg kell adni a Readiris szoftvernek, hogy a dokumentumok melyik mappában vannak, el kell indítani az OCR folyamatot, és a dokumentumok a kívánt kimeneti formátumra lesznek konvertálva. Művelet A Kötegelt OCR funkció indítása előtt először adja meg az OCR-beállításokat. Az OCR-beállításokról további információkat a Dokumentumok beolvasása és a Dokumentumok felismerése fejezetben talál.
Kattintson a Fájl menü Kötegelt OCR parancsára. A Kötegelt OCR parancs nem választható, ha a Readiris programban meg van nyitva egy dokumentum. A Kötegelt OCR funkció használata előtt zárjon be minden dokumentumot.
A Tallózás gombokra kattintva válassza ki a képmappát és a szövegmappát. 109
14. fejezet - Beolvasott képek felismerése nagy tételben
Ezek lehetnek eltérő mappák, de ez nem szükségszerű.
A Szöveges formátum gombra kattintva válassza ki a kívánt külső fájlformátumot, és adja meg a beállításait. A formázási beállításokról további információkat a Dokumentumok formázása és mentése fejezetben talál.
A feldolgozási opciók kiválasztása: o Az Almappákban is beállítás hatására a szoftver a képmappa minden almappáját is feldolgozza. Ha a kimeneti mappa és a képmappa nem ugyanaz, akkor a kimeneti mappában is létrejön a képmappa mappastruktúrája. o A Szövegfájlok felülírása beállítás felülírja a korábbi felismerési eredményeket. o A Beolvasások törlése felismerés után beállítás törli a képmappában lévő fájlokat. Az OK gombra kattintva elindítható a felismerés.
110
ReadirisTM Corporate 12 – Felhasználói útmutató
A Readiris feldolgozza a támogatott fájlformátumokban lévő képeket. Az OCR funkció nem korlátozható egy adott fájlformátumra. A felismert dokumentumoknak a program az eredeti képfájlok nevét adja.
FIGYELT MAPPA BEÁLLÍTÁSA A Kötegelt OCR funkció mellett a Readiris ún. Figyelt mappa kezelésére is képes. Ha egy figyelt mappába képfájlt vagy helyez vagy ott lévőt módosít, akkor a Readiris automatikusan feldolgozza. Az OCR program akár több napon át, folyamatosan is futhat. Művelet Figyelt mappa beállítása előtt először adja meg az OCRbeállításokat. Az OCR-beállításokról további információkat a Dokumentumok beolvasása és a Dokumentumok felismerése fejezetben talál.
Kattintson a Fájl menü Figyelt mappa parancsára. A Figyelt mappa parancs nem választható, ha a Readiris programban meg van nyitva egy dokumentum. Figyelt mappa beállítása előtt zárjon be minden dokumentumot.
A Tallózás gombokra kattintva válassza ki a képmappát és a szövegmappát.
111
14. fejezet - Beolvasott képek felismerése nagy tételben
A szövegmappa és a képmappa nem egyezhet meg. Egyik mappa sem lehet a másik almappája.
A Szöveges formátum gombra kattintva válassza ki a kívánt külső fájlformátumot, és adja meg a beállításait. A formázási beállításokról további információkat a Dokumentumok formázása és mentése fejezetben talál.
Az OK gombra kattintva aktiválható a mappa figyelése. A Readiris feldolgozza a támogatott fájlformátumokban lévő képeket. Az OCR funkció nem korlátozható egy adott fájlformátumra. A felismert dokumentumokat a program külső fájlként menti a megadott szövegmappába, és a fájloknak az eredeti képfájlok nevét adja. Felismerés után a képmappából a képek automatikusan törlődnek. Ha nem így lenne, újra meg újra fel kellene dolgoznia őket a programnak.
112
ReadirisTM Corporate 12 – Felhasználói útmutató
15. FEJEZET DOKUMENTUMKÖTEGEK SZÉTVÁLASZTÁSA ÉS INDEXELÉSE DOKUMENTUMKÖTEGEK SZÉTVÁLASZTÁSA Több dokumentum beolvasásakor vagy megnyitásakor feltétlenül jelezni kell a Readiris számára, hogy egy dokumentumnak hol van a vége, és hol kezdődik egy másik. Ezt üres oldalak vagy vonalkódos oldalak segítségével lehet megtenni. Beolvasott dokumentumok szétválasztása Helyezzen be egy üres oldalt vagy egy vonalkódos oldalt a szkenner dokumentumadagolójába, a különböző dokumentumok közé. A fő eszköztáron kattintson a Dokumentumtípus gombra, majd a Dokumentum feldolgozása parancsra. A dokumentumfeldolgozási beállítások a Beállítások menüből is elérhetők.
113
15. fejezet - Dokumentumkötegek szétválasztása és indexelése
A használt elválasztó oldal fajtájától függően válassza az Üres oldalak érzékelése vagy a Vonalkódos fedőlapok érzékelése lehetőséget. A Readiris érzékeli az üres vagy vonalkódos oldalakat, és megjelöli őket fedőlapként. Egy oldal akkor tekinthető üresnek, ha csak zajt tartalmaz. Ha vonalkódokat használ elválasztóként, megadhatja a vonalkódolvasási zónát is (a vonalkód helyét az oldalon), és jelezheti a meghatározott tartalmat, amit a Readiris programnak keresnie kell a vonalkódokban.
114
ReadirisTM Corporate 12 – Felhasználói útmutató
A Beállítások menüben kattintson a Vonalkódok parancsra, és válassza ki, hogy a Readiris milyen vonalkódokat ismerjen fel. A vonalkódokról további információkat a Vonalkódok felismerése fejezetben talál.
Kétoldalas szkenner esetében válassza a Kétoldalas beolvasás lehetőséget. A Readiris figyelmen kívül hagyja a hátoldalakat az üres vagy vonalkódos oldalak keresésekor.
A dokumentumok beolvasásához kattintson a Beolvasás gombra. A beolvasott képeket a Readiris megjeleníti, és az üres oldalak fedőlapként láthatók.
A Felismerés + Mentés gombra kattintva elindítható a dokumentumok feldolgozása. A dokumentumköteget a program szétdarabolja, és külön kimeneti dokumentumokba menti.
A megnyitott dokumentumok kézi szétválasztása A fő eszköztáron kattintson a Megnyitás gombra, majd válassza ki a megnyitni kívánt dokumentumokat. Ha nagy tételben akar dokumentumokat beolvasni, használja a Kötegelt OCR vagy a Figyelt mappa funkciót.
Az oldal eszköztáron megjelennek az oldalak miniatűrjei. Kattintson a jobb gombbal a fedőlapként használni kívánt oldalak miniatűrjére, majd a Fedőlap parancsra. Az oldal eszköztáron az oldal miniatűr képe fedőlappá alakul.
115
15. fejezet - Dokumentumkötegek szétválasztása és indexelése
A Felismerés + Mentés gombra kattintva elindítható a dokumentumok feldolgozása. Alapértelmezés szerint a Kimeneti fájl párbeszédpanelen az Egy fájl létrehozása dokumentumonként beállítás engedélyezett. Ilyenkor a Readiris mindig új kimeneti fájlt hoz létre, ha üres oldalt talál.
A Readiris alapértelmezés szerint elemzi a fedőlapokat is, és hozzáveszi őket a kimeneti fájlhoz. Ha nem akarja, hogy a fedőlapok benne legyenek a kimeneti fájlban, törölje a jelölést a Dokumentum feldolgozása párbeszédpanelen A fedőlapokat is a kimeneti dokumentumokba négyzetből. A Readiris az oldalelemzés használata helyett elrendezési beállításokat is alkalmazhat a fedőlapokra. Az elrendezési beállítások alkalmazásához válassza Az elrendezés alkalmazása minden fedőlapra lehetőséget, és a Tallózás gombra kattintva válassza ki a kívánt elrendezésfájlt. Az elrendezésfájlokról további információkat az Ablakozási sablonok használata fejezetben talál.
DOKUMENTUMKÖTEGEK INDEXELÉSE A dokumentumkötegek szétválasztása mellett a Readiris lehetővé teszi a dokumentumkötegek indexelését is. A Readiris létrehozhat egy olyan XML indexfájlt, amely tartalmazza a feldolgozott dokumentumok és akár az OCR eredmények részletes információit. Az XML indexfájl később programozási célokra felhasználható. A dokumentumindexelés engedélyezése:
116
ReadirisTM Corporate 12 – Felhasználói útmutató
A fő eszköztáron kattintson a Dokumentumtípus gombra, majd a Dokumentum feldolgozása parancsra. A dokumentumfeldolgozási beállítások a Beállítások menüből is elérhetők.
Válassza az Üres oldalak érzékelése vagy a Vonalkódos fedőlapok érzékelése lehetőséget. Egy oldal akkor tekinthető üresnek, ha csak zajt tartalmaz.
117
15. fejezet - Dokumentumkötegek szétválasztása és indexelése
Ha kell, vonalkód esetében adja meg a vonalkód-olvasási zónát is, és/vagy jelezze a meghatározott tartalmat, amit a Readiris programnak keresnie kell. A Beállítások menüben kattintson a Vonalkódok parancsra, és válassza ki, hogy a Readiris milyen vonalkódokat ismerjen fel. A vonalkódokról további információkat a Vonalkódok felismerése fejezetben talál.
Válassza az XML index létrehozása lehetőséget. A megfelelő beállítással a fedőlapokon lévő szöveg is bekerülhet az XML indexbe. Ezek a beolvasási eredmények azonban nem kerülnek be a kimeneti dokumentumba.
Az OK gombra kattintva mentse el a dokumentumfeldolgozási beállításokat. A Felismerés + Mentés gombra kattintva elindítható a dokumentumok feldolgozása. Az XML index a kimeneti dokumentummal azonos mappába lesz mentve. A vonalkódolvasási eredmények az XML indexbe lesznek mentve, nem a kimeneti dokumentumokba. A dokumentumpanel jelzi a felismert vonalkódok értékét.
118
ReadirisTM Corporate 12 – Felhasználói útmutató
16. FEJEZET NYOMTATOTT KÉZÍRÁSOS SZÖVEG FELISMERÉSE A nyomtatott szöveg, a táblázatok, a grafikák és vonalkódok mellett a Readiris a nyomtatott kézírásos szöveget is felismeri. A nyomtatott kézírás különálló nyomtatott nagybetűkből áll.
A nyomtatott kézírásos karakterek felismerésére csak speciális ICR programok (intelligens karakterfelismerés) képesek. Nyomtatott kézírás felismerése: Kattintson a kép eszköztáron a nyomtatott kézírás gombra.
Rajzoljon keretet a nyomtatott kézírásos szöveg köré. Kattintson a fő eszköztáron a Felismerés + Mentés gombra. A program felismeri a teljes dokumentumot, beleértve a nyomtatott kézírásos szöveget is. Megjegyzés: ha a jobb gombbal kattint egy nyomtatott kézírás zónára, és a Másolás szövegként parancsot választja, akkor a nyomtatott kézírásos zóna tartalmát a vágólapra másolhatja.
119
16. fejezet - Nyomtatott kézírásos szöveg felismerése
Felismert szimbólumok A nyomtatott kézírás felismerése funkció a latin ábécé betűit támogatja, továbbá a számokat (0-9), a nagybetűket (A-Z) és a következő jeleket: pont, vessző, pluszjel és kötőjel. Az ékezetes, umlautos és egyéb különleges karaktereket a program nem támogatja.
Megjegyzések A Readiris a nyomtatott kézírást, támogatja, nem a kézírást. További információkat a Nyomtatott kézírás szabályok fejezetben talál.
A nagybetűs karaktereket a felismerés után a program kisbetűs karakterekre cseréli, ha nem a mondat elején állnak. A dokumentumjellemzők közül a nyelv, a betűtípus és a karaktersűrűség nyomtatott kézírás esetében nem számít. Hasonlóképpen nem használható az interaktív tanulás funkció. Az ICR technológia több mint egymillió írásmintán alapul.
NYOMTATOTT KÉZÍRÁS SZABÁLYOK Ahhoz, hogy a Readiris felismerje a kézírást, számos szabályt kell figyelembe venni: Szabályos, kellő távolságra lévő karakterek kellenek.
120
ReadirisTM Corporate 12 – Felhasználói útmutató
Ügyelni kell az A, a G és a Q betű írására.
Vastagon fogó tollat kell használni. A fekete tinta jobb a kéknél. Ne használjon ceruzát.
Az egyéni stílus nem előnyös.
A túlzottan stilizált karakterek növelik a karakterfelismerési hibákat.
Ne hagyjon nyitva zárt hurkokat, és ne zárjon le olyan hurkokat, amelyeknek nyitva kellene lenniük.
Ne legyenek töredékes karakterek.
A többszöri átírás kerülendő.
A többszöri átírás csökkenti a képminőséget és a jelek olvashatóságát. A teljesen kihúzott karaktereket a program kihagyja a felismeréskor.
Az egyeseket helyesen kell leírni. Az 1-es számnak van "angolos" és "európai" írásmódja. Az egyesek lehetnek aláhúzottak vagy nem.
121
16. fejezet - Nyomtatott kézírásos szöveg felismerése
A vízszintes aláhúzásnak nem feltétlenül kell a számot érintenie.
Tipp: ha az eredmény nem a legjobb, használja az I.R.I.S. írólapot, és ahhoz igazítsa az írás stílusát. Az üres I.R.I.S. írólap egy teljes oldalas sablon, amelyet megfelelő méretű nyomtatott nagybetűkkel lehet kitölteni. A lap megtalálható a Readiris CD-ROM lemezen és a Readiris telepítési mappában.
122
ReadirisTM Corporate 12 – Felhasználói útmutató
17. FEJEZET VONALKÓDOK FELISMERÉSE A VONALKÓDOLVASÁS BEMUTATÁSA Amellett, hogy 128 nyelven írt szövegek optikai karakterfelismerésére képes, a Readiris a vonalkódokat is el tudja olvasni. Az indexeléshez használt vonalkódokat fel lehet ismerni kézi és automatikus módon. A program minden gyakoribb vonalkód kódrendszert támogat: Codabar, Code 128, Code 39, Code 39 extended, Code 39 HIBC, Code 93, Datalogic 2/5, Discrete 2/5, EAN-13, EAN-8, Interleaved 2/5, MSI Pharmaceutical, MSI-Plessey, Kodak patch code, PDF417, PostNet, UCC-128, UPC-A és UPC-E.
Megjegyzés: A Readiris csak a lézernyomtatóval vagy tintasugaras nyomtatóval nyomtatott vonalkódokat tudja felismerni. A program nem támogatja a mátrixnyomtatóval nyomtatott vonalkódokat, mert azok nem biztosítanak kellő kontrasztot, és a felbontásuk általában 60 dpi-re korlátozódik. Kézi vonalkódolvasás Állapítsa meg, hogy a Readiris programnak milyen vonalkódokat kell felismernie: 123
17. fejezet - Vonalkódok felismerése
o Kattintson a Beállítások menü Vonalkódok parancsára. o Válassza ki, hogy a Readiris programnak milyen kódrendszert kell felismernie. o Határozza meg, hogy a Readiris ellenőrizze vagy eltávolítsa-e az ellenőrző számjegyeket. A kép eszköztáron kattintson a vonalkód gombra, és rajzoljon keretet a dokumentum vonalkódzónái köré.
Kattintson a fő eszköztáron a Felismerés + Mentés gombra. A program felismeri a teljes dokumentumot, beleértve a vonalkódokat is. Megjegyzés: ha a jobb gombbal kattint egy vonalkódra, és a Másolás adatként parancsot választja, akkor a tartalmát a vágólapra másolhatja.
Automatikus vonalkódolvasás A vonalkódok használhatók egy dokumentumköteg egyes dokumentumainak elválasztóiként. A Readiris automatikusan megtalálja a vonalkódos oldalakat, és megjelöli őket az új dokumentum elejét jelző fedőlapként. Állapítsa meg, hogy a Readiris programnak milyen vonalkódokat kell felismernie: o Kattintson a Beállítások menü Vonalkódok parancsára. o Válassza ki, hogy a Readiris programnak milyen kódrendszert kell felismernie. o Döntse el, hogy a Readiris ellenőrizze vagy eltávolítsa-e az ellenőrző számjegyeket.
124
ReadirisTM Corporate 12 – Felhasználói útmutató
A fő eszköztáron kattintson a Dokumentumtípus gombra, majd a Dokumentum feldolgozása parancsra. A dokumentumfeldolgozási beállítások a Beállítások menüből is elérhetők.
Válassza a Vonalkódos fedőlapok érzékelése lehetőséget. Ha kell, adja meg a vonalkód-olvasási zónát is (a vonalkód helyét az oldalon), és/vagy jelezze a meghatározott tartalmat, amit a Readiris programnak keresnie kell. Megjegyzés: a vonalkódolvasási eredmények XML indexbe is menthetők. Egyszerűen kattintson a kívánt beállításra. Az indexelésről további információkat a Dokumentumkötegek indexelése fejezetben talál.
Az OK gombra kattintva zárja be a dokumentumfeldolgozási beállításokat, majd a dokumentum felismeréséhez kattintson a Felismerés + Mentés gombra. A program felismeri a dokumentumot, beleértve a vonalkódokat is. A vonalkódolvasási eredmények a dokumentumpanelen is megjelennek.
125
ReadirisTM Corporate 12 – Felhasználói útmutató
18. FEJEZET NÉVJEGYKÁRTYÁK FELISMERÉSE A NÉVJEGYKÁRTYA-OLVASÁS BEMUTATÁSA A "szokásos" dokumentumok felismerésén kívül a Readiris névjegykártyákat is fel tud ismerni. A Readiris programmal a névjegykártyák beolvashatók, tartalmuk felismerhető, majd címadatbázisba konvertálható. OCR (optikai karakterfelismerés) program segítségével a névjegykártyák adatai a képből automatikusan kinyerhetők, szerkeszthető szöveggé alakíthatók, majd mezőelemző technológia segítségével a megfelelő adatbázismezőbe helyezhetők. Ez 28 ország esetében működik. A Readiris nemcsak elemzi, de formázni is tudja a felismert szöveget. Az eredményül kapott adatok sokféleképpen felhasználhatók: névjegyek küldése a Microsoft Outlook, a Microsoft Outlook Express, a Lotus Notes vagy a Palm Desktop programnak, elmentésük strukturált fájlba, például vCard formátumba, illetve exportálás bármilyen címadatbázisba. A Readiris az ajánlott IRIS névjegykártya-szkennerekkel működik együtt legjobban. Forduljon az I.R.I.S. céghez, ha további információkra kíváncsi az IRISCard névjegykártyaszkennerekkel kapcsolatban.
127
18. fejezet - Névjegykártyák felismerése
Névjegykártyák felismerése: Kattintson a Dokumentumtípus gombra, majd a Névjegykártyákvagy a Több névjegykártya egyetlen beolvasással lehetőségre. Síkágyas szkennerek esetében válassza az utóbbit. Megjegyzés: a Readiris csak akkor képes kinyerni a különféle névjegykártyák tartalmát, ha a háttér fekete. A háttér feketesége elérhető azzal, ha felnyitott szkennerfedéllel olvassa be a kártyákat. Ha elfelejtette a Több névjegykártya egyetlen beolvasással lehetőséget választani dokumentumtípusként, kattintson a Névjegykártyák kibontása parancsra a Feldolgozás menüben. A program kibontja a beolvasott kép különféle névjegykártyáit.
Névjegykártyák beolvasásakor előbb kattintson a Szkenner gombra, és ellenőrizze, hogy helyesek-e a szkennerbeállítások.
Tipp: a névjegykártyák sikeres felismeréséhez 400–500 dpi beolvasási felbontás ajánlatos.
Alapértelmezés szerint a kellő beállítások engedélyezve vannak: a Readiris automatikusan alkalmazza az Oldalferdeség korrekciója, az Automatikus elforgatás és az Oldalelemzés beállítást. Ha módosítani szeretné a beállításokat, kattintson a Beállítások gombra.
A Megnyitás gombra kattintva nyissa meg a beolvasott névjegykártyát.
128
ReadirisTM Corporate 12 – Felhasználói útmutató
A nyomtatott névjegykártyákat a Beolvasás gombra kattintva olvassa be.
IRISCard pro használata esetén a következő párbeszédpanel jelenik meg. Válassza ki a megfelelő papírméretet, felbontást és képtípust.
Kattintson a Kalibráció gombra, ha a szkennert először használja, és helyezze be a kalibrációs lapot. Válassza ki a megfelelő papírméretet, felbontást és képtípust. A párbeszédpanelen a Beolvasás gombra kattintva olvassa be a névjegykártyát.
A Readiris megjeleníti a kielemzett névjegykártyát.
129
18. fejezet - Névjegykártyák felismerése
Ha kell, módosítsa az ablaktípusokat: kattintson a jobb gombbal a módosítani kívánt ablakra, utána mutasson az Ablak, majd a Típus parancsra. Utána kattintson a helyes ablaktípusra.
Kattintson a földgömb gombra, és válassza ki a megfelelő kártyastílust.
Ajánlatos a névjegykártyákat ország szerint rendezni, mert egyszerre csak egy kártyastílus lehet engedélyezve.
Kattintson a Formázás gombra, és válassza ki a kívánt kimeneti formátumot.
A névjegykártyák elmenthetők vCard, HTML és vesszővel tagolt szöveg formátumban, illetve elküldhetők a Microsoft Outlook, a Microsoft Outlook Express, a Lotus Notes vagy a Palm Desktop programnak.
A Felismerés + Mentés gombra kattintva elindíthatja a szövegfelismerést, és exportálhatja a névjegykártyákat. Az Interaktív tanulás funkció a névjegykártyák olvasásakor is választható. További információkat Az interaktív tanulás használata fejezetben talál.
130
ReadirisTM Corporate 12 – Felhasználói útmutató
TÁRGYMUTATÓ A,Á
D
ablakozási sablonok ............. 58
digitális aláírások.................. 92
ADF ................................... 105
digitális fényképezőgép ........ 40
arab dokumentumok ...8, 12, 64
dokumentumjellemzők ......... 70
automatikus ablakozás ......... 51
dokumentumok küldése emailben ................................. 78
automatikus dokumentumadagoló .......... 105 ázsiai dokumentumok .8, 12, 64 ázsiai kiadás ................8, 12, 64
dokumentumok szétválasztása ............................................ 113 dokumentumpanel ................ 25 dokumentumtípus ................. 33
B beállításfájl......................... 101 beállítások ............................ 34 beállítások betöltése ........... 101 beállítások mentése ............ 101 beolvasott dokumentumok igazítása ............................... 43 betűkészlet szótárak ............. 74 betűtípus............................... 70
dokumentumtulajdonságok ... 77 E,É elforgatás .............................. 34 elrendezésfájlok .................... 58 elrendezési beállítások .......... 80 eltávolítás, Readiris .............. 17 Excel kimenet ....................... 77 F fedőlapok ............................ 108
131
Tárgymutató
fekete-fehér kép ................... 39
héber dokumentumok . 8, 12, 64
felbontás............................... 38
HTML kimenet ..................... 77
felhasználói felület ............... 23
I,Í
felhasználói felület nyelve ... 26
indexelés, dokumentumok .. 116
felhasználói felület nyelvének módosítása ........................... 26
interaktív tanulás .................. 71
felhasználói index készítése . 61 felhasználói lexikonok ......... 67
intervallumos beolvasás...... 106 invertált képek ...................... 40 IRISCard ............................ 127
fényerősség .................... 39, 44 J ferdeségkorrekció ................ 34 figyelt mappák ................... 111
jelszóval védett PDF kimenet .............................................. 91
foltmentesítés ....................... 46
JPEG 2000 tömörítés ............ 99
forrásdokumentum létrehozása újból ..................................... 80 fő eszköztár .......................... 24 G grafikus beállítások .............. 97 Gy gyári beállítások ................. 101
K kalibráció ............................ 129 karaktersűrűség..................... 71 kép eszköztár ........................ 25 kézi ablakozás ...................... 53 kimeneti formátumok ........... 77 kontraszt ......................... 39, 46
gyári beállítások visszaállítása ........................................... 101
kötegelt OCR ...................... 109
gyors binarizálás . 34, 37, 41, 44
közel-keleti kiadás ...... 8, 12, 64
H háttérszín .............................. 81
132
M másodlagos nyelvek ............. 66
ReadirisTM Corporate 12 – Felhasználói útmutató
munkalapok ......................... 83
PDF dokumentumok átalakítása ............................. 93
N névjegykártyák ................... 127 névjegykártyák adatainak kinyerése ............................ 128 numerikus ............................ 65 Ny nyelv .................................... 64 nyomtatott kézírás .......119, 120 O,Ó oldalak ............................... 106 áthelyezés ....................... 107
PDF iHQC kimenet .............. 89 PDF kimenet ................... 77, 87 PDF/A kimenet ..................... 89 pontmátrix ............................ 70 pontosság – sebesség ............ 67 R regisztráció ........................... 18 rendszerkövetelmények ........ 15 RTF kimenet ......................... 77 S
kijelölés .......................... 107
sebesség – pontosság ............ 67
kizárás ............................ 108
SmartTask funkciók ....... 24, 27
törlés............................... 107
sorferdülés ............................ 42
oldalelemzés .................. 34, 51
SpreadsheetML kimenet ....... 77
oldalferdeség korrekciója ..... 34 OpenDocument kimenet ...... 77 P
Sz színes kép ....................... 39, 43 színes képek simítása...... 39, 43
papírméretek ........................ 82
színmód ................................ 39
PDF beállítások .................... 88
szkennerbeállítások .............. 37
PDF dokumentumok aláírása 92
szöveges dokumentumok...... 79 szürkeárnyalatos kép ............ 39
133
Tárgymutató
T
V
táblázatcellák háttérszíne ..... 86
varázsló ................................ 21
táblázatkezelő dokumentumok ............................................. 83
vegyes nyelvek ..................... 66 vonalkódok ......................... 123
táblázatok ............................. 83 W támogatott képformátumok .. 37 telepítés ................................ 16
Word kimenet ....................... 77 WordML kimenet ................. 77
terméktámogatás .................. 18 X több névjegykártya ............. 127 többoldalas dokumentumok ....................................103, 105 többoldalas dokumentumok szerkesztése ....................... 106 U,Ú Unicode kimenet .................. 77
134
XML kimenet ....................... 77 XPS iHQC kimenet .............. 96 XPS kimenet ................... 77, 94 XPS-beállítások .................... 96