tags and all their children from the downloaded HTML. remove_tags_after = None Remove all tags that occur after the specified tag. For the format for specifying a tag see BasicNewsRecipe.remove_tags (stránka 50). For example: remove_tags_after = [dict(id='content')]
will remove all tags after the first element with id=”content”. remove_tags_before = None Remove all tags that occur before the specified tag. For the format for specifying a tag see BasicNewsRecipe.remove_tags (stránka 50). For example: remove_tags_before = dict(id='content')
will remove all tags before the first element with id=”content”. requires_version = (0, 6, 0) Minimum calibre version needed to use this recipe resolve_internal_links = False If set to True then links in downloaded articles that point to other downloaded articles are changed to point to the downloaded copy of the article rather than its original web URL. If you set this to True, you might also need to implement canonicalize_internal_url() (stránka 43) to work with the URL scheme of your particular website. reverse_article_order = False Reverse the order of articles in each feed scale_news_images = None Maximum dimensions (w,h) to scale images to. If scale_news_images_to_device is True this is set to the device screen dimensions set by the output profile unless there is no profile set, in which case it is left at whatever value it has been assigned (default None). scale_news_images_to_device = True Rescale images to fit in the device screen dimensions set by the output profile. Ignored if no output profile is set. simultaneous_downloads = 5 Number of simultaneous downloads. Set to 1 if the server is picky. Automatically reduced to 1 if BasicNewsRecipe.delay (stránka 48) > 0 summary_length = 500 Max number of characters in the short description
template_css = u’\n .article_date {\n color: gray; font-family: monospace;\n }\n\n .article_description {\n text-indent: 0 The CSS that is used to style the templates, i.e., the navigation bars and the Tables of Contents. Rather than overriding this variable, you should use extra_css in your recipe to customize look and feel. timefmt = ‘ [%a, %d %b %Y]’ The format string for the date shown on the first page. By default: Day_Name, Day_Number Month_Name Year timeout = 120.0 Timeout for fetching files from server in seconds title = u’Nezn\xe1m\xfd zdroj zpr\xe1v’ The title to use for the ebook
1.2. Pˇridávání oblíbených webových stránek se zprávami
51
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
use_embedded_content = None Normally we try to guess if a feed has full articles embedded in it based on the length of the embedded content. If None, then the default guessing is used. If True then the we always assume the feeds has embedded content and if False we always assume the feed does not have embedded content. use_javascript_to_login = False If you set this True, then calibre will use javascript to login to the website. This is needed for some websites that require the use of javascript to login. If you set this to True you must implement the javascript_login() (stránka 45) method, to do the actual logging in.
1.3 Prohlížecˇ e-knih calibre obsahuje vestavˇený prohlížeˇc e-knih, který umí zobrazit všechny hlavní formáty e-knih. Prohlížeˇc je vysoce pˇrizp˚usobitelný a má mnoho pokroˇcilých funkcí. • • • • •
Spuštˇení prohlížeˇce (stránka 52) Navigace v e-knize (stránka 52) Pˇrizp˚usobení vzhledu a chování vašeho zážitku ze cˇ tení (stránka 55) Vyhledávání ve slovníku (stránka 55) Kopírování textu a obrázk˚u (stránka 55)
ˇ prohlížece ˇ 1.3.1 Spuštení Jakoukoliv z knih ve své knihovnˇe calibre m˚užete zobrazit výbˇerem knihy a stisknutím tlaˇcítka Zobrazit. To otevˇre knihu v prohlížeˇci e-knih. M˚užete také spustit samotný prohlížeˇc z nabídky Start ve Windows nebo pomocí pˇríkazu ebook-viewer v Linuxu a OS X (nejdˇríve musíte nainstalovat nástroje pˇríkazového ˇrádku pˇrejitím na Pˇredvolby>Rozšíˇrené->R˚uzné).
1.3.2 Navigace v e-knize
V knize m˚užete “otáˇcet stránky” pomocí tlaˇcítek Další stránka a Pˇredchozí stránka , nebo stisknutím kláves Page Down a Page Up. Na rozdíl od vˇetšiny prohlížeˇcu˚ e-knih vás calibre nenutí prohlížet knihy v režimu stránek. M˚užete posouvat po množstvích menších než stránka pomocí posuvníku nebo r˚uzných pˇrizp˚usobitelných klávesových zkratek. Záložky Když jste uprostˇred knihy a zavˇrete prohlížeˇc, zapamatuje si, kde jste pˇrestali cˇ íst, a vrátí se tam, když pˇríštˇe otevˇrete
knihu. M˚užete také nastavit záložky v knize pomocí tlaˇcítka Záložka . Pˇri prohlížení knih ve formátu EPUB jsou tyto záložky skuteˇcnˇe ukládány do samotného souboru EPUB. M˚užete pˇridat záložky, a pak odeslat soubor pˇrátel˚um. Když otevˇrou soubor, uvidí vaše záložky. 52
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Obsah
Pokud kniha, kterou cˇ tete, definuje obsah, m˚užete k nˇemu pˇristoupit stisknutím tlaˇcítka Obsah seznam oddíl˚u v knize. M˚užete kliknout na kterýkoliv z nich pro pˇrejití na tuto cˇ ást knihy.
. To zobrazí
Navigace podle místa E-knihy, na rozdíl od papírových knih, nemají žádný koncept stránek. Namísto toho když cˇ tete knihu, všimnete si, že je . To je jak vaše aktuální vaše pozice v knize zobrazena v levém horním rohu v poli, jako je toto pozice, tak celková délka knihy. Tato cˇ ísla jsou nezávislá na velikosti obrazovky a písma, ve kterých zobrazujete knihu, a hrají podobnou roli, jako cˇ ísla stránek v papírové knize. M˚užete zadat, kterékoliv cˇ íslo chcete, abyste pˇrešli na odpovídající místo v knize.
. calibre má také velice šikovný režim odkaz˚u. M˚užete ho zapnout kliknutím na tlaˇcítko Režim odkaz˚u Jakmile to udˇeláte, pokaždé, když pohnete myší nad odstavcem, calibre zobrazí jedineˇcné cˇ íslo složené z cˇ ísel oddílu a odstavce.
1.3. Prohlížecˇ e-knih
53
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Toto cˇ íslo m˚užete použít pro jednoznaˇcné odkazy na cˇ ásti knih, když o nich diskutujete s pˇráteli, nebo na nˇe odkazujete v jiných pracích. Tato cˇ ísla m˚užete zadat do pole oznaˇceného Pˇrejít na... v horní cˇ ásti okna pro pˇrejití na konkrétní místo odkazu. Pokud kliknete na odkazy uvnitˇr e-knihy, aby vás pˇrenesli na r˚uzné cˇ ásti knihy, jako je vysvˇetlivka, m˚užete použít tlaˇcítka Zpˇet a Vpˇred v levém horním rohu pro návrat tam, kde jste byli. Tato tlaˇcítka se chovají stejnˇe jako ta v internetovém prohlížeˇci.
54
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
ˇ 1.3.3 Pˇrizpusobení ˚ vzhledu a chování vašeho zážitku ze ctení
M˚užete zmˇenit velikosti písem za chodu pomocí tlaˇcítek velikosti písma
na celou obrazovku stisknutím tlaˇcítka Pˇrepnout na celou obrazovku
. M˚užete také pˇrepnout prohlížeˇc
. Kliknutím na tlaˇcítko Pˇredvolby
m˚užete zmˇenit výchozí písma použitá prohlížeˇcem na taková, která se vám líbí, stejnˇe jako výchozí velikost písma po spuštˇení prohlížeˇce. Pokroˇcilejší pˇrizp˚usobení m˚uže být dosaženo nastavením uživatelské šablony styl˚u. To je šablona styl˚u, kterou m˚užete nastavit, aby se použila na každou knihu. Pomocí ní m˚užete dˇelat vˇeci, jako jsou bílý text na cˇ erném pozadí, zmˇena styl˚u odstavce, zarovnání textu do bloku atd. Pro pˇríklady vlastních šablon styl˚u používaných uživateli calibre navštivte fórum23 .
1.3.4 Vyhledávání ve slovníku Význam slov v aktuální knize m˚užete vyhledat oznaˇcením slova pˇretažením myší, pak kliknutím pravým tlaˇcítkem myši a výbˇerem Vyhledat ve slovníku. calibre používá pro vyhledání slov veˇrejnˇe dostupný server slovníku na dict.org. Definice je zobrazena v malém poli ve spodní cˇ ásti obrazovky.
1.3.5 Kopírování textu a obrázku˚ Text a obrázky m˚užete vybrat pˇretažením obsahu myší a potom kliknutím pravým tlaˇcítkem myši na Kopírovat. Zkopírovaný materiál m˚uže být vložen do jiné aplikace jako prostý text a obrázky.
1.4 Pˇrevod e-knihy Calibre má systém pˇrevodu, který je navržen tak, aby se velmi snadno používal. Obyˇcejnˇe staˇcí pˇridat knihu do Calibre, kliknout na pˇrevod a Calibre se pokusí vygenerovat výstup, který je co nejpodobnˇejší vstupu. Calibre však pˇrijímá velké množství vstupních formát˚u, z nichž ne všechny jsou stejnˇe vhodné jako jiné pro pˇrevod na e-knihy. V pˇrípadˇe takových vstupních formát˚u, nebo pokud pouze chcete vˇetší kontrolu nad systémem pˇrevodu, Calibre má mnoho voleb pro jemné ladˇení procesu pˇrevodu. Pamatujte však, že systému pˇrevodu Calibre není náhradou za plnohodnotný editor e-knih. Pro úpravu e-knih je doporuˇcuji nejdˇríve pomocí Calibre pˇrevést do formátu EPUB nebo AZW3, a pak použít funkci Upravit knihu, abyste je dostali do dokonalé podoby. Pak m˚užete použít upravenou e-knihu jako vstup pro pˇrevod do jiných formát˚u v Calibre. This document will refer mainly to the conversion settings as found in the conversion dialog, pictured below. All these settings are also available via command line interface to conversion, documented at ebook-convert (stránka 245). In calibre, you can obtain help on any individual setting by holding your mouse over it, a tooltip will appear describing the setting. 23
http://www.mobileread.com/forums/showthread.php?t=51500
1.4. Pˇrevod e-knihy
55
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Obsah • • • • • • • • • • •
Úvod (stránka 56) Vzhled a chování (stránka 58) Nastavení stránky (stránka 60) Heuristické zpracování (stránka 61) Hledat a nahradit (stránka 62) Rozpoznávání struktury (stránka 62) Obsah (stránka 63) Požití obrázku jako názvu kapitol pˇrí konverzi HTML vstupních dokument˚u (stránka 65) Používání atribut˚u znaˇcek pro dodání textu pro položky v obsahu (stránka 65) Jak jsou volby nastaveny nebo uloženy pro pˇrevod (stránka 65) Format specific tips (stránka 66)
1.4.1 Úvod První vˇec, kterou musíte pochopit o systému pˇrevodu, je to, že je navržen jako ˇretˇezec. Schematicky to vypadá takto:
56
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Vstupní formát se nejdˇríve pˇrevede na XHTML vhodným vstupním modulem. Toto HTML se pak transformuje. V posledním kroku se zpracované XHTML pˇrevede na zadaný výstupní formát vhodným výstupním modulem. Výsledky pˇrevodu se mohou znaˇcnˇe lišit v závislosti na vstupním formátu. Nˇekteré formáty se pˇrevádˇejí mnohem lépe než ostatní. Seznam nejlepších zdrojových formát˚u pro pˇrevod je dostupný zde (stránka 106). Transformace, které se provádˇejí na výstupu XHTML, je místo, kde se odehrává veškerá práce. Existují r˚uzné transformace, napˇríklad pro vložení metadat knihy jako stránky na zaˇcátek knihy, pro rozpoznání nadpis˚u kapitol a automatického vytvoˇrení obsahu, pro proporcionální zmˇenu velikosti písma a tak dále. Je d˚uležité si zapamatovat, že všechny transformace se provádˇejí na výstupním XHTML pomocí vstupního modulu, ne na samotném vstupním souboru. Takže napˇríklad když požádáte Calibre, aby pˇrevedlo soubor RTF na EPUB, tak bude nejdˇríve vnitˇrnˇe pˇreveden na XHTML, na toto XHTML budou použity r˚uzné transformace, a pak výstupní modul vytvoˇrí soubor EPUB, automaticky vygeneruje všechna metadata, obsah a tak dále.
1.4. Pˇrevod e-knihy
57
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Tento proces m˚užete vidˇet v akci použitím volby ladˇení
. Staˇcí zadat cestu k adresáˇri pro výstup ladˇení.
ˇ ri Bˇehem pˇrevodu Calibre umístí XHTML generované r˚uznými fázemi pˇrevodního ˇretˇezce do r˚uzných podadresáˇru˚ . Ctyˇ podadresáˇre jsou: Tabulka 1.2: Fáze pˇrevodního ˇretˇezce Adresáˇr vstup analyzováno struktura zpracováno
Popis Obsahuje výstup HTML ze vstupního modulu. Použijte pro ladˇení vstupního modulu. Výsledek pˇredzpracování a pˇrevodu na XHTML výstupu ze vstupního modulu. Použijte pro ladˇení rozpoznávání struktury. Po rozpoznání struktury, ale pˇred vyhlazením CSS a pˇrevodem velikosti písma. Použijte pro ladˇení pˇrevodu velikosti písma a transformace CSS. Tˇesnˇe pˇred tím, než je e-kniha pˇredána výstupnímu modulu. Použijte pro ladˇení výstupního modulu.
Pokud chcete trochu upravit vstupní dokument pˇred tím, než ho necháte Calibre pˇrevést, to nejlepší, co m˚užete udˇelat, je upravit soubory v podadresáˇri vstup, pak je zazipovat a použít soubor zip jako vstupní formát pro následující pˇrevody. Abyste to udˇelali, použijte dialogové okno Upravit metadata pro pˇridání souboru zip jako formátu pro knihu, a pak v levém horním rohu dialogového okna pˇrevodu vyberte ZIP jako vstupní formát. Tento dokument se bude zabývat hlavnˇe r˚uznými transformacemi, které pracují na polotovaru XHTML, a jak je ovládat. Na konci je nˇekolik konkrétních tip˚u pro každý vstupní nebo výstupní formát.
1.4.2 Vzhled a chování Obsah • • • •
Úprava mˇerˇítka velikosti písma (stránka 58) Mezery mezi odstavci (stránka 59) Dodateˇcné CSS (stránka 60) R˚uzné (stránka 60)
Tato skupina voleb urˇcuje r˚uzné aspekty vzhledu a chování pˇrevedené e-knihy. ˇ rítka velikosti písma Úprava meˇ Jedna z nejhezˇcích funkcí pˇri cˇ tení e-knih je schopnost snadno upravit velikost písma, aby vyhovovalo jednotlivým potˇrebám a svˇetelným podmínkám. Calibre má propracované algoritmy, aby zajistilo, že všechny produkované knihy mají jednotné velikosti písma, bez ohledu na to, jaké velikosti písma jsou zadány ve vstupním dokumentu. Základní velikost písma dokumentu je nejbˇežnˇejší velikost písma v tomto dokumentu, t. j. velikost vˇetší cˇ ásti textu v tomto dokumentu. Když zadáte Základní velikost písma, Calibre automaticky pˇrimˇeˇrenˇe zmˇení mˇeˇrítko všech velikostí písma v dokumentu, takže nejbˇežnˇejší velikost písma se stane zadanou základní velikostí písma a ostatním velikostem písma bude pˇrimˇeˇrenˇe upraveno mˇeˇrítko. Výbˇerem vˇetší základní velikosti písma m˚užete písma v dokumentu zvˇetšit a naopak. Když nastavíte základní velikost písma, mˇeli byste pro dosažení nejlepších výsledk˚u také nastavit klíˇc velikosti písma. Obyˇcejnˇe Calibre automaticky zvolí základní velikost písma vhodnou pro výstupní profil, který jste zvolili (viz Nastavení stránky (stránka 60)). Toto však zde m˚užete pˇrepsat, pokud pro vás výchozí nastavení není vhodné.
58
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
Volba Klíˇc velikosti písma vám umožˇnuje urˇcit, jak se mˇení nezákladní velikosti písma. Algoritmus zmˇeny velikosti písma funguje pomocí klíˇce velikosti písma, což je jednoduše cˇ árkami oddˇelený seznam velikostí písma. Klíˇc velikost písma ˇríká Calibre, o kolik “krok˚u” vˇetší nebo menší by mˇela daná velikost písma být v porovnání s základní velikostí písma. Pˇredpokládá se, že by v dokumentu mˇel být omezený poˇcet velikostí písma. Napˇríklad jedna velikost pro základní text, nˇekolik velikostí pro r˚uzné úrovnˇe nadpis˚u a nˇekolik velikostí pro horní nebo dolní indexy a poznámky pod cˇ arou. Klíˇc velikosti písma umožˇnuje Calibre rozˇclenit velikosti písma ve vstupních dokumentech do samostatných “koš˚u” odpovídajících r˚uzným logickým velikostem písem. Vysvˇetleme si to na pˇríkladu. Pˇredpokládejme, že zdrojový dokument, který pˇrevádíme, byl vytvoˇren nˇekým s vynikajícím zrakem a má základní velikost písma 8pt. To znamená, že vˇetší cˇ ást textu v dokumentu má velikost 8pt, zatímco nadpisy jsou o nˇeco vˇetší (ˇreknˇeme 10 a 12pt) a poznámky pod cˇ arou o nˇeco menší 6pt. Takže pokud použijeme následující nastavení: Base font size : 12pt Font size key : 7, 8, 10, 12, 14, 16, 18, 20
výstupní dokument bude mít základní velikost písma 12pt, nadpisy 14 a 16pt a poznámky pod cˇ arou 8pt. Nyní pˇredpokládejme, že chceme, aby nejvˇetší velikost nadpisu více vyˇcnívala a také aby poznámky pod cˇ arou byly trochu vˇetší. Abychom toho dosáhli, klíˇc písma by mˇel být zmˇenˇen na: New font size key : 7, 9, 12, 14, 18, 20, 22
Nejvˇetší nadpisy budou mít nyní 18pt, zatímco poznámky pod cˇ arou budou mít 9pt. M˚užete si hrát s tímto nastavením, abyste se pokusili zjistit, co by pro vás bylo nejlepší pomocí pr˚uvodce zmˇeny mˇeˇrítka písma, který m˚užete otevˇrít kliknutím na malé tlaˇcítko vedle nastavení Klíˇc velikosti písma. M˚uže tu být také zakázána veškerá zmˇena velikosti písma v pˇrevodu, pokud chcete zachovat velikost písma ve vstupním dokumentu. Související nastavení je Výška rˇádku. Výška ˇrádku urˇcuje svislou výšku ˇrádk˚u. Ve výchozím nastavení (výška ˇrádku 0) se neprovádí žádná manipulace s výškami ˇrádk˚u. Pokud zadáte nevýchozí hodnotu, budou výšky ˇrádk˚u nastaveny na všech místech, které nemají urˇcenu vlastní výšky ˇrádk˚u. Toto je však taková tupá zbraˇn a mˇelo by to být používáno šetrnˇe. Pokud chcete upravit výšky ˇrádk˚u pro nˇejaký oddíl vstupu, je lepší použít Dodateˇcné CSS (stránka 60). Mezery mezi odstavci Obyˇcejnˇe jsou odstavce v XHTML vykresleny s prázdným ˇrádkem mezi nimi a bez úvodního odsazení textu. Calibre má pár voleb, jak toto urˇcit. Odebrat mezery mezi odstavci vynutí zajištˇení, aby všechny odstavce nemˇely žádné vnitˇrní mezery mezi odstavci. Nastaví také odsazení textu na 1,5em (m˚uže být zmˇenˇeno) pro oznaˇcení zaˇcátku každého odstavce. Vložit prázdný rˇádek dˇelá opak, což zaruˇcuje, že je právˇe jeden prázdný ˇrádek mezi každou dvojicí odstavc˚u. Obˇe tyto volby jsou velice ucelené, odebírají mezery nebo je vkládají pro všechny odstavce (technicky vzato znaˇcky
a
). Je to proto, abyste mohli jen nastavit volbu a být si jistí, že se to provede tak, jak bylo ohlášeno bez ohledu na to, jak je neuspoˇrádaný vstupní soubor. Jedinou výjimkou je pˇrípad, kdy vstupní soubor používá pevné konce ˇrádk˚u pro doplnˇení mezer mezi odstavce. Pokud chcete odebrat mezery mezi všemi odstavci kromˇe pár vybraných, nepoužívejte tyto volby. Místo toho pˇridejte následující kód CSS do Dodateˇcné CSS (stránka 60): p, div { margin: 0pt; border: 0pt; text-indent: 1.5em } .spacious { margin-bottom: 1em; text-indent: 0pt; }
Pak ve zdrojovém dokumentu oznaˇcte odstavce, které potˇrebují mezery class=”spacious”. Pokud váš vstupní dokument není v HTML, použijte volbu ladˇení popsanou v Úvodu, abyste získali HTML (použijte podadresáˇr input).
1.4. Pˇrevod e-knihy
59
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
ˇ Dodatecné CSS Tato volba vám umožˇnuje zadat libovolné CSS, které bude použito na všechny soubory HTML na vstupu. Toto CSS je použito s velice vysokou prioritou, a proto by mˇelo pˇrepsat vˇetšinu CSS pˇrítomného v samotném vstupním dokumentu. Toto nastavení m˚užete použít pro jemné ladˇení prezentace nebo rozložení dokumentu. Napˇríklad pokud chcete, aby všechny odstavce tˇrídy endnote byly zarovnány vpravo, staˇcí pˇridat: .endnote { text-align: right }
nebo pokud chcete zmˇenit odsazení všech odstavc˚u: p { text-indent: 5mm; }
Dodateˇcné CSS je velice výkonná volba, ale potˇrebujete pochopit, jak CSS funguje, pro použití jejího plného potenciálu. M˚užete použít volbu ladˇení ˇretˇezce popsanou výše, abyste vidˇeli, jaké CSS je pˇrítomné ve vstupním dokumentu. Ruzné ˚ V tomto oddílu je nˇekolik dalších voleb. Žádné zarovnání textu Obyˇcejnˇe, pokud to výstupní formát podporuje, Calibre vynutí, aby výstupní e-kniha mˇela zarovnaný text (tj. hladký pravý okraj). Tato volba vypne toto chování, v takovém pˇrípadˇe bez ohledu na zarovnání zadané ve vstupním dokumentu bude použito namísto toho. Pˇrevést tabulky na rˇádky Nˇekteré chybnˇe navržené dokumenty používají tabulky pro ovládání rozložení textu na stránce. Pˇri pˇrevodu mají tyto dokumenty cˇ asto text, který vybíhá mimo stránku a jiné artefakty. Tato volba extrahuje obsah z tabulek a zobrazí ho v lineárním tvaru. Pamatujte, že tato volba pˇrevede na ˇrádky všechny tabulky, takže ji používejte, pouze pokud jste si jisti, že vstupní dokument nepoužívá tabulky pro oprávnˇené úˇcely, jako je zobrazení tabulkových informací. Pˇrekódovat znaky unicode Pˇrekódovat znaky unicode do zastoupení ASCII. Používejte opatrnˇe, protože to nahradí znaky unicode za ASCII. Napˇríklad to nahradí “Михаил Горбачёв” za “Michail Gorbaˇcov”. Také pamatujte, že v pˇrípadech, kdy je více zastoupení znak˚u (napˇríklad znaky spoleˇcné pro cˇ ínštinu a japonštinu), bude použito zastoupení používané nejvˇetším poˇctem lidí (napˇríklad cˇ ínština v pˇredchozím). Tato volba je hlavnˇe užiteˇcná, pokud se chystáte zobrazit e-knihu na zaˇrízení, které nemá podporu unicode. Vstupní kódování znaku˚ Starší dokumenty nˇekdy nezadávají své kódování znak˚u. Pˇri pˇrevodu to m˚uže vést k neanglické znak˚um nebo speciálním znak˚um, jako je poškození chytrých uvozovek. Calibre zkouší automaticky rozpoznat kódování znak˚u zdrojového dokumentu, ale není vždy úspˇešné. Pomocí tohoto nastavení m˚užete vynutit pˇredpokládání konkrétního kódování znak˚u. cp1252 je bˇežné kódování pro dokumenty vytvoˇrené pomocí softwaru Windows. Mˇeli byste si také pˇreˇcíst How do I convert my file containing non-English characters, or smart quotes? (stránka 106) pro více informací o problematice kódování.
1.4.3 Nastavení stránky Volby Nastavení stránky jsou pro ovládání rozložení obrazovky, jako jsou okraje a velikosti obrazovky. Existují volby pro nastavení okraj˚u stránky, které budou použity Výstupním modulem, pokud vybraný Výstupní formát podporuje okraje stránky. Kromˇe toho byste mˇeli vybrat Vstupní profil a Výstupní profil. Obˇe sady profil˚u se v podstatˇe zabývají tím, jak interpretovat rozmˇery ve vstupních a výstupních dokumentech, velikosti obrazovky a klíˇce úpravy mˇeˇrítka výchozího písma. Pokud víte, že soubor, který pˇrevádíte, byl zamýšlen k použití na konkrétním zaˇrízení nebo softwarové platformˇe, zvolte odpovídající vstupní profil, jinak prostˇe zvolte výchozí vstupní profil. Pokud víte, že soubory, které vytváˇríte, jsou urˇceny pro konkrétní typ zaˇrízení, zvolte odpovídající výstupní profil. Zejména pro výstupní soubory MOBI byste mˇeli zvolit Kindle, pro LIT cˇ teˇcku Microsoft a pro EPUB cˇ teˇcku Sony. V pˇrípadˇe EPUB bude mít profil cˇ teˇcky Sony za výsledek soubory EPUB, které budou fungovat všude. Má to však nˇekteré vedlejší úˇcinky, jako je umˇelé vkládání
60
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
konc˚u oddíl˚u pro zachování vnitˇrních souˇcástí pod mezní hodnotou velikosti, což je vyžadování pro zaˇrízení SONY. Zvláštˇe pro telefony iPhone nebo Android zvolte vyberte výstupní profil SONY. Pokud víte, že vaše soubory EPUB nebudou cˇ teny na SONY nebo podobném zaˇrízení, použijte výchozí výstupní profil. Pokud vytváˇríte soubory MOBI, které nejsou zamýšleny pro Kindle, zvolte výstupní profil knih Mobipocket. Výstupní profil také urˇcuje velikost obrazovky. To napˇríklad zp˚usobí, že v nˇekterých výstupních formátech bude u obrázk˚u automaticky zmˇenˇena velikost, aby se pˇrizp˚usobily obrazovce. Takže zvolte profil zaˇrízení, které má podobnou velikost obrazovky vašemu zaˇrízení.
1.4.4 Heuristické zpracování Heuristické zpracování poskytuje celou ˇradu funkcí, které mohou být použity pro pokus o rozpoznání a opravu bˇežných problém˚u ve špatnˇe formátovaných vstupních dokumentech. Použijte tyto funkce, pokud váš vstupní dokument trpí špatným formátování Protože tyto funkce spoléhají na bˇežné vzory, uvˇedomte si, že v nˇekterých pˇrípadech m˚uže volba vést k horším výsledk˚um, tak to používejte opatrnˇe. Napˇríklad nˇekolik z tˇechto voleb odebere všechny entity pevných mezer, nebo mohou zahrnovat falešnˇe pozitivní shody souvisejících s funkcí. Povolit heuristické zpracování Tato volba aktivuje fázi heuristického zpracování pˇrevodního ˇretˇezce Calibre. Musí to být povoleno, aby byly použity r˚uzné dílˇcí funkce. Zrušit zalomení rˇádku˚ Povolení této volby zp˚usobí, že se Calibre pokusí rozpoznat a opravit tvrdé pevné konce rˇádk˚u existujících v dokumentu pomocí interpunkˇcních vodítek a délky ˇrádku. Calibre se nejdˇríve pokusí rozpoznat, zda pevné konce ˇrádk˚u existují, pokud se zdá, že neexistují, Calibre se nepokusí zrušit zalomení ˇrádk˚u. Koeficient zrušení zalomení ˇrádku m˚uže být zmenšen, pokud chcete ‘vynutit’, aby Calibre zrušilo zalomení ˇrádk˚u. Koeficient zrušení zalomení rˇádku Tato volba urˇcuje algoritmus, který Calibre používá k odebrání pevných konc˚u ˇrádk˚u. Napˇríklad pokud je hodnota této volby 0,4, znamená to, že Calibre odebere pevné konce ˇrádk˚u z konc˚u ˇrádk˚u, jejichž délky jsou menší než délka 40 % všech ˇrádk˚u v dokumentu. Pokud má váš dokument pouze nˇekolik konc˚u ˇrádk˚u, které potˇrebují opravu, pak by tato hodnota mˇela být snížena nˇekam mezi 0,1 a 0,2. Rozpoznat a oznaˇcit neformátované nadpisy a podnadpisy kapitol Pokud váš dokument neobsahuje nadpisy kapitol a názvy formátované odlišnˇe od zbytku textu, Calibre m˚uže použít tuto volbu, aby se je pokusilo rozpoznat a obklopit je znaˇckami nadpis˚u. Znaˇcky
se používají pro nadpisy kapitol; znaˇcky se používají pro jakékoliv rozpoznané názvy. Tato funkce nevytvoˇrí obsah, ale v mnoha pˇrípadech zp˚usobí, že výchozí nastavení rozpoznání kapitol Calibre správnˇe rozpozná kapitoly a sestaví obsah. Upravte XPath v Rozpoznávání struktury, pokud není obsah automaticky vytvoˇren. Pokud v dokumentu nejsou použity žádné další nadpisy, pak nastavení “//h:h2” v Rozpoznávání struktury bude nejsnadnˇejší zp˚usob, jak vytvoˇrit obsah pro dokument. Tyto vložené nadpisy nejsou naformátovány, pro použití formátování použijte volbu Dodateˇcné CSS pod Vzhledem a chováním v nastavení pˇrevodu. Napˇríklad pro znaˇcky zarovnání nadpis˚u na stˇred použijte následující: h2, h3 { text-align: center }
Pˇreˇcíslovat sekvence znaˇcek nebo Nˇekteˇrí vydavatelé formátují nadpisy kapitol pomocí více znaˇcek nebo postupnˇe. Výchozí nastavení pˇrevodu Calibre zp˚usobí, že takové nadpisy budou rozdˇeleny na dvˇe cˇ ásti. Tato volba pˇreˇcísluje znaˇcky nadpis˚u, aby se zabránilo rozdˇelení. Odstranit prázdné rˇádky mezi odstavci Tato volba zp˚usobí, že Calibre analyzuje prázdné rˇádky obsažené v dokumentu. Pokud je každý odstavec proložený prázdným ˇrádkem, pak Calibre odebere všechny tyto prázdné odstavce. Sekvence více prázdných ˇrádk˚u budou považovány za pˇrerušení pˇríbˇehu a budou zachovány jako jeden odstavec. Tato volba se liší od volby ‘Odebrat mezery mezi odstavci’ pod ‘Vzhled a chování’ v tom, že skuteˇcnˇe mˇení obsah HTML, zatímco druhá volba mˇení styly dokumentu. Tato volba m˚uže také odebrat odstavce, které byly vloženy pomocí volby Calibre ‘Vložit prázdný ˇrádek’. Zajistit konzistentní formátování pˇrerušení pˇríbˇehu Pomocí této volby se Calibre pokusí rozpoznat bˇežné znaˇcky pˇrerušení pˇríbˇehu a zajistit, aby byly zarovnané na stˇred. Znaˇckám ‘mˇekkého’ pˇrerušení pˇríbˇehu, tj. pˇrerušení
1.4. Pˇrevod e-knihy
61
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
pˇríbˇehu definované pouze dodateˇcnými prázdnými znaky, jsou zmˇenˇeny styly, aby se zajistilo, že nebudou zobrazeny ve spojení s konci stránek. Nahradit pˇrerušení pˇríbˇehu Pokud je tato volba konfigurována, pak Calibre nahradí znaˇcky pˇrerušení pˇríbˇehu, které najde, nahrazovacím textem zadaným uživatelem. Pamatujte, prosím, že nˇekteré ozdobné znaky nemusí být podporovány na všech cˇ tecích zaˇrízení. Obecnˇe byste se mˇeli vyhnout používání znaˇcek HTML, Calibre zahodí jakékoliv znaˇcky a použije pˇredem definované znaˇcení. Znaˇcky
, tj. vodorovné cˇ áry, a znaˇcky jsou výjimky. Vodorovné cˇ áry mohou být volitelnˇe zadány styly, pokud se rozhodnete pˇridat vlastní styl, nezapomeˇnte zahrnout nastavení šíˇrky ‘width’, jinak bude informace stylu zahozena. M˚užete použít znaˇcky obrázk˚u, ale Calibre neposkytuje možnost pˇridat obrázek bˇehem pˇrevodu, to musí být provedeno po faktickém použití funkce ‘Upravit knihu’. Pˇríklad znaˇcky obrázku (po pˇrevodu umístí obrázek do složky ‘Images’ uvnitˇr souboru epub ): Pˇríklad vodorovné cˇ áry se styly:
Odebrat nadbyteˇcné spojovníky Calibre analyzuje veškerý obsah rozdˇelený spojovníky v dokumentu, když je tato volba povolena. Samotný dokument je použit jako slovník pro analýzu. To umožˇnuje Calibre pˇresnˇe odebrat spojovníky pro jakákoliv slova v dokumentu v jakémkoliv jazyce, spoleˇcnˇe s vymyšlenými a neznámými vˇedeckými slovy. Primární nevýhodou je, že slova objevující se v dokumentu pouze jednou nebudou zmˇenˇena. ˇ Analýza probíhá ve dvou pr˚uchodech, první pr˚uchod analyzuje konce ˇrádk˚u. Rádk˚ um je zrušeno zalomení, pouze pokud v dokumentu slovo existuje s nebo bez spojovníku. Druhý pr˚uchod analyzuje všechna slova rozdˇelená spojovníky v celém dokumentu, spojovníky jsou odebrány, pokud slovo existuje nˇekde jinde v dokumentu bez shody. Pˇrevést na kurzívu obecná slova a vzory Pokud je povoleno, bude Calibre hledat obecná slova a vzory, které oznaˇcují kurzívu a pˇrevede je na kurzívu. Pˇríkladem jsou obecné textové zásady, jako je ~slovo~, nebo fráze, které by obecnˇe mˇely být kurzívou, napˇr. latinské fráze, jako jsou ‘etc.’ nebo ‘et cetera’. Nahradit odsazení entitami pomocí odsazeními CSS Nˇekteré dokumenty používají zásadu definování odsazení textu pomocí entit pevných mezer. Když je tato volba povolena, Calibre se pokusí rozpoznat tento druh formátování a pˇrevést je na 3% odsazení textu pomocí CSS.
1.4.5 Hledat a nahradit Tyto volby jsou užiteˇcné pˇredevším pro pˇrevody dokument˚u PDF nebo pˇrevody OCR, i když mohou být také použity pro opravu mnoha konkrétních problém˚u dokument˚u. Napˇríklad nˇekteré pˇrevody mohou zanechat záhlaví a zápatí stránek v textu. Tyto volby používají regulární výrazy, aby se pokusily rozpoznat záhlaví, zápatí nebo jiný libovolný text a odebrat ho nebo nahradit. Nezapomeˇnte, že pracují s polotovarem XHTML vytvoˇreným pˇrevodním ˇretˇezcem. K dispozici je pr˚uvodce, aby vám pomohl pˇrizp˚usobit regulární výrazy pro váš dokument. Kliknˇete na kouzelnou h˚ulku vedle pole výrazu a kliknˇete na tlaˇcítko ‘Tesovat’ po sestavení vyhledávacího výrazu. Úspˇešné shody budou zvýraznˇeny žlutˇe. Vyhledávání funguje pomocí regulárního výrazu Pythonu. Všechny odpovídající texty jsou jednoduše odebrány z dokumentu nebo nahrazeny pomocí vzoru nahrazení. Vzor nahrazení je nepovinný, pokud z˚ustane prázdný, pak text odpovídající hledanému vzoru bude z dokumentu odstranˇen. Další informace o regulárních výrazech a jejich syntaxi m˚užete zjistit v Vše o používání regulárních výraz˚u v Calibre (stránka 163).
1.4.6 Rozpoznávání struktury Rozpoznávání struktury zahrnuje to, že se Calibre pokouší co nejlépe rozpoznat strukturální prvky ve vstupním dokumentu, pokud nejsou správnˇe zadány. Napˇríklad kapitoly, konce stránek, záhlaví, zápatí atd. Jak si dokážete pˇredstavit,
62
Kapitola 1. Oddíly
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
tento proces se velice liší knihu od knihy. Naštˇestí má Calibre velice mocné možnosti, aby toto urˇcilo. S mocí pˇrichází složitost, ale pokud si jednou udˇeláte cˇ as na to nauˇcit se to složité, zjistíte, že to stálo za námahu. Konce kapitol a stránek Calibre má dvˇe sady možností pro rozpoznávání kapitol a vkládání konc˚u stránek. To m˚uže být nˇekdy trochu matoucí, protože ve výchozím nastavení Calibre vloží konce stránek pˇred rozpoznané kapitoly, stejnˇe jako pˇred místa rozpoznaná možností konc˚u stránek. D˚uvodem pro to je to, že cˇ asto existují místa, kam by mˇely být vloženy konce stránek, která nejsou hranicemi kapitoly. Rozpoznané kapitoly mohou být také volitelnˇe vloženy do automaticky generovaného obsahu. Calibre používá XPath, výkonný jazyk, který umožˇnuje uživateli zadat hranice kapitol nebo konce stránek. XPath se m˚uže zdát nejdˇríve trochu skliˇcující pro používání, naštˇestí je zde kurz XPath (stránka 131) v uživatelské pˇríruˇcce. Nezapomeˇnte, že Rozpoznávání struktury pracuje na polotovaru XHTML vytvoˇreného pˇrevodním ˇretˇezcem. Použijte možnost ladˇení popsanou v Úvod (stránka 56), abyste urˇcili vhodné nastavení pro svou knihu. Je zde také tlaˇcítko pro Pr˚uvodce XPath, aby pomohl s generováním jednoduchých výraz˚u XPath. Ve výchozím nastavení používá Calibre následující výraz pro rozpoznávání kapitol:
//*[((name()='h1' or name()='h2') and re:test(., 'chapter|book|section|part\s+', 'i')) or @class = 'c
Tento výraz je pomˇernˇe složitý, protože se snaží zpracovat velký poˇcet bˇežných pˇrípad˚u soubˇežnˇe. To znamená, že Calibre bude pˇredpokládat, že kapitoly zaˇcínají bud’ znaˇckou nebo , které obsahují kterékoliv z tˇechto slov (kapitola, kniha, oddíl nebo cˇ ást), nebo které mají atribut class=”kapitola”. Související možností je Oznaˇcení kapitol, který vám umožní urˇcit, co Calibre udˇelá, když rozpozná kapitolu. Ve výchozím nastavení vloží konec stránky pˇred kapitolu. M˚užete ho nechat vložit linku namísto nebo navíc ke konci stránky. M˚užete ho také nechat nedˇelat nic. Výchozí nastavení pro rozpoznávání konc˚u stránek je: //*[name()='h1' or name()='h2']
což znamená, že Calibre ve výchozím nastavení vloží konce stránek pˇred každou znaˇcku a . Poznámka: Výchozí výrazy se mohou mˇenit v závislosti na vstupním formátu, který pˇrevádíte.
Ruzné ˚ V tomto oddílu je nˇekolik dalších voleb. Vložit metadata jako stránku na zaˇcátek knihy Jednou ze skvˇelých vˇecí na Calibre je to, že vám umožˇnuje udržovat velice kompletní metadata o všech vašich knihách, napˇríklad hodnocení, štítky, komentáˇre atd. Tato možnost vytvoˇrí jednoduchou stránku se všemi tˇemito metadaty a vloží ji do pˇrevedené e-knihy, obvykle hned za obálku. Berte to jako zp˚usob, jak si vytvoˇrit sv˚uj vlastní pˇrizp˚usobený pˇrebal knihy. Odebrat první obrázek Nˇekdy zdrojový dokument, který pˇrevádíte, obsahuje obálku jako souˇcást knihy namísto samostatné obálky. Pokud jste také zadali obálku v Calibre, pak bude mít pˇrevedená kniha dvˇe obálky. Tato možnost jednoduše odebere první obrázek ze zdrojového dokumentu, cˇ ímž zajistí, že pˇrevedená kniha má pouze jednu obálku, tu zadanou v Calibre.
1.4.7 Obsah Když má vstupní dokument ve svých metadatech obsah, Calibre ho prostˇe použije. Nicménˇe velké množství starších formát˚u bud’ nepodporuje obsah založený na metadatech nebo ho jednotlivé dokumenty nemají. V tˇechto pˇrípadech 1.4. Pˇrevod e-knihy
63
ˇ Uživatelská pˇrírucka Calibre, Vydání 2.50.1
vám volby v tomto oddílu mohou pomoct automaticky vygenerovat obsah v pˇrevádˇené e-knize založený na skuteˇcném obsahu ve vstupním dokumentu. Poznámka: Používání tˇechto voleb m˚uže být trochu složitˇejší, abyste získali pˇresnˇe to pravé. Pokud upˇrednostˇnujete vytváˇrení nebo úpravu obsahu ruˇcnˇe, pˇreved’te na formáty EPUB nebo AZW3 a vyberte zaškrtávací políˇcko v dolní oddílu Obsah v dialogovém oknˇe pˇrevodu, která ˇríká: Ruˇcnˇe jemnˇe ladit obsah po dokonˇcení pˇrevodu. Tímto se po pˇrevodu spustí nástroj Upravit obsah. Umožní vám vytváˇret položky v obsahu jednoduše kliknutím na místo v knize, kam chcete, aby položka ukazovala. M˚užete také použít samotný nástroj Upravit obsah, aniž byste provádˇeli pˇrevod. Pˇrejdˇete na Pˇredvolby->Panely nástroj˚u a pˇridejte Upravit obsah na hlavní panel nástroj˚u. Pak staˇcí vybrat knihu, kterou chcete upravit, a kliknout na tlaˇcítko Upravit obsah. První volba je Vynutit použití automaticky generovaného obsahu. Zaškrtnutím této volby m˚užete nechat Calibre pˇrepsat jakýkoliv nalezený obsah v metadatech vstupního dokumentu automaticky vygenerovaným. Výchozí zp˚usob, jakým vytvoˇrení automaticky vygenerovaného obsahu funguje, je ten, že Calibre nejdˇríve zkusí pˇridat všechny rozpoznané kapitoly do vygenerovaného obsahu. Jak pˇrizp˚usobit rozpoznávání kapitol m˚užete zjistit ve výše uvedeném oddílu Rozpoznávání struktury (stránka 62). Pokud nechcete zahrnout rozpoznané kapitoly do vygenerovaného obsahu, zaškrtnˇete volbu Nepˇridávat rozpoznané kapitoly do obsahu. Pokud bylo rozpoznáno ménˇe kapitol, než je hodnota Mezní hodnota kapitol, Calibre pak pˇridá do obsahu všechny hypertextové odkazy, které najde ve vstupním dokumentu. Toto cˇ asto funguje dobˇre na mnoha vstupních dokumentech, které obsahují hypertextové odkazy obsahu hned na zaˇcátku. Volba Poˇcet odkaz˚u m˚uže být použita k ovládání tohoto chování. Pokud je nastavena na nulu, nejsou pˇridány žádné odkazy. Pokud je nastavena na cˇ íslo vˇetší než nula, je pˇridán nanejvýše tento poˇcet odkaz˚u. Calibre automaticky vyfiltruje duplicity z generovaného obsahu. Pokud však jsou zde nˇejaké další nežádoucí položky, m˚užete je vyfiltrovat pomocí volby Filtr obsahu. To je regulární výraz, který porovná názvy položek ve vygenerovaném obsahu. Kdykoliv je nalezena shoda, bude odebrána. Napˇríklad pro odebrání všech názv˚u položek “Další” nebo “Pˇredchozí” použijte: Next|Previous
Volby Obsah 1., 2. a 3. úrovnˇe vám umožní vytvoˇrit propracovaný víceúrovˇnový obsah. Jsou to výrazy XPath, které porovnají znaˇcky v polotovaru XHTML vytvoˇreného pˇrevodním ˇretˇezcem. Podívejte se na Úvod (stránka 56), jak získat pˇrístup k tomuto XHTML. Pˇreˇctˇete si také Kurz XPath (stránka 131), abyste zjistili, jak vytváˇret výrazy XPath. Vedle každé volby je tlaˇcítko, které spustí pr˚uvodce, který vám pom˚uže s vytvoˇrením základních výraz˚u XPath. Následující jednoduchý pˇríklad vysvˇetluje, jak používat tyto volby. Pˇredpokládejte, že máte vstupní dokument, jehož výstupem je XHTML, které vypadá takto: Sample document Chapter 1
... Section 1.1
... Section 1.2
... Chapter 2
... Section 2.1
...