TEXTOVÉ STEGANOGRAFICKÉ TECHNIKY Text steganographical methods
Ing. Bc. Marek Čandík, PhD.
Abstrakt Steganografie ukrývá existenci komunikace. Probíhá tím, že ukrývá informace do jiných informací. Jednou z významných technik steganografie je textová steganografie, cílem které je ukrýt textové řetězce do jiných (krycích) souborů. Existuje celá řada textových steganografických technik, které se vzájemně liší složitostí a rychlostí, všechny přístupy disponují silnými a slabými stránkami. Různé aplikace kladou odlišné požadavky na použití textových steganografických technik. Prioritní ale u všech steganografických technik zůstává absolutní nevnímatelnost (neviditelnost) vložené zprávy a velká kapacita velké tajná data dostat skryté.
Klíčová slova: ukrývání dat, textová steganografie, bezpečnost.
Abstract Steganography conceals the existence of communication. It is based on the progress by hidden information to other information. One of the most important techniques of steganography is text steganography, the aim of which is to hide text strings into other (cover) files. There are a number of text steganographical techniques, which differ in complexity and speed, all approaches have strengths and weaknesses. Different applications impose different requirements on the use of text steganographical techniques. But the priority for all steganographical techniques remains absolute inperceptibility (invisibility) embedded messages and large capacity high reach hidden secret data.
Keywords: The data hiding, text steganography, safety. 1
ÚVOD Steganografie je technika psaní skrytých zpráv tak, aniž by nikdo, na rozdíl od odesílatele a zamýšleného příjemce, o přenosu zpráv věděl. Steganografie je slovo řeckého původu a znamená "skryté psaní" z řeckých slov Steganos (Στεγανός) - "skrytá nebo chráněná", a graphein (γράφειν) -"psát". První zaznamenané použití termínu bylo v roce 1499, kdy Johannes Trithemius ve svém díle Steganographia. V posledních několika letech internet výrazně expandoval. Jedním z důvodů, proč tomu tak je, vytváří potřeba komunikovat. Z hlediska bezpečnosti komunikace se mimo kryptografických technik stále ve větší míře prosazují techniky skryté komunikace – tj. steganografické techniky. Většina staganografických technik používá pro krytí zpráv obrazy, zvuky, hudbu, videoklipy, texty, atd. Textová steganografie je dílčí součástí steganografie, která skrývá zprávu za druhou krycí textovou zprávu. Technicky lze skrýt text např. za HTML kódování webu stránky. Webové stránky jsou základním stavebním kamenem internetu a poskytují rozsáhlé krycí prostředí pro textové steganografické techniky. Textová steganografie patří k obtížnéjším steganografickým technikám, a to z důvodu nedostatku nadbytečných informací v textových souborech, ve srovnání s obrazovými, resp. zvukovými soubory, které disponují relativně vysokou redundancí. Některé textové steganografické techniky: A. Gramatické ekvivalenty Tato metoda se používá pro skrývání dat v zejména textů psaných v angličtině. Využívá odlišnosti pravopisu v americké angličtině a britské angličtině – zejména ve slovech, kde je malý rozdíl mezi slovním hláskováním slova ve Velké Británii a Spojených státech, Tab.1
2
Tab.1 Ukázka gramatických ekvivalentů
B. Synonymické ekvivalenty Často se stává, že pro stejnou věc je v britské a americké angličtině úplně jiné slovo. Tato slova jsou někdy specifická pouze pro jednu variantu a ve druhé se nepoužívají vůbec. Např. britské slovo pro dálnici (motorway) se v americké angličtině neobjevuje a naopak americké (freeway) se vůbec nepoužívá v Británii. Jiná slova se používají v obou variantách, jejich význam se však liší. Např. slovo chips znamená v britské angličtině 'hranolky' a v americké 'čipsy'. Na tom je postaven koncept, kdy lze provést záměnu celých slov jejich ekvivalentem (synonymem), jak uvádí tab.2.
Tab.2 Ukázka synonymických ekvivalentů
Je patrné, že změna slova přináší informační hodnotu 1bit, proto pro přenos utajované zprávy je zapotřebí rozsáhlý textový krycí soubor. Výhod je, že kontrola pravopisu u některých editorů nedetekuje tuto záměnu jako chybu, protože se jedná o gramaticky správnou formulaci.
3
C. Syntaktické metody V tomto způsobu se zaměňují některé interpunkční znaky, jako jsou tečka (.) a čárka (,) na správném místě (tj. tak, aby věta byla gramaticky „v pořádku“).
Tato metoda vyžaduje identifikace správné místo nebo
uvedení interpunkční znaménka. D. Značkovací techniky (využití HTML kódu) Atributy HTML dokumentů představují vhodné prostředí pro ukrývání informací. Používání html dokumentů má výhodu, že existence tajné zprávy nebude podezřelé - HTML dokumenty jsou základními prvky webu a jsou velmi často používány na internetu. V zásadě se u HTML steganografických technik využívají tyto postupy: Selektivní skrývání (selective hiding): Tento ukrývá znaky na první (nebo jiné konkrétní) místo znaků slova. Spojením těchto znaků lze vložený text extrahovat. Nevýhodou této techniky je, že vyžaduje značné množství prostého textu. HTML webové stránky (HTML web pages): To může skrýt textu pomocí skutečnosti, že atributy HTML tagy jsou malá a velká písmena. Tyto znaky pak mohou být použity k získání původního textu. Skrytí pomocí tzv. bílých míst (Whitespace): menší počet těchto znaků může specifikovat „0“ a větší počet těchto znaků mezi slovy může stanovit „1“. Sémantické ukrývání: Používá synonyma pro skrytí zprávy. Jedná se vlastně o gramatické a synonymické ekvivalenty. Pro textovou steganografii lze použít HTML značkovací jazyk pro skrytí textu, hlavně ze dvou důvodů:
4
Webové stránky jsou přítomny v obrovském množství a detekce
1)
stránky s ukrytou informací je velmi obtížné (prakticky nemožné). 2) pro vzhled stránky je někdy pořadí značek irelevantní- např. písmo tučné šikmé můžeme formátovat
v pořadí nejdříve „tučně“, pak
šikmo, nebo nejdříve „šikmo“, pak tučně – výsledný vyobrazený efekt bude stejný. Textová steganografie je ve srovnání s obrazem a zvukem náročnější, vzhledem k přítomnosti výrazně menší redundanci v textových dokumentech. Html tagy
lze psát různě s ohledem na použití malých a velkých písmen,
například použití tagů , , nebo bude mít stejný dopad na webový dokument stejný dopad. Bity ukrývané informace jsou skryty ve značkách změnou velkých a malých písmen a představují hodnotu 1 bitu. HTML Značky mají vlastnost, že pořadí atributů neovlivní vzhled webové stránky. V podstatě tato technika zahrnuje tři hlavní kroky: 1) generování klíče (Key generace file) – potřebujeme stanovit, co a jak budeme modifikovat: Tento krok generuje soubor klíče a skládá se z kombinací kláves. Tyto kombinace jsou uspořádány ve formě řádků asloupců. Tyto kombinace se skládají z primárních a sekundárních atributů. Uspořádání primárních a sekundárních atributů může skrývat jeden bit dat v závislosti na jejich uspořádání. 2) Skrytí
zprávy
(message
hiding):
Skenování
dokumentu
HTML
s určovením vhodných míst pro modifikaci. Pokud atribut odpovídá stanoveným požadavkům, provede se záměna. 3) Rozbalení zprávy (message extraction): inverzní proces – proces detekce steganograficky relevantních míst pro extrakci s následnou extrakcí zprávy.
5
Závěr Vývoj textových steganografických technik je v současnosti velmi progresivní a využívá stále se vyvíjející nové techniky tvorby webu – např. CSS styly, C#.net techniky apod. Princip ale zůstává stejný -
produkovat takové modifikace
webových souborů, výsledkem kterých bude vizuálně stejný produkt (vizuálně neodlišitelná modifikace na webové stránce), ale použitím různých přístupů. To znamená, že možnost tvorby vizuálního efektu stránky různými způsoby usnadňuje možnost textové steganografie, protože volba toho, či onoho přístupu (se stejným efektem) nám do dokumentu vkládá neviditelnou informační hodnotu.
Literatura [1] H.Kabetta, B.Y. Dwiandiyanta, Suyoto, “Information hiding in CSS: A secure scheme text-stegangraphy using public key Cryptosystem”,IJCIS,pp.13-22 ,Vol.1, No.1,December 2011. [2] Mohit Garg,” A Novel Text Steganography Technique Based on Html Documents”,International
Journal
of
Advanced
Science
and
Technology,pp.132-138,Vol. 35, October, 2011. [3] W. Bender, D. Gruhl, N. Morimoto, and A. Lu, “Techniques for data hiding”, pp. 313-336, IBM Systems Journal, vol. 35, Issues 3&4, 1996. [4] P.Singh, R.chaudhary and A.Agarwal,” A Novel Approach of Text Steganography based on null spaces”, IOSRJCE, PP 11-17,Volume 3, Issue 4 (July-Aug. 2012). [5] M.S. Shahreza,” A New Method for Steganography in HTML Files”, Computer,
Information,
and
Systems
Sciences,
and
Engineering,
ProceedingsIETA 2005, TeNe 2005, EIAE 2005, 247-251, Springer.
6