Univerzita Karlova v Praze
Ústav formální a aplikované lingvistiky
Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít Jindˇrich Libovický ˇkolu na své s ˇkole Propaguj s Gymnázium Kladno, 23.10. 2014
Obsah
Co je rozpoznávání textu? Dekódování textu Poˇ cítaˇ cová lingvistika v rozpoznávání Závˇ er
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 2/ 18
Co je rozpoznávání textu?
Obsah
Co je rozpoznávání textu? Dekódování textu Poˇ cítaˇ cová lingvistika v rozpoznávání Závˇ er
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 3/ 18
Co je rozpoznávání textu?
Obsah
Co je rozpoznávání textu? Dekódování textu Poˇ cítaˇ cová lingvistika v rozpoznávání Závˇ er
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 4/ 18
Co je rozpoznávání textu?
Scene Text Recognition
(200, 532) (358, 575)
FREEDOM
Zdroj: ICDAR Robust Reading Dataset
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 5/ 18
Co je rozpoznávání textu?
ˇemu je to dobré? Kc
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 6/ 18
Co je rozpoznávání textu?
ˇemu je to dobré Kc
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 7/ 18
Co je rozpoznávání textu?
ˇemu je to dobré Kc
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 8/ 18
Dekódování textu
Obsah
Co je rozpoznávání textu? Dekódování textu Poˇ cítaˇ cová lingvistika v rozpoznávání Závˇ er
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 9/ 18
Dekódování textu
Výsledek zpracování obrazu
b L N M C L c
E
A
L W
1 4
L
P
l I i
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 10/ 18
F B 8
w
Dekódování textu
Hledání nejlepˇ sí cesty
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 11/ 18
Dekódování textu
Jak to mˇ eˇrit?
É
ˇas, ... na mapˇ e vzdálenost, c
... ale co v grafu z písmenek
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 12/ 18
Poˇ cítaˇ cová lingvistika v rozpoznávání
Obsah
Co je rozpoznávání textu? Dekódování textu Poˇ cítaˇ cová lingvistika v rozpoznávání Závˇ er
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 13/ 18
Poˇ cítaˇ cová lingvistika v rozpoznávání
Typografický model
Ab Abc top line
top l. and centroid l. angle
top lines angle
centroid line
centroid lines angle
bottom line
bottom l. and centroid l. angle
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 14/ 18
bottom lines angle
Poˇ cítaˇ cová lingvistika v rozpoznávání
Model jazyka
É
pravdˇ epodobnost skupin písmen v jazyce ˇeˇ ˇeˇ P( „ˇrý“ | c stina) < P( „ˇrí“ | c stina)
É
ˇitelné ⇔ lze rozdˇ slovo je c elit na slabiky ling-vis-ti-ka
É
kdyˇ z slovo existuje, bude ve slovníku nebo na webu
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 15/ 18
Poˇ cítaˇ cová lingvistika v rozpoznávání
Výsledky rozpoznávání
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 16/ 18
Závˇ er
Shrnutí
É
rozpoznávání textu na fotografiích není snadné, okolo 50 %
É
poˇrádají se soutˇ ez ˇe
É
znalost jazyka dokᡠze výraznˇ e pomoct
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 17/ 18
Dˇ ekuji za pozornost.
Jindˇrich Libovický, Univerzita Karlova v Praze, 23.10. 2014 Proˇ c není snadné pˇreˇ císt nápis z fotky a proˇ c bychom to mˇ eli chtít, 18/ 18