k47.cz

twitter RSS
««« »»»

Čitelnost

31. 5. 2022 — k47

Určitě jste to taky zažili: máte seznam věcí na čtení (není o tom pochyb, jistě jste inkvizivní & inteligentní lidí, co bytostně prahnou po vzdělání) a když z něho vezmete jednu věc k vyřízení, tak poté, co dočtete poslední řádek, je seznam delší než na začátku.

Přesně tak to probíhalo i u mě: Na seznamu ležel akademický článek o strojové detekci dezinformací, během čtení se dotkl mnoha témat, o nichž jsem neměl do té doby tušení a tak se seznam literatury k prozkoumání zas o něco rozrostl. Jedním z témat v terra nullis byly metriky čitelnosti.

Ono to ani není příliš překvapivé, že někdo zkonstruoval statistické testy vyjadřující, jak snadno lidé přečtou a pochopí daný text. Jako civilizace ve velkém produkujeme texty nějaké to století & bylo na čase, dalo by se říct. Tak vznikl Flesch–Kincaid readability test, který se snaží kvantifikovat komplikovanost textu na základě průměrné délky vět a průměrné délky slov. Intuitivně to dává smysl: čím delší věta, tím horší čitelnost, stejně tak pro samostatná slova. Metrika tomu nasadí korunu vyčíslením příslušných koeficientů a finální vzorec nabere následující podobu.

206.835 – 1.015 * průměrný počet slov ve větě – 84.6 * průměrný počet slabik ve slově

Tak to ale platí pro angličtinu. Každý jazyk se chová jinak. Pokud se vzorec aplikuje na český text, ten vždy vyjde jako krajně nečitelný. Víc slov ve větách nebo něco na ten způsob. Naštěstí koumáci z Univerzity Karlovy aktualizovali vzorec pro náš rodný jazyk & tak teď můžeme vyjádřit čitelnost ve stejné stupnici.

Ok, zajímavé, ale co dál? Diverze mě vybavila nástroji, které se dají použít různými způsoby, pro páchání dobra nebo páchání zla; můžu je třeba aplikovat na k47čku. Jak komplikované jsou texty, co mi lezou z klávesnice? Tuším, že mám tendenci věty protahovat, co to jen jde, téměř do groteskních délek & spojovat štrůdly slov čárkami v nekonečném rytmu staccata. Vědět je jedna věc, ale co na to říká objektivní metrika čitelnosti?

Asi takhle: Za poslední rok & něco se na poslední příčku čitelnosti dostal článek I v apokalypse svět vypadal tak klidně…. Čitelnost 21.85, podle tabulky: Very difficult to read. Best understood by university graduates. Skóre čitelnosti je určené v rozmezí 100 – 0. Stovku snadno pochopí páťák, nula je na čtení extémně obtížná, jen pro odchovance univerzit.

Další texty s obzvláště malou čitelností:

Naopak, nejlépe čitelné texty jsou:

To je ale jen za poslední rok a kus, k47čka žije o něco déle, skoro dvě dekády, a za tu dobu jsem na ni zanechal velké množství slov, možná příliš mnoho slov. Jak jsme na tom celkově? Co je nejméně čitelný blok slov vůbec? Mám tu dva exemplární příklady.

Docela hrůza, co? Jestli mě teď omluvíte, půjdu se vrátit k seznamu literatury, mám v něm pár knih o konspiračních teoriích, co se samy nepřečtou.

píše k47 & hosté, ascii@k47.cz