摘要:Miroslav Kubát ve své publikované dizertaci zkoumá paralely mezi konvenčním žánrovým zařazením textu a jeho jazykovými rysy,měřenými pomocí kvantitativně lingvistických metod. Snaží se tedy zodpovědět otázky týkající se vztahu mezi vnětextovou a vnitrotextovou charakteristikou textu: Vyznačuje se báseň vyšší nebo nižší tematickou koncentrací než román,nebo jsou oba žánry srovnatelné? Jak jsou na tom z hlediska lexikální bohatosti? atp. Používá při tom široké spektrum stylometrických metod,v jejichž pečlivém výběru a srozumitelně formulované charakteristice tkví největší přínos celé práce. Nicméně jak vyplyne z následujících řádků,dva klíčové aspekty práce vybízejí přinejmenším k polemice. Jmenovitě jde o volbu materiálu,s nímž Kubát pracuje (jedná se o výbor z díla jediného autora,Karla Čapka),a různé aspekty analýzy dat (statistické vyhodnocení,jeho interpretace,vizualizace výsledků). Věnujme se však nejprve jednoznačně kladným aspektům práce. Výběr použitých stylometrických indikátorů je podložen pečlivým studiem sekundární literatury,v níž se autor velmi dobře orientuje,jak ostatně dokazuje i fundovaným výkladem zvažovaných metod,rozborem jejich kladů a záporů a názornými příklady. Metody dělí do dvou skupin,přičemž první z nich bychom mohli označit za lingvisticky motivované,a tudíž i interpretovatelné,druhou pak za pragmatické. Autor sám o této druhé skupině hovoří jako o metodách,„které se primárně používají ke klasifikaci textů,zejména pak v oblasti určování autorství“ (s. 38),a zařazuje je spíš jako zajímavost pro doplnění. Do první kategorie řadí různé způsoby určování slovního bohatství odvozené od type-token ratio (TTR),tematickou koncentraci textu,vzdálenosti sloves,průměrnou délku tokenu a tzv. aktivitu;do druhé pak charakteristiku textu pomocí n-gramů a nejfrekventovanějších slov. Tímto dělením autor vhodně poukazuje na to,že cílem práce není ani tolik hrubou silou co nejlépe automaticky identifikovat žánry,jako spíš empiricky zjistit typické jazykové rysy,které tyto žánry vykazují,a pokusit se je lingvisticky interpretovat..