Státnice - Informatika - I3: Matematická lingvistika
Z ωικι.matfyz.cz
Verze z 16. 10. 2012, 11:18, kterou vytvořil Tuetschek (diskuse | příspěvky) (vraceni smazaneho obsahu)
Podle oficiálních stránek MFF sestávají státnicové otázky pro obor Matematická lingvistika z následujících okruhů:
Okruhy povinné pro obory I2 a I3[editovat | editovat zdroj]
Chcete-li otázky výrazně upravovat a dopracovávat, nebo získat pěkné PDF pro tisk, přečtěte si, prosím, návod. -- Tuetschek 11:41, 22 Sep 2010 (CEST)
Základy složitosti a vyčíslitelnosti[editovat | editovat zdroj]
- Metody tvorby algoritmů (rozděl a panuj, dynamické programování, hladový algoritmus)
- NP-úplnost (úplné problémy pro třídu NP, Cook-Levinova věta, pseudopolynomiální algoritmy, silná NP-úplnost)
- Aproximační algoritmy a schémata
- Algoritmicky vyčíslitelné funkce, jejich vlastnosti, ekvivalence jejich různých matematických definic, částečně rekurzivní funkce
- Algoritmicky nerozhodnutelné problémy (halting problem)
- Věty o rekurzi a jejich aplikace: příklady, Riceova věta
Datové struktury[editovat | editovat zdroj]
K dispozici je souhrn i detailnější popis otázek:
- Stromové vyhledávací struktury (binární stromy a jejich vyvažování, haldy, trie, B-stromy a jejich varianty)
- Hašování (řešení kolizí, univerzální hašování, perfektní hašování)
- Třídění ve vnitřní a vnější paměti.
Matematická lingvistika[editovat | editovat zdroj]
Chcete-li otázky výrazně upravovat a dopracovávat, nebo získat pěkné PDF pro tisk, přečtěte si, prosím, návod. -- Tuetschek 11:41, 22 Sep 2010 (CEST)
Základy formálního popisu přirozených jazyků[editovat | editovat zdroj]
- Závislostní syntax (formální definice a vlastnosti závislostních stromů -- závislosti, koordinace, projektivita)
- Syntax bezprostředních složek a frázové gramatiky (základní principy, vývoj Chomského školy)
- Základy obecné lingvistiky (zdroje a přínosy strukturní lingvistiky, typologie jazyků, pojem funkce)
- Funkční generativní popis (základní charakteristika, struktura rovin, valenční teorie, zachycení významu, aktuální členění)
- Formální sémantika
Jazykové korpusy, strojové učení a stochastické metody[editovat | editovat zdroj]
- Jazykové korpusy a lingvistická anotace (zdroje dat, anotace, datové formáty, typologie korpusů, počítačová lexikografie, wordnety)
- Metody strojového učení (učení založené na konceptu, rozhodovací stromy, neuronové sítě, učení založené na příkladech, vyhodnocování hypotéz, výpočetní aspekty strojového učení)
- Stochastické metody a jejich aplikace v počítačové lingvistice (Teorie informace, Bayesovské učení, HMM, algoritmy učení a zpracování, aplikace v lingvistice)
- Návrh a vyhodnocování lingvistických experimentů (příprava dat, standardní evaluační metriky, typy evaluace podle úloh)
Automatické zpracování přirozeného jazyka[editovat | editovat zdroj]
- Automatická analýza jazyka (morfologie, syntax povrchová a hloubková, aplikace)
- Generování přirozeného jazyka
- Analýza a syntéza mluvené řeči (jazykové modely, kombinace modelů)
- Vyhledávání a extrakce informací
- Strojový překlad (transfer, interlingua, metody překladu, systémy pro češtinu, počítačem podporovaný překlad)
PDF verze[editovat | editovat zdroj]
K dispozici je PDF verze, která ale nemusí být aktuální. Chcete-li vytvořit PDF pro tisk aktuální verze státnicových otázek, přečtěte si návod.
EPUB / MOBI verze[editovat | editovat zdroj]
K dispozici je EPUB a MOBI verze, která byla vygenerovana 9. 8. 2011. Více informací je v návodu.