The series Frequency Dictionaries aims at producing dictionaries with comparable frequency data for a large number of different languages. For many of the languages featured in this collection, this series is the first comprehensive compilation using a large-scale empirical base.
The dictionaries are available in print and electronic version. Each dictionary provides the most frequent 1000 word forms ordered by frequency and the most frequent 10000 word forms in alphabetical order. They provide an introductory description of the data and the methodological approach. In addition, language specific statistical information on letters, word structure and structural changes depending on word frequency is provided. The enclosed CD-ROM contains a more comprehensive version of the dictionary as an e-book, with data on relative frequency of up to 1000000 word forms given in alphabetical order.
This series of dictionaries provides the opportunity to explore comparative linguistic topics as well as monolingual issues such as studies on word formation and frequency-based examinations of lexical areas for dictionaries or language teaching.
Řada Frequency Dictionaries si klade za cíl sestavit slovníky se srovanatelný mi frekvenčními daty pro velký počet různých jazyků. Pro mnohý z jazyků, které byly do tohoto souboru zařazeny, je slovník v této řadě vůbec prvním komplexním produktem založeným na empirické bázi velkého rozsahu.
Tyto slovníky jsou dostupné jak v tištěné tak elektronické podobě. Každý z nich nabízí 1000 nejčastějších slovních tvarů seřazených podle frekvence a 10 000 nejfrekventovanějších slovních tvarů podle abecedy. Nabízí také úvodní popis těchto dat a užitého metodologického přístupu. Kromě toho se tu s ohledem na daný jazyk nabízejí statistické informace o písmenech, struktuře
slova a strukturních změnách.
Přiložená CD-ROM obsahuje úplnější verzi slovníku v podobě e-knihy. Obsahuje data o relativní frekvenci až 1 000 000 nejčastějších slov seřazených frekvenčně. Počet slovních tvarů pro ten který jazyk závisí na rozsahu a složení užitého korpusu. Seznam těchto slov (s jejich frekvenčními třídami) se na tomto CD nabízí í v podobě prostého textu, a to v jejich abecedním a frekvenčním pořadí. Užitím tohoto souboru lze snadno vytvářet slovní seznamy pro různé aplikace. Slovní tvary v tištěné části slovníku byly pečlivě kontrolovány manuálně kvůli zjištění nesprávných tvarů či takových slov, která se píšou podle nových pravopisných pravidel. Naproti tomu mnohem větší seznam na CD-ROM se kontroloval pouze za použití automatických pravděpodobnostních kritérií.
K sestavení slovníku se systematicky užívaly komplexní dostupné elektronické zdroje obsažené v Leipzig Corpora Collection. Korpusy, na nichž jsou jednotlivé frekvenční slovníky založené, obsahují novinové texty, články Wikipedie a jiné namátkově sesbírané texty dostupné na Internetu. Ty jsou přístupné online na adrese http://corpora.uni-leipzig.de/. Tato slovníková řada skýtá tedy příležitost ke srovnávacímu studiu takových lingvistických témat a jednojazyčných otázek jako jsou studie slovotvorné a frekvenčně založené zkoumání lexikálních oblastí užívaných ve slovnících či výuce jazyků. Statistické výsledky zde prezentované můžou nabídnout i prvotní podněty pro více oblastí výzkumu. Titul frekvenční slovníky vždy obsahuje jméno jazyka v angličtině a v původním jazyce a užívá třípísmennou zkratku podle ISO 639-3.
weniger
The series Frequency Dictionaries aims at producing dictionaries with comparable frequency data for a large number of different languages. For many of the languages featured in this collection, this
...
mehr