The series
Frequency Dictionaries aims at producing dictionaries with comparable frequency data for a large number of different languages. For many of the languages featured in this collection, this series is the first comprehensive compilation using a large-scale empirical base.
The dictionaries are available in print and electronic version. Each dictionary provides the most frequent 1000 word forms ordered by frequency and the most frequent 10000 word forms in alphabetical order. They provide an introductory description of the data and the methodological approach. In addition, language specific statistical information on letters, word structure and structural changes depending on word frequency is provided. The enclosed CD-ROM contains a more comprehensive version of the dictionary as an e-book, with data on relative frequency of up to 1000000 word forms given in alphabetical order.
This series of dictionaries provides the opportunity to explore comparative linguistic topics as well as monolingual issues such as studies on word formation and frequency-based examinations of lexical areas for dictionaries or language teaching.
Данная серия Frequency Dictionaries предназначена для создания частотных словарей со сравнимыми данными по частоте в большом количестве разных языков. Для многих языков, чьи словари были опубликованы в этой серии, в них представлена первая попытка публикации представи тельной версии.
Словари доступны в печатном и электронном вариантах. Каждый словарь содержит 1000 наиболее частотных словоформ, упорядоченных по частоте, и 10000 наиболее частотных словоформы в алфавитном порядке. В этих словарях также содержится вступление, описывающее данные и методологию их обработки. Кроме того, для каждого языка предоставляется статистическая информация о частоте букв, структуре слова и морфологии.
Прилагаемый компакт-диск содержит более полную версию словаря в виде электронной книги. Она включает в себя данные об относительной частоте вплоть до 1 миллиона словоформ. Для языков с меньшими ресурсами эти списки короче в связи с меньшим размером соответствующих корпусов. Список слов с их классами частотности также доступен в виде простого текстового файла, который можно использовать для порождения списков слов для различных приложений. Словоформы в печатной части словаря были проверены вручную, чтобы отделить неправильные формы. Более полный список слов на CD-ROM был проверен лишь с помощью автоматических критериев достоверности.
Для словарей в этой серии используются достаточно большие корпуса из Leipzig Corpora Collection. Эти корпуса содержат газетные тексты, статьи из Википедии и другие виды текстов, доступные в Интернете. Доступ к ним в Интернете возможен по адресу http://corpora.informatik.uni-leipzig.de/. Эта серия словарей предоставляет возможность проводить исследования в области компаративистики, а также исследовать в рамках каждого отдельного языка такие вопросы как словообразование или частотные лексические исследования для использования в словарях или для преподавания языка. Статистические результаты, представленные в этих словарях, могут послужить источником начальных гипотез в различных областях научных исследований.
Заглавие частотных словарей всегда включает в себя название языка на английском языке, на языке оригинала и трёхбуквенное сокращенное название языка по ISO 639-3.
weniger
The series
Frequency Dictionaries aims at producing dictionaries with comparable frequency data for a large number of different languages. For many of the languages featured in this
...
mehr