Библиотека
Энциклопедия
Ссылки
О проекте






предыдущая главасодержаниеследующая глава

Статистическая структура лексики Лермонтова

В таблице 1 приводятся сведения о числе слов с данной частотой. Для частоты более 50 они даны выборочно (полностью - см. в разделе 2 Частотного словаря), для частоты 50 и ниже - все. В графе 1 указывается абсолютная частота (F), в графе 2 - число слов с данной частотой (n), в графе 3 - общее число слов с частотой, не ниже данной (∑n), в графе 4 - общее число словоупотреблений этих же слов (∑F).

Графа 3 может служить для нахождения ранга слова с частотой F < 50. Групповой ранг определяется следующим образом: конец ранга находим в графе 3 данной строки, а начало его получаем добавлением единицы к показателю графы 3 в предыдущей строке. Например, групповой ранг слов с частотой 25 составляет 1715-1764, то есть в текстах Лермонтова представлено 1764 слова с частотой 25 и более. В третьей же графе в последней строке находим общее число разных русских слов у Лермонтова. Оно равно 14 939.

В последней строке графы 4 находим общее число словоупотреблений русских слов - 341726. Графа 4 дает возможность определить суммарное число словоупотреблений для слов с частотой F и более. Так, для частоты 395 в этой графе находим 154 832 словоупотребления. Это значит, что 100 самых частых слов составляют 45,3% (то есть 154 832 : 341 726) всех словоупотреблений в тексте. Для 1000 самых частых слов этот показатель равен 75,6%, для 5000 - 94,1%.


предыдущая главасодержаниеследующая глава





© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2010-2016
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://m-y-lermontov.ru/ "M-Y-Lermontov.ru: Михаил Юрьевич Лермонтов"