|
|||
Библиотека Энциклопедия Ссылки О проекте |
Статистическая структура лексики ЛермонтоваВ таблице 1 приводятся сведения о числе слов с данной частотой. Для частоты более 50 они даны выборочно (полностью - см. в разделе 2 Частотного словаря), для частоты 50 и ниже - все. В графе 1 указывается абсолютная частота (F), в графе 2 - число слов с данной частотой (n), в графе 3 - общее число слов с частотой, не ниже данной (∑n), в графе 4 - общее число словоупотреблений этих же слов (∑F). Графа 3 может служить для нахождения ранга слова с частотой F < 50. Групповой ранг определяется следующим образом: конец ранга находим в графе 3 данной строки, а начало его получаем добавлением единицы к показателю графы 3 в предыдущей строке. Например, групповой ранг слов с частотой 25 составляет 1715-1764, то есть в текстах Лермонтова представлено 1764 слова с частотой 25 и более. В третьей же графе в последней строке находим общее число разных русских слов у Лермонтова. Оно равно 14 939. В последней строке графы 4 находим общее число словоупотреблений русских слов - 341726. Графа 4 дает возможность определить суммарное число словоупотреблений для слов с частотой F и более. Так, для частоты 395 в этой графе находим 154 832 словоупотребления. Это значит, что 100 самых частых слов составляют 45,3% (то есть 154 832 : 341 726) всех словоупотреблений в тексте. Для 1000 самых частых слов этот показатель равен 75,6%, для 5000 - 94,1%.
|
||
© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2010-2018
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник: http://m-y-lermontov.ru/ "M-Y-Lermontov.ru: Михаил Юрьевич Лермонтов" |