Название: Башкирский стих XX века. Корпусное исследование
Автор: Борис Орехов
Издательство: Алетейя
Жанр: Поэзия
isbn: 978-5-907189-29-4
isbn:
Другие случаи таких нарушений зависимости поможет выявить линейная регрессионная модель. В её основе лежит идея, что рост одного параметра линейно зависит от роста другого, из чего следует, что значения параметров можно предсказать. Ситуации, похожие на ту, которую демонстрирует творчество М. Гафури, будут плохо предсказываться такой моделью, и их можно будет найти по ошибке предсказания. Визуализацию соотношения модельных (прямая на графике) и реальных (точки) значений можно наблюдать на рис. 2.
Рис. 2. Линейная зависимость приходящихся на долю автора словоупотреблений от числа стихотворений в корпусе
Как раз такая ситуация наблюдается у Г. Саляма, при 70 стихотворениях его доля в словоупотреблениях составляет 34 540, хотя модель предсказывает значение около 8326 слов.
Согласно данным линейной регрессии, поэтику-антипод М. Гафури и Г. Саляма демонстрирует Р. Мифтахов. При большом числе стихотворений (544, 3,07 %) его доля слов в корпусе невелика: 26 251, это всего 1,49 % от общего числа словоупотреблений в коллекции, хотя модель предсказывает почти в два раза больше, 49 066 слов. Это говорит о том, что большинство созданных автором произведений очень короткие.
Сказанное позволяет охарактеризовать корпус как сбалансированный, то есть равномерно представляющий творчество различных поэтов, не делая акцента на идиостиле одного автора, поэтического направления или кружка.
3.2.2. Оценка репрезентативности
Оценка репрезентативности – это ответ на вопрос, как соотносится материал, использованный в этом исследовании, со всем объёмом башкирской поэзии или, говоря языком статистики, выборка с генеральной совокупностью. Вероятным путём здесь было бы сравнение индекса коллекции с библиографией опубликованных на башкирском языке поэтических произведений. К сожалению, усилия, которые требовалось бы потратить на составление такой библиографии, намного превосходят те, что были предприняты для оцифровки имеющегося в нашем распоряжении корпуса.
Так как полная библиография отсутствует, исследователь может обратиться к другим источникам: биобиблиографическим изданиям, очеркам истории литературы и поэтическим антологиям. Все они по-своему отражают топологию башкирской литературы. Так, в биобиблиографический справочник [Гайнуллин, Хусаинов 1977: 3] «включены данные о писателях, являющихся членами Союза писателей СССР, а также нескольких известных писателях, умерших до организации творческого союза». В этой книге с помощью членства в писательской организации зафиксирована институционализированная часть башкирской поэзии. Из 160 упоминаемых там персоналий только 72 являются СКАЧАТЬ