Башкирский стих XX века. Корпусное исследование. Борис Орехов
Чтение книги онлайн.

Читать онлайн книгу Башкирский стих XX века. Корпусное исследование - Борис Орехов страница 23

СКАЧАТЬ научной сферы и усилия, которые предпринимают авторы, чтобы утвердить свой взгляд на этот предмет, отвлекаются от насущной проблемы накопления и описания материала, систематизация которого могла помочь в освещении других стиховедческих аспектов. Высказывания на эту тему можно встретить практически в любой около-стиховедческой работе о тюркской поэзии, ср.: «Нельзя не признать обоснованным и справедливым критический разбор мнений Ф. Е. Корша, А. П. Поцелуевского, М. А. Унгвицкой о силлабо-тоническом характере тюрского стиха» [Асланов 1968: 118].

      Мы не подвергаем сомнению силлабическую природу башкирского советского стиха, хотя при этом нельзя исключать и отдельных пограничных случаев, появившихся в результате влияния на него инородных форм, и далее такие случаи нами будут рассмотрены. Однако мы хотели бы сразу отрешиться от политических и идеологических импликаций, стоящих за рассуждениями о принципе, лежащем в основе стихосложения. Каким бы ни был по своей природе башкирский стих, его культурная ценность самодостаточна и не может быть умалена или увеличена утверждениями о механизме, определяющем систему стихосложения.

      3. Башкирская поэзия XX века. Характеристика корпуса

      3.1. Поэтические корпуса и башкирский поэтический корпус

      Материалом этого исследования стала созданная в XX веке поэзия на башкирском языке, объединённая в корпус. Корпус в том значении, которое здесь используется, – это электронная поисковая система. Поиск в ней осуществляется по коллекции текстов, а результатом поиска обычно являются контексты употребления слов или других языковых явлений, а также данные о частотности этих явлений в коллекции.

      Обычно создатели корпусов стремятся к тому, чтобы текстовые коллекции были представительными, то есть достаточно большими, чтобы отражать устройство языка. В большом хорошем корпусе встретится всё, что есть в языке (слова, их значения, грамматические конструкции и т. д.).

      Создатели корпусов стремятся также к тому, чтобы их корпуса были сбалансированными, то есть отражали бы реальное соотношение жанров в языке. Таким образом, если в хорошо сбалансированном корпусе какое-то слово (или грамматическое явление) встречается чаще, чем другое слово, то это значит, что оно встречается чаще и в языке.

      Тексты, помещённые в корпус, специальным образом обрабатываются, чтобы из них можно было извлекать лингвистически значимую информацию. Такая обработка называется разметкой (или аннотацией). Она позволяет искать не просто слова, но и определённые грамматические формы и другие языковые явления.

      Важным свойством применения корпуса как инструмента исследования становится количественный фактор, то есть возможность получить сведения о сравнительной распространённости того, что ищет пользователь.

      Помимо больших корпусов, отражающих реальность языка, существуют и специализированные СКАЧАТЬ