Название: Башкирский стих XX века. Корпусное исследование
Автор: Борис Орехов
Издательство: Алетейя
Жанр: Поэзия
isbn: 978-5-907189-29-4
isbn:
Мы не подвергаем сомнению силлабическую природу башкирского советского стиха, хотя при этом нельзя исключать и отдельных пограничных случаев, появившихся в результате влияния на него инородных форм, и далее такие случаи нами будут рассмотрены. Однако мы хотели бы сразу отрешиться от политических и идеологических импликаций, стоящих за рассуждениями о принципе, лежащем в основе стихосложения. Каким бы ни был по своей природе башкирский стих, его культурная ценность самодостаточна и не может быть умалена или увеличена утверждениями о механизме, определяющем систему стихосложения.
3. Башкирская поэзия XX века. Характеристика корпуса
3.1. Поэтические корпуса и башкирский поэтический корпус
Материалом этого исследования стала созданная в XX веке поэзия на башкирском языке, объединённая в корпус. Корпус в том значении, которое здесь используется, – это электронная поисковая система. Поиск в ней осуществляется по коллекции текстов, а результатом поиска обычно являются контексты употребления слов или других языковых явлений, а также данные о частотности этих явлений в коллекции.
Обычно создатели корпусов стремятся к тому, чтобы текстовые коллекции были представительными, то есть достаточно большими, чтобы отражать устройство языка. В большом хорошем корпусе встретится всё, что есть в языке (слова, их значения, грамматические конструкции и т. д.).
Создатели корпусов стремятся также к тому, чтобы их корпуса были сбалансированными, то есть отражали бы реальное соотношение жанров в языке. Таким образом, если в хорошо сбалансированном корпусе какое-то слово (или грамматическое явление) встречается чаще, чем другое слово, то это значит, что оно встречается чаще и в языке.
Тексты, помещённые в корпус, специальным образом обрабатываются, чтобы из них можно было извлекать лингвистически значимую информацию. Такая обработка называется разметкой (или аннотацией). Она позволяет искать не просто слова, но и определённые грамматические формы и другие языковые явления.
Важным свойством применения корпуса как инструмента исследования становится количественный фактор, то есть возможность получить сведения о сравнительной распространённости того, что ищет пользователь.
Помимо больших корпусов, отражающих реальность языка, существуют и специализированные СКАЧАТЬ