Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры. Эрец Эйден
Чтение книги онлайн.

Читать онлайн книгу Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эрец Эйден страница 18

СКАЧАТЬ мир не может прожить без поисковых машин в Интернете, самых мощных инструментов поиска информации из когда-либо созданных. Что такое поисковая машина? По сути, она представляет собой список слов и страниц в сети Интернет, где эти слова появляются. За каждым крошечным белым поисковым окошком кроется огромный цифровой конкорданс.

      Конкордансы не умерли со времен Бусы. Напротив, они завоевали этот мир.

      Разделить розу на части и посчитать лепестки

      Ципф был удивительным человеком, чья работа изменила множество областей знаний, некоторые из которых даже не входили в сферу его научных интересов. В наши дни сложно заниматься множеством вещей – от лингвистики до биологии, от городского планирования до физики процесса сыроварения, не сталкиваясь с наследием Ципфа. В своей работе Ципф подарил нам множество подсказок, необходимых для открытия секретов эволюции языка.

      Но что же в этом довольно странном теоретике германской литературы превратило его, выражаясь научным языком, в пророка?

      Джордж A. Миллер, один из основателей когнитивной психологии, как-то раз сказал о Ципфе интересную фразу, и нам кажется, что она позволяет в каком-то смысле ответить на этот вопрос. По мнению Миллера, Ципф был представителем «такого типа людей, которые разделяют розы на части, чтобы посчитать их лепестки» [72]. На первый взгляд это кажется не особенно лестным. Неужели Ципф так навязчиво занимался подсчетами, что не мог оценить красоту цветка?

      Разумеется, нет. Ципф был знаменитым литературоведом, глубоко ценившим красоту и силу книги, этого цветка литературного гения. Однако Ципфа отличало то, что он не замыкался на этой красоте и мог оценить цветок с разных сторон. И один из таких способов как раз и состоит в том, чтобы разделить цветок на составные части.

      До Ципфа книга была чем-то, что можно было прочитать и понять – строчку за строчкой и страницу за страницей. Ученые воспринимали ее гештальт полностью, как розу в период цветения. Даже Хенли, индекс которого помог Ципфу в его предприятии, предполагал, что его работа послужит помощником в традиционном чтении.

      Однако Ципфа интересовало радикально новое понимание того, чем могла бы быть книга. Его великолепная интуиция подсказывала, что возможна и другая форма чтения – анализ небольших лепестков текста, избавление от их цветистого контекста и поиск свидетельств математической конструкции, лежащей в его основе.

      В течение последнего столетия ученые активно следовали по пути, указанному этим гениальным провидцем. К моменту завершения анализа глаголов мы изрядно гордились тем, что относимся к этой группе исследователей. Но, честно говоря, мы были слишком захвачены особенностями неправильных глаголов, чтобы в полной мере оценить всю силу подхода Ципфа.

      Но этому суждено было измениться. В конечном счете Ципф показал всем нам захватывающие научные горизонты, выбрав для этого ничтожную горстку цветов. СКАЧАТЬ



<p>72</p>

См. Miller G. A. Introduction to The Psycho-Biology of Language. Cambridge, MA: MIT Press, 1965, доступно в сети Интернет: http://goo.gl/KYvOcK. Полная цитата из введения к изданию книги 1965 года кажется теперь актуальной, как никогда раньше: «Цель книги The Psycho-Biology of Language („Психобиология языка“) состоит в не том, чтобы удовлетворить всем вкусам. Ципф был из той породы людей, которые разделяют розы на части, чтобы посчитать их лепестки; если вы считаете кощунством переставление местами слов в шекспировском сонете и их подсчет, то эта книга не для вас. Ципф относился к языку как ученый – и для него это означало статистический анализ языка как биологического, психологического и социального процесса. Если такой анализ отталкивает вас, то оставьте язык в покое и бегите от Джорджа Кингсли Ципфа как от чумы. Вам будет куда приятнее читать цитаты Марка Твена: „Существует три вида лжи: ложь, наглая ложь и статистика“ или У. Х. Одена: „Да не будешь ты сидеть рядом со статистиками или заниматься социальными науками“. Однако тем, кто не побоится убить красоту ради благого дела, научные старания Ципфа помогут прийти к прекрасным и неожиданным результатам, поражающим разум и дразнящим воображение».