Название: BIG DATA. Вся технология в одной книге
Автор: Андреас Вайгенд
Издательство: Эксмо
Жанр: Базы данных
Серия: Top Business Awards
isbn: 978-5-04-094117-9
isbn:
Глава 1
Как научиться разбираться в данных
Основной инструментарий цифрового гражданина
В XVIII веке грамотным считался человек, способный прочитать вслух знакомые ему куски из Библии или катехизиса; в наши дни человека, не умеющего большего, сочли бы функционально неграмотным – неспособным усвоить тексты, которые необходимы для экономического выживания[21].
Как устроена обработка данных и какая именно информация о вас представляет ценность?
«Данные для людей» – не просто лозунг. В повседневной жизни мы постоянно сталкиваемся с информационными продуктами и услугами в виде рейтингов и рекомендаций, созданных на основе социальных данных. На смену традиционным рекламным деятелям пришли специалисты по обработке и анализу данных, которые пропускают через просчитанные алгоритмы несметные количества цифровых следов миллиардов людей. Изменения в ментальности имеют даже более важное значение, чем лавинообразный рост количества получаемой нами информации. Чтобы сделаться полноценным участником революции в использовании социальных данных, необходимо отбросить старые «потребительские» установки по принципу «бери, что дают» и переключиться на новое мышление – мышление активного созидателя социальных данных. Происходят сдвиги в балансах сил между продавцами и покупателями, банкирами и заемщиками, работодателями и работниками, докторами и пациентами, учителями и учениками. Информация о людях и от людей может и должна стать информацией для людей.
На самом деле нет ничего важнее запроса на информацию для людей. Социальные данные – самое ценное сырье XXI века, новая нефть[22]. Такая аналогия представляется вполне уместной по целому ряду причин. На протяжении более чем ста лет нашу экономику и общественно-политическую жизнь во многом определяли нефть и развитие технологий ее добычи, хранения и переработки в продукцию, потребляемую каждым жителем планеты. Сегодня возможность переработки персональных данных в продукты и услуги привносит в жизнь человечества изменения, сопоставимые с эффектом промышленной революции.
Нефть не используется в ее первичном состоянии. Ее нужно переработать в автомобильное горючее, пластмассы и многие другие продукты нефтехимии. В свою очередь нефтепереработка дала толчок развитию техники индустриальной эпохи и сыграла важную роль в производстве подавляющего большинства видов физической продукции современной экономики. Схожим образом и первичные персональные данные сами по себе являются достаточно бесполезными. Данные приобретают ценность в результате переработки – агрегирования, анализа, сравнения, фильтрации и дистрибуции новых СКАЧАТЬ
21
Miller, George A., “The Challenge of Universal Literacy”, Science 241 (September 9, 1988), p. 1293, http://science.sciencemag.org/content/241/4871/1293.
22
Я использую эту метафору в своей преподавательской работе уже много лет и дважды выступал на тему переработки первичных данных в 2011 году – в ООН и на конференции O’Reilly Strata Summit. Но в этом я не одинок. Среди тех, кто говорит о данных, как о новой нефти, – Клайв Хамби, участвовавший в создании клубной карты британской сети супермаркетов Tesco’s – одной из первых карт лояльности, учитывавшей все покупки в корзине покупателя. В ООН я выступал в рамках программы Global Pulse, запущенной по инициативе Генерального секретаря. Видеозапись доступна на http://www.youtube.com/watch?v=lbmsDH8RJA4.