Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики. Билл Фрэнкс
Чтение книги онлайн.

Читать онлайн книгу Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики - Билл Фрэнкс страница 7

СКАЧАТЬ «большие», 2) слово «данные», 3) оба слова или 4) ни одно из них? Задумайтесь об этом на минуту и, определившись с ответом, переходите к следующему абзацу. Мысленно проиграйте музыку, которую включают в игре, пока участники думают.

      Теперь проверим, правы ли вы. Правильный ответ – вариант 4). В термине «большие данные» ни одну из составных частей нельзя считать важнейшей. Важнее всего то, как организации используют большие данные. Анализ больших данных, производимый вашей организацией, в сочетании с действиями, предпринимаемыми для улучшения вашего бизнеса, – вот что имеет значение.

      Наличие большого источника данных само по себе не является дополнительной ценностью. Возможно, ваши данные больше, чем мои. Кого это волнует? На самом деле наличие любого набора данных, вне зависимости от размера, само по себе не добавляет какой-либо ценности. Собранные, но не используемые данные имеют не большее значение, чем старый хлам, хранящийся на чердаке или в подвале. Данные не имеют значения до тех пор, пока не будут помещены в контекст и использованы. Мощь больших данных, как, впрочем, любого источника данных, заключается в том, что с ними делают. Как они анализируются? Какие действия предпринимаются на основании полученных результатов? Как эти данные используются для совершенствования бизнеса?

      Вокруг больших данных поднята такая шумиха, что многие полагают: только благодаря большому объему, скорости передачи и разнообразию они важнее всех других. Это не так. Как мы увидим далее в этой главе (в разделе «Большая часть больших данных не имеет значения»), в больших данных доля бесполезного или малозначимого контента намного выше, чем в любом привычном источнике данных. Когда вы отберете действительно нужную вам информацию, источник больших данных может показаться вам не таким уж большим. Но это ничего не значит, поскольку после обработки данных их объем не имеет значения. Важно то, что вы будете делать с полученными результатами.

Дело не в объеме данных, а в способе их использования!

      Значимость большим данным придает вовсе не то, что они большие, и даже не то, что они представляют собой данные. Важно то, как вы анализируете и применяете эти данные для развития своего бизнеса.

      Что делает большие данные интересными для вас и вашей организации? Вовсе не то, что они «большие». Самое интересное связано с новыми мощными средствами их анализа. Об этом и поговорим.

      Чем большие данные отличаются от традиционных данных?

      Большие данные отличаются от традиционных данных рядом важных характеристик. Не каждый источник больших данных имеет все перечисленные особенности, однако большинству свойственно следующее.

      Во-первых, большие данные часто автоматически генерируются машиной без участия человека. Традиционные источники данных всегда предполагают присутствие человека. Возьмем, к примеру, розничные или банковские транзакции, записи с содержанием телефонных звонков, доставку товаров или выставление счетов на оплату. Все эти действия подразумевают СКАЧАТЬ