Источники данных
Автор данной книги является предпринимателем в области информационных технологий с многолетним опытом создания и продвижения собственных проектов (более 10 штук). Поэтому иногда в тексте вы будете встречать цифры и факты без пояснительной сноски на исследовательские статьи-источники. Эта информация была получена из личного опыта автора этой книги, что нисколько не умаляет ее значимость и даже напротив: ее стоит воспринимать как актуальное и реальное положение дел в IT-бизнесе на территории России в 2023 году.
Порядок и план изложения материала
В разных главах этой книги десятки раз будет возникать одна и та же цепочка из трех элементов: «цифровизация» – «большие данные» – «машинное обучение». Но структуру изложения правильнее назвать «спиралевидной». Потому что на каждом последующем витке обсуждения будут рассматриваться новые вопросы, тонкости и особенности всех трех составляющих. Таким образом, читатель сможет последовательно, по нарастающей вникнуть в различные аспекты и без лишнего напряжения овладеть этими темами на хорошем уровне. Главную же мысль данного руководства, которая и описывает вышеуказанную спираль, можно сформулировать так: «Машинное обучение позволяет заработать больше. Но чтобы обучить машину, нужны большие данные. А чтобы собрать большие данные, нужна единая информационная система компании и цифровизация всего трудового процесса».
В первой части книги мы поговорим о цифровизации некоторых процессов компании, а точнее разных ее отделений. Затем разберем способ объединения разрозненных систем. Все эти шаги позволят собирать и накапливать большие данные, о которых речь пойдет в середине руководства.
Если же читатель уже провел цифровизацию всех отделений своей компании, создал единую информационную систему и начал накапливать большие данные, ему стоит сразу обратить внимание на последнюю треть этой книги. Начиная с глав «Примеры успеха» и «Примеры неудач» и далее описаны разнообразные способы использования больших данных и машинного обучения. Приведенные истории взяты из совершенно разных отраслей предпринимательской деятельности: от свинофермы до аэропорта. В них обязательно найдутся идеи и для вашего бизнеса.
Почему машинное обучение стало полезным
С момента появления людей на планете и до двадцатого века нашей эры человечество накопило примерно два терабайта информации в виде печатных книг, рукописных свитков, скрижалей, изображений на стенах пещер и т. п. Но в настоящее время (2023 год) мы создаем подобный объем информации за долю секунды (более 300 экзобайт в день). При этом с каждым днем скорость накопления данных резко увеличивается. Почти 90 % всей существующей информации появилось за последние 2 года. А общее количество данных, накопленных человечеством, достигает уже 120 зетабайтСКАЧАТЬ