Информатика и ИТ. Нейросети.. Николай Петрович Морозов
Чтение книги онлайн.

Читать онлайн книгу Информатика и ИТ. Нейросети. - Николай Петрович Морозов страница 5

СКАЧАТЬ расширенно толкуемое понятие текста подпадают и обычные письменные и печатные тексты, и результаты регистрации показаний прибора, и картина художника, и запись симфонического концерта и пр.

      На втором этапе коммуникационного процесса текст, отображаемый данными, играет роль входной информации, которая далее обрабатывается совместно с другой информацией (знаниями), известной воспринимающей системе.

      Совокупность сведений (знаний), которыми располагает получатель (человек или система) называется тезаурус. Тезаурус обычно включает некое представление воспринимающей системы о той предметной области, к которой принадлежит источник данных, и о самом источнике данных.

      В процессе обработки входной информации, сопоставления ее с тезаурусом получателя происходит понимание информации (выявление ее смысла) и выделение в ней полезной информации, т.е. сведений, новых для получателя, еще не включенных в его тезаурус. Пополнение тезауруса получателя вновь выявленными сведениями и является результатом восприятия информации.

      Для понимания полученной информации получатель (называемый также пользователем) должен изначально обладать определенным запасом знаний о некоторой предметной области.

      Количество семантической информации, извлекаемой пользователем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний пользователя о предмете растет количество полезной информации, извлекаемой из сообщения.

      В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в свой тезаурус. Характер такой зависимости показан на рис.1.1. Этот рисунок демонстрирует следующее:

      – при Sp = 0 пользователь не имеет знаний о предметной области, поэтому не понимает поступившее сообщение S и количество полученной им семантической информации равно нулю (Ic = 0);

      – если тезаурус пользователя Sp, т.е. он уже «все знает» о предметной области, то очередное сообщение не содержит для него ничего нового, и Ic = 0;

      – вначале по мере роста объема тезауруса Sp возрастает количество информации, понимаемой пользователем, и, следовательно, растет количество извлекаемой полезной информации Ic, пополняющей тезаурус пользователя;

      – максимальное количество семантической информации пользователя получает тогда, когда объем тезауруса Sp позволяет ему понимать всю поступающую информацию (это значение Sp обозначено как Sp opt);

      – при дальнейшем увеличении Sp количество понятой информации уже не увеличивается, но все больше информации из поступающего сообщения оказывается пользователю известной; поэтому количество СКАЧАТЬ