Измерение информации - миф или реальность

Материал из Saratov FIO Wiki
Перейти к: навигация, поиск

Учебный проект

Учебный проект Измерение информации - миф или реальность?

Тема исследования

Измерение информации – миф или реальность?


Интересные факты

А чтобы вы представили, что это за единицы измерения, послушайте!

5 бит – буква в клетке кроссворда.

1 байт – символ, введенный с клавиатуры.

6 байт – средний размер слова, в тексте на русском языке.

50 байт – строка текста.

2 Кбайта – страница машинописного текста.

100 Кбайт – фотография в низком разрешении

1 Мбайт – небольшая художественная книга.

100 Мбайт – метровая книга с полками.

1 Гбайт – прочитывает человек за всю жизнь.

3 Гбайт – час качественной видеозаписи.

Цель исследования

Изучение подходов к измерению количества информации.

Вопросы исследования

  • Как вы понимаете слово «Информация»?
  • Как измеряется информация в быту?
  • Как измеряется информация в технике?
  • Как измеряется информация в теории информации?

План исследования


1. Теоретическое знакомство с подходами к измерению информаци.

a) Что мы понимаем по словом "Информация"?

Работая над темой мы узнали, что термин "информация" происходит от латинского слова "informatio", что означает сведения, разъяснения, изложение.

в обиходе информацией называют любые данные или сведения, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п. "Информировать" в этом смысле означает "сообщить нечто, неизвестное раньше";

в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов;

в кибернетике под информацией понимает ту часть знаний, которая используется для ориентирования, активного действия, управления, т.е. в целях сохранения, совершенствования, развития системы (Н. Винер).

Клод Шеннон, американский учёный, заложивший основы теории информации — науки, изучающей процессы, связанные с передачей, приёмом, преобразованием и хранением информации, — рассматривает информацию как снятую неопределенность наших знаний о чем-то.

б) I ПОДХОД.

Измеряемость информации в быту (информация как новизна)

ПРИМЕР

Вы получили какое - то сообщение, например, прочитали статью в любимом журнале. В этом сообщении содержится какое-то количество информации. Как оценить, сколько информации Вы получили? Другими словами, как измерить информацию? Можно ли сказать, что чем больше статья, тем больше информации она содержит?

Разные люди, получившие одно и то же сообщение, по-разному оценивают его информационную ёмкость, то есть количество информации, содержащееся в нем. Это происходит оттого, что знания людей о событиях, явлениях, о которых идет речь в сообщении, до получения сообщения были различными. Поэтому те, кто знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, могут сказать, что информации не получили вовсе. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя.


в) II ПОДХОД. Измерение информации в технике.

В технике, где информацией считается любая хранящаяся, обрабатываемая или передаваемая последовательность знаков, сигналов, часто используют простой способ определения количества информации, который может быть назван объемным. Он основан на подсчете числа символов в сообщении, то есть связан только с длиной сообщения и не учитывает его содержания.

Длина сообщения зависит от числа знаков, употребляемых для записи сообщения. Например, слово “мир” в русском алфавите записывается тремя знаками, в английском - пятью (peace), а в КОИ -8 - двадцатью четырьмя битами (111011011110100111110010).


г) III ПОДХОД - вероятностный.

Получение информации (ее увеличение) одновременно означает увеличение знания, что, в свою очередь, означает уменьшение незнания или информационной неопределенности. За единицу количества информации принимают выбор одного из двух равновероятных сообщений (“да” или “нет”, “1” или “0”). Она также названа бит. Вопрос ценности этой информации для получателя - это уже из иной области.

Таким образом, с точки зрения на информацию как на снятую неопределенность количество информации зависит от вероятности получения данного сообщения. Причем, чем больше вероятность события, тем меньше количество информации в сообщении о таком событии.

Иными словами, количество информации в сообщении о каком-то событии зависит от вероятности свершения данного события.

Научный подход к оценке сообщений был предложен еще в 1928 году Р.Хартли. Расчетная формула имеет вид:

I = log2N или 2I = N,

где

N - количество равновероятных событий (число возможных выборов),

I - количество информации.

Если N = 2 (выбор из двух возможностей), то I = 1 бит.

д) заполнение сравнительной таблицы.

444.JPG

2. Решение задач на определение количества информации.

Изучив теоретический материал, мы научились решать во такие задачи.

ЗАДАНИЕ 1

Сколько следует задать вопросов и как их следует формулировать, чтобы оценить сообщение о том, что вагон стоит на одном из 16 путей?

ОТВЕТ. 4 бита.

ЗАДАНИЕ 2

Шарик находится в одном из 64 ящичков. Сколько единиц информации будет содержать сообщение о том, где находится шарик?

ОТВЕТ. 6 бит.

ЗАДАНИЕ 3

Определите, сколько бит информации несет сообщение о том, что на светофоре горит зеленый свет.

ОТВЕТ. log23 = 1,585 (бит)


Эксперимент

"Как узнать сколько мы получили информации? Какие подходы можно использовать для подсчёта информации?"

Цель эксперимента: подсчитать количество информации, которое мы получаем в различных ситуациях, используя различные подходы.

Ход эксперимента

I. Получение информации из программы Новости Приморье.

Новость "Стройка века": проезд через фуникулер обещают открыть к концу декабря.

На бытовом уровне.

Если мы слышим эту новость впервые, то получим 1 бит информации. Если мы это уже слышали, то информации мы не получим.

Алфавитный подход.

В данное сообщение входит 71 символ, значит в кодировке КОИ-8 мы получим 71 байт информации.

Содержательный подход.

а) Если в данном сообщении рассматривать 2 варианта ответа: "откроют" или "не откроют", то мы получим 1 бит информации.

б) Если делать акцент на слова "к концу декабря", то неопределённость знаний уменьшается в 12 раз, значит мы получим log212 бит информации.

II. Работа с учебным пособием "Основы крмпьютерных сетей"

Прочитать "Рекомендации по использованию учебного курса".

В данной ситуации наиболее удобным является алфавитный подход.

Текст написан на русском языке, значит информационный вес одного символа log233.

Каждая строка содержит в среднем 68 символов, таких строк на странице 24.

Значит, мы получим 24*68* log233=1632*log233

Вывод

В зависимости от ситуации можно воспользоваться различными способами подсчёта информации.

На наш взгляд, наиболее удобным является алфавитный способ, так как:

  1. Применим в любой ситуации.
  2. Является наиболее точным, связан с математикой.
  3. Не носит вероятносный характер.

Ресурсы

Измерение информации