Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/834bf9078af853396287658e051b55f3 to your computer and use it in GitHub Desktop.
Save anonymous/834bf9078af853396287658e051b55f3 to your computer and use it in GitHub Desktop.
Способа оценки количества информации

Способа оценки количества информации - Измерение информации



Как уже отмечалось, понятие информации можно рассматривать при различных ограничениях, накладываемых на ее свойства, т. В основном выделяют три уровня — синтаксический, семантический и прагматический. Соответственно на каждом из них для определения количества информации применяют различные оценки. На синтаксическом уровне для оценки количества информации используют вероятностные методы, которые принимают во внимание только вероятностные свойства информации и не учитывают другие смысловое содержание, полезность, актуальность и т. Такой подход, называемый также вероятностным, постулирует принцип: При этом сообщения содержат информацию о каких-либо событиях, которые могут реализоваться с различными вероятностями. Формулу для определения количества информации для событий с различными вероятностями и получаемых от дискретного источника информации предложил американский ученый К. Согласно этой формуле количество информации может быть определено следующим образом:. Определяемое с помощью формулы 1. Если вероятность появления отдельных событий одинаковая и они образуют полную группу событий, т. Применение логарифмов в формулах 1. Для простоты рассуждений воспользуемся соотношением 1. Чтобы определить, какое событие из N равновероятных событий произошло, для каждого числа ряда необходимо последовательно производить операции выбора из двух возможных событий. Таким образом получим следующий ряд чисел: Последовательность значений чисел, которые принимает аргумент N, представляет собой ряд, известный в математике как ряд чисел, образующих геометрическую прогрессию, а последовательность значений чисел, которые принимает функция I , будет являться рядом, образующим арифметическую прогрессию. Таким образом, логарифм в формулах 1. Для количественного определения оценки любой физической величины необходимо определить единицу измерения, которая в теории измерений носит название меры. Как уже отмечалось, информацию перед обработкой, передачей и хранением необходимо подвергнуть кодированию. Кодирование производится с помощью специальных алфавитов знаковых систем. В информатике, изучающей процессы получения, обработки, передачи и хранения информации с помощью вычислительных компьютерных систем, в основном используется двоичное кодирование, при котором используется знаковая система, состоящая из двух символов 0 и 1. По этой причине в формулах 1. Исходя из вероятностного подхода к определению количества информации эти два символа двоичной знаковой системы можно рассматривать как два различных возможных события, поэтому за единицу количества информации принято такое количество информации, которое содержит сообщение, уменьшающее неопределенность знания в два раза до получения событий их вероятность равна 0,5, после получения — 1, неопределенность уменьшается соответственно: Такая единица измерения информации называется битом от англ. Таким образом, в качестве меры для оценки количества информации на синтаксическом уровне, при условии двоичного кодирования, принят один бит. Следующей по величине единицей измерения количества информации является байт, представляющий собой последовательность, составленную из восьми бит, т. Выбор этот объясняется тем, что компьютер в основном оперирует числами не в десятичной, а в двоичной системе счисления. Для устранения этой некорректности международная организацией International Electrotechnical Commission, занимающаяся созданием стандартов для отрасли электронных технологий, утвердила ряд новых приставок для единиц измерения количества информации: Однако пока используются старые обозначения единиц измерения количества информации, и требуется время, чтобы новые названия начали широко применяться. Вероятностный подход используется и при определении количества информации, представленной с помощью знаковых систем. Если рассматривать символы алфавита как множество возможных сообщений N, то количество информации, которое несет один знак алфавита, можно определить по формуле 1. При равновероятном появлении каждого знака алфавита в тексте сообщения для определения количества информации можно воспользоваться формулой 1. Количество информации, которое несет один знак алфавита, тем больше, чем больше знаков входит в этот алфавит. Количество знаков, входящих в алфавит, называется мощностью алфавита. Количество информации информационный объем , содержащееся в сообщении, закодированном с помощью знаковой системы и содержащем определенное количество знаков символов , определяется с помощью формулы:. Определим, какое количество информации можно получить после реализации одного из шести событий. Вероятность первого события составляет 0,15; второго — 0,25; третьего — 0,2; четвертого — 0,12; пятого — 0,12; шестого — 0,1, т. Для вычисления этого выражения, содержащего логарифмы, воспользуемся сначала компьютерным калькулятором, а затем табличным процессором Microsoft MS Excel, входящим в интегрированный пакет программ MS Office ХР. После запуска программы выполним команду: Кнопка log калькулятора производит вычисление десятичного по основанию 10 логарифма отображаемого числа. Поскольку в нашем случае необходимо производить вычисления логарифмов по основанию 2, а данный калькулятор не позволяет этого делать, то необходимо воспользоваться известной формулой:. При вычислении на калькуляторе используем кнопки: Результат вычисления показан на рис. Воспользуемся теперь табличным процессором MS Excel. Для запуска программы Excel выполним команду: Для написания нижних индексов у вероятностей Р? P в ячейках А1, В1, С1, D1, E1, F1 выполним следующую команду: В ячейки А2, В2, С2, D2, Е2, F2 запишем соответствующие значения вероятностей. После записи значений в ячейки необходимо установить в них формат числа. Для этого необходимо выполнить следующую команду: Устанавливаем в ячейке G2 тот же числовой формат. Определим, какое количество байт и бит информации содержится в сообщении, если его объем составляет 0,25 Кбайта. С помощью калькулятора определим количество байт и бит информации, которое содержится в данном сообщении:. Определим мощность алфавита, с помощью которого передано сообщение, содержащее символов, если информационный объем сообщения составляет 2 Кбайта. Определим количество бит, приходящееся на один символ информационный объем одного символа в алфавите:. Как уже отмечалось, если принять во внимание только свойство информации, связанное с ее смысловым содержанием, то при определении понятия информации можно ограничиться смысловым, или семантическим, уровнем рассмотрения этого понятия. На семантическом уровне информация рассматривается по ее содержанию, отражающему состояние отдельного объекта или системы в целом. При этом не учитывается ее полезность для получателя информации. На данном уровне изучаются отношения между знаками, их предметными и смысловыми значениями см. Поскольку смысловое содержание информации передается с помощью сообщения, т. При этом под тезаурусом понимается совокупность априорной информации сведений , которой располагает приемник информации. Данный подход предполагает, что для понимания осмысливания и использования полученной информации приемник получатель должен обладать априорной информацией тезаурусом , т. Таким образом, если принять знания о данном объекте или явлении за тезаурус, то количество информации, содержащееся в новом сообщении о данном предмете, можно оценить по изменению индивидуального тезауруса под воздействием данного сообщения. В зависимости от соотношений между смысловым содержанием сообщения и тезаурусом пользователя изменяется количество семантической информации, при этом характер такой зависимости не поддается строгому математическому описанию и сводится к рассмотрению трех основных условий, при которых тезаурус пользователя:. Два первых предельных случая соответствуют состоянию, при котором количество семантической информации, получаемое пользователем, минимально. Третий случай связан с получением максимального количества семантической информации. Таким образом, количество семантической информации, получаемой пользователем, является величиной относительной, поскольку одно и то же сообщение может иметь смысловое содержание для компетентного и быть бессмысленным для некомпетентного пользователя. Поэтому возникает сложность получения объективной оценки количества информации на семантическом уровне ее рассмотрения и для получения такой оценки используют различные единицы измерения количества информации: В качестве абсолютных единиц измерения могут использоваться символы, реквизиты, записи и т. Например, для определения на семантическом уровне количества информации, полученной студентами на занятиях, в качестве единицы измерения может быть принят исходный балл символ , характеризующий степень усвояемости ими нового учебного материала, на основе которого можно косвенно определить количество информации, полученное каждым студентом. Это количество информации будет выражено через соответствующий оценочный балл в принятом диапазоне оценок. При семантическом подходе к оценке количества информации и выборе единицы измерения существенным является вид получаемой информации сообщения. Так, данный подход к оценке количества экономической информации позволяет выявить составную единицу экономической информации, состоящую из совокупности других единиц информации, связанных между собой по смыслу. Элементарной составляющей единицей экономической информации является реквизит, т. Деление реквизитов на символы приводит к потере их смыслового содержания. Каждый реквизит характеризуется именем, значением и типом. При этом под именем реквизита понимается его условное обозначение, под значением — величина, характеризующая свойства объекта или явления в определенных обстоятельствах, под типом — множество значений реквизита, объединенных определенными признаками и совокупностью допустимых преобразований. Реквизиты-основания характеризуют количественную сторону экономического объекта, процесса или явления, которые могут быть получены в результате совершения отдельных операций — вычислений, измерений, подсчета натуральных единиц и т. В экономических документах к ним можно отнести, например, цену товара, его количество, сумму и т. Реквизиты-основания чаще всего выражаются в цифрах, над которыми могут выполняться математические операции. Реквизиты-признаки отражают качественные свойства экономического объекта, процесса или явления. С помощью реквизитов-признаков сообщения приобретают индивидуальный характер. В экономических документах к ним можно отнести, например, номер документа, имя отправителя, дату составления документа, вид операции и т. Реквизиты-признаки позволяют осуществлять логическую обработку единиц количества информации на семантическом уровне: Отдельный реквизит-основание вместе с относящимися к нему реквизитами-признаками образует следующую в иерархическом отношении составную единицу экономической информации — показатель. Показатель имеет наименование, в состав которого входят термины, обозначающие измеряемый объект: Кроме того, показатель содержит формальную характеристику и дополнительные признаки. К формальной характеристике относится способ его получения объем, сумма, прирост, процент, среднее значение и т. Таким образом, с помощью совокупности реквизитов и соответствующих им показателей можно оценить количество экономической информации, получаемой от исследуемого объекта источника информации. Кроме подхода, основанного на использовании тезаурусной меры, при определении количества информации на семантическом уровне находят применение и другие подходы [1]. Например, один из подходов, связанных с семантической оценкой количества информации, заключается в том, что в качестве основного критерия семантической ценности информации, содержащейся в сообщении, принимается количество ссылок на него в других сообщениях. Количество получаемой информации определяется на основе статистической обработки ссылок в различных выборках. Подводя итог сказанному, можно утверждать, что существовала и существует проблема формирования единого системного подхода к определению информации на семантическом уровне. Это подтверждается и тем, что в свое время для создания строгой научной теории информации К. Шеннон вынужден был отбросить важное свойство информации, связанное со смысловым ее содержанием. Кроме перечисленных уровней рассмотрения понятия информации достаточно широко используется прагматический уровень. На данном уровне информация рассматривается с точки зрения ее полезности ценности для достижения потребителем информации человеком поставленной практической цели. Данный подход при определении полезности информации основан на расчете приращения вероятности достижения цели до и после получения получения информации [1]. Количество информации, определяющее ее ценность полезность , находится по формуле:. В качестве единицы измерения меры количества информации, определяющей ее ценность, может быть принят 1 бит при основании логарифма, равном 2 , т. Рассмотрим три случая, когда количество информации, определяющее ее ценность, равно нулю и когда она принимает положительное и отрицательное значение. Такую информацию называют дезинформацией. Дальнейшее развитие данного подхода базируется на статистической теории информации и теории решений. При этом кроме вероятностныхарактеристик достижения цели после получения информации вводятся функции потерь и оценка полезности информации производится в результате минимизации функции потерь. Максимальной ценностью обладает то количество информации, которое уменьшает потери до нуля при достижении поставленной цели [1]. История науки и техники Com New. Единицы измерения количества информации Как уже отмечалось, понятие информации можно рассматривать при различных ограничениях, накладываемых на ее свойства, т. Согласно этой формуле количество информации может быть определено следующим образом:


Как составить резюме инженера образец
Почему машина стиральная занусси течет причина
Методы оценки количества информации
Значение судебной практики
Гугл адвордс создать компанию
Снять приворот через церковь
Контракты примеры скачать
Образцы номенклатуры дел в доу
Схема не имеет решения
Общая правовая характеристика объекта
Жимолость волхова описание сорта фото
Экологические нормативы качества
Три подхода к определению понятия "Количество информации"
Как стать феей попроще
Финансовый вид бизнеса характеристика
Шумоизоляция ваз 21213 своими руками
Погода на 2 недели
Фильм где расчленяют людей
Методы оценки количества информации.
Каталог домовой спб свежий
Восточное шоссе 21 нижний тагил на карте
Как правильно начать качаться в тренажерном зале
Какой мужчина рак когда влюблен
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment