Кодирование текстовой информации

Кодирование текстовых данных — это присваивание символу текста кода из кодовой системы. Существуют различные стандартные таблицы кодирования текстовой информации: ASCII — первая в мире система кодировки с кодами на 256 символов. Unicode — расширяет программу ASCII и превышает его размер в 256 раз. KOI-8SOI-1251SOI-866ISO — русские буквенные таблицы. В этом случае следует учитывать, что код, полученный в одной программе не будет читаться в другой программе.

Кодировка числовой информации

Все числа кодируются с помощью бинарного кодирования, состоящего из чисел от 0 до 1 и эти символы называются битом. Этот метод кодирования самый популярный, потому что его легко можно реализовать: если есть сигнал, то значит 1, если нет сигнала, то 0. Единственным недостатком бинарной кодовой системы является длинное кодирование, но в техническом плане это будет удобнее, поскольку длинное кодирование из простых однотипных компонентов легче передавать, чем длинное из сложных. Целые числа кодируются при переводе их в другую систему счисления с помощью 80 — разрядной кодировки.

Кодирование звуковой информации

Звук — это непрерывная волна с изменяющейся амплитудой и частотой. Чтобы компьютер мог работать с непрерывным звуковым сигналом, его необходимо подвергнуть дискретизации, то есть превратить в последовательность электроимпульсов. Это означает, что звуковые волны разбиваются на несколько временных участков. Гладкие кривые заменяются последовательностью, называемой «ступенью». Каждой «ступени» присваивают значение звуковой громкости. Чем больше уровней звука, тем качественнее будет звучание. Чем больше число измерений частоты звука в секунду, тем чётче будет звук. Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации. Для подсчета веса звуковых волн достаточно перемножить частоту и глубину кодирования, а также время звучания звуковых волн. Современное звучание делится на стереозвучание и квадрозвучание.

Решение задач на кодирование текстовой информации

Что нужно знать: все символы кодируются одинаковым числом бит (алфавитный подход) чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные) при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта после знака препинания внутри (не в конце!) текста ставится пробел чтобы найти информационный объем текста  I , нужно умножить количество символов  N  на число бит на символ  K : I=N*K

Задача 1.

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?

Дано:

i1 = 16

i2 = 8

I1 = x

I2 = x — 800

K = ?

Решение:

i1 — i2 = 16 — 8 = 8 (бит)

Так как объем информационного сообщения уменьшился на 800 бит, следовательно количество символов в сообщение равно 800/8=100.

K = 800/8=100

Ответ: 100 символов

Задача 2.

Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 7–битном коде ASCII, в 16–битную кодировку Unicode.

При этом информационное сообщение увеличилось на

Дано:

K = 48

i1 = 7

i2 = 16

I2 = ?

Решение:

I1 = 48 * 7 = 336 (бит)

i = i2 — i1 = 16 — 7 =9 (бит)

I2 = 48 * 16 = 768 (бит)

I2 — I1 = 432 (бита)

Ответ: на 432

Задача 3.

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16–битном коде Unicode, в 8–битную кодировку Windows–1251, при этом информационный объем сообщения составил 60 байт.

Определите информационный объем сообщения до перекодировки.

Дано:

i1 = 16 бит

i2 = 8 бит

I2 = 60 байт = 480 бит

I1 = ?

Решение:

K = I2 / i2 = 480 / 8 = 60 (символов)

I1 = K * i1 = 60 * 16 = 960 (бит)

Ответ: 960

Решение задач на кодирование звуковой информации.

Теоретическая часть

При решении задач учащиеся опираются на следующие понятия:

 Временная дискретизация – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук.

Глубина звука (глубина кодирования) — количество бит на кодировку звука.

Количество различных уровней громкости рассчитываем по формуле N= 2I , где I – глубина звука.

Частота дискретизации – количество измерений уровня входного сигнала в единицу времени (за 1 сек). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц).

 Качество двоичного кодирования – величина, которая определяется глубиной кодирования и частотой дискретизации.

Разрядность регистра — число бит в регистре аудио адаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I, то при измерении входного сигнала может быть получено 2I =N различных значений.

Практическая часть. Разбор и решение задачи.

Задача 1. Оцените информационный объём цифрового звукового стерео файла длительностью 20 секунд при глубине кодирования 16 бит и частоте дискретизации 10000 Гц?  Результат представить в Кбайтах, округлить до сотых.

При решении таких задач надо не забывать следующее:

Что  моно — 1 канал, стерео — 2 канала

Дано:

I = 16 бит

t = 20 сек

d =10000 Гц

 

 

I — разрядность звуковой карты,

t — время звучания аудиофайла,

d — частота дискретизации

 

 

Решение:

V =2· I · d ·t

V = 2* 16 * 10000*20 = 6400000 бит

6400000/8 = 800000 байт

800000/1024 = 781,25 Кбайт

Ответ:V(Инфор.) = 781,25 Кбайт

Найти: V(информационный объём)-?

Задача 2. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит.

 Дано:

I = 8 бит=1 байт

t = 10 сек

d = 22,05 кГц = 22,05 * 1000 Гц = 22050 Гц

I — разрядность звуковой карты,

t — время звучания аудиофайла,

d — частота дискретизации

Решение:

V(Инфор.) =  I · d ·t

V(Инфор.) =  22050 *10 *1 = 220500 байт

Ответ: V(Инфор.) = 220500 байт

Найти: V(информационный объём)-?

Задача 3. Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Дано:

I = 16 бит = 2 байт

V(Инфор.) = 5,25Мб = 5505024 байт

d = 22,05 кГц =22,05 * 1000 Гц =22050 Гц

  Решение:

V(Инфор.) =  I · d ·t

t = V(Инфор.)/( d · I)

t = 5505024/( 22050 *2 = 124,8 сек

Ответ: t = 124,8 секунды

Найти: t-?  

 

Фамилия, группа
Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 8–битном коде, в 16–битную кодировку Unicode.

Какое количество информации было в изначальном сообщении

Какой объем видеопамяти необходим для хранения двух страниц изображения при условии, что разрешающая способность дисплея равна 640 на 480 точек, а глубина цвета равна24?

Запишите число в байтах

Определите объем памяти для хранения моноаудиофайла, время звучания которого составляет пять минут при частоте дискретизация 44кГц и глубине кодирования 16 бит.

Запишите число в Мб (округлить до целого)

Какой должна быть частота дискретизации и глубина кодирования для записи звуковой информации длительностью 2 минуты, если в распоряжении пользователя имеется память объемом 5,1 Мб?

Если глубина кодирования 8 бит (ответ в Гц)

Каков информационный объем сообщения "Я помню чудное мгновенье" при условии, что один символ кодируется одним байтом и соседние слова разделены одним пробелом?

Ответ запишите в байтах

Расшифруйте (декодируйте), что записано в сообщении


Оцените информационный объём цифрового звукового стерео файла длительностью 25 секунд при глубине кодирования 8 бит и частоте дискретизации 10000 Гц? Результат представить в Кбайтах, округлить до десятых.

Объем свободной памяти на диске — 7,3 Мб, разрядность звуковой платы — 32. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Округлить до десятых