7. Представление звука в ПК

1.7.ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЯ И ЗВУКА В КОМПЬЮТЕРЕ

Создавать и хранить графические объекты в компьютере можно двумя способами: как растровое или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.

Растровое изображение представляет собой совокупность точек, используемых для его отображения на экране монитора.

Объём растрового изображения определяется как произведение количества точек и информационного объёма одной точки, который зависит от количества возможных цветов. Для черно-белого изображения информационный объём одной точки равен 1 биту, так как точка может быть либо чёрной, либо белой, что можно закодировать одной из двух цифр — 0 или 1.

Информационный объём растрового изображения (V) определяется как произведение числа входящих в изображение точек (N) на информационный объём одной точки (q), который зависит от количества возможных цветов, т. е. V=N⋅q.

При чёрно-белом изображении q = 1 бит (например, 1 — точка подсвечивается и 0 — точка не подсвечивается). Поэтому для хранения чёрно-белого (без оттенков) изображения размером 100x100 точек требуется 10000 бит.

Если между чёрным и белым цветами имеется ещё шесть оттенков серого (всего 8), то информационный объём точки равен 3 бита (log28 = 3). Информационный объём такого изображения увеличивается в три раза: V = 30000бит.

Рассмотрим, сколько потребуется бит для отображения цветной точки: для 8 цветов необходимо 3 бита; для 16цветов — 4 бита; для 256 цветов — 8 битов (1 байт). В таблице ниже представлено кодирование цветовой палитры из 16 цветов.

Разные цвета и их оттенки получаются за счёт наличия или отсутствия трёх основных цветов (красного, синего, зеленого) и степени их яркости. Каждая точка на экране кодируется с помощью 4 битов.

Цветные изображения могут отображаться в различных режимах, соответственно изменяется и информационный объём точки (см. таблицу ниже).

Описание цвета пикселя является кодом цвета.

Количество бит, отводимое на каждый пиксель для представления цвета, называют глубиной цвета (англ. color depth). От количества выделяемых бит зависит разнообразие палитры.

Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита.

Чем больше глубина цвета, тем больше объем графического файла.

Для хранения растрового изображения размером 32x32 пикселя отвели 512 байтов памяти.

Каково максимально возможное число цветов в палитре изображения?

Решение. Число точек изображения равно 32⋅32 = 1024. Мы знаем, что 512 байтов = 512⋅8=4096 бит. Найдём глубину цвета 4096÷1024=4. Число цветов равно 24 = 16.

Цвет на Web-страницах кодируется в виде RGB-кода в шестнадцатеричной системе: #RRGGBB, где RR, GG и BB — яркости красного, зеленого и синего, записанные в виде двух шестнадцатеричных цифр; это позволяет закодировать 256 значений от 0 (0016) до 255 (FF16) для каждой составляющей.

Коды некоторых цветов:

При обозначении цветов в HTML-документах вначале ставят знак номера #. В HTML: #FF0000 — интенсивно красный цвет, #00FF00 — зелёный цвет, #0000FF — синий цвет. Отсутствие цветов (#000000) даёт чёрный цвет, а самое интенсивное сочетание всех трёх каналов (#FFFFFF) даёт белый цвет.

FF — наибольшая яркость цветовой компоненты, для получения различных оттенков одного и того же цвета изменяют яркость.

Чтобы получить светлый оттенок какого-то «чистого» цвета, нужно одинаково увеличить нулевые составляющие; например, чтобы получить светло-красный цвет, нужно сделать максимальной красную составляющую и, кроме этого, одинаково увеличить остальные — синюю и зелёную: #FF9999 (сравните с красным: #FF0000).

Чтобы получить тёмный оттенок чистого цвета, нужно одинаково уменьшить все составляющие, например,#660066 — это тёмно-фиолетовый цвет (сравните с фиолетовым #FF00FF).

Заметим, что если старший бит в коде (первая, третья или пятая цифра) находится в диапазоне от 0 до 3, то можно считать, что эта цветовая компонента отсутствует в цвете, то есть #0F0F0F — это чёрный цвет.

Также следует отметить, что равное или почти равное сочетание цветовых компонент обозначает серый цвет разной интенсивности.

Векторное изображение представляет собой совокупность графических примитивов. Каждый примитив состоит из элементарных отрезков кривых, параметры которых (координаты узловых точек, радиус кривизны и пр.) описываются математическими формулами.

Для каждой линии указываются её тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет, а замкнутые фигуры дополнительно характеризуются типом заливки.

Рассмотрим, например, такой графический примитив, как окружность радиуса r. Для её построения необходимо и достаточно следующих исходных данных:

- координаты центра окружности;

- значение радиуса r;

- цвет заполнения (если окружность не прозрачная);

- цвет и толщина контура (в случае наличия контура).

Информация о векторном рисунке кодируется обычным способом, как хранятся тексты, формулы, числа, т. е. хранится не графическое изображение, а только координаты и характеристики изображения его деталей. Поэтому для хранения векторных изображений требуется существенно меньше памяти, чем растровых изображений.

Звук

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека.

Чем больше частота сигнала, тем выше тон.

Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz).

Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука.

Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц).

Процесс перевода звуковых сигналов от непрерывной формы представления к дискретной, цифровой форме называют оцифровкой.

Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1секунду:

- 1 (одно) измерение в секунду соответствует частоте 1 Гц;

- 1000 измерений в секунду соответствует частоте 1 кГц.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценить информационный объём моноаудиофайла (V) можно следующим образом: V = N⋅f⋅k, где N — общая длительность звучания (секунд), f — частота дискретизации (Гц), k — глубина кодирования (бит).

Например, при длительности звучания 1 минуту и среднем качестве звука (16 бит, 24 кГц):

V = 60⋅24000⋅16 бит = 23040000 бит = 2880000 байт = 2812,5 Кбайт = 2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла длительностью звучания 1секунда при среднем качестве звука (16 битов, 24000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1секунду и умножить на 2 (стереозвук):

V=16 бит ⋅24000⋅2 = 768000 бит = 96000 байт = 93,75 Кбайт.

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и, следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

Преобразование звукового сигнала в дискретный сигнал: a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП.

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. ниже. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Преобразование дискретного сигнала в звуковой сигнал: а — дискретный сигнал на входе ЦАП; б — звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Когда говорят о видеозаписи, прежде всего, имеют в виду движущееся изображение на экране телевизора или монитора.

Преобразование оптического изображения в последовательность электрических сигналов осуществляется видеокамерой. Эти сигналы несут информацию о яркости и цвете отдельных участков изображения. Они сохраняются на носителе в виде изменения намагниченности видеоленты (аналоговая форма) или в виде последовательности кодовых комбинаций электрических импульсов (цифровая форма).

Процесс превращения непрерывного сигнала в набор кодовых слов называется аналого-цифровым преобразованием.

Это сложный процесс, состоящий из:

- дискретизации, когда непрерывный сигнал заменяется последовательностью мгновенных значений через равные промежутки времени;

- квантования, когда величина каждого отсчёта заменяется округлённым значением ближайшего уровня;

- кодирования, когда каждому значению уровней квантования, полученных на предыдущем этапе, сопоставляются их порядковые номера в двоичном виде.

По своей сути видеофайл — это набор статичных изображений, меняющих друг друга с определенной частотой. Каждое статичное изображение является отдельным кадром видео. Это действительно так, если мы говорим о несжатом видео. Однако в таком формате никто не хранит фильмы.

Дело в том, что несжатое видео занимает на диске очень много места. Кадр видео формата PAL состоит из 720точек по горизонтали и 576 по вертикали. То есть один кадр состоит из 414720 точек.

Для хранения цвета каждой точки в памяти отводится 24 бита (по 8 бит для каждой из составляющих RGB).

Следовательно, для хранения одного кадра понадобится 9953280 бит (или примерно 1,2 Мбайт).

То есть секунда несжатого видео в формате PAL будет занимать почти 30 Мбайт. А один час такого видео — более 100Гбайт.

Каким же образом полнометражный фильм (а то и несколько) умещается на одном компакт-диске или флеш-накопителе?

Дело в том, что, в основном, видео хранят в видеофайлах, в которых применены различные алгоритмы сжатия информации. Благодаря этим технологиям видеофайл можно сжимать в десятки и сотни раз практически без потери качества картинки и звука.

AVI (Audio Video Interleave) — это контейнерный формат, что означает, что в нём могут содержаться аудио/видео, сжатые различными комбинациями кодирования.

AVI файл может содержать различные виды компрессированных данных (например, DivX для видеоинформации и MP3 для аудио), в зависимости от того, какой кодек используется для кодирования/декодирования. В файле с расширением AVI может храниться несжатое видео, видео в форматах DV, MPEG-4, DivX, Xvid и даже MPEG-1 иMPEG-2. Кроме того, файл формата AVI может, например, содержать в себе только звук. То есть файлы форматаAVI являются контейнером для хранения данных различного типа.

Контейнер — это файл с каким либо расширением, служащий для хранения в цифровом виде преобразованной аналоговой информации. Контейнер является файлом некоего стандарта, в котором одновременно может содержаться несколько различных типов информации.

DivX — технология видеозаписи, позволяющая создавать и просматривать медиа файлы с высокой степенью сжатия. Это технология сжатия, которая делает фильм в 8-12 раз меньшим с небольшой потерей качества.

DivX широко используется для сжатия компьютерных видеофайлов и файлов DVD, чтобы они помещались на стандартный CD.

MPEG (Moving Picture Expert Group) — формат, предназначенный для сжатия звуковых и видеофайлов для загрузки или пересылки, например, через Интернет.

Разработан Экспертной группой кинематографии, которая занимается разработкой стандартов кодирования и сжатия видео- и аудиоданных. Существуют разные стандарты MPEG: MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7. Например, MPEG-4 — стандарт, благодаря которому фильмы можно кодировать в хорошем качестве при низкой скорости передачи данных. Стандарт MPEG-4 в основном используется для вещания (потоковое видео), записи фильмов на компакт-диски, видеотелефонии (видеотелефон) и широковещания, в которых активно используется сжатие цифровых видео и звука.

Теоретический материал взят с сайта http://www.yaklass.ru

Доступная информатика

ЛЕГКО И ПРОСТО...

1.7.ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЯ И ЗВУКА В КОМПЬЮТЕРЕ