Глубина кодирования звука - что это? Определение, формула
Опубликованно 22.01.2018 00:30
Кодирование звука относится к способам сохранения и передачи аудио данных. В следующей статье описывается, как такая Кодировка.
Обратите внимание, что это довольно сложная тема - "Глубина кодирования звука". Определение этого понятия будет дана в нашей статье. Представленные в концепции статья предназначена только для общего обзора. Раскрыть представление о глубине кодирования звука. Некоторые из этих данных могут быть полезны для понимания того, как API работает, и как сформулировать и обработать звук в ваших приложениях. Как найти глубину кодирования звука
Аудио Формат не эквивалентно abdikadirova. Например, популярный формат файлов, таких как WAV, определяет Формат заголовка звукового файла, но не сам закодированный звук. WAV аудио файлы часто, но не всегда использование линейного кодирования ИКМ.
В свою очередь, FLAC-это Формат файла и кодировки, что иногда приводит к некоторой путанице. В речи API глубина FLAC аудио кодирование-это только кодирование, которое требует аудио-данные, содержащиеся в заголовке. Все другие кодировки указывают Сайлент аудио данных. Когда мы имеем в виду FLAC в речи API, мы всегда обращаемся к кодеку. Когда мы ссылаемся на Формат файла FLAC, мы будем использовать Формат ".ФЛАК".
Вам не нужно указывать кодировку и частоту дискретизации для файлов WAV или FLAC. Если этот параметр опущен, Облачный API и речи, автоматически определяет кодировку и частоту дискретизации для WAV и FLAC файлов основанных на файле заголовка. Если вы укажите стоимость кодирования и частота дискретизации, которая не совпадает со значением в файле заголовка, речь облачных API возвращает ошибку. Глубина кодирования звука — что это?
Состоит из звуковых сигналов, состоящий из интерполяции волн различных частот и амплитуд. Для представления этих сигналов в цифровой среде, сигналы должны быть отброшены с большой скоростью, что может представлять звуки высочайшей частоты, которые вы хотите играть. Они также должны сохранить достаточно Разрядность для представления правильной амплитудой (громкостью и мягкостью) узор волны звука.
Возможность обработки аудио устройства для воссоздания частот, известный как его Частотный диапазон, и умение создать правильный объем и мягкость известен как динамический диапазон. Вместе эти термины часто называют аудио устройств. Глубина кодирования звука-это средство, с помощью которого вы можете восстановить звук с помощью этих двух основных принципов, и способность эффективно сохранять и передавать такие данные.Частота отбора проб
Существует звук, как аналоговый форма волны. Сегмент цифрового звука approximarely этого аналогового сигнала и отсчетов амплитуды с достаточно высокой скоростью, чтобы имитировать естественную частоту волны. Частота дискретизации цифрового звука определяет количество образцов, взятых из оригинального аудио материала (во втором). Высокая частота дискретизации расширяет возможности цифрового аудио, чтобы точно представлять высоких частотах.
Как следствие теоремы Котельникова-Шеннона, обычно нужно попробовать как минимум вдвое частоту звуковой волны, которую вы хотите записать в цифровой форме. Например, чтобы представить звук в диапазоне человеческого слуха (20-20000) Гц цифровой формат аудио должен показать не менее 40000 раз в секунду (что является причиной того, что аудио компакт-дисков используется Частота дискретизации 44100 Гц).Битовая глубина
Глубина кодирования звука это влияет на динамический диапазон звука образца. Высокую битовую глубину, могут обеспечить более точную амплитуду. Если у вас есть много громких и мягких звуков в одном звуке образца, вам потребуется больше бит, чтобы правильно передать эти звуки.
Более высокой битовой глубины также снизить Соотношение "сигнал/шум" в аудио. Если глубина кодирования звука составляет 16 бит, музыка CD звук передается с помощью значений данных. Некоторые методы сжатия может компенсировать более низкую битовую глубину, но они, как правило, убытки. DVD-Аудио использует 24 бит глубины, в то время как большинство телефонов глубина кодирования звука равна 8 бит.Несжатый звук
Большая часть цифровой обработки звука использует эти два метода (Частота дискретизации и Разрядность) для легкого хранения аудио-данных. Одна из самых популярных технологий цифровой аудио (популяризируется, когда компакт-диск) называется импульсно-кодовой модуляции (или PCM). Аудио выбирается через заданные интервалы времени, и амплитуда дискретизированных волна на данный момент хранится в цифровом значении, используя битовую глубину образца.
Линейный PCM (что указывает на амплитуду линейно однородной в образец) - это стандарт, используемый на компакт-дисках и кодирования LINEAR16 речи API. Оба кодирования создать несжатый поток байтов, которое соответствует непосредственно audiocandy, и обоих стандартов содержат 16-битную глубину цвета. Линейная ИКМ используется Частота дискретизации 44100 Гц компакт-диска, подходящий для оплавления музыки. Однако, Частота дискретизации 16000 Гц больше подходит для рекомпозиции речи.
Линейный PCM (LINEAR16) является примером несжатого аудио, поскольку цифровые данные хранятся точно так же. При чтении один канал поток байтов, закодированных с помощью линейного PCM, вы можете рассчитывать каждые 16 бит (2 байта) для различных значений амплитуды сигнала. Практически все устройства могут изначально обрабатывать такие цифровые данные, вы можете обрезать аудио Линейный PCM с помощью текстового редактора, но несжатый звук не самый эффективный способ хранения и передачи цифрового аудио. По этой причине большинство аудио использует методы цифрового сжатия.Сжатый звук
Аудио-данные, как и все данные, часто сжимаются, что облегчает их хранение и транспортировку. Abdikadirova сжатие может быть без потерь или с потерями. Сжатие без потерь может быть распакован для восстановления цифровых данных в исходной форме. Компрессия наверняка удаляет некоторую информацию во время процедуры декомпрессии и параметризованные, чтобы определить степень толерантности к технике сжатия для удаления данных.Без потерь
Без потерь сжатого цифрового аудио-записи используя сложную перегруппировку данных, которые не приводят к ухудшению качества исходного цифрового образца. Для сжатия, распаковки данные в оригинальном цифровом виде, информация не будет потеряна.
Так почему же методы сжатия без потерь иногда параметры оптимизации? Эти параметры часто обращаются с размером файла для декомпрессии время погружения. Например, в формате FLAC с уровнем сжатия от 0 (самый быстрый) до 8 (самый маленький размер файла). Сжатие ФЛАК более высоком уровне не потеряете никакой информации по сравнению с более низким уровнем сжатия. Вместо этого, алгоритм сжатия просто нужно тратить больше энергии вычислений при построении или demonstrirovalsya оригинальный цифровой звук.
Речи API поддерживает два кодирование без потерь: FLAC и LINEAR16. Технически LINEAR16 не "без потерь", как в не участвует сжатия. Если Размер файла или передачи данных являются важными для вас, выберите ФЛАК в качестве способа кодирования звука.Потеря компрессии
Сжатие аудиоданных устраняет или снижает некоторые виды информации при создании сжатых данных. Речи API поддерживает несколько форматов С потерями, хотя их следует избегать, потому что потеря данных может повлиять на точность распознавания.
Популярный кодек MP3 является примером метода кодирования С потерями. Все методы сжатия mp3 удалить звук из вне обычного audiozapisey человека и настроить уровень сжатия, регулируя эффективную скорость передачи данных для MP3 кодек или количество битов в секунду для сохранения даты звук.
Например, CD-стерео с линейной PCM 16 бит имеет эффективную скорость. Формула глубина кодирования звука:
441000 * 2 канала * 16 бит = 1411200 бит в секунду (бит/с) = 1411 Кбит / с
Например, сжатие mp3 удаляет такие цифровые данные, используя скорость передачи данных, такой как 320 кбит, 128 кбит / С или 96 Кбит / с, что приводит к ухудшению качества звука. Mp3 поддерживает Переменный Битрейт, который может дополнительно сжать аудио. Оба метода потери информации и может влиять на качество. С уверенностью сказать, что большинство людей могут отличить формате mp3 музыка 96 kbps или 128 kbps.Другие формы сжатия
MULAW 8-битного РСМ кодирования, где амплитуда модулированного образец логарифмически, а не линейно. Результат оцифрованных аудиозаписей в формате ulaw уменьшает эффективный динамический диапазон сжат звук. Хотя оцифрованных аудиозаписей в формате ulaw была введена специально для оптимизации кодирования речи в отличие от других типов аудио 16-разрядный LINEAR16 (несжатые) еще далеко превосходит 8-битный сжатый аудио оцифрованных аудиозаписей в формате ulaw.
AMR и предназначенная для модулирования кодированных audiocast, вводя Переменный Битрейт в исходном образце аудио.
Хотя API речи поддерживает множество форматов С потерями, вы должны избегать их, если у вас есть контроль над источником звука. Хотя удаление этих данных с помощью сжатия С потерями, может не оказать заметного влияния на звук слышимого для человеческого уха, потеря таких данных в систему распознавания речи может значительно ухудшать точность.
Категория: обо всём