Артефакт сжатия - Compression artifact

Исходное изображение с хорошей цветопередачей
Потеря четкости краев и "размытости" тона в тяжелых JPEG сжатие

А артефакт сжатия (или же артефакт) - заметное искажение медиа (в том числе картинки, аудио, и видео ) вызвано применением сжатие с потерями. Потерянный Сжатие данных включает в себя отбрасывание некоторых данных носителя, чтобы они стали достаточно маленькими, чтобы их можно было хранить в желаемом дисковое пространство или переданный (потоковое) в пределах доступной полосы пропускания (известной как скорость передачи данных или битрейт ). Если компрессор не может сохранить достаточно данных в сжатой версии, результатом будет потеря качества или появление артефактов. В алгоритм сжатия может быть недостаточно умным, чтобы отличить искажения, не имеющие особой субъективной важности, от искажений, неугодных пользователю.

Наиболее распространенными артефактами цифрового сжатия являются блоки DCT, вызванные дискретное косинусное преобразование (DCT) алгоритм сжатия, используемый во многих цифровые медиа стандарты, такие как JPEG сжатие изображений, MP3 цифровой звук, и MPEG форматы кодирования видео.[1][2][3] Эти артефакты сжатия появляются при применении сильного сжатия,[1] и часто встречаются в распространенных цифровых медиа, таких как DVD, распространенные компьютерные форматы файлов, такие как файлы JPEG, MP3 и MPEG, а также некоторые альтернативы компакт-диск, такие как Sony MiniDisc формат. Несжатые носители (например, на Лазерные диски, Аудио компакт-диски, и WAV файлы) или сжатие без потерь СМИ (например, FLAC или PNG ) не страдают артефактами сжатия.

Минимизация воспринимаемых артефактов - ключевая цель реализации алгоритма сжатия с потерями. Однако иногда артефакты намеренно произведен в художественных целях, стиль, известный как глюк искусство[4] или датамошинг.[5]

Технически говоря, артефакт сжатия - это особый класс ошибок данных, который обычно является следствием квантование при сжатии данных с потерями. Где преобразование кодирования используется, он обычно принимает форму одного из базисные функции пространства преобразования кодера.

Изображений

Иллюстрация эффекта сжатия JPEG на слегка зашумленном изображении со смесью текста и пробелов. Текст - это снимок экрана из беседы в Википедии с добавленным шумом (интенсивность 10 в Paint.NET). Один кадр анимации был сохранен в формате JPEG (качество 90) и перезагружен. Затем оба кадра были увеличены в 4 раза (интерполяция ближайшего соседа).

При выполнении блочного дискретное косинусное преобразование (DCT)[1] кодирование для квантование, как в JPEG -сжатые изображения могут появиться несколько типов артефактов.

  • Звон
  • Контуринг
  • Постеризация
  • Лестничный шум (сглаживание ) по изогнутым краям
  • Блочность в "загруженных" регионах (артефакты границ блока, иногда называемые макроблокированием, квилтингом или шахматной доской)

Другие алгоритмы с потерями, которые используют сопоставление с образцом для дедупликации похожих символов, часто приводят к появлению трудно обнаруживаемых ошибок в печатном тексте. Например, можно заменить цифры «6» и «8». Это происходило с JBIG2 в некоторых копировальных аппаратах.[6][7]

Артефакты границы блока

Артефакты блочного кодирования в изображении JPEG. Плоские блоки вызваны грубым квантованием. Видны разрывы на границах блока преобразования.

При низких скоростях передачи любой с потерями Схема блочного кодирования вводит видимые артефакты в блоки пикселей и на границах блоков. Эти границы могут преобразовывать границы блоков, границы блоков прогнозирования или и то, и другое, и могут совпадать с макроблок границы. Период, термин макроблокирование обычно используется независимо от причины артефакта. Другие названия включают черепицу,[8] мозаика, пикселирование, квилтинг и шахматная доска.

Блок-артефакты - это результат самого принципа блочное преобразование кодирование. Преобразование (например, дискретное косинусное преобразование) применяется к блоку пикселей, и для достижения сжатия с потерями коэффициенты преобразования каждого блока равны квантованный. Чем ниже скорость передачи в битах, тем грубее представлены коэффициенты и тем больше коэффициентов квантуются до нуля. По статистике, изображения имеют более низкуючастота чем высокочастотный контент, поэтому именно низкочастотный контент остается после квантования, что приводит к размытым блокам с низким разрешением. В самом крайнем случае сохраняется только DC-коэффициент, то есть коэффициент, который представляет средний цвет блока, а блок преобразования имеет только один цвет после восстановления.

Поскольку этот процесс квантования применяется индивидуально в каждом блоке, соседние блоки по-разному квантуют коэффициенты. Это приводит к разрывам на границах блоков. Они наиболее заметны на плоских участках, где мало деталей, чтобы замаскировать эффект.

Уменьшение артефактов изображения

Были предложены различные подходы для уменьшения эффектов сжатия изображения, но для использования стандартизированных методов сжатия / распаковки и сохранения преимуществ сжатия (например, более низких затрат на передачу и хранение) многие из этих методов ориентированы на «постобработку», т. Е. , обработка изображений при получении или просмотре. Не было показано, что во всех случаях методы постобработки улучшают качество изображения; следовательно, ни один из них не получил широкого признания, хотя некоторые были реализованы и используются в проприетарных системах. Например, многие программы для редактирования фотографий имеют собственные встроенные алгоритмы уменьшения артефактов JPEG. В бытовом оборудовании эту постобработку часто называют «шумоподавлением MPEG».[9]

Артефакты JPEG, возникающие в результате квантования, могут быть изменены с визуально раздражающего отображения одной или нескольких базовых функций в отдельных блоках на более приятные «зерна», похожие на те, что на фотопленках с высоким ISO. Вместо простого умножения квантованных коэффициентов на шаг квантования Q, относящийся к 2D-частоте, интеллектуальный шум в форме случайного числа в интервале] -Q / 2; Q / 2 [можно добавить к деквантованному коэффициенту. Однако для больших шагов квантования следует установить пределы L на добавленный шум, поместив случайное число в интервал] max (-Q / 2, L); min (Q / 2, L) [. Этот метод может быть добавлен как неотъемлемая часть декомпрессоров JPEG, работающих с триллионами существующих и будущих изображений JPEG. По сути, это не метод «постобработки».[10]

видео

Пример изображения с артефактами из-за ошибки передачи

Когда используется прогнозирование движения, как в MPEG-1, MPEG-2 или MPEG-4, артефакты сжатия, как правило, остаются на нескольких поколениях декомпрессированных кадров и перемещаются вместе с оптический поток изображения, что приводит к необычному эффекту, промежуточному между эффектом рисования и «грязью», которая движется вместе с объектами в сцене.

Ошибки данных в сжатом битовом потоке, возможно, из-за ошибок передачи, могут привести к ошибкам, подобным большим ошибкам квантования, или могут полностью нарушить синтаксический анализ потока данных на короткое время, что приведет к "разрыву" изображения. . Когда в битовом потоке произошли грубые ошибки, декодеры продолжают применять обновления к поврежденному изображению в течение короткого интервала, создавая эффект «фантомного изображения», до получения следующего независимо сжатого кадра. В кодировании изображений MPEG они известны как "I-кадры ", где" I "означает" intra ". Пока не поступит следующий I-кадр, декодер может выполнять маскировка ошибок.

Артефакты границы блока компенсации движения

Разрывы границ блока могут возникать на краях компенсация движения блоки предсказания. При сжатии видео с компенсацией движения текущее изображение прогнозируется путем сдвига блоков (макроблоков, разделов или единиц прогнозирования) пикселей из ранее декодированных кадров. Если два соседних блока используют разные векторы движения, на краю между блоками будет разрыв.

Москитный шум

Артефакты сжатия видео включают в себя совокупные результаты сжатия составляющих неподвижных изображений, например звон или другая занятость краев в последовательных неподвижных изображениях последовательно проявляется в виде мерцающих пятен по краям, называемых москитный шум, так как они напоминают комаров, роящихся вокруг объекта.[11][12] Так называемый «москитный шум» возникает из-за блочного дискретное косинусное преобразование (DCT) алгоритм сжатия, используемый в большинстве стандарты кодирования видео, такой как MPEG форматы.[3]

Уменьшение видео артефактов

Артефакты на границах блоков можно уменьшить, применив деблокирующий фильтр. Как и при кодировании неподвижных изображений, можно применить фильтр удаления блочности к выходу декодера в качестве постобработки.

При кодировании видео с предсказанием движения с замкнутым циклом предсказания кодер использует выходной сигнал декодера в качестве эталона предсказания, на основании которого предсказываются будущие кадры. С этой целью кодер концептуально интегрирует декодер. Если этот «декодер» выполняет блочность, то деблокировали изображение затем используются в качестве опорного изображения для компенсации движения, что повышает эффективность кодирования пути предотвращения распространения блочных артефактов через кадры. Это называется внутрицикловым фильтром удаления блочности. Стандарты, которые определяют фильтр внутренней деблокировки, включают: ВК-1, H.263 Приложение J, H.264 / AVC, и H.265 / HEVC.

Аудио

Сжатие звука с потерями обычно работает с психоакустической моделью - моделью человеческого слухового восприятия. Аудиоформаты с потерями обычно включают использование преобразования временной / частотной области, например модифицированное дискретное косинусное преобразование. В психоакустической модели используются эффекты маскировки, такие как частотная маскировка и временная маскировка, поэтому звуки, которые должны быть незаметными, не записываются. Например, как правило, люди не могут воспринимать тихий тон, воспроизводимый одновременно с аналогичным, но более громким звуком. Метод сжатия с потерями может определить этот тихий тон и попытаться удалить его. Кроме того, шумы квантования можно «спрятать» там, где они будут замаскированы более заметными звуками. При низком уровне сжатия используется консервативная психомодель с небольшими размерами блоков.

Когда психоакустическая модель является неточной, когда размер блока преобразования ограничен или когда используется агрессивное сжатие, это может привести к артефактам сжатия. Артефакты сжатия в сжатом аудио обычно проявляются как звон, предварительное эхо, "птичьи артефакты",[требуется разъяснение ] выпадение, дребезжание, трели, металлический звон, ощущение под водой, шипение или "зернистость".

Примером артефактов сжатия в аудио является аплодисменты в относительно сильно сжатом аудиофайле (например, MP3 96 кбит / с). В общем, музыкальные тона имеют повторяющиеся формы волны и более предсказуемые вариации громкости, тогда как аплодисменты по сути случайны, поэтому их сложно сжать. Сильно сжатый трек аплодисментов может иметь «металлический звон» и другие артефакты сжатия.

Художественное использование

Видео глюк-арт

Артефакты сжатия могут намеренно использоваться в качестве визуального стиля, иногда известного как глюк искусство. Роза Менкман Глитч-арт использует артефакты сжатия,[13] особенно дискретное косинусное преобразование блоки (блоки DCT) встречаются в большинстве цифровые медиа Сжатие данных форматы, такие как JPEG цифровые изображения и MP3 цифровой звук.[2] В неподвижных изображениях примером является JPEG немецким фотографом Томас Рафф, который использует преднамеренные артефакты JPEG в качестве основы стиля изображения.[14][15]

В видеоарт, один из используемых методов перенос данных, где два видео чередуются, поэтому промежуточные кадры интерполируются из двух отдельных источников. Другой метод включает простое перекодирование из одного видеоформата с потерями в другой, что позволяет использовать разницу в том, как отдельные видеокодеки обрабатывают информацию о движении и цвете.[16] Техника была изобретена художниками Самолеты Бертрана в сотрудничестве с Кристианом Жакменом в 2006 году с DivXPrime,[17] Свен Кёниг, Такеши Мурата, Жак Перконте и Пол Б. Дэвис в сотрудничестве с Паперрад, а в последнее время используется Дэвид Орейли и внутри видеоклипы за Кресельный подъемник и Набиль Эльдеркин в музыкальном видео "Welcome to Heartbreak" на Канье Вест.[18][19]

Смотрите также

Рекомендации

  1. ^ а б c Katsaggelos, Aggelos K .; Бабаджан, С. Дерин; Чун-Джен, Цай (2009). «Глава 15 - Итеративное восстановление образа». Основное руководство по обработке изображений. Академическая пресса. С. 349–383. ISBN  9780123744579.
  2. ^ а б Алихани Дарья (1 апреля 2015 г.). «За гранью разрешения: глюк-арт Розы Менкман». POSTmatter. Получено 19 октября 2019.
  3. ^ а б «Москитный шум». Журнал ПК. Получено 19 октября 2019.
  4. ^ Гир, Дункан (13 декабря 2011 г.). "Глитч-арт, созданный с помощью 'databending'". Проводной. Получено 23 декабря 2011.
  5. ^ Бейкер-Смит, Бен (28 апреля 2009 г.). «Датамошинг - красота глюка». Bitsynthesis.com. Архивировано из оригинал 16 ноября 2010 г.. Получено 28 апреля 2009.
  6. ^ «Сканеры / копировальные аппараты Xerox случайным образом изменяют номера в отсканированных документах». 2 августа 2013 г.. Получено 4 августа 2013.
  7. ^ «Запутавшиеся копировальные аппараты Xerox переписывают документы, считает эксперт». Новости BBC. 6 августа 2013 г.. Получено 6 августа 2013.
  8. ^ Уоткинсон, Джон (2004). Справочник MPEG Джона Уоткинсона. ISBN  9780240805788.
  9. ^ «Журнал ПК, Определение блокировки артефактов».
  10. ^ Хадсон, Грэм; Леже, Ален; Нисс, Биргер; Себастьен, Иштван; Ваабен, Йорген (31 августа 2018 г.). «Стандарт JPEG.1 25 лет: прошлые, настоящие и будущие причины успеха». Журнал электронного изображения. 27 (4): 1. Дои:10.1117 / 1.JEI.27.4.040901. S2CID  52164892.
  11. ^ Ле Динь, Фук-Вт; Патри, Жак. «Артефакты сжатия видео и шумоподавление MPEG». Встроенный. Получено 19 февраля 2016.
  12. ^ "3.9 москитный шум: Форма искажения занятости краев, иногда связанная с движением, характеризующаяся движущимися артефактами и / или пятнистыми шумами, наложенными на объекты (напоминающие комара, летающего вокруг головы и плеч человека) ».Рек. МСЭ-Т. P.930 (08/96) Принципы эталонной системы искажений для видео
  13. ^ Менкман, Роза (октябрь 2011 г.). Момент глюка (ммм) (PDF). Институт сетевых культур. ISBN  978-90-816021-6-7. Получено 19 октября 2019.
  14. ^ jpegs, Томас Рафф, Диафрагма, 31 мая 2009 г., 132 с., ISBN  978-1-59711-093-8
  15. ^ Обзор: JPEG от Томаса Руффа, к Йорг Кольберг, 17 апреля 2009 г.
  16. ^ Anoniem zei (19 февраля 2009 г.). «От артефакта сжатия к фильтру». Rosa-menkman.blogspot.com. Получено 23 декабря 2011.
  17. ^ Жакмен, Кристиан (2008). "Le bug dans l'oeuvre DivXPrime de Bertrand Planes: Invention et mutation. In, Ivan Toulouse и Daniel Danétis, редакторы, Eurêka: Le moment de l'invention, un dialog entre art et science, L'Harmattan, Париж" (PDF). стр. 245–256. Получено 5 ноября 2012.
  18. ^ Пиксельное кровотечение, Джон Майкл Болинг. Корневище. 25 февраля 2009 г.
  19. ^ Родригес, Джейсон (18 февраля 2009 г.). «Канье Уэст размещает новое видео на своем веб-сайте - Новости MTV». Mtv.com. Получено 23 декабря 2011.

внешняя ссылка