Формат кодирования видео - Video coding format

А формат кодирования видео[1][2] (или иногда формат сжатия видео) это формат представления контента для хранения или передачи цифровой видеоконтент (например, в файле данных или битовый поток ). Обычно используется стандартизованный сжатие видео алгоритм, чаще всего основанный на дискретное косинусное преобразование (DCT) кодирование и компенсация движения. Примеры форматов кодирования видео включают H.262 (MPEG-2, часть 2), MPEG-4, часть 2, H.264 (MPEG-4, часть 10), HEVC (H.265), Теора, RealVideo RV40, VP9, и AV1. Конкретная программная или аппаратная реализация, способная выполнять сжатие или декомпрессию в / из определенного формата кодирования видео, называется видео кодек; пример видеокодека Xvid, который является одним из нескольких кодеков, реализующих кодирование и декодирование видео в MPEG-4, часть 2 формат кодирования видео в программном обеспечении.

Некоторые форматы кодирования видео задокументированы подробным техническая спецификация документ, известный как спецификация кодирования видео. Некоторые такие спецификации написаны и утверждены организации по стандартизации в качестве технические стандарты, и поэтому известны как стандарт кодирования видео. Термин «стандартный» также иногда используется для де-факто стандарты а также формальные стандарты.

Видеоконтент, закодированный с использованием определенного формата видеокодирования, обычно объединяется с аудиопотоком (кодируется с использованием формат кодирования звука ) внутри формат мультимедийного контейнера Такие как AVI, MP4, FLV, RealMedia, или же Матроска. Таким образом, у пользователя обычно нет H.264 файл, но вместо него .mp4 видео файл, который представляет собой контейнер MP4, содержащий видео в кодировке H.264, обычно вместе с AAC закодированный звук. Форматы мультимедийных контейнеров могут содержать любой из множества различных форматов кодирования видео; например, формат контейнера MP4 может содержать видео в любом MPEG-2, часть 2 или формат кодирования видео H.264, среди прочего. Другой пример - начальная спецификация для типа файла. WebM, в котором указан формат контейнера (Matroska), но также и какое именно видео (VP8 ) и аудио (Vorbis ) формат сжатия используется внутри контейнера Matroska, хотя сам формат контейнера Matroska может содержать другие форматы кодирования видео (VP9 видео и Opus поддержка звука была позже добавлена ​​в спецификацию WebM).

Различие между «форматом» и «кодеком»

Хотя форматы кодирования видео, такие как H.264, иногда называют кодеки, существует четкая концептуальная разница между спецификацией и ее реализациями. Форматы кодирования видео описаны в спецификациях, и программное или аппаратное обеспечение для кодирования / декодирования данных в данном формате кодирования видео из / в несжатое видео являются реализациями этих спецификаций. По аналогии, формат кодирования видео H.264 (спецификация) соответствует кодек ОткрытьH264 (конкретная реализация) какой Язык программирования C (спецификация) передается компилятору GCC (конкретная реализация). Обратите внимание, что для каждой спецификации (например, H.264 ), может быть много кодеков, реализующих эту спецификацию (например, x264, OpenH264, Продукты и реализации H.264 / MPEG-4 AVC ).

Это различие не находит постоянного терминологического отражения в литературе. Спецификация H.264 требует H.261, H.262, H.263, и H.264 стандарты кодирования видео и не содержит слова кодек.[3] В Альянс открытых СМИ четко различает AV1 формат кодирования видео и соответствующий кодек, который они разрабатывают, но сам формат кодирования видео называет спецификация видеокодека.[4] В VP9 спецификация называет сам формат кодирования видео VP9 кодек.[5]

В качестве примера слияния Chromium's[6] и Mozilla[7] страницы со списком их видеоформатов поддерживают оба формата кодирования видео вызова, такие как H.264 кодеки. В качестве другого примера, в объявлении Cisco о видеокодеке «бесплатно, как в пиве», в пресс-релизе формат кодирования видео H.264 упоминается как «кодек» («выбор общего видеокодека»), но упоминается кодек Cisco. реализация кодера / декодера H.264 вскоре после этого «кодек» («наш кодек H.264 с открытым исходным кодом»).[8]

Формат кодирования видео не диктует все алгоритмы используется кодек реализация формата. Например, большая часть того, как обычно работает сжатие видео, - это поиск сходство между видеокадрами (сопоставление блоков), а затем достижение сжатия путем копирования ранее закодированных похожих фрагментов изображений (например, макроблоки ) и добавляя небольшие отличия при необходимости. Поиск оптимальных комбинаций таких предикторов и различий - это NP-жесткий проблема,[9] Это означает, что найти оптимальное решение практически невозможно. Хотя формат видеокодирования должен поддерживать такое сжатие по кадрам в формате битового потока, не требуя без надобности определенных алгоритмов для поиска таких совпадений блоков и других этапов кодирования, кодеки, реализующие спецификацию видеокодирования, имеют некоторую свободу для оптимизации и нововведений в своем выборе. алгоритмов. Например, в разделе 0.5 спецификации H.264 говорится, что алгоритмы кодирования не являются частью спецификации.[3] Свободный выбор алгоритма также позволяет пространственно-временная сложность компромиссы для одного и того же формата кодирования видео, так что прямая трансляция может использовать быстрый, но неэффективный алгоритм, в то время как одноразовое кодирование DVD для более позднего массового производства может заменить длительное время кодирования на компактное кодирование.

История

Концепция чего-либо аналоговое видео Сжатие восходит к 1929 году, когда Р.Д. Келл в Великобритании предложил концепцию передачи только тех частей сцены, которые меняются от кадра к кадру. Концепция чего-либо цифровое видео сжатие восходит к 1952 году, когда Bell Labs исследователи Б. Оливер и К.В. Харрисон предложили использовать дифференциальная импульсно-кодовая модуляция (DPCM) в кодировании видео. Концепция чего-либо межкадровый компенсация движения восходит к 1959 году, когда NHK исследователи Y. Taki, M. Hatori и S. Tanaka предложили прогнозирующее межкадровое кодирование видео в временное измерение.[10] В 1967 г. Лондонский университет исследователи А. Х. Робинсон и К. Черри предложили кодирование длин серий (RLE), а сжатие без потерь схема, чтобы уменьшить пропускную способность передачи аналоговое телевидение сигналы.[11]

Самые ранние алгоритмы кодирования цифрового видео были либо для несжатое видео или использовал сжатие без потерь, оба метода неэффективны и непрактичны для кодирования цифрового видео.[12][13] Цифровое видео было представлено в 1970-х годах,[12] изначально с использованием несжатого импульсно-кодовая модуляция (PCM) требующий высокого битрейты около 45–200 Мбит / с за Стандартное определение (SD) видео,[12][13] который был до 2000 раз больше, чем телекоммуникации пропускная способность (до 100 кбит / с ) доступны до 1990-х годов.[13] Точно так же несжатый высокое разрешение (HD) 1080p видео требует битрейта больше 1 Гбит / с, значительно превышающей пропускную способность, доступную в 2000-х годах.[14]

DCT с компенсацией движения

Практичный сжатие видео стало возможным благодаря развитию с компенсацией движения DCT (MC DCT) кодирование,[13][12] также называется компенсацией движения блока (BMC)[10] или компенсация движения DCT. Это гибридный алгоритм кодирования,[10] который сочетает в себе два ключевых Сжатие данных техники: дискретное косинусное преобразование (DCT) кодирование[13][12] в пространственное измерение, и прогнозирующий компенсация движения в временное измерение.[10]

Кодирование DCT - это с потерями блочное сжатие преобразование кодирования метод, который был впервые предложен Насир Ахмед, который изначально предназначался для сжатие изображений, пока он работал на Канзасский государственный университет в 1972 году Ахмед с Т. Натараджаном и его разработали в практический алгоритм сжатия изображений. К. Р. Рао на Техасский университет в 1973 г. и был опубликован в 1974 г.[15][16][17]

Другим ключевым достижением было гибридное кодирование с компенсацией движения.[10] В 1974 году Али Хабиби на Университет Южной Калифорнии введено гибридное кодирование,[18][19][20] который сочетает в себе кодирование с предсказанием и кодирование с преобразованием.[10][21] Он изучил несколько методов кодирования с преобразованием, включая DCT, Преобразование Адамара, преобразование Фурье, наклонное преобразование и Преобразование Карунена-Лоэва.[18] Однако его алгоритм изначально был ограничен внутрикадровый кодирование в пространственном измерении. В 1975 году Джон А. Роуз и Ганер С. Робинсон расширили алгоритм гибридного кодирования Хабиби до временного измерения, используя кодирование с преобразованием в пространственном измерении и кодирование с предсказанием во временном измерении, разработав межкадровый гибридное кодирование с компенсацией движения.[10][22] Для кодирования с пространственным преобразованием они экспериментировали с различными преобразованиями, включая DCT и быстрое преобразование Фурье (FFT), разработав для них межкадровые гибридные кодеры, и обнаружил, что DCT является наиболее эффективным из-за его меньшей сложности, способного сжимать данные изображения до 0,25-кусочек на пиксель для видеотелефон сцена с качеством изображения, сравнимым с типичным внутрикадровым кодером, требующим 2 бита на пиксель.[23][22]

DCT был применен к кодированию видео Wen-Hsiung Chen,[24] который разработал быстрый алгоритм DCT с C.H. Смит и С.К. Фралик в 1977 г.,[25][26] и основал Лаборатории сжатия коммерциализировать технологию DCT.[24] В 1979 г. Анил К. Джайн и Джасвант Р. Джайн разработали дальнейшее сжатие видео DCT с компенсацией движения.[27][10] Это привело к тому, что в 1981 году Чен разработал практический алгоритм сжатия видео, названный DCT с компенсацией движения или адаптивным кодированием сцены.[10] DCT с компенсацией движения позже стал стандартным методом кодирования для сжатия видео с конца 1980-х годов.[12][28]

Стандарты кодирования видео

Первый стандарт кодирования цифрового видео был H.120, разработанная CCITT (ныне ITU-T) в 1984 г.[29] H.120 нельзя было использовать на практике, так как его производительность была слишком низкой.[29] H.120 использует кодирование DPCM с компенсацией движения,[10] алгоритм сжатия без потерь, который был неэффективен для кодирования видео.[12] В конце 1980-х годов ряд компаний начали экспериментировать с дискретное косинусное преобразование (DCT), гораздо более эффективная форма сжатия для видеокодирования. CCITT получил 14 предложений по форматам сжатия видео на основе DCT, в отличие от одного предложения, основанного на векторное квантование (VQ) сжатие. В H.261 Стандарт был разработан на основе сжатия DCT с компенсацией движения.[12][28] H.261 был первым практическим стандартом кодирования видео,[29] и был разработан с патенты по лицензии ряда компаний, в том числе Hitachi, PictureTel, NTT, BT, и Toshiba, среди прочего.[30] Начиная с H.261 сжатие DCT с компенсацией движения было принято всеми основными стандартами кодирования видео (включая H.26x и MPEG форматы).[12][28]

MPEG-1, разработанная Группа экспертов по киноискусству (MPEG), последовавший в 1991 году, и он был разработан для сжатия VHS -качественное видео.[29] Его сменил в 1994 г. MPEG-2 /H.262,[29] который был разработан на основе патентов, полученных по лицензии ряда компаний, в первую очередь Sony, Томсон и Mitsubishi Electric.[31] MPEG-2 стал стандартным видеоформатом для DVD и SD цифровое телевидение.[29] Его алгоритм DCT с компенсацией движения смог достичь коэффициент сжатия до 100: 1, что позволяет разрабатывать цифровые СМИ такие технологии как видео по запросу (VOD)[13] и телевидение высокой четкости (HDTV).[32] В 1999 году за ним последовали MPEG-4 /H.263, который явился большим шагом вперед в технологии сжатия видео.[29] Он был разработан на основании патентов, полученных по лицензии ряда компаний, в первую очередь Mitsubishi, Hitachi и Panasonic.[33]

Самый широко используемый формат кодирования видео по состоянию на 2019 год является H.264 / MPEG-4 AVC.[34] Он был разработан в 2003 году с патентами, полученными по лицензии ряда организаций, в первую очередь Panasonic, Godo Kaisha IP Bridge и LG Electronics.[35] В отличие от стандартного DCT, используемого его предшественниками, AVC использует целочисленный DCT.[24][36] H.264 - один из стандартов кодирования видео для Диски Blu-ray; все проигрыватели дисков Blu-ray должны поддерживать декодирование H.264. Он также широко используется для потоковой передачи интернет-источников, таких как видео из YouTube, Netflix, Vimeo, а ITunes магазин, веб-программное обеспечение, такое как Adobe Flash Player и Microsoft Silverlight, а также различные HDTV вещает по наземному (Стандарты Комитета передовых телевизионных систем, ISDB-T, DVB-T или же DVB-T2 ), кабель (DVB-C ) и спутник (DVB-S2 ).

Основной проблемой для многих форматов кодирования видео было патенты, что делает его использование дорогостоящим или потенциально рискует подать патентный иск из-за подводные патенты. Мотивация многих недавно разработанных форматов кодирования видео, таких как Теора, VP8 и VP9 были для создания (свободный ) стандарт кодирования видео защищен только патентами, не требующими лицензионных отчислений.[37] Патентный статус также был основным предметом споров при выборе видеоформатов, наиболее популярных в мире. веб-браузеры будет поддерживать внутри HTML5 видео тег.

Формат кодирования видео текущего поколения HEVC (H.265), представленный в 2013 году. В то время как AVC использует целочисленный DCT с размерами блоков 4x4 и 8x8, HEVC использует целочисленный DCT и Летнее время преобразуется с различными размерами блоков от 4x4 до 32x32.[38] HEVC сильно запатентован, при этом большинство патентов принадлежит Samsung Electronics, GE, NTT и JVC Kenwood.[39] В настоящее время он оспаривается стремлением получить свободную лицензию. AV1 формат. По состоянию на 2019 год, AVC является наиболее часто используемым форматом для записи, сжатия и распространения видеоконтента, который используется 91% разработчиков видео, за ним следует HEVC, который используется 43% разработчиков.[34]

Список стандартов кодирования видео

Хронология международных стандартов сжатия видео
Базовый алгоритмСтандарт кодирования видеоГодИздатель (ы)Комитет (ы)Лицензиар (ы)Рыночная доля (2019)[34]Популярные реализации
DPCMH.1201984CCITTVCEGНет данныхНет данныхНеизвестно
DCTH.2611988CCITTVCEGHitachi, PictureTel, NTT, BT, Toshiba, и Т. Д.[30]Нет данныхВидео-конференция, видеотелефония
Motion JPEG (MJPEG)1992JPEGJPEGНет данныхНет данныхQuickTime
MPEG-1, часть 21993ISO, IECMPEGFujitsu, IBM, Мацусита, и Т. Д.[40]Нет данныхВидео-CD, Интернет-видео
H.262 / MPEG-2, часть 2 (Видео MPEG-2)1995ИСО, МЭК, ITU-TMPEG, VCEGSony, Томсон, Mitsubishi, и Т. Д.[31]29%DVD видео, Блю рей, DVB, ATSC, SVCD, SDTV
DV1995IECIECSony, PanasonicНеизвестноВидеокамеры, цифровые кассеты
H.2631996ITU-TVCEGMitsubishi, Hitachi, Panasonic, и Т. Д.[33]НеизвестноВидеоконференцсвязь, видеотелефония, H.320, Цифровая сеть с интегрированными услугами (ISDN),[41][42] мобильное видео (3GP ), MPEG-4 Visual
MPEG-4, часть 2 (MPEG-4 визуальный)1999ISO, IECMPEGМицубиси, Хитачи, Панасоник, и Т. Д.[33]НеизвестноИнтернет-видео, DivX, Xvid
DWTMotion JPEG 2000 (MJ2)2001JPEG[43]JPEG[44]Нет данныхНеизвестноЦифровое кино[45]
DCTРасширенное кодирование видео (H.264 / MPEG-4 AVC)2003ИСО, МЭК, МСЭ-ТMPEG, VCEGPanasonic, Godo Kaisha IP Bridge, LG, и Т. Д.[35]91%Блю рей, HD DVD, HDTV (DVB, ATSC ), видео трансляция (YouTube, Netflix, Vimeo ), ITunes магазин, iPod видео, Apple TV, видео-конференция, Flash Player, Silverlight, VOD
Теора2004ЗифЗифНет данныхНеизвестноИнтернет-видео, веб-браузеры
ВК-12006SMPTESMPTEMicrosoft, Панасоник, LG, Samsung, и Т. Д.[46]НеизвестноBlu-ray, Интернет-видео
Apple ProRes2007яблокояблокояблокоНеизвестноВидео производство, послепроизводственный этап
Высокоэффективное кодирование видео (H.265 / MPEG-H HEVC)2013ИСО, МЭК, МСЭ-ТMPEG, VCEGSamsung, GE, NTT, JVC Kenwood, и Т. Д.[39][47]43%UHD Blu-ray, DVB, ATSC 3.0, UHD потоковое Формат изображения высокой эффективности, macOS High Sierra, iOS 11
AV12018AOMediaAOMediaНет данных7%HTML5 видео
Универсальное кодирование видео (VVC / H.266)2020JVETJVETНеизвестноНет данныхНет данных

Форматы кодирования видео без потерь, с потерями и без сжатия

Потребительское видео обычно сжимается с использованием с потерями видеокодеки, так как это приводит к файлам значительно меньшего размера, чем без потерь сжатие. Хотя существуют форматы кодирования видео, специально разработанные для сжатия с потерями или без потерь, некоторые форматы кодирования видео, такие как Дирак и H.264 поддержите оба.

Несжатое видео форматы, такие как Чистый HDMI, это форма видео без потерь, используемая в некоторых случаях, например при отправке видео на дисплей через HDMI связь. Некоторые камеры высокого класса также могут снимать видео непосредственно в этом формате.

Форматы внутрикадрового кодирования видео

Межкадровое сжатие усложняет редактирование закодированной видеопоследовательности.[48]Одним из подклассов относительно простых форматов кодирования видео являются внутрикадровый видео форматы, такие как DV, в котором каждый кадр видеопотока сжимается независимо, без ссылки на другие кадры в потоке, и не делается попыток воспользоваться корреляциями между последовательными изображениями во времени для лучшего сжатия. Одним из примеров является Motion JPEG, который представляет собой просто последовательность отдельных JPEG -сжатые изображения. Этот подход является быстрым и простым за счет того, что кодируемое видео намного больше, чем формат кодирования видео, поддерживающий Межкадровый кодирование.

Поскольку при межкадровом сжатии данные копируются из одного кадра в другой, если исходный кадр просто вырезан (или потерян при передаче), следующие кадры не могут быть восстановлены должным образом. Создание «нарезок» в видео с внутрикадровым сжатием во время редактирование видео почти так же просто, как редактирование несжатого видео: находят начало и конец каждого кадра и просто копируют побитно каждый кадр, который нужно сохранить, и отбрасывают кадры, которые ему не нужны. Еще одно различие между внутрикадровым и межкадровым сжатием состоит в том, что в внутрикадровых системах каждый кадр использует одинаковый объем данных. В большинстве межкадровых систем определенные кадры (например, "Я кадры " в MPEG-2 ) не могут копировать данные из других фреймов, поэтому для них требуется гораздо больше данных, чем для других фреймов поблизости.[49]

Можно создать компьютерный видеоредактор, который выявляет проблемы, возникающие, когда одни кадры редактируются, а другие кадры нуждаются в них. Это позволило использовать новые форматы, такие как HDV для редактирования. Однако этот процесс требует гораздо большей вычислительной мощности, чем редактирование внутрикадрового сжатого видео с тем же качеством изображения. Но это сжатие не очень эффективно для любого аудиоформата.

Профили и уровни

Формат кодирования видео может определять дополнительные ограничения для кодированного видео, называемые профили и уровни. Можно иметь декодер, который поддерживает декодирование только подмножества профилей и уровней данного видеоформата, например, чтобы сделать программу / оборудование декодера меньше, проще или быстрее.

А профиль ограничивает допустимые методы кодирования. Например, формат H.264 включает профили исходный уровень, главный и высоко (и другие). Пока P-ломтики (которые можно предсказать на основе предыдущих срезов) поддерживаются во всех профилях, B-срезы (которые можно предсказать на основе как предшествующих, так и следующих срезов) поддерживаются в главный и высоко профили, но не в исходный уровень.[50]

А уровень - это ограничение на такие параметры, как максимальное разрешение и скорость передачи данных.[50]

Смотрите также

Ссылки и примечания

  1. ^ Термин «кодирование видео» можно увидеть, например, в имена Расширенное кодирование видео, Высокоэффективное кодирование видео, и Группа экспертов по кодированию видео
  2. ^ Томас Виганд; Гэри Дж. Салливан; Жисль Бьонтегаард и Аджай Лутра (июль 2003 г.). «Обзор стандарта кодирования видео H.264 / AVC» (PDF). СДЕЛКИ IEEE ПО СХЕМАМ И СИСТЕМАМ ДЛЯ ВИДЕОТЕХНОЛОГИЙ.
  3. ^ а б «СЕРИЯ H: АУДИОВИЗУАЛЬНЫЕ И МУЛЬТИМЕДИЙНЫЕ СИСТЕМЫ: Инфраструктура аудиовизуальных услуг - Кодирование движущегося видео: Расширенное кодирование видео для общих аудиовизуальных услуг». Itu.int. Получено 6 января 2015.
  4. ^ "Титульная страница". Альянс открытых СМИ. Получено 2016-05-23.
  5. ^ Адриан Грейндж; Питер де Риваз и Джонатан Хант. «Спецификация битового потока и процесса декодирования VP9» (PDF).
  6. ^ "Аудио видео". Проекты Chromium. Получено 2016-05-23.
  7. ^ «Мультимедийные форматы, поддерживаемые элементами аудио и видео HTML». Mozilla. Получено 2016-05-23.
  8. ^ Роуэн Троллоп (30.10.2013). «H.264 с открытым исходным кодом устраняет барьеры для WebRTC». Cisco. Получено 2016-05-23.
  9. ^ «Глава 3: Модифицированный алгоритм A * Prune для обнаружения K-MCSP при сжатии видео» (PDF). Shodhganga.inflibnet.ac.in. Получено 2015-01-06.
  10. ^ а б c d е ж грамм час я j «История сжатия видео». ITU-T. Объединенная группа по видео (JVT) ISO / IEC MPEG и ITU-T VCEG (ISO / IEC JTC1 / SC29 / WG11 и ITU-T SG16 Q.6). Июль 2002. С. 11, 24–9, 33, 40–1, 53–6.. Получено 3 ноября 2019.
  11. ^ Робинсон, А. Х .; Черри, К. (1967). «Результаты прототипа схемы сжатия полосы пропускания телевидения». Труды IEEE. IEEE. 55 (3): 356–364. Дои:10.1109 / PROC.1967.5493.
  12. ^ а б c d е ж грамм час я Ганбари, Мохаммед (2003). Стандартные кодеки: от сжатия изображений до расширенного кодирования видео. Институт инженерии и технологий. С. 1–2. ISBN  9780852967102.
  13. ^ а б c d е ж Ли, Уильям (1994). Видео по запросу: исследовательский доклад 94/68. 9 мая 1994 г .: Библиотека Палаты общин. Получено 20 сентября 2019.CS1 maint: location (связь)
  14. ^ Ли, Джек (2005). Масштабируемые системы непрерывной потоковой передачи мультимедиа: архитектура, дизайн, анализ и реализация. Джон Уайли и сыновья. п. 25. ISBN  9780470857649.
  15. ^ Ахмед, Насир (Январь 1991 г.). "Как я пришел к дискретному косинусному преобразованию". Цифровая обработка сигналов. 1 (1): 4–5. Дои:10.1016 / 1051-2004 (91) 90086-Z.
  16. ^ Ахмед, Насир; Натараджан, Т .; Рао, К. Р. (январь 1974 г.), "Дискретное косинусное преобразование", Транзакции IEEE на компьютерах, С-23 (1): 90–93, Дои:10.1109 / T-C.1974.223784
  17. ^ Рао, К.; Ип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения, Бостон: Academic Press, ISBN  978-0-12-580203-1
  18. ^ а б Хабиби, Али (1974). «Гибридное кодирование графических данных». Транзакции IEEE по коммуникациям. 22 (5): 614–624. Дои:10.1109 / TCOM.1974.1092258.
  19. ^ Chen, Z .; Он, Т .; Джин, X .; Ву, Ф. (2019). «Обучение сжатию видео». Транзакции IEEE по схемам и системам для видеотехнологий. 30 (2): 566–576. arXiv:1804.09869. Дои:10.1109 / TCSVT.2019.2892608.
  20. ^ Пратт, Уильям К. (1984). Достижения электроники и электронной физики: Приложение. Академическая пресса. п. 158. ISBN  9780120145720. Значительный прогресс в методологии кодирования изображений произошел с введением концепции кодирования гибридного преобразования / DPCM (Habibi, 1974).
  21. ^ Ом, Йенс-Райнер (2015). Кодирование и передача мультимедийных сигналов. Springer. п. 364. ISBN  9783662466919.
  22. ^ а б Роуз, Джон А .; Робинсон, Гунер С. (30 октября 1975 г.). «Комбинированное пространственное и временное кодирование последовательностей цифровых изображений». Эффективная передача графической информации. Международное общество оптики и фотоники. 0066: 172–181. Bibcode:1975SPIE ... 66..172R. Дои:10.1117/12.965361.
  23. ^ Хуанг, Т. С. (1981). Анализ последовательности изображений. Springer Science & Business Media. п. 29. ISBN  9783642870378.
  24. ^ а б c Станкович, Радомир С .; Астола, Яакко Т. (2012). «Воспоминания о ранних работах в DCT: интервью с К.Р. Рао» (PDF). Отпечатки с первых дней информационных наук. 60. Получено 13 октября 2019.
  25. ^ Чен, Вэнь-Сюн; Smith, C.H .; Фралик, С. К. (сентябрь 1977 г.). «Быстрый вычислительный алгоритм для дискретного косинусного преобразования». Транзакции IEEE по коммуникациям. 25 (9): 1004–1009. Дои:10.1109 / TCOM.1977.1093941.
  26. ^ «T.81 - Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном - Требования и рекомендации» (PDF). CCITT. Сентябрь 1992 г.. Получено 12 июля 2019.
  27. ^ Чианчи, Филип Дж. (2014). Телевидение высокой четкости: создание, развитие и внедрение технологии HDTV. Макфарланд. п. 63. ISBN  9780786487974.
  28. ^ а б c Ли, Цзянь Пин (2006). Материалы Международной компьютерной конференции 2006 г. по технологии вейвлет-активных сред и обработке информации: Чунцин, Китай, 29-31 августа 2006 г.. Всемирный научный. п. 847. ISBN  9789812709998.
  29. ^ а б c d е ж грамм "История инфографики форматов видеофайлов". RealNetworks. 22 апреля 2012 г.. Получено 5 августа 2019.
  30. ^ а б «Заявленный патент (ы)» Рекомендацией МСЭ-Т ». ITU. Получено 12 июля 2019.
  31. ^ а б «Патентный список MPEG-2» (PDF). MPEG LA. Получено 7 июля 2019.
  32. ^ Шишикуи, Ёсиаки; Наканиши, Хироши; Имаидзуми, Хироюки (26–28 октября 1993 г.). «Схема кодирования HDTV с использованием DCT с адаптивным размером». Обработка сигналов HDTV: Материалы международного семинара по HDTV '93, Оттава, Канада. Эльзевир: 611–618. Дои:10.1016 / B978-0-444-81844-7.50072-3. ISBN  9781483298511.
  33. ^ а б c "MPEG-4 Visual - Патентный список" (PDF). MPEG LA. Получено 6 июля 2019.
  34. ^ а б c «Отчет разработчика видео 2019» (PDF). Битмовин. 2019. Получено 5 ноября 2019.
  35. ^ а б «AVC / H.264 - Патентный список» (PDF). MPEG LA. Получено 6 июля 2019.
  36. ^ Ван, Ханли; Kwong, S .; Кок, К. (2006). «Эффективный алгоритм прогнозирования целочисленных коэффициентов DCT для оптимизации H.264 / AVC». Транзакции IEEE по схемам и системам для видеотехнологий. 16 (4): 547–552. Дои:10.1109 / TCSVT.2006.871390.
  37. ^ https://blogs.cisco.com/collaboration/world-meet-thor-a-project-to-hammer-out-a-royalty-free-video-codec
  38. ^ Томсон, Гэвин; Шах, Атар (2017). «Представляем HEIF и HEVC» (PDF). Apple Inc. Получено 5 августа 2019.
  39. ^ а б «Патентный список HEVC» (PDF). MPEG LA. Получено 6 июля 2019.
  40. ^ «Стандарты и патенты ISO». ISO. Получено 10 июля 2019.
  41. ^ Дэвис, Эндрю (13 июня 1997 г.). «Обзор рекомендаций H.320». EE Times. Получено 7 ноября 2019.
  42. ^ IEEE WESCANEX 97: связь, питание и вычисления: материалы конференции. Университет Манитобы, Виннипег, Манитоба, Канада: Институт инженеров по электротехнике и электронике. 22–23 мая 1997 г. с. 30. ISBN  9780780341470. H.263 похож на H.261, но более сложен. В настоящее время это наиболее широко используемый международный стандарт сжатия видео для видеотелефонии на телефонных линиях ISDN (Integrated Services Digital Network).
  43. ^ "Motion JPEG 2000, часть 3". Объединенная группа экспертов по фотографии, JPEG, и Объединенная группа экспертов по двухуровневому изображению, JBIG. Архивировано из оригинал 22 сентября 2012 г.. Получено 21 июн 2014.
  44. ^ Таубман, Дэвид; Марселлин, Майкл (2012). JPEG2000: основы, стандарты и практика сжатия изображений: основы, стандарты и практика сжатия изображений. Springer Science & Business Media. ISBN  9781461507994.
  45. ^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональное руководство. Тейлор и Фрэнсис. п. 147. ISBN  9780240806174.
  46. ^ «Патентный список ВК-1» (PDF). MPEG LA. Получено 11 июля 2019.
  47. ^ «Предварительный список патентов HEVC». HEVC Advance. Получено 6 июля 2019.
  48. ^ Бходжани, Д. «4.1 Сжатие видео» (PDF). Гипотеза. Получено 6 марта 2013.
  49. ^ Джайсвал, Р. (2009). Аудио-видео техника. Пуна, Махараштра: Нирали Пракашан. п. 3.55. ISBN  9788190639675.
  50. ^ а б Ян Озер. «Параметры кодирования для видео H.264». Adobe.com. Получено 6 января 2015.