Форматы полезной нагрузки RTP - RTP payload formats

В Транспортный протокол в реальном времени (RTP) определяет формат данных общего назначения и сетевой протокол для передачи цифровых медиапотоков на протокол Интернета (IP) сети. Детали кодирования мультимедиа, такие как частота дискретизации сигнала, размер кадра и синхронизация, указаны в Формат полезной нагрузки RTP. Параметры формата полезной нагрузки RTP обычно передаются между конечными точками передачи с Протокол описания сеанса (SDP), но другие протоколы, такие как Расширяемый протокол обмена сообщениями и присутствия (XMPP) можно использовать.

Типы полезной нагрузки аудио и видео

RFC 3551, озаглавленный Профиль RTP для аудио и видео (RTP / AVP), определяет технические параметры форматов полезной нагрузки для аудио- и видеопотоков.

Стандарт также описывает процесс регистрации новых типов полезной нагрузки в IANA; дополнительные форматы полезной нагрузки и типы полезной нагрузки определены в следующих спецификациях:

  • RFC  3551, Стандарт 65, Профиль RTP для аудио- и видеоконференций с минимальным контролем
  • RFC  4856, Регистрация типов мультимедиа форматов полезной нагрузки в профиле RTP для аудио- и видеоконференций
  • RFC  3190, Формат полезной нагрузки RTP для 12-битного DAT Audio и 20- и 24-битный линейно дискретизированный звук
  • RFC  6184, Формат полезной нагрузки RTP для H.264 видео
  • RFC  3640, Формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4
  • RFC  6416, Формат полезной нагрузки RTP для MPEG-4 Аудио / видео потоки
  • RFC  2250, Формат полезной нагрузки RTP для MPEG1 /MPEG2 видео
  • RFC  7798, Формат полезной нагрузки RTP для Высокоэффективное кодирование видео (HEVC)
  • RFC  2435, Формат полезной нагрузки RTP для видео, сжатого в формате JPEG
  • RFC  4587, Формат полезной нагрузки RTP для H.261 Видео потоки
  • RFC  2658, Формат полезной нагрузки RTP для PureVoice Аудио видео
  • RFC  4175, Формат полезной нагрузки RTP для несжатого видео
  • RFC  7587, Формат полезной нагрузки RTP для Opus Речевой и аудиокодек

Идентификаторы 96–127 полезной нагрузки используются для полезных нагрузок, определяемых динамически во время сеанса. Рекомендуется динамически назначать номера портов, хотя номера портов 5004 и 5005 были зарегистрированы для использования профиля, когда динамически назначаемый порт не требуется.

Приложения всегда должны поддерживать PCMU (тип полезной нагрузки 0); ранее также рекомендовался DVI4 (тип полезной нагрузки 5), но он был удален в 2013 г. RFC 7007.

Тип полезной нагрузки (PT)ИмяТипКол-во каналовТактовая частота (Гц)[примечание 1]Размер кадра (мс)Размер пакета по умолчанию (мс)ОписаниеРекомендации
0PCMUаудио18000любой20ITU-T G.711 PCM μ-закон аудио 64 кбит / сRFC 3551
1зарезервировано (ранее FS-1016 CELP )аудио18000зарезервировано, ранее ПС-1016 CELP аудио 4,8 кбит / сRFC 3551, ранее RFC 1890
2зарезервировано (ранее G721 или G726-32)аудио18000зарезервировано, ранее ITU-T G.721 ADPCM аудио 32 кбит / с или ITU-T G.726 аудио 32 кбит / сRFC 3551, ранее RFC 1890
3GSMаудио180002020Европейский Полная скорость GSM аудио 13 кбит / с (GSM 06.10)RFC 3551
4G723аудио180003030ITU-T G.723.1 аудиоRFC 3551
5DVI4аудио18000любой20IMA ADPCM аудио 32 кбит / сRFC 3551
6DVI4аудио116000любой20IMA ADPCM аудио 64 кбит / сRFC 3551
7LPCаудио18000любой20Экспериментальный Кодирование с линейным прогнозированием аудио 5,6 кбит / сRFC 3551
8PCMAаудио18000любой20ITU-T G.711 PCM Закон аудио 64 кбит / сRFC 3551
9G722аудио18000[заметка 2]любой20ITU-T G.722 аудио 64 кбит / сRFC 3551 - стр. 14
10L16аудио244100любой20Линейный PCM 16-битный стереозвук 1411,2 кбит / с,[2][3][4] несжатыйRFC 3551, стр. 27
11L16аудио144100любой20Линейный PCM 16-битный звук 705,6 кбит / с, без сжатияRFC 3551, стр. 27
12QCELPаудио180002020Линейное предсказание с возбуждением от кода QualcommRFC 2658, RFC 3551
13CNаудио18000Комфортный шум. Тип полезной нагрузки, используемый с аудиокодеками, которые не поддерживают комфортный шум как часть самого кодека, например G.711, G.722.1, G.722, G.726, G.727, G.728, GSM 06.10, Сирена, и RTAudio.RFC 3389
14MPAаудио1, 2900008–72MPEG-1 или же MPEG-2 только аудиоRFC 3551, RFC 2250
15G728аудио180002.520ITU-T G.728 аудио 16 кбит / сRFC 3551
16DVI4аудио111025любой20IMA ADPCM аудио 44,1 кбит / сRFC 3551
17DVI4аудио122050любой20Аудио IMA ADPCM 88,2 кбит / сRFC 3551
18G729аудио180001020ITU-T G.729 и звук G.729a 8 кбит / с; Приложение B подразумевается, если приложениеb = нет параметр используетсяRFC 3551, стр. 20, RFC 3555, стр. 15
19зарезервировано (ранее CN)аудиозарезервировано, ранее комфортный шумRFC 3551
25CELBвидео90000солнце CellB видео[5]RFC 2029
26JPEGвидео90000JPEG видеоRFC 2435
28NVвидео90000Xerox PARC Сетевое видео пользователя (NV)[6]RFC 3551, стр. 32
31H261видео90000ITU-T H.261 видеоRFC 4587
32MPVвидео90000Видео MPEG-1 и MPEG-2RFC 2250
33MP2Tаудио видео90000MPEG-2 транспортный потокRFC 2250
34H263видео90000H.263 видео, первая версия (1996)RFC 3551, RFC 2190
72–76зарезервированныйзарезервировано, потому что типы пакетов RTCP 200–204 в противном случае были бы неотличимы от типов полезной нагрузки RTP 72–76 с установленным битом маркераRFC 3550, RFC 3551
динамичныйH263-1998видео90000H.263 видео, вторая версия (1998)RFC 3551, RFC 4629, RFC 2190
динамичныйH263-2000видео90000H.263 видео, третья версия (2000)RFC 4629
динамический (или профиль)H264 AVCвидео90000H.264 видео (MPEG-4, часть 10)RFC 6184, ранее RFC 3984
динамический (или профиль)H264 SVCвидео90000H.264 видеоRFC 6190
динамический (или профиль)H265видео90000H.265 видео (HEVC)RFC 7798
динамический (или профиль)Теоравидео90000Теора видеопроект-барбато-авт-ртп-теора
динамичныйiLBCаудио1800020, 3020, 30Интернет-кодек с низким битрейтом 13,33 или 15,2 кбит / сRFC 3952
динамичныйPCMA-WBаудио1160005ITU-T G.711.1 ЗаконRFC 5391
динамичныйPCMU-WBаудио1160005ITU-T G.711.1 μ-законRFC 5391
динамичныйG718аудио32000 (заполнитель)20ITU-T G.718проект-ietf-полезная нагрузка-RTP-g718
динамичныйG719аудио(разные)4800020ITU-T G.719RFC 5404
динамичныйG7221аудио16000, 3200020ITU-T G.722.1 и G.722.1 Приложение CRFC 5577
динамичныйG726-16аудио18000любой20ITU-T G.726 аудио 16 кбит / сRFC 3551
динамичныйG726-24аудио18000любой20Аудио ITU-T G.726 24 кбит / сRFC 3551
динамичныйG726-32аудио18000любой20Аудио ITU-T G.726 32 кбит / сRFC 3551
динамичныйG726-40аудио18000любой20Аудио ITU-T G.726 40 кбит / сRFC 3551
динамичныйG729Dаудио180001020ITU-T G.729 Приложение D.RFC 3551
динамичныйG729Eаудио180001020ITU-T G.729 Приложение ERFC 3551
динамичныйG7291аудио1600020ITU-T G.729.1RFC 4749
динамичныйGSM-EFRаудио180002020ITU-T GSM-EFR (GSM 06.60)RFC 3551
динамичныйGSM-HR-08аудио1800020ITU-T GSM-HR (GSM 06.20)RFC 5993
динамический (или профиль)AMRаудио(разные)800020Адаптивная многоскоростная передача аудиоRFC 4867
динамический (или профиль)AMR-WBаудио(разные)1600020Адаптивная многоскоростная широкополосная связь аудио (ITU-T G.722.2)RFC 4867
динамический (или профиль)AMR-WB +аудио1, 2 или опустить7200013.3–40Расширенная адаптивная мультискорость - WideBand аудиоRFC 4352
динамический (или профиль)ворбисаудио(разные)(разные)Vorbis аудиоRFC 5215
динамический (или профиль)опусаудио1, 248000[заметка 3]2.5–6020Opus аудиоRFC 7587
динамический (или профиль)Speexаудио18000, 16000, 3200020Speex аудиоRFC 5574
динамичныймпа-надежныйаудио1, 29000024–72Безнадежный MP3 аудиоRFC 5219 (ранее RFC 3119 )
динамический (или профиль)MP4A-LATMаудио90000 или другиеMPEG-4 аудиоRFC 6416 (ранее RFC 3016 )
динамический (или профиль)MP4V-ESвидео90000 или другиеMPEG-4 VisualRFC 6416 (ранее RFC 3016 )
динамический (или профиль)mpeg4-genericаудио видео90000 или другойMPEG-4 Элементарные потокиRFC 3640
динамичныйVP8видео90000VP8 видеоRFC 7741
динамичныйVP9видео90000VP9 видеопроект-ietf-полезной нагрузки-vp9
динамичныйL8аудио(разные)(разные)любой20Линейный PCM 8-битный звук со смещением 128RFC 3551 Раздел 4.5.10 и таблица 5
динамичныйDAT12аудио(разные)(разные)любой20 (по аналогии с L16)IEC 61119 12-битный нелинейный звукRFC 3190 Раздел 3
динамичныйL16аудио(разные)(разные)любой20Линейный PCM 16-битный звукRFC 3551 Раздел 4.5.11, RFC 2586
динамичныйL20аудио(разные)(разные)любой20 (по аналогии с L16)Линейный PCM 20-битный звукRFC 3190 Раздел 4
динамичныйL24аудио(разные)(разные)любой20 (по аналогии с L16)Линейный PCM 24-битный звукRFC 3190 Раздел 4
динамичныйсыройвидео90000Несжатое видеоRFC 4175
динамичныйac3аудио(разные)32000, 44100, 48000Dolby AC-3 аудиоRFC 4184
динамичныйeac3аудио(разные)32000, 44100, 48000Улучшенный AC-3 аудиоRFC 4598
динамичныйt140текст1000Текст по IPRFC 4103
динамичныйEVRC
EVRC0
EVRC1
аудио8000EVRC аудиоRFC 4788
динамичныйEVRCB
EVRCB0
EVRCB1
аудио8000EVRC-B аудиоRFC 4788
динамичныйEVRCWB
EVRCWB0
EVRCWB1
аудио16000EVRC-WB аудиоRFC 5188
динамичныйjpeg2000видео90000JPEG 2000 видеоRFC 5371
динамичныйUEMCLIPаудио8000, 16000UEMCLIP аудиоRFC 5686
динамичныйATRAC3аудио44100ATRAC 3 аудиоRFC 5584
динамичныйATRAC-Xаудио44100, 48000ATRAC 3+ аудиоRFC 5584
динамичныйATRAC-ADVANCED-Без потерьаудио(разные)ATRAC Расширенный звук без потерьRFC 5584
динамичныйDVвидео90000DV видеоRFC 6469 (ранее RFC 3189 )
динамичныйBT656видеоМСЭ-R BT.656 видеоRFC 3555
динамичныйBMPEGвидеоПакетное видео MPEG-2RFC 2343
динамичныйSMPTE292MвидеоSMPTE 292M видеоRFC 3497
динамичныйКРАСНЫЙаудиоИзбыточные аудиоданныеRFC 2198
динамичныйVDVIаудиоАудио DVI4 с переменной скоростьюRFC 3551
динамичныйMP1SвидеоMPEG-1 Systems потоковое видеоRFC 2250
динамичныйMP2PвидеоПрограмма MPEG-2 передает видеоRFC 2250
динамичныйтонаудио8000 (по умолчанию)тонRFC 4733
динамичныйтелефонное мероприятиеаудио8000 (по умолчанию)DTMF тонRFC 4733
динамичныйaptxаудио2 – 6(равно частоте дискретизации)4000 ÷ частота дискретизации4[примечание 4]aptX аудиоRFC 7310
  1. ^ «Тактовая частота» - это скорость, с которой увеличивается метка времени в заголовке RTP, которая не обязательно должна быть такой же, как частота дискретизации кодека. Например, видеокодеки обычно используют тактовую частоту 90000, поэтому их кадры могут быть более точно согласованы с меткой времени RTCP NTP, даже если частота дискретизации видео обычно находится в диапазоне 1–60 выборок в секунду.
  2. ^ Хотя частота дискретизации для G.722 составляет 16000, его тактовая частота составляет 8000, чтобы оставаться обратно совместимой с RFC 1890, который неправильно использовал это значение.[1]
  3. ^ Поскольку Opus может динамически изменять частоту дискретизации, его тактовая частота фиксируется на уровне 48000, даже если кодек будет работать с более низкой частотой дискретизации. В максимальная скорость воспроизведения и sprop-maxcapturerate параметры в SDP может использоваться для указания подсказок / предпочтений относительно максимальной частоты дискретизации для кодирования / декодирования.
  4. ^ Для aptX интервал пакетирования должен быть округлен до ближайшего интервала пакета, который может содержать целое число выборок. Таким образом, при частотах дискретизации 11025, 22050 или 44100 частота пакетирования «4» округляется до 3,99.

Полезная нагрузка текстовых сообщений

  • RFC  4103, Формат полезной нагрузки RTP для текстового разговора

Полезная нагрузка MIDI

Смотрите также

Рекомендации

  1. ^ RFC 3551, Профиль RTP для аудио- и видеоконференций с минимальным контролем, Х. Шульцринне, С. Каснер, Интернет-сообщество (июль 2003 г.).
  2. ^ «RFC 2586 - Тип содержимого MIME Audio / L16». Май 1999 г.. Получено 2010-03-16.
  3. ^ «RFC 3108 - Соглашения об использовании протокола описания сеанса (SDP) для соединений носителя ATM». Май 2001 г.. Получено 2010-03-16.
  4. ^ «RFC 4856 - Регистрация типа мультимедиа для форматов полезной нагрузки в профиле RTP для аудио- и видеоконференций - Регистрация типа мультимедиа аудио / L16». Март 2007 г.. Получено 2010-03-16.
  5. ^ Руководство программиста XIL, Глава 22 «Кодек CellB». Август 1997. Проверено 19 июля 2014.
  6. ^ nv - сетевое видео на сайте Хеннинга Шульцринна, Сетевое видео на сайте Университета Торонто, Проверено 9 июля 2009.

внешняя ссылка