Шкала Мел - Mel scale
В мел шкала, названный Стивенс, Фолькманн и Ньюман в 1937 г.,[1] перцептивный масштаб из поля оцениваются слушателями на равном расстоянии друг от друга. Точка отсчета между этой шкалой и нормальным частота измерение определяется путем присвоения перцептивной высоты звука 1000 мэл на 1000 Гц тон, 40 дБ выше порога слушателя. Выше примерно 500 Гц, все больше интервалы оцениваются слушателями как производящие одинаковые приращения высоты тона. В результате четыре октавы по шкале герц выше 500 Гц составляют около двух октав по шкале мел. Название мел происходит от слова мелодия чтобы указать, что шкала основана на сравнении высоты тона.
Формула
Популярная формула преобразования ж герц в м mels это:[2]
История и другие формулы
Не существует единой формулы мел-шкалы.[3] Популярная формула из книги О'Шонесси может быть выражена с разными логарифмическими основаниями:
Соответствующие обратные выражения:
Кривые и таблицы психофизических шкал тона публиковались с 1937 года.[4] кривые на основе едва заметные различия смолы. Вскоре последовали новые кривые в книге Флетчера и Мансона 1937 г.[5] и Флетчера 1938 г.[6]и Стивенса 1937 г.[1] и 1940 Стивенса и Фолькмана[7]статьи, использующие различные экспериментальные методы и подходы к анализу.
В 1949 году Кениг опубликовал аппроксимацию, основанную на отдельных линейных и логарифмических сегментах с разрывом на 1000 Гц.[8]
Гуннар Фант предложил в 1949 году популярную сегодня популярную линейно-логарифмическую формулу, но с угловой частотой 1000 Гц.[9]
Альтернативное выражение формулы, не зависящее от выбора основания логарифма, отмечено у Фанта (1968):[10][11]
В 1976 г. Махоул и Cosell опубликовали популярную сейчас версию с угловой частотой 700 Гц.[12]Как отмечает Ганчев и др. заметили: «Формулы [с 700] по сравнению с [Фанта с 1000] обеспечивают более близкое приближение к шкале Мела для частот ниже 1000 Гц за счет более высокой неточности для частот выше 1000 Гц».[13] Однако выше 7 кГц ситуация меняется, и версия 700 Гц снова подходит лучше.
Данные, которыми мотивированы некоторые из этих формул, сведены в таблицу Беранека (1949), измеренная по кривым Стивенса и Фолькманна:[14]
Данные шкалы мела Беранека 1949 г. от Стивенса и Фолькманна 1940 г. Гц 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000 мел 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250
Формула с частотой прерывания 625 Гц дана Линдси и Норманом (1977);[15] формула не появляется в их первом издании 1972 года:
Для прямого сравнения с другими формулами это эквивалентно:
Большинство формул мел-шкалы дают ровно 1000 мелей при 1000 Гц. Частота прерывания (например, 700 Гц, 1000 Гц или 625 Гц) является единственным свободным параметром в обычной форме формулы. Некоторые формулы частотной шкалы non-mel используют ту же форму, но с гораздо более низкой частотой прерывания, не обязательно сопоставленной с 1000 при 1000 Гц; например ERB-курс шкала Гласберга и Мура (1990) использует точку излома 228,8 Гц,[16] а на карте частот-мест улитки Гринвуда (1990) используется частота 165,3 Гц.[17]
Другие функциональные формы мелкой шкалы исследовали Umesh et al .; они указывают на то, что традиционные формулы с логарифмической областью и линейной областью не соответствуют данным из кривых Стивенса и Фолькмана, а также некоторым другим формам, основанным на следующей таблице данных измерений, которые они сделали из этих кривых:[18]
Umesh et al. Данные шкалы мела за 1999 г. от Стивенса и Фолькманна, 1940 г. Гц 40 161 200 404 693 867 1000 2022 3000 3393 4109 5526 6500 7743 12000 мел 43 257 300 514 771 928 1000 1542 2000 2142 2314 2600 2771 2914 3228
Критика
Ученик Стивенса, Дональд Д. Гринвуд, который работал над экспериментами с мелкой шкалой в 1956 году, считает, что шкала смещена из-за экспериментальных ошибок. В 2009 году он отправил в список рассылки,[19]
Я бы спросил, зачем использовать шкалу Мела сейчас, если она кажется необъективной? Если кому-то нужна шкала Мела, он должен сделать это заново, тщательно контролируя систематическую ошибку порядка и используя множество предметов - больше, чем в прошлом - и используя как музыкантов, так и не музыкантов для поиска любых различий в исполнении, которые могут регулироваться музыкантом. / отличия от музыкантов или различия в предметах в целом.
использованная литература
- ^ а б Стивенс, Стэнли Смит; Фолькманн; Джон и Ньюман, Эдвин Б. (1937). «Шкала для измерения психологической величины шага». Журнал Акустического общества Америки. 8 (3): 185–190. Bibcode:1937ASAJ .... 8..185S. Дои:10.1121/1.1915893. Архивировано из оригинал 14 апреля 2013 г.
- ^ Дуглас О'Шонесси (1987). Речевое общение: человек и машина. Эддисон-Уэсли. п. 150. ISBN 978-0-201-16520-3.
- ^ У. Диксон Уорд (1970). «Музыкальное восприятие». В Джерри В. Тобиас (ред.). Основы современной слуховой теории. 1. Академическая пресса. п. 412.
Никто не утверждает, что еще определил «шкалу Mel».
- ^ Джон С. Стейнберг (1937). «Позиции раздражения в улитке чистыми тонами». Журнал Акустического общества Америки. 8 (3): 176–180. Bibcode:1937ASAJ .... 8..176S. Дои:10.1121/1.1915891.
- ^ Харви Флетчер и У. А. Мансон (1937). «Связь между громкостью и маскировкой». Журнал Акустического общества Америки. 9 (1): 1–10. Bibcode:1937ASAJ .... 9 .... 1F. Дои:10.1121/1.1915904.
- ^ Харви Флетчер (1938). «Громкость, маскировка и их связь с процессом слуха и проблема измерения шума». Журнал Акустического общества Америки. 9 (4): 275–293. Bibcode:1938ASAJ .... 9..275F. Дои:10.1121/1.1915935.
- ^ Стивенс, С. & Фолькманн, Дж. (1940). «Отношение высоты звука к частоте: пересмотренная шкала». Американский журнал психологии. 53 (3): 329–353. Дои:10.2307/1417526. JSTOR 1417526.
- ^ В. Кениг (1949). «Новая частотная шкала для акустических измерений». Телефонная лаборатория Bell. 27: 299–301.
- ^ Гуннар Фант (1949) "Анализ свенска консонантлюден: все таланты свэннингсструктур", протокол LM Ericsson H / P 1064
- ^ Фант, Гуннар. (1968). Анализ и синтез речевых процессов. В Б. Мальмберге (ред.), Руководство по фонетике (стр. 173-177). Амстердам: Северная Голландия.
- ^ Джонатан Харрингтон и Стив Кэссиди (1999). Приемы акустики речи. Springer. п. 18. ISBN 978-0-7923-5731-5.
- ^ Джон Махоул И Линн Козелл (1976). «LPCW: вокодер LPC с линейным прогнозированием искажения спектра». ICASSP '76. Международная конференция IEEE по акустике, речи и обработке сигналов. ICASSP 1976 г.. 1. IEEE. С. 466–469. Дои:10.1109 / ICASSP.1976.1170013.
- ^ Т. Ганчев; Н. Факотакис и Г. Коккинакис (2005), «Сравнительная оценка различных реализаций MFCC для задачи проверки говорящего», Материалы СПЕКОМ-2005., стр. 191–194, CiteSeerX 10.1.1.75.8303
- ^ Беранек, Лев Л. (1949). Акустические измерения. Нью-Йорк: Макгроу-Хилл.
- ^ Линдси, Питер Х .; И Норман, Дональд А. (1977). Обработка информации человеком: введение в психологию (2-е изд.). Нью-Йорк: Academic Press.
- ^ B.C.J. Мур и Б. Гласберг, «Предлагаемые формулы для расчета ширины полосы пропускания слухового фильтра и паттернов возбуждения» Журнал Американского акустического общества 74: 750-753, 1983.
- ^ Гринвуд, Д. Д. (1990). Частота-положение улитки для нескольких видов - 29 лет спустя. Журнал акустического общества Америки, 87, 2592–2605.
- ^ Умеш, С., Коэн, Л. и Нельсон, Д. (1999), "Подгонка к шкале Мела", Proc. ICASSP 1999: 217–220, ISBN 978-0-7803-5041-0CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ http://lists.mcgill.ca/scripts/wa.exe?A2=ind0907d&L=auditory&P=389
внешние ссылки
- Преобразование Гц – мел, мел – Гц (использует уравнение О'Шонесси)
- Volkmann, J; Стивенс, СС; Ньюман, Е.Б. (1937). «Шкала для измерения психологической величины шага». Журнал акустического общества Америки. 8 (3): 208. Bibcode:1937ASAJ .... 8..208В. Дои:10.1121/1.1901999.