Психоакустика - Psychoacoustics

Психоакустика это филиал психофизика с участием научных исследований звук восприятие и аудиология - как люди воспринимают различные звуки. В частности, это отрасль науки, изучающая психологический ответы, связанные со звуком (в том числе шум, речь, и Музыка ). Психоакустика - это междисциплинарная область многих областей, включая психологию, акустику, электронную инженерию, физику, биологию, физиологию и информатику.[1]

Фон

Слух - это не чисто механическое явление распространение волн, но также является сенсорным и перцептивным событием; Другими словами, когда человек что-то слышит, это что-то достигает ухо как механическая звуковая волна, распространяющаяся по воздуху, но внутри уха она превращается в нервную потенциалы действия. Наружные волосковые клетки (OHC) млекопитающих улитка вызывают повышенную чувствительность и лучше[требуется разъяснение ] частотное разрешение механического отклика кохлеарной перегородки. Затем эти нервные импульсы попадают в мозг, где и воспринимаются. Следовательно, во многих задачах в акустике, например, для обработка звука, полезно учитывать не только механику окружающей среды, но и тот факт, что и ухо, и мозг участвуют в слушании человека.[требуется разъяснение ][нужна цитата ]

В внутреннее ухо, например, существенно обработка сигналов в преобразовании звука формы волны в нервные стимулы, поэтому некоторые различия между формами волны могут быть незаметными.[2] Сжатие данных методы, такие как MP3 воспользуйтесь этим фактом.[3] Кроме того, ухо нелинейно реагирует на звуки разной интенсивности; этот нелинейный отклик называется громкость. Телефонные сети и аудио подавление шума системы используют этот факт, нелинейно сжимая образцы данных перед передачей, а затем расширяя их для воспроизведения.[4] Другой эффект нелинейной реакции уха заключается в том, что звуки, близкие по частоте, создают ноты фантомных ударов, или интермодуляция продукты искажения.[5]

Термин «психоакустика» также возникает в дискуссиях о когнитивной психологии и о влиянии, которое личные ожидания, предрассудки и предрасположенности могут иметь на относительные оценки слушателей и сравнения звуковой эстетики и остроты зрения, а также на различные определения слушателей об относительных качествах различных музыкальных произведений. инструменты и исполнители. Выражение «слышит то, что хочет (или ожидает) услышать», может иметь отношение к таким дискуссиям.[нужна цитата ]

Пределы восприятия

An контур равной громкости. Обратите внимание на пиковую чувствительность около 2–4 кГц, в середине полоса частот голоса.

Человеческое ухо номинально может слышать звуки в диапазоне 20 Гц (0,02 кГц) к 20000 Гц (20 кГц). Верхний предел имеет тенденцию уменьшаться с возрастом; большинство взрослых не слышат выше 16 кГц. Самая низкая частота, которая была идентифицирована как музыкальный тон, составляет 12 Гц в идеальных лабораторных условиях.[6] Тоны от 4 до 16 Гц можно воспринимать через осязание.

Частотное разрешение уха составляет около 3,6 Гц в пределах октавы. 1000–2000 Гц. То есть изменения высоты тона более 3,6 Гц можно ощутить в клинических условиях.[6] Однако даже меньшие различия в высоте тона можно ощутить и другими способами. Например, интерференцию двух нот часто можно услышать как повторяющееся изменение громкости тона. Эта амплитудная модуляция происходит с частотой, равной разности частот двух тонов, и известна как избиение.

В полутон Шкала, используемая в западной музыкальной нотации, не является линейной шкалой частот, а логарифмический. Другие шкалы были получены непосредственно из экспериментов с человеческим слуховым восприятием, например мел шкала и Шкала коры (они используются при изучении восприятия, но не обычно в музыкальной композиции), и они приблизительно логарифмические по частоте на высокочастотном конце, но почти линейные на низкочастотном конце.

Диапазон интенсивности слышимых звуков огромен. Барабаны человеческого уха чувствительны к колебаниям звукового давления и могут обнаруживать изменения давления от нескольких единиц. микропаскали (мкПа) до более чем 100 кПа. По этой причине, уровень звукового давления также измеряется логарифмически, причем все давления относятся к 20 мкПа (или 1,97385 × 10−10 банкомат ). Поэтому нижний предел слышимости определяется как 0 дБ, но верхний предел не так четко определен. Верхний предел - это больше вопрос предела, при котором ухо будет физически повреждено или может вызвать потеря слуха из-за шума.

Более тщательное исследование нижних пределов слышимости определяет, что минимальный порог, при котором звук может быть услышан, зависит от частоты. Измеряя эту минимальную интенсивность для тестирования тонов различных частот, частотно-зависимый абсолютный порог слышимости (ATH) кривая может быть получена. Обычно ухо показывает пик чувствительности (т. Е. Самое низкое значение ATH) между 1–5 кГц, хотя порог изменяется с возрастом, и более старые уши показывают снижение чувствительности выше 2 кГц.[7]

ATH - самый низкий из контуры равной громкости. Контуры равной громкости показывают уровень звукового давления (дБ SPL) в диапазоне слышимых частот, которые воспринимаются как имеющие равную громкость. Контуры равной громкости были впервые измерены Флетчером и Мансоном в Bell Labs в 1933 году с использованием чистых тонов, воспроизводимых через наушники, а собранные ими данные называются Кривые Флетчера – Мансона. Поскольку субъективную громкость было трудно измерить, кривые Флетчера – Мансона были усреднены по многим испытуемым.

Робинсон и Дадсон усовершенствовали процесс в 1956 году, чтобы получить новый набор кривых равной громкости для фронтального источника звука, измеренного в безэховая камера. Кривые Робинсона-Дадсона были стандартизированы как ISO 226 в 1986 г. В 2003 г. ISO 226 был пересмотрен как контур равной громкости с использованием данных 12 международных исследований.

Звуковая локализация

Звуковая локализация это процесс определения местоположения источника звука. Мозг использует тонкие различия в громкости, тоне и времени между двумя ушами, чтобы мы могли локализовать источники звука.[8] Локализацию можно описать с точки зрения трехмерного положения: азимут или горизонтальный угол, зенит или вертикальный угол, и расстояние (для статических звуков) или скорость (для движущихся звуков).[9] Люди, как и большинство четвероногие животные, умеют определять направление по горизонтали, но меньше по вертикали из-за симметричного расположения ушей. Некоторые виды совы их уши расположены асимметрично и могут улавливать звук во всех трех плоскостях, что является приспособлением для охоты на мелких млекопитающих в темноте.[10]

Маскирующие эффекты

График маскировки звука

Предположим, что слушатель может слышать данный акустический сигнал в беззвучном режиме. Когда сигнал воспроизводится во время воспроизведения другого звука (маскирующего устройства), сигнал должен быть более сильным, чтобы слушатель мог его услышать. Для маскирования маскеру не нужны частотные составляющие исходного сигнала. Можно услышать замаскированный сигнал, даже если он слабее, чем маскирующий. Маскирование происходит, когда сигнал и маскер играют вместе - например, когда один человек шепчет, а другой кричит, - и слушатель не слышит более слабый сигнал, поскольку он был замаскирован более громким маскером. Маскирование также может происходить, когда сигнал начинается после остановки маскатора. Например, один внезапный громкий звук хлопка может привести к появлению неслышных звуков. Эффект обратной маскировки слабее, чем прямой. Эффект маскировки широко изучался в психоакустических исследованиях. Можно изменить уровень маскера и измерить порог, а затем создать диаграмму кривой психофизической настройки, которая покажет похожие особенности. Эффекты маскирования также используются при кодировании звука с потерями, например MP3.

Отсутствует фундаментальный

При представлении гармонический ряд частот в соотношении 2ж, 3ж, 4ж, 5жи др. (где ж это конкретная частота), люди склонны воспринимать высоту тона ж. Наглядный пример можно найти на YouTube.[11]

Программного обеспечения

При перцептивном кодировании звука используются алгоритмы, основанные на психоакустике.

Психоакустическая модель обеспечивает высокое качество сжатие сигнала с потерями описывая, какие части данного цифрового аудиосигнала можно безопасно удалить (или агрессивно сжать), то есть без значительных потерь в (сознательно) воспринимаемом качестве звука.

Это может объяснить, как резкий хлопок в ладоши может показаться мучительно громким в тихой библиотеке, но едва заметен после того, как автомобиль загорелся на оживленной городской улице. Это дает большое преимущество для общей степени сжатия, а психоакустический анализ обычно приводит к сжатым музыкальным файлам, размер которых составляет от 1/10 до 1/12 от размера высококачественных мастеров, но с заметно меньшей пропорциональной потерей качества. Такое сжатие характерно почти для всех современных форматов сжатия звука с потерями. Некоторые из этих форматов включают Dolby Digital (АС-3), MP3, Opus, Ogg Vorbis, AAC, WMA, MPEG-1 Layer II (используется для цифровое аудиовещание в нескольких странах) и ATRAC, сжатие, используемое в MiniDisc и немного Walkman модели.

Психоакустика во многом основана на Анатомия человека, особенно ограничения уха в восприятии звука, как указано ранее. Подводя итог, эти ограничения:

Алгоритм сжатия может назначать более низкий приоритет звукам, выходящим за пределы диапазона человеческого слуха. Путем осторожного смещения битов от неважных компонентов к важным, алгоритм обеспечивает наиболее точное представление звуков, которые слушатель, скорее всего, будет воспринимать.

Музыка

Психоакустика включает темы и исследования, имеющие отношение к музыкальная психология и музыкальная терапия. Теоретики, такие как Бенджамин Борец считают некоторые результаты психоакустики значимыми только в музыкальном контексте.[12]

Ирв Тейбель с Серия сред Пластинки (1969–79) представляют собой ранний пример коммерчески доступных звуков, выпущенных специально для улучшения психологических способностей.[13]

Прикладная психоакустика

Психоакустическая модель

Психоакустика уже давно поддерживает симбиотические отношения с Информатика, компьютерная инженерия, и компьютерная сеть. Пионеры Интернета Дж. К. Р. Ликлайдер и Боб Тейлор оба закончили аспирантуру по психоакустике, а BBN Technologies изначально специализировался на консультировании по вопросам акустики до того, как начал строить первый с коммутацией пакетов компьютерная сеть.

Ликлайдер написал статью под названием «Дуплексная теория восприятия высоты звука».[14]

Психоакустика применяется во многих областях разработки программного обеспечения, где разработчики отображают проверенные и экспериментальные математические закономерности в цифровой обработке сигналов. Многие кодеки сжатия звука, такие как MP3 и Opus используйте психоакустическую модель для увеличения степени сжатия. Успех обычные аудиосистемы для воспроизведения музыки в театрах и дома можно отнести к психоакустике[15] и психоакустические соображения привели к появлению новых аудиосистем, таких как психоакустические синтез звукового поля.[16] Более того, ученые с ограниченным успехом экспериментировали по созданию нового акустического оружия, которое излучает частоты, которые могут повредить, повредить или убить.[17] Психоакустика также используется в озвучивание чтобы сделать несколько независимых измерений понятными и легко интерпретируемыми.[18] Это дает возможность слухового сопровождения без необходимости пространственного звука и озвучивание компьютерные игры[19] и другие приложения, такие как дрон летающий и хирургия под визуальным контролем[20]. Он также применяется сегодня в музыке, где музыканты и артисты продолжают создавать новые слуховые ощущения, маскируя нежелательные частоты инструментов, вызывая усиление других частот. Еще одно применение - разработка небольших громкоговорителей или громкоговорителей более низкого качества, в которых может использоваться явление недостающие основы для создания эффекта низких частот на более низких частотах, чем акустические системы физически способны воспроизводить (см. ссылки).

Производители автомобилей проектируют свои двигатели и даже двери так, чтобы звук был определенным.[21]

Смотрите также

Связанные поля

Психоакустические темы

Рекомендации

Примечания

  1. ^ Баллоу, Г. (2008). Справочник звукорежиссера (Четвертое изд.). Берлингтон: Focal Press. п. 43.
  2. ^ Кристофер Дж. Плак (2005). Чувство слуха. Рутледж. ISBN  978-0-8058-4884-7.
  3. ^ Ларс Альзен; Кларенс Сонг (2003). Sound Blaster Live! Книга. Пресс без крахмала. ISBN  978-1-886411-73-9.
  4. ^ Рудольф Ф. Граф (1999). Современный словарь электроники. Newnes. ISBN  978-0-7506-9866-5.
  5. ^ Джек Кац; Роберт Ф. Буркард и Ларри Медветски (2002). Справочник по клинической аудиологии. Липпинкотт Уильямс и Уилкинс. ISBN  978-0-683-30765-8.
  6. ^ а б Олсон, Гарри Ф. (1967). Музыка, физика и инженерия. Dover Publications. С. 248–251. ISBN  978-0-486-21769-7.
  7. ^ Фастл, Хьюго; Цвикер, Эберхард (2006). Психоакустика: факты и модели. Springer. С. 21–22. ISBN  978-3-540-23159-2.
  8. ^ Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  9. ^ Дороги, Кертис. Учебник компьютерной музыки. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
  10. ^ Льюис, Д. (2007): Уши и слух совы. Совиные страницы [Интернет]. Имеется в наличии: http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011, 5 апреля]
  11. ^ Акустический, Музыкальный. "Отсутствует фундаментальный". YouTube. Получено 19 августа 2019.
  12. ^ Стерн, Джонатан (2003). Звуковое прошлое: культурные истоки воспроизведения звука. Дарем: издательство Duke University Press. ISBN  9780822330134.
  13. ^ Каммингс, Джим. "Ирв Тейбель умер на этой неделе: создатель пластинок" Environments "1970-х годов.. Земляное ухо. Получено 18 ноября 2015.
  14. ^ Ликлидер, Дж. К. Р. (январь 1951 г.). «Дуплексная теория восприятия высоты звука» (PDF). Журнал акустического общества Америки. 23 (1): 147. Bibcode:1951ASAJ ... 23..147L. Дои:10.1121/1.1917296. В архиве (PDF) из оригинала от 02.09.2016.
  15. ^ Цимер, Тим (2020). «Обычный стереофонический звук». Синтез звукового поля психоакустической музыки. Текущие исследования в систематическом музыкознании. 7. Чам: Спрингер. С. 171–202. Дои:10.1007/978-3-030-23033-3_7. ISBN  978-3-030-23033-3.
  16. ^ Цимер, Тим (2020). Синтез звукового поля психоакустической музыки. Текущие исследования в систематическом музыкознании. 7. Чам: Спрингер. Дои:10.1007/978-3-030-23033-3. ISBN  978-3-030-23032-6. ISSN  2196-6974.
  17. ^ «Архивная копия». Архивировано из оригинал в 2010-07-19. Получено 2010-02-06.CS1 maint: заархивированная копия как заголовок (связь)
  18. ^ Цимер, Тим; Шультейс, Хольгер; Блэк, Дэвид; Кикинис, Рон (2018). «Психоакустическая интерактивная сонификация для ближней навигации». Acta Acustica вместе с Acustica. 104 (6): 1075–1093. Дои:10.3813 / AAA.919273.
  19. ^ CURAT. «Игры и обучение минимально инвазивной хирургии». CURAT. Бременский университет. Получено 15 июля 2020.
  20. ^ Цимер, Тим; Нучпрайун, Нуттавут; Шультейс, Хольгер (2019). «Психоакустическая сонификация как пользовательский интерфейс для взаимодействия человека с машиной» (PDF). Международный журнал общества информатики. 12 (1). arXiv:1912.08609. Дои:10.13140 / RG.2.2.14342.11848. Получено 15 июля 2020.
  21. ^ Тарми, Джеймс (5 августа 2014 г.). "Двери Mercedes имеют фирменный звук: вот как". Bloomberg Business. Получено 10 августа 2020.

Источники

внешняя ссылка