Воспроизведение паттернов - Pattern playback

В воспроизведение паттернов[1][2] это одно из первых говорящих устройств, созданное доктором. Франклин С. Купер и его коллеги, включая Джона М. Борста и Кэрил Хаскинс, в Лаборатории Хаскинса в конце 1940-х и завершено в 1950 году. Существовало несколько различных версий этого аппаратного устройства. В настоящее время выживает только один. Аппарат преобразует изображения акустических паттернов речи в виде спектрограмма обратно в звук. Используя это устройство, Элвин Либерман, Фрэнк Купер и Пьер Делатр (позже к ним присоединился Кэтрин Саффорд Харрис, Ли Лискер и др.) смогли обнаружить акустические подсказки для восприятия фонетический сегменты (согласные и гласные). Это исследование было фундаментальным для разработки современных методов синтез речи, читающие машины для слепых изучение восприятие речи и распознавание речи, и развитие моторная теория восприятия речи.

Для создания звука устройство воспроизведения паттернов использует источник дугового света, который направлен на вращающийся диск с 50 концентрическими дорожками, прозрачность которых систематически изменяется, чтобы произвести 50 гармоник основной частоты. Далее свет проецируется на спектрограмма отражательная способность которого соответствует уровню звукового давления части сигнала, а затем направляется к фотоэлектрическому элементу, с помощью которого изменение света преобразуется в изменения звукового давления.

Последний раз воспроизведение паттерна использовалось в экспериментальном исследовании Роберт Ремез в 1976 г. Образец воспроизведения сейчас находится в музее по адресу Лаборатории Хаскинса в Нью-Хейвен, Коннектикут.

Техника воспроизведения паттернов теперь также относится, в более общем смысле, к алгоритмам или методам преобразования спектрограммы, кохлеограммы и коррелограммы из изображений обратно в звуки.

Воспроизведение цифрового паттерна

В 1970-х годах воспроизведение цифровых паттернов стало вытеснять более раннюю версию. Ранний прототип был разработан Патриком Найом, Филип Рубин и коллеги из Лаборатории Хаскинса. Он объединил в себе «универсальный анализатор спектра»[1] для автоматического спектрального анализа, вместе с VAX Процессор дисплея GT-40 для графической обработки отображаемой спектрограммы, форма «синтеза искусством» и последующего повторного синтеза с использованием 40-канального банка фильтров. Это гибридное аппаратно-программное воспроизведение цифрового шаблона было в конечном итоге заменено на Лаборатории Хаскинса посредством АИД система анализа и отображения, разработанная Филип Рубин, и реализовано в Фортран на VAX семейство компьютеров. Более современная версия была описана Араи и его коллегами. [2].Доступна онлайн-демонстрация. [3].

Смотрите также

Рекомендации

  1. ^ "Лаборатории Хаскинса". Haskins.yale.edu. Получено 2016-10-21.
  2. ^ «История синтеза речи, 1770 - 1970 гг.». Ling.su.se. 1997-07-08. Получено 2016-10-21.

Библиография

  • Купер, Ф.С., Либерман, А.М., и Борст, Дж. М., Взаимопревращение звуковых и видимых паттернов как основа для исследования восприятия речи. Труды Национальной академии наук, 1951, 37, 318-325.
  • Купер, Франклин С., Делатр, Пьер К., Либерман, А. М., Борст, Дж. М. и Герстман, Л. Дж., Некоторые эксперименты по восприятию синтетических звуков речи. Журнал акустического общества Америки, 1952, 24, 597-606.
  • Купер, Франклин С., Некоторые инструментальные средства для исследования речи. В Отчет четвертого ежегодного круглого стола по лингвистике и преподаванию языков. Вашингтон, округ Колумбия: Институт языков и лингвистики, Джорджтаунский университет, 1953, 46-53.
  • Дж. М. Борст, Использование спектрограмм для анализа и синтеза речи, J. Audio Eng. Soc., 4, 14-23, 1956.
  • Либерман, Элвин М., Некоторые результаты исследования восприятия речи. Журнал акустического общества Америки, 1957, 29, 117-123.
  • Ремез, Роберт Э., Адаптация границы категорий между речью и неречием: доводы против детекторов функций. Когнитивная психология, 1979, 11, 38-57.
  • Малкольм Слейни. Воспроизведение паттернов с 1950 по 1995 год. Материалы конференции по системам, человеку и кибернетике IEEE 1995 г.. 22–25 октября 1995 г., Ванкувер, Канада.
  • Малкольм Слейни, Воспроизведение паттернов в 90-х, в Достижения в системах обработки нейронной информации 7, Джеральд Тезауро, Дэвид Турецки и Тодд Лин (редакторы), MIT Press, Кембридж, Массачусетс, 1995.
  • Т. Араи, К. Ясу и Т. Гото, Воспроизведение цифровых паттернов, Proc. Осенняя встреча. Акуст. Soc. JPN., 429-430, 2005.
  • Т. Араи, К. Ясу и Т. Гото, Воспроизведение цифровых паттернов: преобразование спектрограмм в звук в образовательных целях, Акуст. Sci. & Тех., 27(6), 393-395, 2006