Daitch – Mokotoff Soundex - Daitch–Mokotoff Soundex

Daitch – Mokotoff Soundex (D – M Soundex) является фонетический алгоритм изобретен в 1985 году еврейскими генеалогами Гэри Мокотофф и Рэнди Дэйч. Это усовершенствование Рассела и Америки Soundex алгоритмы, разработанные для обеспечения большей точности сопоставления Славянский и идиш фамилии с похожими произношение но различия в написании.

Daitch – Mokotoff Soundex иногда называют «Jewish Soundex» и «Eastern European Soundex», хотя авторы не рекомендуют использовать эти прозвища для алгоритма, потому что сам алгоритм не зависит от того факта, что мотивация для создания новой системы была плохой. результаты предшествующих систем при работе со славянскими и идишскими фамилиями.

Улучшения

Усовершенствования по сравнению со старыми алгоритмами Soundex включают:

  • Кодированные имена состоят из шести цифр, что повышает точность поиска (традиционный Soundex использует четыре символа)
  • Кодируется начальный символ имени.
  • Несколько правил в алгоритме кодируют многосимвольные n-граммы как однозначные (American и Russell Soundex не обрабатывают многосимвольные n-граммы)
  • Для одного имени может быть возвращено несколько возможных кодировок (традиционный Soundex возвращает только одну кодировку, даже если написание имени потенциально может иметь несколько вариантов произношения)

Примеры

Некоторые примеры:

ФамилияАмериканский SoundexD – M Soundex
ПитерсP362739400, 734000
ПетерсонP362739460, 734600
МосковицM232645740
МосковицM213645740
АуэрбахA612097500, 097400
UhrbachU612097500, 097400
ДжексонJ250154600, 454600, 145460, 445460
Джексон-ДжексонJ252154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464

Алгоритм сопоставления фонетических имен Бейдера – Морса

Чтобы устранить большое количество ложноположительных результатов, генерируемых D – M Soundex, Стивен П. Морс и Александр Бейдер создал алгоритм сопоставления фонетических имен Бейдера – Морзе.[1] Этот новый алгоритм сокращает количество ложных срабатываний за счет некоторых ложноотрицательных результатов. Ряд сайтов предлагают звуковой индекс B – M в дополнение к звуку D – M.[2]

Примечания

  1. ^ Фонетическое соответствие Бейдера – Морзе: альтернатива Soundex с меньшим количеством ложных совпадений - копия Авотайну: Международный обзор еврейской генеалогии (лето 2008 г.)
  2. ^ Ну? Что нового? Том 9, номер 22 Гэри Мокотофф, редактор - Электронный журнал еврейской генеалогии от Avotaynu

внешняя ссылка