Индексирование скрытой семантической структуры - Latent semantic structure indexing

Индексирование скрытой семантической структуры (ЛаССИ) - это метод расчета химического сходства, полученный из латентно-семантический анализ (LSA).

LaSSI был разработан в Merck & Co. и запатентовано в 2007 г.[1] Ричарда Халла, Юджина Флудера, Суреш Сингха, Роберта Шеридана, Роберта Нахбара и Саймона Кирсли.

Обзор

LaSSI похож на LSA в том, что он включает построение матрицы вхождений из корпуса элементов и применение разложение по сингулярным числам в эту матрицу, чтобы получить скрытые функции. Отличается только то, что матрица вхождений представляет собой частоту двух- и трехмерных химических дескрипторов (а не терминов естественного языка), обнаруженных в химическая база данных химических структур. Этот процесс выводит концепции скрытой химической структуры, которые можно использовать для расчета химического сходства и отношения структура – ​​деятельность за открытие лекарств.

Рекомендации

  • Халл Р.Д., Флудер Е.М., Сингх С.Б., Нахбар Р.Б., Шеридан Р.П. и Кирсли С.К. (2001) «Индексирование скрытой семантической структуры (LaSSI) для определения химического сходства». J Med Chem, 2001 г., 12 апреля; 44 (8): 1177–84. Дои:10.1021 / jm000393c
  • Халл Р.Д., Сингх С.Б., Накбар Р.Б., Шеридан Р.П., Кирсли С.К. и Флудер, E.M. (2001) «Поиск химического сходства с использованием индексации латентной семантической структуры (LaSSI) и сравнение с TOPOSIM». J Med Chem, 2001 г., 12 апреля; 44 (8): 1185–91.
  • Сингх, С.Б., Шеридан, Р.П., Флудер, Э.М. и Халл, Р.Д. (2001) "Разработка химического карьера с помощью совместных химических зондов: применение индексации скрытой семантической структуры (LaSSI) и TOPOSIM (Dice) для анализа химических баз данных". J Med Chem, 10 мая 2001 г.; 44 (10): 1564–75.