Передача обучения - Transfer learning

Трансферное обучение (TL) проблема исследования в машинное обучение (ML), который фокусируется на хранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме.^[1] Например, знания, полученные при обучении распознавать cars может применяться при попытке распознать грузовики. Эта область исследований имеет некоторое отношение к долгой истории психологической литературы по передача обучения, хотя формальные связи между двумя областями ограничены. С практической точки зрения повторное использование или перенос информации из ранее изученных задач для обучения новым задачам может значительно повысить эффективность выборки обучение с подкреплением агент.^[2]

История

В 1976 году Стево Бозиновски и Анте Фулгози опубликовали статью, в которой явно рассматривались вопросы трансферного обучения при обучении нейронных сетей. ^[3] ^[4] В статье представлена математическая и геометрическая модель трансферного обучения. В 1981 году был представлен отчет о применении трансферного обучения для обучения нейронной сети на наборе данных изображений, представляющих буквы компьютерных терминалов. Экспериментально продемонстрировано как положительное, так и отрицательное трансферное обучение. ^[5]

В 1993 году Лориен Пратт опубликовал статью о переводе в машинное обучение, формулируя алгоритм передачи на основе различимости (DBT).^[6]

В 1997 г. журнал Машинное обучение опубликовал специальный выпуск, посвященный трансферному обучению,^[7] и к 1998 году эта область расширилась и включила многозадачное обучение,^[8] наряду с более формальным анализом его теоретических основ.^[9] Учиться усваивать знания,^[10] под редакцией Пратта и Себастьян Трун, представляет собой обзор этого предмета за 1998 год.

Трансферное обучение также применялось в когнитивной науке с журналом Связь Наукапубликация специального выпуска о повторном использовании нейронных сетей через перенос в 1996 году.^[11]

Эндрю Нг сказал в своем руководстве NIPS 2016 ^[12]^[13]^[14] что TL станет следующим драйвером коммерческого успеха ML после контролируемое обучение чтобы подчеркнуть важность TL.

Определение

Определение трансферного обучения дается с точки зрения предметных областей и задач. Домен ${ Displaystyle { mathcal {D}}}$ состоит из: пространство функций ${ displaystyle { mathcal {X}}}$ и распределение предельной вероятности ${ Displaystyle P (X)}$ , куда ${ displaystyle X = {x_ {1}, ..., x_ {n} } in { mathcal {X}}}$ . Учитывая конкретный домен, ${ Displaystyle { mathcal {D}} = {{ mathcal {X}}, P (X) }}$ , задача состоит из двух компонентов: пространство метки ${ displaystyle { mathcal {Y}}}$ и объективная функция прогнозирования ${ displaystyle f: { mathcal {X}} rightarrow { mathcal {Y}}}$ . Функция ${ displaystyle f}$ используется для прогнозирования соответствующей метки ${ displaystyle f (x)}$ нового экземпляра ${ displaystyle x}$ . Эта задача, обозначенная ${ Displaystyle { mathcal {T}} = {{ mathcal {Y}}, f (x) }}$ , извлекается из обучающих данных, состоящих из пар ${ Displaystyle {х_ {я}, у_ {я} }}$ , куда ${ displaystyle x_ {i} in X}$ и ${ displaystyle y_ {i} in { mathcal {Y}}}$ . ^[15]

Учитывая исходный домен ${ displaystyle { mathcal {D}} _ {S}}$ и учебная задача ${ displaystyle { mathcal {T}} _ {S}}$ , целевой домен ${ displaystyle { mathcal {D}} _ {T}}$ и учебная задача ${ Displaystyle { mathcal {T}} _ {T}}$ , куда ${ Displaystyle { mathcal {D}} _ {S} neq { mathcal {D}} _ {T}}$ , или же ${ Displaystyle { mathcal {T}} _ {S} neq { mathcal {T}} _ {T}}$ , трансферное обучение направлено на улучшение усвоения целевой функции прогнозирования. ${ displaystyle f_ {T} ( cdot)}$ в ${ Displaystyle { mathcal {T}} _ {T}}$ используя знания в ${ displaystyle { mathcal {D}} _ {S}}$ и ${ Displaystyle { mathcal {T}} _ {S}}$ .^[15]

Приложения

Алгоритмы трансферного обучения доступны в Марковские логические сети^[16] и Байесовские сети.^[17] Трансферное обучение также применялось к открытию подтипа рака,^[18] использование здания,^[19]^[20] общая игра,^[21] классификация текста,^[22]^[23] распознавание цифр ^[24], медицинская визуализация и фильтрация спама.^[25]

В 2020 году было обнаружено, что из-за их схожей физической природы переносное обучение возможно между Электромиографический (ЭМГ) сигналы от мышц при классификации поведения Электроэнцефалографический (ЭЭГ) мозговые волны от распознавание жеста в область распознавания психического состояния. Также было отмечено, что эта взаимосвязь работает наоборот, показывая, что ЭЭГ также может быть использована для классификации ЭМГ дополнительно.^[26] Эксперименты отметили, что точность нейронные сети и сверточные нейронные сети были улучшены^[27] через переносное обучение как в первую эпоху (до любого обучения, т. е. по сравнению со стандартным случайным распределением весов), так и в асимптоту (конец процесса обучения). То есть алгоритмы улучшаются за счет воздействия на другой домен. Более того, конечный пользователь предварительно обученной модели может изменить структуру полностью связанных слоев для достижения превосходной производительности.^[28].

Смотрите также

Рекомендации

^ Уэст, Джереми; Вентура, Дэн; Варник, Шон (2007). «Презентация весенних исследований: теоретические основы индуктивного переноса». Университет Бригама Янга, Колледж физико-математических наук. Архивировано из оригинал на 2007-08-01. Получено 2007-08-05.
^ Джордж Каримпанал, Томмен; Буффане, Роланд (2019). «Самоорганизующиеся карты для хранения и передачи знаний при обучении с подкреплением». Адаптивное поведение. 27 (2): 111–126. arXiv:1811.08318. Дои:10.1177/1059712318818568. ISSN 1059-7123. S2CID 53774629.
^ Стево. Божиновски и Анте Фульгози (1976). «Влияние подобия паттернов и передачи обучения на тренировку базового перцептрона B2». (оригинал на хорватском языке) Proceedings of Symposium Informatica 3-121-5, Bled.
^ Стево Бозиновски (2020) «Напоминание о первой статье о трансферном обучении в нейронных сетях, 1976». Informatica 44: 291–302.
^ С. Бозиновский (1981). «Учебное пространство: концепция представления для адаптивной классификации шаблонов». Технический отчет COINS, Массачусетский университет в Амхерсте, № 81-28 [доступно на сайте: UM-CS-1981-028.pdf]
^ Пратт, Л. Я. (1993). «Передача данных между нейронными сетями на основе различимости» (PDF). Конференция NIPS: Достижения в системах обработки нейронной информации 5. Издательство Морган Кауфманн. С. 204–211.
^ Pratt, L. Y .; Трун, Себастьян (июль 1997 г.). «Машинное обучение - специальный выпуск по индуктивному переносу». link.springer.com. Springer. Получено 2017-08-10.
^ Каруана, Р., «Многозадачное обучение», стр. 95-134 в Пратт и Трун 1998
^ Бакстер, Дж., "Теоретические модели обучения, чтобы учиться", стр. 71-95. Пратт и Трун 1998
^ Thrun & Pratt 2012.
^ Пратт, Л. (1996). «Специальный выпуск: повторное использование нейронных сетей посредством передачи». Связь Наука. 8 (2). Получено 2017-08-10.
^ Учебное пособие NIPS 2016: «Основные принципы создания приложений искусственного интеллекта с использованием глубокого обучения» Эндрю Нг., получено 2019-12-28
^ «Расписание НИПС-2016». nips.cc. Получено 2019-12-28.
^ Гайки и болты создания приложений ИИ с использованием глубокого обучения, слайды
^ ^а ^б Линь, Юань-Пин; Юнг, Цзы-Пинг (27 июня 2017 г.). «Улучшение классификации эмоций на основе ЭЭГ с использованием условного переноса обучения». Границы нейробиологии человека. 11: 334. Дои:10.3389 / fnhum.2017.00334. ЧВК 5486154. PMID 28701938. Материал был скопирован из этого источника, который доступен под Международная лицензия Creative Commons Attribution 4.0.
^ Михалкова, Лиляна; Huynh, Tuyen; Муни, Раймонд Дж. (Июль 2007 г.), «Отображение и проверка логических сетей Маркова для передачи» (PDF), Учебные материалы 22-й конференции AAAI по искусственному интеллекту (AAAI-2007), Ванкувер, Британская Колумбия, стр. 608–614., получено 2007-08-05
^ Никулеску-Мизил, Александру; Каруана, Рич (21–24 марта 2007 г.), «Индуктивный перенос для изучения структуры байесовской сети» (PDF), Материалы одиннадцатой Международной конференции по искусственному интеллекту и статистике (AISTATS 2007), получено 2007-08-05
^ Хаджирамезанали, Э., Дадане, С. З., Кербалайгара, А., Чжоу, З., Цянь, X. Байесовское многодоменное обучение для обнаружения подтипов рака на основе данных подсчета секвенирования следующего поколения. 32-я конференция по системам обработки нейронной информации (NeurIPS 2018), Монреаль, Канада. arXiv:1810.09433
^ Arief-Ang, I.B .; Salim, F.D .; Гамильтон, М. (8 ноября 2017 г.). DA-HOC: адаптация полууправляемой области для прогнозирования занятости комнаты с использованием данных датчика CO2. 4-я Международная конференция ACM по системам для энергоэффективных построенных сред (BuildSys). Делфт, Нидерланды. С. 1–10. Дои:10.1145/3137133.3137146. ISBN 978-1-4503-5544-5.
^ Arief-Ang, I.B .; Гамильтон, М .; Салим, Ф.Д. (2018-12-01). «Масштабируемое прогнозирование занятости комнаты с переносимым разложением временного ряда данных датчика CO2». Транзакции ACM в сенсорных сетях. 14 (3–4): 21:1–21:28. Дои:10.1145/3217214. S2CID 54066723.
^ Банерджи, Бикрамджит и Питер Стоун. "Общее игровое обучение с использованием передачи знаний. »IJCAI. 2007.
^ До, Чыонг Б .; Нг, Эндрю Ю. (2005). «Трансферное обучение для классификации текстов». Фонд систем обработки нейронной информации, NIPS * 2005 (PDF). Получено 2007-08-05.
^ Раджат, Райна; Ng, Andrew Y .; Коллер, Дафна (2006). «Построение информационных априорных точек с использованием трансферного обучения». Двадцать третья международная конференция по машинному обучению (PDF). Получено 2007-08-05.
^ Maitra, D. S .; Bhattacharya, U .; Паруи, С. К. (август 2015 г.). «Общий подход на основе CNN к распознаванию рукописных символов в нескольких сценариях». 2015 13-я Международная конференция по анализу и распознаванию документов (ICDAR): 1021–1025. Дои:10.1109 / ICDAR.2015.7333916. ISBN 978-1-4799-1805-8. S2CID 25739012.
^ Бикель, Штеффен (2006). «Обзор проблемы обнаружения ECML-PKDD 2006». Семинар ECML-PKDD Discovery Challenge (PDF). Получено 2007-08-05.
^ Bird, Jordan J .; Кобыларз, Джонатан; Faria, Diego R .; Экарт, Анико; Рибейро, Эдуардо П. (2020). «Междоменное обучение передаче MLP и CNN для обработки биологических сигналов: ЭЭГ и ЭМГ». Доступ IEEE. Институт инженеров по электротехнике и радиоэлектронике (IEEE). 8: 54789–54801. Дои:10.1109 / доступ.2020.2979074. ISSN 2169-3536.
^ Майтра, Дурджой Сен; Бхаттачарья, Удджвал; Паруи, Свапан К. (август 2015 г.). «Общий подход на основе CNN к распознаванию рукописных символов в нескольких сценариях». 2015 13-я Международная конференция по анализу и распознаванию документов (ICDAR): 1021–1025. Дои:10.1109 / ICDAR.2015.7333916.
^ Кабир, Х. М., Абдар, М., Джалали, С. М. Дж., Хосрави, А., Атия, А. Ф., Нахаванди, С., и Шринивасан, Д. (2020). Spinalnet: глубокая нейронная сеть с постепенным вводом. Препринт arXiv arXiv: 2007.03347.

Источники

Трун, Себастьян; Пратт, Лориен (6 декабря 2012 г.). Учиться усваивать знания. Springer Science & Business Media. ISBN 978-1-4615-5529-2.CS1 maint: ref = harv (связь)

[1] Уэст, Джереми; Вентура, Дэн; Варник, Шон (2007). «Презентация весенних исследований: теоретические основы индуктивного переноса». Университет Бригама Янга, Колледж физико-математических наук. Архивировано из оригинал на 2007-08-01. Получено 2007-08-05.

[2] Джордж Каримпанал, Томмен; Буффане, Роланд (2019). «Самоорганизующиеся карты для хранения и передачи знаний при обучении с подкреплением». Адаптивное поведение. 27 (2): 111–126. arXiv:1811.08318. Дои:10.1177/1059712318818568. ISSN 1059-7123. S2CID 53774629.

[3] Стево. Божиновски и Анте Фульгози (1976). «Влияние подобия паттернов и передачи обучения на тренировку базового перцептрона B2». (оригинал на хорватском языке) Proceedings of Symposium Informatica 3-121-5, Bled.

[4] Стево Бозиновски (2020) «Напоминание о первой статье о трансферном обучении в нейронных сетях, 1976». Informatica 44: 291–302.

[5] С. Бозиновский (1981). «Учебное пространство: концепция представления для адаптивной классификации шаблонов». Технический отчет COINS, Массачусетский университет в Амхерсте, № 81-28 [доступно на сайте: UM-CS-1981-028.pdf]

[6] Пратт, Л. Я. (1993). «Передача данных между нейронными сетями на основе различимости» (PDF). Конференция NIPS: Достижения в системах обработки нейронной информации 5. Издательство Морган Кауфманн. С. 204–211.

[7] Pratt, L. Y .; Трун, Себастьян (июль 1997 г.). «Машинное обучение - специальный выпуск по индуктивному переносу». link.springer.com. Springer. Получено 2017-08-10.

[8] Каруана, Р., «Многозадачное обучение», стр. 95-134 в Пратт и Трун 1998

[9] Бакстер, Дж., "Теоретические модели обучения, чтобы учиться", стр. 71-95. Пратт и Трун 1998

[FOOTNOTEThrunPratt2012-10] Thrun & Pratt 2012.

[11] Пратт, Л. (1996). «Специальный выпуск: повторное использование нейронных сетей посредством передачи». Связь Наука. 8 (2). Получено 2017-08-10.

[12] Учебное пособие NIPS 2016: «Основные принципы создания приложений искусственного интеллекта с использованием глубокого обучения» Эндрю Нг., получено 2019-12-28

[13] «Расписание НИПС-2016». nips.cc. Получено 2019-12-28.

[14] Гайки и болты создания приложений ИИ с использованием глубокого обучения, слайды

[Lin,_Jung_2017-15] а ^б Линь, Юань-Пин; Юнг, Цзы-Пинг (27 июня 2017 г.). «Улучшение классификации эмоций на основе ЭЭГ с использованием условного переноса обучения». Границы нейробиологии человека. 11: 334. Дои:10.3389 / fnhum.2017.00334. ЧВК 5486154. PMID 28701938. Материал был скопирован из этого источника, который доступен под Международная лицензия Creative Commons Attribution 4.0.

[16] Михалкова, Лиляна; Huynh, Tuyen; Муни, Раймонд Дж. (Июль 2007 г.), «Отображение и проверка логических сетей Маркова для передачи» (PDF), Учебные материалы 22-й конференции AAAI по искусственному интеллекту (AAAI-2007), Ванкувер, Британская Колумбия, стр. 608–614., получено 2007-08-05

[17] Никулеску-Мизил, Александру; Каруана, Рич (21–24 марта 2007 г.), «Индуктивный перенос для изучения структуры байесовской сети» (PDF), Материалы одиннадцатой Международной конференции по искусственному интеллекту и статистике (AISTATS 2007), получено 2007-08-05

[:bmdl-18] Хаджирамезанали, Э., Дадане, С. З., Кербалайгара, А., Чжоу, З., Цянь, X. Байесовское многодоменное обучение для обнаружения подтипов рака на основе данных подсчета секвенирования следующего поколения. 32-я конференция по системам обработки нейронной информации (NeurIPS 2018), Монреаль, Канада. arXiv:1810.09433

[19] Arief-Ang, I.B .; Salim, F.D .; Гамильтон, М. (8 ноября 2017 г.). DA-HOC: адаптация полууправляемой области для прогнозирования занятости комнаты с использованием данных датчика CO2. 4-я Международная конференция ACM по системам для энергоэффективных построенных сред (BuildSys). Делфт, Нидерланды. С. 1–10. Дои:10.1145/3137133.3137146. ISBN 978-1-4503-5544-5.

[20] Arief-Ang, I.B .; Гамильтон, М .; Салим, Ф.Д. (2018-12-01). «Масштабируемое прогнозирование занятости комнаты с переносимым разложением временного ряда данных датчика CO2». Транзакции ACM в сенсорных сетях. 14 (3–4): 21:1–21:28. Дои:10.1145/3217214. S2CID 54066723.

[21] Банерджи, Бикрамджит и Питер Стоун. "Общее игровое обучение с использованием передачи знаний. »IJCAI. 2007.

[22] До, Чыонг Б .; Нг, Эндрю Ю. (2005). «Трансферное обучение для классификации текстов». Фонд систем обработки нейронной информации, NIPS * 2005 (PDF). Получено 2007-08-05.

[23] Раджат, Райна; Ng, Andrew Y .; Коллер, Дафна (2006). «Построение информационных априорных точек с использованием трансферного обучения». Двадцать третья международная конференция по машинному обучению (PDF). Получено 2007-08-05.

[24] Maitra, D. S .; Bhattacharya, U .; Паруи, С. К. (август 2015 г.). «Общий подход на основе CNN к распознаванию рукописных символов в нескольких сценариях». 2015 13-я Международная конференция по анализу и распознаванию документов (ICDAR): 1021–1025. Дои:10.1109 / ICDAR.2015.7333916. ISBN 978-1-4799-1805-8. S2CID 25739012.

[25] Бикель, Штеффен (2006). «Обзор проблемы обнаружения ECML-PKDD 2006». Семинар ECML-PKDD Discovery Challenge (PDF). Получено 2007-08-05.

[26] Bird, Jordan J .; Кобыларз, Джонатан; Faria, Diego R .; Экарт, Анико; Рибейро, Эдуардо П. (2020). «Междоменное обучение передаче MLP и CNN для обработки биологических сигналов: ЭЭГ и ЭМГ». Доступ IEEE. Институт инженеров по электротехнике и радиоэлектронике (IEEE). 8: 54789–54801. Дои:10.1109 / доступ.2020.2979074. ISSN 2169-3536.

[27] Майтра, Дурджой Сен; Бхаттачарья, Удджвал; Паруи, Свапан К. (август 2015 г.). «Общий подход на основе CNN к распознаванию рукописных символов в нескольких сценариях». 2015 13-я Международная конференция по анализу и распознаванию документов (ICDAR): 1021–1025. Дои:10.1109 / ICDAR.2015.7333916.

[28] Кабир, Х. М., Абдар, М., Джалали, С. М. Дж., Хосрави, А., Атия, А. Ф., Нахаванди, С., и Шринивасан, Д. (2020). Spinalnet: глубокая нейронная сеть с постепенным вводом. Препринт arXiv arXiv: 2007.03347.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]