Как работи многозадачното обучение, част 3 (Изкуствен интелект)

1. Последователно многозадачно обучение, базирано на кръстосано внимание(arXiv)

Автор:Sunkyung Kim, Hyesong Choi, Dongbo Min

Абстракт: При многозадачно обучение (MTL) за визуално разбиране на сцената е от решаващо значение да се прехвърля полезна информация между множество задачи с минимални смущения. В този документ ние предлагаме нова архитектура, която ефективно прехвърля информативни характеристики чрез прилагане на механизма за внимание към многомащабните характеристики на задачите. Тъй като прилагането на модула за внимание директно към всички възможни характеристики по отношение на мащаба и задачата изисква висока сложност, ние предлагаме модулът за внимание да се прилага последователно за задачата и мащаба. Модулът за внимание между задачи (CTAM) първо се прилага за улесняване на обмена на подходяща информация между функциите на множество задачи от същия мащаб. След това кръстосаният модул за внимание (CSAM) агрегира полезна информация от картите на функции с различни разделителни способности в една и съща задача. Също така, ние се опитваме да уловим зависимости от дълги разстояния чрез модула за самовнимание в мрежата за извличане на функции. Обширните експерименти показват, че нашият метод постига най-съвременна производителност на набора от данни NYUD-v2 и PASCAL-Context.

2. Упражнявано от ограничения многозадачно обучение(arXiv)

Автор: Богдан Крету, Андрю Кропър

Резюме:Индуктивното логическо програмиране е форма на машинно обучение, базирано на математическа логика, която генерира логически програми от дадени примери и основни знания. В този проект ние разширяваме системата Popper ILP, за да използваме многозадачно обучение. Ние прилагаме най-съвременния подход и няколко нови стратегии за подобряване на ефективността на търсенето. Освен това въвеждаме запазване на ограниченията, техника, която подобрява цялостната производителност за всички подходи. Запазването на ограничения позволява на системата да прехвърля знания между актуализациите на набора от основни знания. Следователно, ние намаляваме количеството повтаряща се работа, извършвана от системата. Освен това, запазването на ограниченията ни позволява да преминем от сегашния най-съвременен итеративен подход за задълбочаване на търсенето към по-ефективен подход за първо търсене в ширина. И накрая, ние експериментираме с техники за обучение по учебна програма и показваме тяхната потенциална полза за полето

3.Откриване на реч на омразата в невидими домейни чрез многозадачно обучение: Казус от политически публични фигури(arXiv)

Автор:Lanqin Yuan, Marian-Andrei Rizoiu

Резюме: Автоматичното идентифициране на насаждащо омраза и злоупотреба съдържание е жизненоважно в борбата с разпространението на вредно онлайн съдържание и неговите вредни ефекти. Повечето съществуващи разработки оценяват модели чрез изследване на грешката при обобщаване на разделянето на влак-тест върху набори от данни за речта на омразата. Тези набори от данни често се различават по своите дефиниции и критерии за етикетиране, което води до лоша производителност на модела при прогнозиране в нови домейни и набори от данни. В тази работа ние предлагаме нов тръбопровод за многозадачно обучение (MTL), който използва MTL, за да обучава едновременно множество набори от данни за реч на омразата, за да изгради по-всеобхватен класификационен модел. Ние симулираме оценка на нови невиждани досега набори от данни, като възприемаме схема за изключване, в която пропускаме целеви набор от данни от обучението и съвместно обучаваме другите набори от данни. Нашите резултати постоянно превъзхождат голяма извадка от съществуваща работа. Ние показваме силни резултати при изследване на грешката на обобщаване в разделянето на тестове за влак и съществени подобрения при прогнозиране на невиждани преди набори от данни. Освен това, ние събираме нов набор от данни, наречен PubFigs, фокусиран върху проблемната реч на американски публични политически фигури. Ние автоматично откриваме проблемна реч в 305 235 туита в PubFigs и разкриваме информация за поведението на публични личности при публикуване

Как работи многозадачното обучение, част 3 (Изкуствен интелект)

Подобни въпроси