Манифест машинного обучения

После нескольких месяцев содержательных дискуссий, отзывов и исследований я решился предложить список из 42 принципов для более целостных инициатив в области машинного обучения.

Инженеры данных, Agile-практики, операторы и инженеры по машинному обучению, специалисты по данным, юристы по вопросам конфиденциальности и все люди в мире, затронутые радикальным преобразованием экономики и рабочих мест, которые революционизируют наше мышление, сопротивляются росту близорукости данных. Поэтому мы объявляем:

Разрабатывайте и внедряйте модели в соответствии с последними представлениями об этичном использовании искусственного интеллекта, а также будьте в курсе последних событий.
Поощряйте и поощряйте прямые обсуждения между разработчиком модели и пользователем модели.
Сократите количество посредников и иерархий, чтобы информация могла свободно и с минимальными искажениями передаваться группам моделирования.
Тщательно изучите и прозрачно сообщите метрики оценки модели, а не полагайтесь на полезные метрики для рекламы успеха.
Бороться за то, чтобы избежать предвзятости в данных, мнениях и дизайне с помощью сбалансированных стратегий укомплектования персоналом и сбора данных.
Соблюдайте большую осторожность при подготовке и сборе данных о метках и функциях.
Открыто, прозрачно и неоднократно сообщайте о механике модели, чтобы любой, кто хочет понять логику, мог это сделать.
Для каждой развернутой модели разработайте план эксплуатации модели для мониторинга производительности и согласованности данных, качества, полноты и структурных изменений.
Эффективно используйте документацию, чтобы облегчить передачу предположений модели, входных данных, ключевых аспектов разработки алгоритма и механики.
Стремиться собирать достаточно точные, непротиворечивые, чистые и окончательные этикетки и поддерживать процесс обновления этикеток.
Создайте позитивную культуру ошибок, чтобы рано и часто терпеть неудачи и подавать пример, признавая ошибки и оставаясь открытыми для критики.
Не поощряйте создание обширных команд по науке о данных в центральной башне из слоновой кости
Признать, что отличное управление данными и особенно документирование и качество данных необходимы для надежного ввода данных, управляющих моделями, в использовании которых люди чувствуют себя уверенно.
Поощряйте и помогайте установить принятие ИИ перед развертыванием, а не полагаться на пассивную терпимость или отклонение, особенно для моделей, основанных на петлях обратной связи.
Напишите проверки качества ввода данных и интегрируйте этот шаг в процесс проектирования модели и, насколько это возможно, в оценку модели.
Работайте над уменьшением предвзятости в отношении результатов ИИ и включите ИИ как аспект разнообразия и интеграции для организаций.
Создавайте кросс-функциональные команды, в которые вовлекается как можно больше людей, использующих результаты модели в процессе разработки, чтобы уменьшить страх и неприятие.
Предоставление реальных перспектив работы модели, обслуживания и улучшения параметров людям, чья текущая работа изменится из-за развертывания ИИ.
Прислушивайтесь к советам инженеров по моделям и данным, которые были наняты независимо от их социального, этического, профессионального или корпоративного положения.
Всегда будьте в курсе и настроены на технические аспекты работы
Поддержка отрасли в создании надлежащих процедур и структур проектирования, эксплуатации, контроля и мониторинга.
Признать, что искусственный интеллект влияет на суть того, что определяет человеческую природу и, следовательно, особую ответственность за заботу о пострадавших сторонах.
Стремитесь избегать межфункциональной специализации команды и обучайте основам разработки данных и моделей, чтобы каждый член команды мог внести значимый вклад.
Предотвратите установление нереалистичных ожиданий скорости и точности моделей AI/ML.
Не пытайтесь нарушить законы физики или математики с помощью машинного обучения.
Дополнить AI/ML соответствующим статистическим анализом как до, так и после моделирования; это не соревнование, а симбиотические отношения
Позвольте моделям учиться и совершенствоваться с течением времени и признайте, что процесс обучения может потребовать потенциально обширного наблюдения за деятельностью человека, прежде чем модели будут работать желаемым образом, особенно для таких моделей с петлей обратной связи/человеком в цикле/совместной фильтрацией.
Оценивайте модели на предмет проблем с данными перед развертыванием
Прославляйте инженеров как героев данных, понимая их критическую роль и прислушиваясь к их рекомендациям и советам.
Прославляйте нетехнические профессии в области данных как героев в своих областях
Никогда не противопоставляйте инженеров и нетехнических профессий друг другу, но признайте, что хорошие модели требуют сотрудничества между несколькими дисциплинами.
Документируйте и обновляйте сведения об элементах данных, таких как атрибуты, значение кода, время и источник, а также юридические разрешения всегда как можно ближе к записи данных, чтобы это было очевидно во время исследования данных.
Создавайте гибкие структуры машинного обучения со многими довольными командами с поддержкой ИИ в организации.
Установите повторяющиеся процедуры, чтобы данные, модели и среда, в которой они работают, были хорошо согласованы.
Разрабатывайте модели AI/ML таким образом, чтобы их можно было попросить разучиться и забыть, если в этом возникнет необходимость.
Отслеживайте модели, данные и версии конфигурации, используемые для обучения и развертывания.
Установить юридически допустимое использование каждого элемента данных в момент сбора данных и, в случае вторичных данных, получить юридическое заключение о том, как можно использовать входные данные.
Оставайтесь любопытными, узнайте и примите тот факт, что опыт искажается событиями, свидетелями которых люди случайно стали в течение своей жизни.
Используйте существующие определения ролей из гибких и технических областей, а не создавайте для фирм специальные нишевые роли, из-за которых всем будет сложнее ориентироваться во многих обязанностях в области ИИ.
Помогите своей команде лидеров установить стимулы для служащих лидеров
Создайте бизнес-обоснование и модель доходов/затрат для своей инициативы
Не решайте математические задачи с помощью моделей машинного обучения

Написано в честь Манифеста ключевого поезда с полными ссылками, опубликованными в бесплатной книге Unmanage. На этом история не заканчивается. Пожалуйста, поделитесь своим мнением или поддержите манифест в комментариях.

Манифест машинного обучения

Похожие вопросы