После нескольких месяцев содержательных дискуссий, отзывов и исследований я решился предложить список из 42 принципов для более целостных инициатив в области машинного обучения.

Инженеры данных, Agile-практики, операторы и инженеры по машинному обучению, специалисты по данным, юристы по вопросам конфиденциальности и все люди в мире, затронутые радикальным преобразованием экономики и рабочих мест, которые революционизируют наше мышление, сопротивляются росту близорукости данных. Поэтому мы объявляем:

  1. Разрабатывайте и внедряйте модели в соответствии с последними представлениями об этичном использовании искусственного интеллекта, а также будьте в курсе последних событий.
  2. Поощряйте и поощряйте прямые обсуждения между разработчиком модели и пользователем модели.
  3. Сократите количество посредников и иерархий, чтобы информация могла свободно и с минимальными искажениями передаваться группам моделирования.
  4. Тщательно изучите и прозрачно сообщите метрики оценки модели, а не полагайтесь на полезные метрики для рекламы успеха.
  5. Бороться за то, чтобы избежать предвзятости в данных, мнениях и дизайне с помощью сбалансированных стратегий укомплектования персоналом и сбора данных.
  6. Соблюдайте большую осторожность при подготовке и сборе данных о метках и функциях.
  7. Открыто, прозрачно и неоднократно сообщайте о механике модели, чтобы любой, кто хочет понять логику, мог это сделать.
  8. Для каждой развернутой модели разработайте план эксплуатации модели для мониторинга производительности и согласованности данных, качества, полноты и структурных изменений.
  9. Эффективно используйте документацию, чтобы облегчить передачу предположений модели, входных данных, ключевых аспектов разработки алгоритма и механики.
  10. Стремиться собирать достаточно точные, непротиворечивые, чистые и окончательные этикетки и поддерживать процесс обновления этикеток.
  11. Создайте позитивную культуру ошибок, чтобы рано и часто терпеть неудачи и подавать пример, признавая ошибки и оставаясь открытыми для критики.
  12. Не поощряйте создание обширных команд по науке о данных в центральной башне из слоновой кости
  13. Признать, что отличное управление данными и особенно документирование и качество данных необходимы для надежного ввода данных, управляющих моделями, в использовании которых люди чувствуют себя уверенно.
  14. Поощряйте и помогайте установить принятие ИИ перед развертыванием, а не полагаться на пассивную терпимость или отклонение, особенно для моделей, основанных на петлях обратной связи.
  15. Напишите проверки качества ввода данных и интегрируйте этот шаг в процесс проектирования модели и, насколько это возможно, в оценку модели.
  16. Работайте над уменьшением предвзятости в отношении результатов ИИ и включите ИИ как аспект разнообразия и интеграции для организаций.
  17. Создавайте кросс-функциональные команды, в которые вовлекается как можно больше людей, использующих результаты модели в процессе разработки, чтобы уменьшить страх и неприятие.
  18. Предоставление реальных перспектив работы модели, обслуживания и улучшения параметров людям, чья текущая работа изменится из-за развертывания ИИ.
  19. Прислушивайтесь к советам инженеров по моделям и данным, которые были наняты независимо от их социального, этического, профессионального или корпоративного положения.
  20. Всегда будьте в курсе и настроены на технические аспекты работы
  21. Поддержка отрасли в создании надлежащих процедур и структур проектирования, эксплуатации, контроля и мониторинга.
  22. Признать, что искусственный интеллект влияет на суть того, что определяет человеческую природу и, следовательно, особую ответственность за заботу о пострадавших сторонах.
  23. Стремитесь избегать межфункциональной специализации команды и обучайте основам разработки данных и моделей, чтобы каждый член команды мог внести значимый вклад.
  24. Предотвратите установление нереалистичных ожиданий скорости и точности моделей AI/ML.
  25. Не пытайтесь нарушить законы физики или математики с помощью машинного обучения.
  26. Дополнить AI/ML соответствующим статистическим анализом как до, так и после моделирования; это не соревнование, а симбиотические отношения
  27. Позвольте моделям учиться и совершенствоваться с течением времени и признайте, что процесс обучения может потребовать потенциально обширного наблюдения за деятельностью человека, прежде чем модели будут работать желаемым образом, особенно для таких моделей с петлей обратной связи/человеком в цикле/совместной фильтрацией.
  28. Оценивайте модели на предмет проблем с данными перед развертыванием
  29. Прославляйте инженеров как героев данных, понимая их критическую роль и прислушиваясь к их рекомендациям и советам.
  30. Прославляйте нетехнические профессии в области данных как героев в своих областях
  31. Никогда не противопоставляйте инженеров и нетехнических профессий друг другу, но признайте, что хорошие модели требуют сотрудничества между несколькими дисциплинами.
  32. Документируйте и обновляйте сведения об элементах данных, таких как атрибуты, значение кода, время и источник, а также юридические разрешения всегда как можно ближе к записи данных, чтобы это было очевидно во время исследования данных.
  33. Создавайте гибкие структуры машинного обучения со многими довольными командами с поддержкой ИИ в организации.
  34. Установите повторяющиеся процедуры, чтобы данные, модели и среда, в которой они работают, были хорошо согласованы.
  35. Разрабатывайте модели AI/ML таким образом, чтобы их можно было попросить разучиться и забыть, если в этом возникнет необходимость.
  36. Отслеживайте модели, данные и версии конфигурации, используемые для обучения и развертывания.
  37. Установить юридически допустимое использование каждого элемента данных в момент сбора данных и, в случае вторичных данных, получить юридическое заключение о том, как можно использовать входные данные.
  38. Оставайтесь любопытными, узнайте и примите тот факт, что опыт искажается событиями, свидетелями которых люди случайно стали в течение своей жизни.
  39. Используйте существующие определения ролей из гибких и технических областей, а не создавайте для фирм специальные нишевые роли, из-за которых всем будет сложнее ориентироваться во многих обязанностях в области ИИ.
  40. Помогите своей команде лидеров установить стимулы для служащих лидеров
  41. Создайте бизнес-обоснование и модель доходов/затрат для своей инициативы
  42. Не решайте математические задачи с помощью моделей машинного обучения

Написано в честь Манифеста ключевого поезда с полными ссылками, опубликованными в бесплатной книге Unmanage. На этом история не заканчивается. Пожалуйста, поделитесь своим мнением или поддержите манифест в комментариях.