Публикации по теме 'reinforcement-learning'


Змеиный алгоритм обучения с подкреплением
Обучение алгоритма змеи — один из самых основных проектов, связанных с обучением с подкреплением. Это что-то вроде Hello World обучения с подкреплением. Недавно я обнаружил серию YouTube инженера по Python, где он построил алгоритм обучения с подкреплением с нуля, используя pytorch, но мне показалось, что он не очень хорошо объяснил концепции или модель. Я пишу эту статью, чтобы объяснить основы алгоритма и, возможно, кое-что из математики, лежащей в его основе. Видео Youtube инженера..

Освоение обучения с подкреплением: теория и приложения
Что такое обучение с подкреплением? Обучение с подкреплением (RL) — это тип машинного обучения, при котором агент учится принимать решения, взаимодействуя с окружающей средой. Агент получает обратную связь в виде вознаграждения или наказания за свои действия, что позволяет ему учиться на своем опыте и со временем совершенствовать свои решения. В RL агенту не даются четкие инструкции о том, какие действия следует предпринять, вместо этого он должен исследовать среду и учиться методом..

21 обязательный инструмент с открытым исходным кодом для машинного обучения, который вы, вероятно, не используете (но должны!)
Вы должны уже знать популярные инструменты с открытым исходным кодом, такие как R, Python, записные книжки Jupyter и так далее. Но есть мир за пределами этих популярных инструментов - место, где существуют скрытые инструменты машинного обучения. Они не такие выдающиеся, как их аналоги, но могут спасти многие задачи машинного обучения. В этой статье мы рассмотрим 21 такой открытый инструмент для машинного обучения . Я настоятельно рекомендую вам потратить некоторое время на изучение..

Введение в фиктивную игру
Первый шаг к пониманию самостоятельной игры в обучении с подкреплением Обновление : лучший способ изучить и практиковать обучение с подкреплением - зайти на http://rl-lab.com Фиктивная игра - это концепция теории игр. Он состоит из анализа игры, чтобы выяснить, какую стратегию лучше всего использовать при столкновении с противником в игре с нулевой суммой. Обычно это сложная тема, поэтому мы начнем с некоторых важных определений, а затем объясним алгоритм фиктивной игры. Игра..

Глубокое обучение с подкреплением с помощью Python | Часть 2 | Создание и обучение агента RL с использованием Deep Q…
Глубокое обучение с подкреплением с помощью Python | Часть 2 | Создание и обучение агента RL с использованием сети Deep Q Network (DQN) В первой части мы сделали игровую среду и объяснили ее построчно. В этой части мы узнаем, как создать и обучить сеть Deep Q Network (DQN) и позволить агентам использовать ее, чтобы стать экспертами в нашей игре. Глубокое обучение с подкреплением с помощью Python | Часть 1 | Создание среды Проектирование и..

Конец открытых соревнований по искусственному интеллекту
Конец открытых соревнований по искусственному интеллекту От основателя StarCraft AI Competition. Обновление: Dota 2 действительно предоставляет интерфейс сценариев , позволяющий писать ботов на Lua. Однако этот ограниченный интерфейс не позволяет ботам связываться с удаленными процессами и сохранять данные о сыгранных играх. OpenAI Five - огромный шаг вперед для ИИ, но он также пугает исследователей ИИ. Никогда прежде не было так много открытых инструментов для создания..

Ты можешь это сделать!!! 5 лучших ресурсов для ЛЕГКОГО обучения глубокому обучению с подкреплением
Год назад я почти ничего не знал об этой захватывающей области исследований, когда осознал ее огромный потенциал. Сейчас я участвую в трех направлениях исследований, посвященных глубокому обучению с подкреплением. Как я это сделал? Я кратко объясню в этой средней статье.