Публикации по теме 'reinforcement-learning'


Методы Монте-Карло - учимся на собственном опыте
Наконец-то мы подошли к началу захватывающих вещей. В предыдущей статье был очень краткий обзор изучения оптимальной политики, когда агент был знаком с моделью среды. Но невозможно получить полную информацию о динамике окружающей среды на практике. Методы Монте-Карло (МК) позволяют учиться на чистом опыте. Работа методов MC Методы MC не требуют знания окружающей среды. Для них требуется только опыт : последовательность состояний, действий и вознаграждений, получаемых при..

Немедленное RL (обучение с подкреплением)
Правильно, то, что мы называем немедленным обучением с немедленным подкреплением. Итак, если вы помните, существует множество характеристик проблемы обучения с подкреплением, и одна из них заключается в том, что вы получаете эту оценку из окружающей среды. Потенциально это может быть отложено, поэтому я сказал, что на самом деле вы можете потерять фигуру, очень важную фигуру в середине шахматной партии, но вы получаете награду только в конце. Это не похоже на то, что последний сделанный..

Выбор признаков для классификации с использованием глубокого обучения с подкреплением
Обзор методов выбора признаков: традиционные методы vs. методы ДХО Я открываю серию обзоров, чтобы помочь ученым/студентам собирать исследовательские идеи. В этой серии я рассмотрю тему исследования, а затем изложу мотивы, связанные работы, методы и…


Что такое машинное обучение? -Введение в машинное обучение
Если вы здесь, то либо вам любопытно, что такое машинное обучение, либо изучите и узнайте о машинном обучении. Не беспокойтесь, все вначале являются новичками. Здесь я просто и понятно рассказал, что такое машинное обучение и основы машинного обучения. Что такое машинное обучение? Машинное обучение - это подраздел искусственного интеллекта. Основная цель машинного обучения - понять структуру наших данных и приспособить эти данные к нашим моделям, которые могут быть поняты и..

Обучение с подкреплением: краткое введение в TF-агенты для практического применения
Введение: Обучение с подкреплением (RL) — это мощная парадигма в области искусственного интеллекта, которая фокусируется на обучении агентов обучению и принятию решений посредством взаимодействия с окружающей средой. Одной из популярных библиотек, упрощающих реализацию алгоритмов RL, являются агенты TensorFlow (TF-Agents). В этом блоге мы углубимся в основы обучения с подкреплением и предоставим краткое введение в TF-агенты с примером использования, иллюстрирующим их потенциал для..

Проблема К-руких бандитов  — «Введение в обучение с подкреплением… в пиццерии».
Проблема с K-руким бандитом — Введение в обучение с подкреплением… в пиццерии. Все любят пиццу, верно? Но как выбрать лучшую пиццу для себя? На чужое мнение можно положиться, конечно, но вкус субъективен — не всем нравится пицца с ананасами. На самом деле никто не любит пиццу с ананасами, но вы меня поняли. В этой статье я покажу вам, как выбрать лучшую пиццу для вас, используя, конечно же, машинное обучение! Что такое обучение с подкреплением? Ах, слон в комнате. Когда люди..