Introduction to Reinforcement Learning
Курс
90 Вже зареєстровані учні- How agents learn through trial and error using rewards and feedback.
- How to model environments with Markov decision processes and solve basic decision problems.
- The role of exploration in learning, through the lens of multi-armed bandits.
- Different learning strategies: dynamic programming, Monte Carlo methods, and temporal difference learning.
Оснастіть свій бізнес передовими Дані та ШІ експертиза.
Поділіться цим у соціальних мережах та у своєму огляді продуктивності
Є 5 модулі в цьому курсі
Reinforcement Learning (RL) is a powerful branch of machine learning focused on training intelligent agents through interaction with their environment. In this course, you'll learn how agents gradually discover effective behaviors through trial and error. Beginning with core concepts like Markov decision processes and multi-armed bandits, you'll work your way through dynamic programming, Monte Carlo methods, and temporal difference learning.- What is RL?Попередній перегляд
- RL vs Other Learning ParadigmsПопередній перегляд
- Markov Decision ProcessПопередній перегляд
- Episodes and ReturnsПопередній перегляд
- Model, Policy, and ValuesПопередній перегляд
- Exploration vs ExploitationПопередній перегляд
- Gymnasium BasicsПопередній перегляд
- Challenge: Setting Up an EnvironmentПопередній перегляд
- What is Dynamic Programming?Попередній перегляд
- Bellman EquationsПопередній перегляд
- Optimality ConditionsПопередній перегляд
- Policy EvaluationПопередній перегляд
- Policy ImprovementПопередній перегляд
- Generalized Policy IterationПопередній перегляд
- Policy IterationПопередній перегляд
- Value IterationПопередній перегляд
- Challenge: Dynamic ProgrammingПопередній перегляд
- What are Monte Carlo Methods?Попередній перегляд
- Value Function EstimationПопередній перегляд
- Monte Carlo ControlПопередній перегляд
- Exploration ApproachesПопередній перегляд
- On-Policy Monte Carlo ControlПопередній перегляд
- Off-Policy Monte Carlo ControlПопередній перегляд
- Incremental ImplementationsПопередній перегляд
- Challenge: Monte Carlo MethodsПопередній перегляд
- What is Temporal Difference Learning?Попередній перегляд
- TD(0): Value Function EstimationПопередній перегляд
- SARSA: On-Policy TD LearningПопередній перегляд
- Q-Learning: Off-Policy TD LearningПопередній перегляд
- Generalization of TD LearningПопередній перегляд
- Challenge: Temporal Difference LearningПопередній перегляд
З нами навчаються студенти найкращих університетів світу
Чому люди обирають Codefinity для своєї кар'єри

Kwizera Mugisha
The teaching methodology at Codefinity is excellent, and I particularly appreciate how it has prepared me to handle real-world coding problems. Currently, I am delving into Node.js and eagerly anticipate building full-stack projects that integrate all the knowledge I have gained.

Sherry Barnes-Fox
My first course was 4 hours, I did it in a few days, "nugget-style. The instructions are very clear and easy to understand. There is even a hint to help you get the answer, and if you still cannot get the answer, then you can display the answer. I love the learning style that is used, it engages me.

Bill Wagner
I have really liked the browser-based lessons that allow me to code within the lesson. The RUN button allows me to test the code I write before submitting for a grade.

Stephanie Chan
As I went through the first course of the Python track, I liked the way the course was lay out (in easy and digestible modules) with little exercises at the end of each concept.

Daniel Chinea
I have gained a lot of practical and logical thinking skills, along with patience for myself and confidence in myself that I can learn programming.

Steve Bruening
The learning was progressive and made it easy to follow along and make progress. I could feel my skills increasing and building on each other as the course went along.
Рекомендовано, якщо ви зацікавлені в навчанніPython
Захоплюйтеся технічними навичками! Наш ШІ-асистент надає зворотний зв'язок у реальному часі, персоналізовані підказки та пояснення помилок, надаючи вам можливість вчитися з упевненістю.
Завдяки робочим просторам ви можете створювати та ділитися проектами безпосередньо на нашій платформі. Ми підготували шаблони для вашої зручності
Візьміть під контроль свій кар'єрний розвиток і почніть свій шлях до освоєння новітніх технологій
Проекти з реального світу підвищують ваш портфоліо, демонструючи практичні навички, щоб вразити потенційних роботодавців




Повний доступ до каталогу
Одна підписка відкриває цей курс і весь наш каталог проектів і навичок.Ваша підписка також включає:
Часті запитання
Ще є запитання?
Напишіть ваше запитання тут