Introducción al Aprendizaje por Refuerzo con Python

El Aprendizaje por Refuerzo (RL) es una rama poderosa del aprendizaje automático enfocada en entrenar agentes inteligentes mediante la interacción con…Mostrar más

90 Estudiantes

Ya inscrito

Curso para Nivel Avanzado

5 módulos

Entorno interactivo

37 capítulos

Asistente de IA

37 tareas

Certificado compartible

Resultados

Contenido del curso

Cursos relacionados

Testimonios

Características

Precios

Preguntas frecuentes

Resultados

Contenido del curso

Cursos relacionados

Testimonios

Características

Precios

Preguntas frecuentes

Lo que aprenderás

Comprensión de los fundamentos del aprendizaje por refuerzo.

Equilibrio entre estrategias de exploración y explotación.

Dominio de la programación dinámica en RL.

Diferenciación entre RL y otros paradigmas de aprendizaje.

Configuración y ejecución de entornos Gymnasium.

Uso de ecuaciones de Bellman para la evaluación de políticas.

Aplicación de procesos de decisión de Markov en RL.

Implementación de algoritmos de bandidos de múltiples brazos.

Aplicación de métodos de Monte Carlo para RL sin modelo.

Contenido del curso

El Aprendizaje por Refuerzo (RL) es una rama poderosa del aprendizaje automático enfocada en entrenar agentes inteligentes mediante la interacción con su entorno. En este curso, aprenderás có…

Descubra cómo entrenar agentes para tomar decisiones óptimas mediante prueba y error. Explore los conceptos esenciales de la teoría de aprendizaje por refuerzo. Obtenga experiencia práctica configurando y ejecutando un entorno Gymnasium.

¿Qué Es RL?

RL Frente a Otros Paradigmas de Aprendizaje

Proceso de Decisión de Markov

Episodios y Retornos

Modelo, Política y Valores

Exploración vs Explotación

Fundamentos de Gymnasium

Desafío: Configuración de un Entorno

Domina el equilibrio entre exploración y explotación mediante el problema del bandido de varios brazos. Implementación de estimación de valor de acción, métodos ε-greedy, límite superior de confianza y bandido de gradiente. Evaluación del rendimiento de los algoritmos en tareas simuladas de maximización de recompensas.

Introducción al Problema

Valores de Acción

Algoritmo Epsilon-Greedy

Algoritmo de Límite Superior de Confianza

Algoritmo de Bandido de Gradiente

Desafío: Bandidos de Varios Brazos

Dominio de la programación dinámica para RL basado en modelos. Descubrimiento de cómo las ecuaciones de Bellman pueden utilizarse para evaluar y mejorar políticas. Implementación de algoritmos de iteración de políticas y de valores. Exploración de la iteración generalizada de políticas como fundamento teórico para métodos sin modelo.

¿Qué Es la Programación Dinámica?

Ecuaciones de Bellman

Condiciones de Optimalidad

Evaluación de Políticas

Mejora de Políticas

Iteración de Políticas Generalizada

Iteración de Políticas

Iteración de Valores

Desafío: Programación Dinámica

Domina los métodos de Monte Carlo para RL sin modelo. Estimación de funciones de valor y derivación de políticas óptimas a partir de episodios completos. Implementación de algoritmos de control Monte Carlo en política y fuera de política. Descubrimiento de estrategias de exploración para optimizar el aprendizaje sin modelo.

¿Qué Son los Métodos Monte Carlo?

Estimación de la Función de Valor

Control Monte Carlo

Enfoques de Exploración

Control Monte Carlo en la Misma Política

Control Monte Carlo Fuera de Política

Implementaciones Incrementales

Desafío: Métodos de Monte Carlo

Dominio del aprendizaje por diferencia temporal para RL sin modelo. Estimación de funciones de valor a partir de episodios parciales utilizando actualizaciones TD(0). Implementación de los algoritmos SARSA en política y Q-Learning fuera de política. Exploración de la combinación de métodos Monte Carlo y aprendizaje TD en TD de n pasos y TD(λ).

¿Qué es el Aprendizaje por Diferencia Temporal?

TD(0): Estimación de la Función de Valor

SARSA: Aprendizaje TD en Política

Q-Learning: Aprendizaje TD Fuera de Política

Generalización del Aprendizaje TD

Desafío: Aprendizaje por Diferencia Temporal

¡Impulsa tus habilidades tecnológicas!

con hasta un 55% de descuento

What you'll get with our subscription:

500+ cursos mejor calificadosCertificados de finalizaciónRutas de estudio personalizadas40+ proyectos prácticos del mundo real

Tu suscripción también incluye 500+ cursos:

TEST SHORT VIDEO COURSE

Course without tasks for flow test

Course for E2E testing

TEST COURSE WITH ALL TYPES OF COLUMN CHAPTERS

test python course with 6 sections

TEST COURSE (copy) 1768839433948

test descr 1234

TEST FREE COURSE

description

Test mobile outline course

Super course

Realización de Pruebas A/B

En el mundo empresarial, tomar decisiones basadas en datos concretos en lugar de la intuición puede ser la clave del éxito. Este curso se centra en una técnica crucial: el análisis de datos de pruebas A/B. El eje central del curso es un proyecto en el que realizarás un análisis detallado de una prueba A/B. Este proyecto, que puedes incluir en tu CV, está alojado en Codefinity, lo que te permite perfeccionarlo continuamente y demostrar tu creciente experiencia.

TEST SHORT VIDEO COURSE

Course without tasks for flow test

Course for E2E testing

TEST COURSE WITH ALL TYPES OF COLUMN CHAPTERS

test python course with 6 sections

TEST COURSE (copy) 1768839433948

test descr 1234

TEST FREE COURSE

description

Test mobile outline course

Super course

Realización de Pruebas A/B

Por qué la gente elige Codefinity

Web Developer

Kwizera Mugisha

The teaching methodology at Codefinity is excellent, and I particularly appreciate how it has prepared me to handle real-world coding problems. Currently, I am delving into Node.js and eagerly anticipate building full-stack projects that integrate all the knowledge I have gained.

Senior Business Analyst

Sherry Barnes-Fox

My first course was 4 hours, I did it in a few days, "nugget-style". The instructions are very clear and easy to understand. There is even a hint to help you get the answer. I love the learning style that is used, it engages me.

Accounts Payable Specialist

Bill Wagner

I have really liked the browser-based lessons that allow me to code within the lesson. The RUN button allows me to test the code I write before submitting for a grade.

IT Support Specialist

Daniel Chinea

I have gained a lot of practical and logical thinking skills, along with patience for myself and confidence in myself that I can learn programming. Years ago, I would have never thought that I could learn programming in any way, shape or form, and I was able to obtain these certifications and skills with Codefinity.

Technology Project Manager

Steve Bruening

The learning was progressive and made it easy to follow along and make progress. I could feel my skills increasing and building on each other as the course went along.

Project Manager

Stephanie Chan

As I went through the first course of the Python track, I liked the way the course was lay out (in easy and digestible modules) with little exercises at the end of each concept.

Paso a paso hacia resultados estelares

Resuelve tareas de codificación del mundo real

Entorno de codificación interactivo

Sumérgete en nuestro entorno interactivo: escribe y ejecuta tu código con retroalimentación en tiempo real y métricas de éxito—aprende haciendo en cada paso.

Obtén orientación bajo demanda

Soporte potenciado por IA

Aprovecha el asistente de IA integrado para explicar errores, sugerir soluciones o responder cualquier pregunta sobre tu código—para que te mantengas productivo y nunca te quedes atascado.

Consolida tu aprendizaje

Verificación de conocimiento

Concluye cada módulo con un cuestionario rápido que ofrece retroalimentación instantánea, rastrea tu progreso y asegura que hayas dominado los conceptos clave.

Muestra tus habilidades

Celebra el éxito

Obtén tu certificado reconocido por la industria al completar y compártelo en LinkedIn con un clic—deja que tu red vea lo que puedes hacer.

Elegido por empleados de empresas líderes
y estudiantes de universidades de élite

Accede instantáneamente a 500+ cursos

Aprendizaje ilimitado, acceso instantáneoObtén acceso completo a todos los cursos y rutas, incluyendo contenido en video, cuestionarios y materiales detallados—comienza a aprender en cualquier momento.

Certificados reconocidos por la industriaObtén certificados que validen tu experiencia y potencien tu carrera en tecnología, IA, datos, marketing y más allá.

Aprendizaje asistido por IAObtén pistas personalizadas, retroalimentación en tiempo real y explicaciones potenciadas por IA para acelerar tu progreso.

En constante expansión: Nuevos cursos y rutas profesionalesMantente a la vanguardia con cursos constantemente actualizados, hojas de ruta profesionales, desafíos y pruebas prácticas.

Desarrolla habilidades que importanDomina habilidades demandadas con cursos en IA, ciencia de datos, programación, marketing, automatización, desarrollo web y más.

Aprendizaje interactivo y fluidoParticipa en proyectos prácticos, ejercicios del mundo real y una experiencia de aprendizaje intuitiva — no se necesitan herramientas adicionales.

Acceso completo al catálogo

Una suscripción abre este curso y todo nuestro catálogo de proyectos y habilidades.

Features:

500+ cursos mejor calificadosCopiloto de IA de vanguardia

Rutas de estudio personalizadas40+ proyectos prácticos del mundo real

Sin cancelación, antes de que finalice el plan seleccionado con descuento, acepto que Codefinity cobrará automáticamente $79 cada 3 meses hasta que cancele. Obtén más información sobre la política de cancelación y reembolso en Términos de Suscripción.

Prueba Codefinity con confianza – garantía de devolución de dinero de 30 días incluida

Para darte la bienvenida a Codefinity, estamos ofreciendo hasta 64% de descuento en nuestros cursos. Además, tenemos una garantía de devolución de dinero de 30 días, para que puedas probarnos sin riesgo.Esperamos sinceramente darte la bienvenida a nuestra plataforma y estamos comprometidos a hacer que tu experiencia de aprendizaje sea fácil, interactiva y divertida.

Preguntas frecuentes

¿Cómo obtengo acceso a la plataforma?

Aunque puedes estudiar con Codefinity en cualquier dispositivo, recomendamos encarecidamente usar una computadora o portátil para optimizar tu experiencia de aprendizaje.

¿Qué pasa si tengo preguntas mientras aprendo?

Todos nuestros cursos cuentan con un asistente de IA integrado, listo para ayudarte con cualquier pregunta que puedas tener durante tus estudios y ayudarte a resolver cualquier problema.

¿Es necesario un título en tecnología para aprender?

No, no necesitas experiencia previa para comenzar a aprender. Nuestros cursos están diseñados para principiantes, por lo que puedes comenzar fácilmente tu camino en la industria tecnológica.

¿Aún tienes preguntas?

Escribe tu pregunta aquí

Introducción al Aprendizaje por Refuerzo con Python

Curso para Nivel Avanzado

Lo que aprenderás

Contenido del curso

Tu suscripción también incluye 500+ cursos:

Por qué la gente elige Codefinity

Paso a paso hacia resultados estelares

Elegido por empleados de empresas líderes y estudiantes de universidades de élite

Accede instantáneamente a 500+ cursos

Acceso completo al catálogo

Prueba Codefinity con confianza – garantía de devolución de dinero de 30 días incluida

Preguntas frecuentes

¿Aún tienes preguntas?

Elegido por empleados de empresas líderes
y estudiantes de universidades de élite