Preguntas con Tag: reinforcement-learning

El aprendizaje de refuerzo es un área de aprendizaje automático y de informática que se ocupa de cómo seleccionar una acción en un estado que maximice una recompensa numérica en un entorno particular.

Garantía de convergencia de nivel de política con aproximación de función

¿Hay alguna prueba de convergencia del algoritmo de base de la política con la aproximación de la función "general"/Q? Los documentos de cálculo (Sutton1999 & Tsitsiklis1999) prueban que el teo
reinforcement-learning function-approximation policy-gradient-descent
debugdragon
3 años, 4 meses, 29 días

Comprensión de las bases de referencia estables

Estoy tratando de entender la estructura de la política recurrente personalizada introducida en la documentación de la
recurrent-neural-network reinforcement-learning stable-baselines
techtrailblazer
3 años, 5 meses, 0 días

Keras fit lleva tanto tiempo

Recientemente estoy aprendiendo a fortalecer profundamente el aprendizaje y quería aplicar lo que aprendí a un problema desde el gimnasio usando Keras. Durante el entrenamiento Me di cuenta d
tensorflow machine-learning keras deep-learning reinforcement-learning
techtrailblazer8d2c
3 años, 4 meses, 29 días

Utilizando Ray RLlib con simulador personalizado

Soy muy nuevo para Ray RLlib y tengo un problema con el uso de un simulador personalizado que mi equipo hizo. Estamos tratando de integrar un simulador personalizado basado en Python en Ray RLlib p
machine-learning reinforcement-learning openai-gym ray rllib
binarybuilder
3 años, 5 meses, 0 días

MóduloNotFoundError: No hay módulo llamado 'baselines.common '

Corrí el siguiente código en Google Colab: from baselines.common.atari_wrappers import make_atari, wrap_deepmind Y recibió el siguiente error: Mo
python machine-learning google-colaboratory reinforcement-learning baseline
codesculptor3f6e
3 años, 5 meses, 0 días