Preguntas con Tag: reinforcement-learning

El aprendizaje de refuerzo es un área de aprendizaje automático y de informática que se ocupa de cómo seleccionar una acción en un estado que maximice una recompensa numérica en un entorno particular.

Garantía de convergencia de nivel de política con aproximación de función

¿Hay alguna prueba de convergencia del algoritmo de base de la política con la aproximación de la función "general"/Q? Los documentos de cálculo (Sutton1999 & Tsitsiklis1999) prueban que el teo

reinforcement-learning function-approximation policy-gradient-descent

debugdragon

3 años, 4 meses, 29 días

Comprensión de las bases de referencia estables

Estoy tratando de entender la estructura de la política recurrente personalizada introducida en la documentación de la

recurrent-neural-network reinforcement-learning stable-baselines

techtrailblazer

3 años, 5 meses, 0 días

Keras fit lleva tanto tiempo

Recientemente estoy aprendiendo a fortalecer profundamente el aprendizaje y quería aplicar lo que aprendí a un problema desde el gimnasio usando Keras. Durante el entrenamiento Me di cuenta d

tensorflow machine-learning keras deep-learning reinforcement-learning

techtrailblazer8d2c

3 años, 4 meses, 29 días

Utilizando Ray RLlib con simulador personalizado

Soy muy nuevo para Ray RLlib y tengo un problema con el uso de un simulador personalizado que mi equipo hizo. Estamos tratando de integrar un simulador personalizado basado en Python en Ray RLlib p

machine-learning reinforcement-learning openai-gym ray rllib

binarybuilder

3 años, 5 meses, 0 días

MóduloNotFoundError: No hay módulo llamado 'baselines.common '

Corrí el siguiente código en Google Colab: from baselines.common.atari_wrappers import make_atari, wrap_deepmind Y recibió el siguiente error: Mo

python machine-learning google-colaboratory reinforcement-learning baseline

codesculptor3f6e

3 años, 5 meses, 0 días