Preguntas con Tag: reinforcement-learning
El aprendizaje de refuerzo es un área de aprendizaje automático y de informática que se ocupa de cómo seleccionar una acción en un estado que maximice una recompensa numérica en un entorno particular.
Garantía de convergencia de nivel de política con aproximación de función
¿Hay alguna prueba de convergencia del algoritmo de base de la política con la aproximación de la función "general"/Q?
Los documentos de cálculo (Sutton1999 & Tsitsiklis1999) prueban que el teo
reinforcement-learning
function-approximation
policy-gradient-descent
3 años, 4 meses, 29 días
Comprensión de las bases de referencia estables
Estoy tratando de entender la estructura de la política recurrente personalizada introducida en la documentación de la
recurrent-neural-network
reinforcement-learning
stable-baselines
3 años, 5 meses, 0 días
Keras fit lleva tanto tiempo
Recientemente estoy aprendiendo a fortalecer profundamente el aprendizaje y quería aplicar lo que aprendí a un problema desde el gimnasio usando Keras.
Durante el entrenamiento Me di cuenta d
tensorflow
machine-learning
keras
deep-learning
reinforcement-learning
3 años, 4 meses, 29 días
Utilizando Ray RLlib con simulador personalizado
Soy muy nuevo para Ray RLlib y tengo un problema con el uso de un simulador personalizado que mi equipo hizo.
Estamos tratando de integrar un simulador personalizado basado en Python en Ray RLlib p
machine-learning
reinforcement-learning
openai-gym
ray
rllib
3 años, 5 meses, 0 días
MóduloNotFoundError: No hay módulo llamado 'baselines.common '
Corrí el siguiente código en Google Colab:
from baselines.common.atari_wrappers import make_atari, wrap_deepmind
Y recibió el siguiente error:
Mo
python
machine-learning
google-colaboratory
reinforcement-learning
baseline
3 años, 5 meses, 0 días