Evolved Policy Gradients (EPG)

Evolved Policy Gradients, an experimental meta-learning technique to let agents rapidly learn to solve novel tasks: https://blog.openai.com/evolved-policy-gradients/

Aquesta entrada ha esta publicada en General. Afegeix a les adreces d'interès l'enllaç permanent.

Els comentaris estan tancats.