La diferencia es que en el caso de OpenAI usaron como datos de entrenamiento vídeos con gameplays de partidas humanas. Es decir, en cierta forma la IA aprendía de forma supervisada del humano. Pero aquí no. Esto es puro RL -ensayo y error- donde la IA aprende DESDE CERO…!!!
AI learns from scratch: Pure RL versus supervised learning approaches
By
–
Leave a Reply