Outer Optimizers and Inner Optimizers: Beyond Naive Reward Function Pursuit

AI Dynamics

Global AI News Aggregator

Outer Optimizers and Inner Optimizers: Beyond Naive Reward Function Pursuit

–

07 January 2024 21h54

From my perspective, the point of raising the example of natural selection is that it debunks the naive belief that if in general an outer optimizer trains on reward function, it gets an inner optimizer that pursues that reward function OOD. Saying "But SGD is first-order and

→ View original post on X — @esyudkowsky,

7 January 2024

AGENTS AGI AI ETHICS MACHINE LEARNING RESEARCH SAFETY

AI Dynamics

Outer Optimizers and Inner Optimizers: Beyond Naive Reward Function Pursuit

Commentaires

Leave a Reply Cancel reply

MORE ARTICLES

AI Generates Perfect Jokes Using Image Generation Skills

Codex App Transformation: Atlas Integration Reshapes User Experience

AI File Access Limitations: Screenshot vs Disk Storage Issues

Synthetic Aperture Radar: Satellite Tech for Global Monitoring