2) Tal y como reportan en el propio Model Card hay riesgo de que estas evaluaciones hayan sido vistas por el modelo durante el pre-entrenamiento (a.k.a overfitting) y eso desvirtúa la interpretación de las métricas. Trabajo honesto el de Anthropic en la Model Card en muchos de
Anthropic Model Card: Evaluation Overfitting Risks Assessment
By
–
Leave a Reply