¿Qué prompts soléis utilizar para evaluar a los LLMs y que todavía a día de hoy veáis que cuestan ser superados por los modelos actuales? Estoy recopilando y testeando. Por cierto, el Anonymous GPT por ahora pinta bien.
LLM Evaluation Prompts Still Challenging Current Models
By
–
Leave a Reply