GPT-4 es reconocido como el mejor modelo de IA para chatbots
El servicio Chatbot Arena de LMSYS ha actualizado la clasificación de grandes modelos lingüísticos de inteligencia artificial. Permite evaluar qué modelos están dando mejores resultados en la actualidad.
LMSYS Chatbot Arena es una plataforma abierta de crowdsourcing para la evaluación de grandes modelos lingüísticos (LLM). Para elaborar la clasificación se evalúa a más de 300.000 personas. comentarios humanos sobre el rendimiento de los modelos mediante el sistema de clasificación Elo.
Cómo funciona la prueba: los usuarios introducen una consulta y eligen la mejor respuesta entre varias opciones de diferentes modelos. Basándose en miles de pruebas de usuarios, se forma y clasifica el top.
Según la nueva clasificación del ámbito de los chatbot, GPT4 es actualmente el líder entre los LLM. Las recientes afirmaciones de Claude de que su modelo es mejor no han sido confirmadas. Obtuvo el tercer puesto. Justo detrás está el modelo Bard (Gemini Pro) de Google. Todos estos modelos recibieron una puntuación Elo superior a 1200.
Puede encontrar resultados actualizados detallados de la clasificación de los grandes modelos lingüísticos disponibles en la siguiente dirección.