May 30, 2024Open Access

Tabla de clasificación Open Ko-LLM: Evaluación de Modelos de Lenguaje Grande en Coreano con el Benchmark Ko-H5

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Este documento presenta la Tabla de clasificación Open Ko-LLM y el Benchmark Ko-H5 como herramientas vitales para evaluar Modelos de Lenguaje Grande (LLMs) en coreano. Incorporando conjuntos de pruebas privados mientras se refleja la Tabla de clasificación Open LLM en inglés, establecemos un marco de evaluación robusto que ha sido bien integrado en la comunidad de LLMs en coreano. Realizamos un análisis de filtraciones de datos que muestra el beneficio de los conjuntos de pruebas privados junto con un estudio de correlación dentro del benchmark Ko-H5 y análisis temporales de la puntuación Ko-H5. Además, presentamos apoyo empírico para la necesidad de expandirse más allá de los benchmarks establecidos. Esperamos que la Tabla de clasificación Open Ko-LLM senté un precedente para expandir la evaluación de LLMs y fomentar una mayor diversidad lingüística.

Leer artículo completoexternamente

Preguntar a la IA

Me gusta

Guardar

Ver artículo completo