What type of study is this?

This is a Quantitative Study study.

October 16, 2025Open Access

Évaluation des grands modèles de langage pour la génération de tests unitaires avec partitions d'équivalence et valeurs aux limites

Key Points

Les LLM peuvent générer des tests unitaires efficaces lorsque des prompts bien conçus et des exigences précises sont utilisés.
L'efficacité des LLM dans les cas de test dépend fortement de l'analyse qualitative et de la supervision humaine.
Les métriques quantitatives révèlent les forces et faiblesses des LLM par rapport aux tests générés manuellement par des programmeurs formés.
À travers une mise en œuvre robuste, cette recherche met en lumière le potentiel des LLM tout en insistant sur la nécessité d'une supervision manuelle.

Abstract

La conception et la mise en œuvre de tests unitaires est une tâche complexe que de nombreux programmeurs négligent. Cette recherche évalue le potentiel des grands modèles de langage (LLM) dans la génération automatique de cas de test, en les comparant aux tests manuels. Un prompt optimisé a été développé, intégrant le code et les exigences, couvrant des cas critiques tels que les partitions d'équivalence et les valeurs aux limites. Les forces et faiblesses des LLM par rapport aux programmeurs formés ont été comparées à travers des métriques quantitatives et une analyse qualitative manuelle. Les résultats montrent que l'efficacité des LLM dépend de prompts bien conçus, d'une mise en œuvre robuste et d'exigences précises. Bien que flexibles et prometteurs, les LLM nécessitent encore une supervision humaine. Ce travail souligne l'importance de l'analyse qualitative manuelle comme complément essentiel à l'automatisation dans l'évaluation des tests unitaires.

Read Full Paperexternally

Demander à l'IA

Bookmark

View Full Paper