What question did this study set out to answer?

A pesquisa visa desenvolver o VerifEval, um pipeline para avaliar ambientes de verificação de hardware gerados por IA.

May 7, 2026Open Access

VerifEval: Avaliação de ponta a ponta da verificação de hardware gerada por IA com Lint, Cobertura de Simulação, Cobertura de Rastreio e Mutação Dirigida por Formal

Key Points

A pesquisa visa desenvolver o VerifEval, um pipeline para avaliar ambientes de verificação de hardware gerados por IA.
Desenvolvido um pipeline de avaliação de ponta a ponta chamado VerifEval.
Medidos os métricas incluindo qualidade estática, cobertura estrutural e sensibilidade à mutação.
Avaliadas múltiplas linhas de base de grandes modelos de linguagem com cinco designs do OpenCores.
Identificadas lacunas significativas no planejamento e na completude dos ambientes de verificação gerados por IA.
Demonstrado que a cobertura estrutural e a qualidade de verificação são métricas complementares.

Abstract

Este trabalho apresenta o VerifEval, um pipeline de avaliação de ponta a ponta para ambientes de verificação de hardware gerados por IA. O VerifEval mede a qualidade estática, fidelidade executável, cobertura estrutural, cobertura baseada em rastreio e sensibilidade à mutação em testbenches de SystemVerilog/UVM e cocotb/pyuvm. Avaliamos múltiplas linhas de base de grandes modelos de linguagem em cinco designs do OpenCores e mostramos que a cobertura estrutural e a qualidade de verificação são métricas complementares, com lacunas significativas restantes em planejamento e completude.

VerifEval: Avaliação de ponta a ponta da verificação de hardware gerada por IA com Lint, Cobertura de Simulação, Cobertura de Rastreio e Mutação Dirigida por Formal

Key Points

Abstract

Cite This Study