What type of study is this?

This is a Quantitative Study study.

October 10, 2025Open Access

Redes de Puertas Lógicas Diferenciables Ligeras

Puntos clave

Reduce el tamaño del modelo en 4x para entradas binarias mientras mantiene la precisión en CIFAR-100.
Acelera el paso hacia atrás hasta en 1.86x y converge en 8.5x menos pasos de entrenamiento.
Identifica la parametrización subyacente de las neuronas de las puertas lógicas como una causa raíz de los problemas de escalabilidad.
Demuestra que el nuevo enfoque conduce a una precisión competitiva con costos de entrenamiento reducidos.

Resumen

Las redes de puertas lógicas diferenciables (DLGNs) exhiben una eficiencia extraordinaria en la inferencia mientras mantienen una precisión competitiva. Sin embargo, los gradientes que se desvanecen, los errores de discretización y el alto costo de entrenamiento obstaculizan la escalabilidad de estas redes. Incluso con esquemas de inicialización de parámetros dedicados de trabajos posteriores, aumentar la profundidad aún perjudica la precisión. Mostramos que la raíz de estos problemas radica en la parametrización subyacente de las neuronas de las puertas lógicas. Para superar este problema, proponemos una reparametrización que también reduce el tamaño del parámetro logarítmicamente en función del número de entradas por puerta. Para entradas binarias, esto ya reduce el tamaño del modelo en 4x, acelera el paso hacia atrás hasta en 1.86x y converge en 8.5x menos pasos de entrenamiento. Además, demostramos que la precisión en CIFAR-100 se mantiene estable y a veces es superior a la parametrización original.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo