What question did this study set out to answer?

The aim is to assess quantization-induced inconsistencies in clinical small language models prior to deployment.

May 28, 2026Open Access

A Pre-Deployment Audit of Quantization-Induced Inconsistency in Sub-4B Clinical SLMs

Key Points

The aim is to assess quantization-induced inconsistencies in clinical small language models prior to deployment.
Conducted a paired observational audit on three sub-4B clinical small language models.
Analyzed 24,000 generations using various reference-free metric pipelines.
Applied statistical analysis methods including Friedman omnibus and Wilcoxon-Pratt pairwise tests.
Quantization inconsistencies were identified across different GGUF K-quant levels.
Statistical analysis revealed significant variances with MDE δ ≥ 0.246 at 80% power.
Convergent validity was established via a three-judge panel comparison of models.

Abstract

Pre-registered methodology for a within-subject paired observational audit of quantization-induced inconsistency in three sub-4B clinical small language models (Qwen-MediCare-BD 3. 1B, Gemma-3-4B-it, Phi-4-mini-instruct 3. 8B) across four GGUF K-quant levels (Q6K, Q5KM, Q4KM, Q3KM) on 100 stratified ACI-Bench encounters with 20 seeds per condition (24, 000 generations, 228, 000 pairwise metric evaluations). Reference-free metric pipeline: BERTScore-F1, ROUGE-L, MEDCON-F1, numerical Jaccard with paired extraction-volume control, and bidirectional NLI contradiction (three aggregations). Statistical analysis: Friedman omnibus, Wilcoxon-Pratt pairwise, BCa bootstrap with tie-corrected z0, Holm-Bonferroni correction, simulation-based power analysis (MDE δ ≥ 0. 246 at 80% power). Three-judge LLM convergent validity panel (Claude Opus 4. 7, Gemini 3. 1 Pro, DeepSeek Expert Mode) on two parallel tracks. Dual-criterion deployment-readiness matrix

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Md. Hasibul Islam Shanto

Abul Bashar Saurov

Anupom Bhowmik

Actions

Institutions

American International University-Bangladesh

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

A Pre-Deployment Audit of Quantization-Induced Inconsistency in Sub-4B Clinical SLMs

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study