What question did this study set out to answer?

The aim is to evaluate the reliability and risks associated with proxy metrics used in controlled experiments.

April 16, 2026Open Access

System and Method for Reliability Scoring of Proxy Metrics in Experiments

Key Points

The aim is to evaluate the reliability and risks associated with proxy metrics used in controlled experiments.
Introduced PROXIMA framework for evaluating proxy metrics.
Utilized simulation-based counterfactual analysis to model reliability.
Employed sensitivity scoring for understanding fragility.
Conducted long-horizon consistency checks for delayed outcomes.
PROXIMA distinguished stable proxies from misleading ones.
Reduced decision risk in experimentation workflows.
Quantified alignment between short-term and long-term outcomes.

Abstract

This work introduces PROXIMA, a framework for evaluating the reliability, fragility, and decision risk of proxy metrics used in controlled experiments such as A/B testing in online experiments. Unlike prior work that assumes monotonic proxy validity, PROXIMA quantifies directional accuracy, sign-flip fragility, and downstream decision regret, enabling principled proxy selection under delayed outcomes. Proxy metrics are widely used to enable rapid experimentation, yet they frequently fail to accurately reflect long-term business or system outcomes, leading to biased decisions and hidden risk. PROXIMA addresses this problem by modeling proxy reliability using simulation-based counterfactual analysis, sensitivity scoring, and long-horizon consistency checks. The method quantifies the alignment between short-term proxy signals and delayed ground-truth outcomes under distributional shifts and experimental noise. Empirical results demonstrate that PROXIMA can distinguish stable proxies from misleading ones and reduce decision risk in experimentation workflows. This work targets practitioners and researchers in machine learning systems, experimentation platforms, and applied causal inference. Source code and reproducibility artifacts are publicly available. Note: A provisional patent application covering core techniques described in this work has been filed. This disclosure is made in accordance with applicable patent and publication policies.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Avinash Amudala

Rochester Institute of Technology

Actions

Institutions

Film Independent

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

System and Method for Reliability Scoring of Proxy Metrics in Experiments

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Also consider