摘要 动机 在多元数据分析中,检验组内离散性差异是一个基本问题,对解释组结构和验证其他分析(如方差分析)的统计假设有直接影响。现有方法通常基于每个观察值与组中心的距离或组内观察值之间成对不相似性的均值构建检验统计量。当群体间的组内距离均值相似而组内距离的分布不同时,这两种方法都可能失败。这个问题在高维微生物组数据中特别相关,因为离群值和过度离散可能扭曲基于均值不相似性的检验性能。结果 我们引入了非参数的同质性距离检验(DTH),通过计算组内不相似性来衡量一个组的离散性。通过比较不同组的组内不相似性分布来检验组间的离散性差异。组合使用Kolmogorov-Smirnov和Wasserstein距离构建分布之间的差异。对于超过两个组的情况,使用基于置换的p值组合成对组检验。通过模拟,我们证明了我们的方法在某些情况下比现有的同质性检验具有更高的效能,并在其他情况下具有可比的效能。对于连续协变量,我们提供了DTH的启发式扩展,显示出良好的模拟性能。可用性和实现 DTH包及其用于重现所有模拟、分析的代码和附带小册子可在 https://github.com/asmita112358/DTH 获取。
Roy 等(周四)研究了这个问题。