竞争给大型空间数据集的近似方法带来了曙光

放大字体  缩小字体 2022-01-22 16:31  浏览次数:

Competition sheds light on approximation methods for large spatial datasets

在用于分析和建模大型空间数据集的近似方法之间组织一场全球竞争,使KAUST的研究人员能够比较这些不同方法的性能。

空间数据集可以包含许多不同类型的数据,从地形、几何或地理信息,如环境或金融数据,包括在许多地点进行的测量。先进观测技术的发展导致了越来越大的高维数据集,使得空间统计中的统计推断在计算上具有挑战性和非常昂贵。

可以使用各种近似方法对这些大型真实世界空间数据集进行建模和分析,在这些数据集中,精确计算不再可行,推理通常通过经验或拟合模型的预测精度进行验证。然而,比较这些近似方法的统计效率的研究很少,而且这些研究仅限于中小型数据集,只有少数几种方法。

这促使KAUST的Marc Genton、Huang Huang和同事组织了一场不同近似方法之间的竞赛,以评估他们的模型推理性能。

黄说,比赛“旨在对尽可能多的不同方法进行综合比较,也涉及到最近发展起来的方法。”“通过整合几个关键特征,它的设计还克服了之前研究的缺点。”

这些功能包括由ExaGeoStat软件生成的合成空间数据集,包含10万至100万个数据点。“有了这些更大的合成数据集,在那里我们知道大规模的真实过程,我们可以更好地比较不同的近似方法的统计效率,”Genton解释说。

此外,数据生成模型代表了广泛的高斯和非高斯情况下的统计特性,并包括由多个标准评估的估计和预测。

该竞赛于2020年11月启动,激励了来自全球空间统计界的29个研究团队注册他们的兴趣,21个团队在2021年2月竞赛结束前提交了他们的结果。“通过审查参赛作品,我们能够更好地理解每一种近似方法的不足之处,”黄说,这为“理解现有的近似方法的性能提供了一个统一的框架。”

他补充说:“我们现在计划将这种比较扩展到更复杂的数据集,这些数据集来自多变量或时空随机过程。”

热门搜索排行
声明:本站信息均由用户注册后自行发布,本站不承担任何法律责任。如有侵权请告知,立即做删除处理。
违法不良信息举报邮箱
晋ICP备17002844号
中国互联网举报中心