中国科学院南海海洋研究所研究员林强团队在海洋生物物种分布模型构建中如何选择交叉验证方法方面取得进展。9月17日,相关研究成果以Cross-validation matters in species distribution models: A case study with goatfish species为题,在线发表在《生态地理学》(Ecography)上。
在全球生物多样性持续丧失的背景下,准确评估生物多样性的空间分布模式对于制定有效的保护和管理策略至关重要。物种分布模型已成为评估生物多样性的重要工具。该模型通过分析物种分布数据与生态因子之间的关系来预测目标物种的适宜栖息地分布。在模型构建过程中,交叉验证是评估模型预测性能的关键步骤。交叉验证通过在不同数据集上反复训练和验证模型,帮助研究人员选择最佳模型参数。虽然随机交叉验证方法是常见的选择,但有研究提出了空间交叉验证方法以解决随机交叉验证忽视空间自相关性的问题。
该研究通过随机交叉验证与空间交叉验证方法,以海洋近海典型鱼类——羊鱼为对象,进行模型的参数优化和性能评估。研究发现,两种交叉验证方法在95%的物种中得出不同的最佳模型参数组合,并在预测当前和未来的栖息地分布方面存在差异。随机交叉验证方法在预测性能上可能存在过高估计的风险,而空间交叉验证方法倾向于保守。
同步研究结果表明,尽管随机交叉验证和空间交叉验证方法在物种分布预测上存在差异,但两者均得出印度-澳大利亚群岛是羊鱼物种丰富度最高的地区,且易受气候变化的影响。
该研究系统性地比较了随机交叉验证与空间交叉验证方法对物种分布模型结果的影响,揭示了选择交叉验证方法对物种分布模型预测性能和结果的影响,为生物多样性评估研究提供了新视角。
研究工作得到国家重点研发计划和国家自然科学基金等的支持。
论文链接
基于随机交叉验证和空间交叉验证方法的模型预测能力和变量重要性
供稿人:杨越
审核人:文成锋