地理信息科研亟待打破模型“围墙” 这个平台连通地理模型孤岛
你知道未来一周的天气是如何预测的吗?全球流域流量该如何预报?不同地区的碳循环效果又是什么样……大数据预测模拟背后,都有一个强大的工具——地理信息分析模型。
在地质、大气、生态、水文、交通等领域的科学研究和应用开发,都离不开地理信息分析模型。过去,来自不同科研单位开发的成百上千种模型,资源非常分散,接口互不开放,数据存在壁垒,横向缺乏比较,使得科研应用的效率大打折扣。国内科研团队不得不借助欧美的地理分析模型共享平台。
研究者期待能有一个中国人自己的共享平台,让模型开发者和科研应用者接入“一张网”,形成开放、合作、共赢的地理模拟资源整合与复用社区。
近日,南京师范大学陈旻教授及其团队搭建的地理建模与模拟开放平台(OpenGMS)获得中国地理信息产业协会地理信息科技进步奖特等奖,该平台极大地推动了地理信息科学模式创新,并成为全球三大地理信息模型平台之一。
地理信息科研亟待打破模型“围墙”
一直以来,在科研领域,数学模型都是进行预测分析的有效工具,地理分析模型就是地理现象、地理过程和地理规律的主要表达形式,同时,地理模拟也是新时代地理学研究的重要手段。
通过模型进行模拟分析,科学家可以在地质地理、大气环流、水文水利、森林草地等方面的研究中反演过去、预测未来、模拟过程、揭示规律。
随着越来越多的地理信息研究趋向综合化,需要结合水、土、空气、生物等多个方面数据,高效利用分析模型资源就显得愈加重要。
但现实情况是,目前已有的数据资源共享尚不成熟,更不要说分析方法的共享了。
随着地理学科的计量发展形成趋势,相关领域的开发团队构建了大量的地理分析模型。但因地理系统资源分散、专业性强、异构特征显著等特点,现有的地理信息分析对模拟系统构建提出了严峻的挑战。
“比如,不同模型之间的数据资源、计算方式标准不一,涉及区域、领域、尺度各不相同,它们的编程语言、运行环境、执行方式也存在巨大差异。”陈旻告诉记者。
而在科研应用中,又是一把钥匙开一把锁。不同团队、不同项目所用模型各不相同,从整理数据到构建模型,再到预测模拟,往往需要耗费巨大的人力物力以及时间成本,一个人从头开始接触一个全新的模型,需要三个月甚至更长时间。
打破模型孤岛必须要有一个成熟高效的分析方法共享平台。从2008年开始,陈旻在导师闾国年教授的指导下,基于南京师范大学地理信息学科优势,着手于面向地理问题求解的分布式地理建模环境研究。2017年,OpenGMS终于诞生,首次在国际会议上亮相就惊艳了众人。
OpenGMS将散落的资源整合起来,为广大科研人员提供了一个开放式服务型生态社区。截至2021年11月7日,OpenGMS模型条目总数达4709条,其中国内模型达2810条,涵盖大气、交通、水文、林业等多个学科、行业及社会部门。近一年的模型访问量达38.1万次。
从资源、模型到运算工具一站解决
目前,世界上有三大模型组织,分别是国际地表动态建模系统联盟(CSDMS)、开放式建模接口协会(OpenMI)以及我国的OpenGMS,前两者分别为用户提供模型源代码和模型接口,也会定期开展培训课程。
但对于许多国内科研人员来说,前两个平台对使用者的专业性要求较高,且千里迢迢前往欧美参与培训难以实现,所以OpenGMS的出现为国内科研人员提供了一条便捷高效的途径。
模拟复现工具、模拟比较工具……OpenGMS拥有软件及工具16项。“我们平台不仅拥有资源丰富、分类明确的地理分析模型库和运算工具,还提供多种运行程序方式,用户可以下载模型使用或在线上直接运行,也可以利用我们平台的终端,将数据调到我们这里进行运算。”陈旻介绍。
编程语言不同、程序运行方式不同,都会使模型之间的互通难上加难。该如何打破传统地理分析模型之间存在的坚硬“围墙”呢?面对难题,陈旻团队提出了有针对性的理论创新,并在此基础上进一步实施高效的技术创新。
譬如各个国家拥有着不同的语言,同一组数据,在不同的模型中使用的表达方式不同,要想实现模型的高效复用,资源的共享是关键之一。
首先设立统一的表达方式。陈旻团队构建了地理分析模型数据的统一表达与交换方法,为多个来源的不同的模型数据提供了统一的表达载体,并使同一个地理分析模型在多描述标准下可以使用。
有了统一的“语言”,也就成功为模型资源之间的“交流”铺好了路。然而一个个难题接踵而至:用户如何快速拿到模型,又如何快速“上手”呢?为此,团队构建了地理分析模型数据的服务化共享与应用方法,利用网络云服务,解决了地理分析在网络环境中的执行与运算。有效避免了传统方法中“数据孤岛”“模型孤岛”的情况,有效降低了用户的数据准备时间,执行和运算速度大大提升。
后发优势明显并获国际认可
在OpenGMS平台首页显著位置有一个排行榜。“我们构建了模型反馈机制,使模型提供者和使用者之间互相影响,用户使用模型后可做出评价。另外每3个月,平台会汇总每个模型的访问次数、客户意见,后续反馈给模型的提供者。”陈旻介绍说,模型提供者在分享自己资源的同时,也可以收获用户的认可和反馈。
OpenGMS还有效保护模型开发者的知识产权,访问者只可以调用模型的服务,需要在得到开发者授权的情况下才能得到开发者的源代码。
2021年7月,OpenGMS团队联合国内中国地理学会、中国自然资源学会、中国地理信息产业协会、国际数字地球学会中国国家委员会筹备线上国产模型培训班,推广国产化体系分析模型,邀请国内专家教授为科研工作者提供教学服务,第一届培训班就有来自美、英等多个国家1400多人报名,获得多国学者的认可。2020年,OpenGMS被国际著名社会与生态科学建模网络CoMSESNet列入十大可信任资源库之一,且为中国唯一入选。
2020年新冠肺炎疫情期间,陈旻团队作为国际范围内30多个团队里唯一受邀的中国团队,参与疫情扩散模拟,并号召大家在疫情期间携手实现知识共享,并联合在《科学》上发表论文。
目前,OpenGMS已与多所国内外知名高校开展合作,将共享服务架构应用到专业领域中。例如,与美国杨百翰大学合作,基于OpenGMS框架,实现了基于Docker的模型服务与支持,为水文流域模拟系统提供服务基础;与河海大学合作,基于OpenGMS模型,实现全球范围内的流域模拟,预报流域流量及其他指标。
另外,平台还与中山大学、河南大学、南京信息工程大学等国内外院校合作,开发地理模拟比较平台,比较不同生态碳循环的模拟效应。此外,OpenGMS平台正在设计国际三大模型组织之间的模型互通标准协议,将更好地服务于国际模型生态社区建设。