读懂地球:遥感大数据驱动下的地球系统科学研究
现代遥感技术自上世纪60年代诞生以来,为地球科学尤其是地球表层科学研究提供了重要的信息来源和不可或缺的科技手段。
未来,遥感结合大数据,如何更好推动地球系统科学发展?传统地球系统科学又如何更好适应大数据时代?对此,《中国科学报》记者近日专访了中国科学院空天信息研究院副院长张兵研究员,他从遥感大数据的角度进行了分析并提出了应对之策。
大数据开启人类认知全新方式
张兵指出,地球系统科学需要全面、宏观、及时的信息保障。翱翔太空的数百颗遥感卫星就是地球数据采集器,不断为人类提供着超高维度和超高频次的地球观测科学数据。
“数据驱动型的知识发现首先强调的就是海量数据获取的便捷性。”张兵解释,当今地球系统科学研究中涉及的大气、海洋、陆地、生态等要素的大尺度观测几乎都离不开遥感技术,多谱段、多尺度、多角度、多时相的遥感数据结合机器学习手段,使得遥感信息提取技术从统计模型、物理模型逐渐进入到数据模型阶段,也就是遥感大数据时代。
大数据时代,大量的传感器遍布世界各地,让数据采集更加便捷;数据存储、云计算、高性能计算技术的突飞猛进,为海量数据的存储、处理提供了“安身之所”和“用武之地”;智能遥感卫星系统的发展更是将数据获取和信息提取紧密地融为一体。
“数据密集型科学发现已成为人类认知领域的一种全新方式。”张兵说。
机器学习自动发现潜在地学规律
机器学习与人工智能技术的突破,为这些海量数据的信息提取和分析提供了强大工具。
“不是人为设定特征和模式,而是基于大量的已知数据,通过计算得出之前未知的知识和规律。”张兵说,“深度学习能够自动地学习特征,并对特征逐层抽象提取,这都大大超出人类有限的‘总结’、‘归纳’出的特征数量,进而帮助人类发现隐匿着的规律和知识。”
张兵以“传说”中的“比萨斜塔铁球试验”为例,“这是通过一个有意识有计划的物理实验发现了不同重量铁球的自由落体现象,研究者进一步就可以测定重力加速度。假如我们有遍布全球的数据采集器,记录下了每一个物体自由落体过程的各种数据,通过机器学习方式也同样能够发现物体运动规律以及重力加速度。”
当前,遥感数据也面临着不同类型和结构的数据整合、海量数据的高效能计算、智能算法的遥感适用性、数据准确性与结果验证等一系列挑战。
相对常规图片数据,遥感图像数据由于其产生方式、获取条件和应用等方面特征具有明显的独特性,使得现有基于数码照片设计的深度学习算法仍旧无法深入挖掘遥感图像蕴含的相关信息;此外,遥感图像观测尺度大、场景复杂,现有网络模型对遥感图像的理解和特征提取还存在明显不足。
“地球系统科学研究对象极端复杂,这要求遥感大数据应用必须考虑面向对象的遥感知识库构建和融合遥感特征的深度学习网络开发。”张兵说。
打破壁垒 实现数据共享
不过,张兵担心的最大问题是数据共享,“大数据技术具有巨大的发展潜力,但是,中国在数据共享方面的严重滞后很可能严重制约我国大数据技术的发展速度。”
张兵表示,我们发射的遥感卫星很多,但使用效率与国外相比存在巨大差距,尤其是面向科学研究的遥感数据共享,包括基于自主数据的国际科技合作,遥感数据的获取困难重重,数据共享严重不足。
在这方面,国外的经验值得借鉴。他告诉记者,美国法律规定,联邦政府投资的项目所产生的数据,只要不涉及国家秘密就必须对纳税人公开,这无疑促进了数据发挥更大效能。
目前,中科院已率先采取了行动。2019年以来,中科院先后发布了“地球大数据共享服务平台”、《中国科学院科学数据管理与开放共享办法(试行)》,这对于促进大数据驱动下的地球系统科学创新发展具有重大意义。