地球数据科学是地球科学与数据科学的结合,是地球科学研究与数据驱动科学发现范式转变的前沿交叉领域。在地球大数据研究快速兴起的背景下,从地球数据大科学计划、科学数据治理和地球科学数据共享等方面回顾了2020年的进展。介绍了深时数字地球大科学计划、地球大数据科学工程,以及全球数据汇聚、数据认证、数据仓储、数据政策、数据标准、数据标识等方面的进展和地球科学数据中心、数据库、数据模型、数据集成和数据出版等实践。展望未来,充分重视科学数据治理的规则,推动地球科学大数据计划发展,加强建立地球科学数据生态,促进地球科学数据领域的各方面合作,仍然是当前的紧迫需求。
Earth data science is combination of earth science and data science, and is a frontier cross field of earth science research and a paradigm shift of data-driven scientific discovery. This paper reviews the progress of big earth data research in 2020 from the aspects of earth data science program, scientific data governance, and earth science data sharing. It focuses on the Deep-Time Digital Earth Science Program, Big Earth Data Science Engineering Project and achievements in global data aggregation, authentication, repository, policies, standards, and identification, as well as practices of the earth science data centers, databases, data models, data integration, and data publishing. The paper also points out that it is still an urgent need to pay full attention to the rules of scientific data governance, promote the development of earth science big data programme, strengthen the establishment of earth science data ecology, and improve all aspects of cooperation in the field of earth science data.
[1] 程学旗, 梅宏, 赵伟, 等. 数据科学与计算智能:内涵、范式与机遇[J]. 中国科学院院刊, 2020, 35(12):1470-1481.
[2] Stephenson M H, Cheng Q, Wang C, et al. Progress towards the establishment of the IUGS Deep-time Digital Earth (DDE) programme[J]. Episodes Journal of International Geoscience, 2020, 43(4):1057-1062.
[3] 中国科学院战略性先导科技专项(A类). 地球大数据科学工程[J]. 中国科学院院刊, 2018, 33(8):760.
[4] Guo H, Nativi S, Liang D, et al. Big earth data science:an information framework for a sustainable planet[J]. International Journal of Digital Earth, 2020, doi:10.1080/17538947.2020.1743785.
[5] 郭华东. 地球大数据:科学工程数据共享蓝皮书(2019)[M]. 北京:科学出版社, 2020.
[6] Guo H. Big earth data facilitates sustainable development goals[J]. Big Earth Data, 2020, 4(1):1-2.
[7] International Science Council-Would Data System. Data together final version march 2020 Final[EB/OL]. (2020-03-30)[2021-01-07]. https://www.worlddatasystem.org/news/files/DataTogetherFinalVersionMarch2020FINAL.pdf.
[8] Mokrane M, Hugo W, Harrison S. WDS/DSA Certification-International collaboration for a trustworthy research data infrastructure[C]//EGU:General Assembly, 2016.
[9] 王卷乐, 王祎, 卜坤, 等. 世界数据系统CoreTrustSeal数据中心认证实践——以WDC可再生资源与环境数据中心为例[J]. 农业大数据学报, 2019, 1(3):71-81.
[10] Lin D, Crabtree J, Dillo I, et al. The TRUST Principles for digital repositories[J]. Scientific Data, 2020, 7:144.
[11] 中华人民共和国国务院办公厅. 科学数据管理办法[EB/OL]. (2018-04-02)[2021-01-02]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
[12] 中华人民共和国交通运输部办公厅. 交通运输科学数据管理办法(征求意见稿)[EB/OL]. (2020-06-18)[2021-01-02]. http://xxgk.mot.gov.cn/jigou/kjs/202006/t20200623_3398111.html.
[13] 中国气象局. 风云气象卫星数据管理办法(试行)[EB/OL]. (2018-07-06)[2021-01-02]. http://www.gov.cn/gongbao/content/2018/content_5350059.htm.
[14] 王卷乐, 石蕾, 徐波, 等. 我国科学数据标准体系研究[J]. 中国科技资源导刊, 2020, 52(5):45-51, 77.
[15] 中华人民共和国科学技术部. 科技资源标识体系培训工作会在京召开[EB/OL]. (2020-12-02)[2021-01-02]. http://www.most.gov.cn/kjbgz/202012/t20201202_159970.htm.
[16] 邓怡颖, 樊隽轩, 王玥, 等. 古生物学数据库现状与数据驱动下的科学研究[J]. 高校地质学报, 2020, 26(4):361-383.
[17] 张蕾, 钟瀚霆, 陈安清, 等. 大数据驱动下的数字古地理重建:现状与展望[J]. 高校地质学报,2020(1):73-85.
[18] 蒋璟鑫, 李超, 胡修棉. 沉积学数据库建设与沉积大数据科学研究进展:以macrostrat数据库为例[J]. 高校地质学报, 2020, 103(01):29-45.
[19] 信俊昌, 王国仁, 李国徽, 等. 数据模型及其发展历程[J]. 软件学报, 2019, 30(1):142-163.
[20] 李鸿飞, 杜溢墨, 曾熠, 等. 异构混合存储的软硬件协同数据放置策略[J]. 国防科技大学学报, 2020, 42(2):64-71.
[21] Liu J, Wang W, Zhong H. Earth Data Miner:A cloudbased big earth data intelligence analysis platform[J]. IOP Conference Series:Earth and Environmental Science, 2020, 509(1):012032.
[22] 沈志宏, 赵子豪, 王海波. 以图为中心的新型大数据技术栈研究[J]. 数据分析与知识发现, 2020, 4(7):50-65.
[23] 王瑞丹, 高孟绪, 石蕾, 等. 对大数据背景下科学数据开放共享的研究与思考[J]. 中国科技资源导刊, 2020, 52(1):1-5.
[24] 王卷乐, 石蕾, 王玉洁, 等. 科学数据汇聚的模式分析及对我国的发展建议[J]. 地球科学进展, 2020, 35(8):839-847.
[25] Data Cite. Repository Finder[EB/OL].[2021-01-02]. https://repositoryfinder.datacite.org.
[26] 马军花, 段宗奇, 刘闯."全球变化科学研究数据出版系统" 被美国地球物理学会认定为该学会学术期刊关联原创数据仓储中心全球变化[J]. 数据学报(中英文), 2019, 3(3):305-307, 415-417.
[27] 国家青藏高原科学数据中心. 国家青藏高原科学数据中心成为国内首个通过Nature数据期刊Scientific Data认证的数据仓储中心[EB/OL]. (2020-10-02)[2021-01-02]. https://data.tpdc.ac.cn/zh-hans/news/80e2911c-9a6f-4bf5-a363-ed30fb06a18e.
[28] 中国科学院计算机网络中心. 国内首家:ScienceDB成为Nature推荐通用存储库[EB/OL]. (2020-10-02)[2021-01-02]. http://www.cnic.cas.cn/xwdt/zhxw/202010/t20201010_5714666.html.