中国科技投资刊号大摩投资学院投资成都
存储对数据揭晓事情相当主要
存储对数据揭晓事情相当主要。为此,收集中间还自立研发了一套撑持数据出书的事情平台,由中国科学数据在线事情平台和科学数据存储库体系ScienceDB(科学数据银行,以下简称ScienceDB)配合组成。
2015年,中国科学院空天信息立异研讨院副研讨员邱玉宝完毕在地球观察构造的任职,开端对此前的课题功效数据停止梳理。“一方面,期望数占有存储之地,节流查找工夫,也便于分享;另外一方面,我们想紧跟国际数据公然同享的开展趋向。”
数据出书流程不像论文出书那样被作者所熟知。郑崇伟回想说:“第一次向《中国科学数据》投稿时,数据形貌、尺度格局上传等都是第一次打仗,编纂十分仔细肠供给数据论文模板,并分享经历、自动供给协助。”
但让她欣喜的是,这支编纂步队虽小但“精”,“一切人都任劳任怨、存心干事,期望能为我国数据同享和数据出书奉献本人的力气”。
“数据期刊的开展要两条腿走路。从数据同享的初心角度,不克不及仅把它算作刊物,要做更多盘活数据的事;从办刊角度,又要正视刊物载体,勤奋寻求优良的数据和更好的传布力。”她说。
在作者“如沐东风”的体验以后,是编纂团队不知倦怠的支出。“从跟踪研讨项目、筹谋主题、跑专题、联络专家、确认组稿,到收稿考核、偕行评断、主编终审,再到编纂排版、终极出书,以致出刊后宣扬推行等,实践上,期刊编纂的事情十分烦琐。”孔丽华说。
“中国需求外乡的期刊,以是我们摒弃了纯英文期刊的设法,兴办了中英文双语期刊。”黎建辉说,“不只云云,我们还期望鞭策多学科的数据同享,不范围于某个范畴。”
“数据不只要公然,还要高质量地公然,只要高质量的数据才更具传布性和使用性。”在荣获“ScienceDB科学数据奖”小我私家成绩奖后,邱玉宝慨叹道,“数据同享让数据不再停止在硬盘里,而是实其实在被别人在差别范畴真正使用,这是数据性命周期的完好代价链。”
关于期刊将来开展,黎建辉暗示,“一是要持续扩展稿源,丰硕稿源的学科范例;二是站位要愈加高远,环绕国度严重计谋和国际前沿展开数据同享鞭策事情;三是鞭策数据援用的阐发和统计事情,这是增进科学家同享数据的有用鼓励机制。”
因而,编纂部会环绕国度严重计谋和国际前沿等主题自动组稿和约稿。“关于自在来稿,我们不会只看被引率而随便拒稿,数据好欠好用终极还要用户说了算。”孔丽华说。
“全部投稿历程如沐东风大摩投资学院。”郑崇伟评价道,“这支步队松散卖力,他们就像面对面作战的战友一样,不单不会加压,还经常讯问我们的进度,自动为我们处理各类成绩。关于已出书的数据集,他们主动帮我们宣扬,自己很苦的活儿一下有了温度大摩投资学院。”
“预出书阶段属于手艺考核,提交的数据论文和数据集起首由编纂部的数据考核员和论文考核员别离考核,经由过程初审的会间接在网上宣布,凡是只需3天阁下。”孔丽华说,“预出书不只可让数据集得以快速宣布和援用,学者还能对其开放会商,并提出成绩和倡议。”
“科学家科研奉献和学术名誉评价机制原封不动,是障碍科学数据开放同享理论的一个底子成绩。”《中国科学数据》主编、中国科学院院士郭华东以为,“数据出书可以使数据到达可援用和永世可会见的形态,促使数据尽快归入科研评价系统,是科研配合体的试金石、防腐剂。”
停止2020年12月尾,《中国科学数据》曾经正式出书了专题特征数据集17期,期注销版与论文公布合计约335篇,数据总量到达762.86GB投资成都。
比年来,因“原始数据丧失,事情没法反复”酿成的撤稿变乱不足为奇。比方,2020年1月,2018年诺贝尔化学奖得主Frances H. Arnold撤掉了2019年5月揭晓于《科学》的一篇论文,缘故原由是缺失了枢纽的原始数据,以致研讨功效没法反复。
在黎建辉看来,《中国科学数据》不但是一本期刊。“它是一个根据期刊形式鞭策数据同享的平台,期刊只是演进的第一步,将来将借助大数据等特性,将数据跟科研举动交融得愈加严密。”
“论文出书有长久的汗青,构成了成熟的出书系统,而数据出书差别大摩投资学院,作为一个新事物,必需成立一套新的数据出书流程。”黎建辉回想道。
但是,分享之路艰难重重。“在数据出书之前,外洋偕行凡是会经由过程邮件等方法向我们索要数据,他们供给的数据上传网站极难登录,并且数据没有编号,我们也没法见告其数据怎样援用。”郑崇伟坦言,“《中国科学数据》及其存储平台处理了我们的懊恼,我们的数据集有了身份证,不单援用标准起来,援用率也进步了许多。”
《中国科学数据(中英文收集版)》由中国科学院主管、中国科学院计较机收集信息中间主理、国际科技数据委员会(CODATA)中国天下委员会集办,是今朝我国独一特地面向多学科范畴科学数据出书的学术期刊,当选中国科学引文数据库(CSCD)滥觞期刊、天文资本范畴高质量科技期刊(2020年)。
“问渠哪得清多么,为有泉源死水来。为叫醒甜睡的数据,《中国科学数据》期望为科研配合体运送泉源死水,承载数据,问路将来。”郭华东暗示。
实践上,创刊早期,为了得到好稿源,黎建辉经常带着各人到处“化缘”。“我国有丰硕的数据资本,与学术论文严密联系关系的数据集都躲藏在冰山之下,但其时各人对数据出书没无意识,理念疏浚后也就瓜熟蒂落了。”
但是,申请刊号成为其时最难的事。“我国对刊号的审批十分严厉。数据期刊作为新事物,申请刊号更是难上加难,许多人以至不大白数据出书终究是甚么。”黎建辉说。
为更好地皮活数据、鞭策数据同享、进步数据出书速率,《中国科学数据》订定了两个考核阶段,第一阶段是预出书,第二阶段是偕行评断。
2012年,国际数据期刊开端呈开展态势,外洋科学数据开放同享范畴的研讨者们也逐步意想到,数据出书是我国数据同享开展的殊途同归。
水师大连舰艇学院教员郑崇伟持久努力于陆地研讨。他发明,当陆地研讨职员需求数据时投资成都,凡是先想到的是NOAA、NASA等机构,我国陆地数据在国际上的承认度另有待进步。“我们期望将团队建造的陆地数据向国际偕行分享投资成都,展现我国科研职员在陆地大数据研讨方面的主动奉献,进步国际话语权。”
在刊号管控严厉的布景下,假如期刊称号加上“中国”二字,则意味着刊号批复愈加艰难。“必需加中国,这是我们的义务和任务。我们要将中国的优良数据推进来,但其实不料味着只限于中国的数据。”《中国科学数据》编纂部主任孔丽华掷地有声地说。
作为《中国科学数据》的主理单元,多年来,收集中间积聚了丰硕的数据资本投资成都,展开了一系列数据同享探究,但结果仍不幻想。“一方面科学家不情愿同享数据,另外一方面数据同享没有正式的渠道和标准的尺度,而形成科学家将数据攥在手中的底子就是数据权属和鼓励机制成绩。”黎建辉暗示。
期刊名字加不加“中国”?办英文的仍是中文的?做专业范畴仍是多学科范畴?
从2015年完成、公然第一套数据集后,邱玉宝就开端连续经由过程此平台同享科学数据,此中积雪数据集至今已被20多家国表里单元援用,不只在天气变革等范畴,在工程范畴也获得很好的使用,另有学者基于这套数据完成了博士论文的中心章节。“作为一位科研职员和数据消费者,这是我没有料想到的,也促使我后续揭晓更大都据。”
“只揭晓论文不公然研讨数据,能够会招致科学研讨功效没法复现,不只低落论文可托度,还能够衍生学术不端等举动。但怎样让科学家志愿分享科研数据是持久以来难明的成绩。”《中国科学数据(中英文收集版)》(以下简称《中国科学数据》)常务副主编投资成都、中国科学院计较机收集信息中间(以下简称收集中间)研讨员黎建辉在承受《中国科学报》采访时坦言。
在郑崇伟看来,从体量大、信息密度低的原始数据中提取有效信息,并构成数据集,是高效展开陆地建立、完成我国陆地数据弯道超车的枢纽。“《中国科学数据》一站式处理了论文揭晓和数据存储的成绩,我们研制的首套《海上丝绸之路陆地情况与新能源数据集》揭晓后,获得国际偕行的普遍使用和高度评价。”
2015年,国度消息出书广电总局展开收集持续型出书物标准办理试点事情。独具收集出书特征的《中国科学数据》捉住这一机缘,正式获批刊号,成为我国首个特地面向多学科范畴科学数据出书的在线学术期刊。
颠末团队两年攻坚,数据出书平台终究搭建胜利,处理了浩瀚数据集的同享之困。“磨刀不误砍柴工,好的体系能够协助我们做许多工作,前期能够省许多力。”黎建辉说。
跟着信息手艺开展,数据存储和传布所面对的容量、工夫和空间藩篱已被突破,科学数据同享不只是学术界枯苗望雨之盼,更是影响国度宁静和科技前进的主要计谋。
在理解到收集中间展开数据出书并筹建了ScienceDB后,邱玉宝便借助这个平台公然数据。让他没想到的是投资成都,数据公然后获得多个平台转载,《青藏高原MODIS每日无云积雪面积数据集》(以下简称积雪数据集)是今朝经由过程ScienceDB平台下载量最多的数据集,还被科技部的多个国度级数据中间转储。
跟着期刊的开展和办刊理念的前进,投稿体验成为期刊愈来愈存眷的方面,这同样成为期刊扩展稿源、维系作者的“软气力”。
为了更好地展示“中国”力气,收集中间自立研发了ScienceDB和中国科学数据在线事情平台。“外洋也有现成的出书平台,但中国该当有本人的中心手艺,并且外洋平台一定就完整合适海内出书特性。”黎建辉暗示,“我们期望成立一个能为多种期刊效劳、合用于多种差别审稿流程的平台,而完成这类灵敏性具有很浩劫度。”
“偕行评断阶段属于专家考核,经由过程初审的数据论文和数据会议送至既有学科布景又理解数据的审稿专家,普通45天阁下就可以完成审稿。”孔丽华进一步注释。