首页 >> 智库 >> 即时消息 >> 智讯
澳大利亚研究人员建议:提升科研论文公开数据集质量
2015年11月18日 09:07 来源:中国社会科学报 作者:王悠然 字号

内容摘要:澳大利亚一项新研究显示,许多科研论文附带的公开数据集不完整,不利于再现性研究( reproducibility study )和后续研究的开展。

关键词:公开;研究人员;澳大利亚;科研论文;公开数据

作者简介:

  中国社会科学报综合外媒报道澳大利亚一项新研究显示,许多科研论文附带的公开数据集不完整,不利于再现性研究(reproducibility study)和后续研究的开展。

  近日,在线学术期刊《公共科学图书馆·生物学》(PLOS Biology)刊登了澳大利亚国立大学生物研究学院4位研究人员合著的论文《生态学与进化研究领域的公开数据存档:状况如何?》(Public Data Archiving in Ecology and Evolution: How Well Are We Doing?)。该文提出,在包括生态学与进化研究在内的许多科研领域里,公开数据存档政策即学术期刊要求作者将论文所用的数据上传到公共数据库中,现在正成为一种规范,其价值在于使再现性研究和数据再利用成为可能,共享数据还可以加速科学发现并节约重复收集数据带来的经济成本。然而,论文作者提交的这些数据集有时也存在不完整、不可用的情况。

  研究人员从生态学与进化研究领域设置了严格的公开数据存档政策的7家顶尖期刊中,抽取了2012—2013年被收录于知名数字资源库“树妖”(Dryad)的100篇论文,并从两方面分析了这些论文的公开数据集质量,一是数据是否完全公开、符合期刊的公开数据存档政策,即“完整性”(completeness);二是数据是否便于第三方访问和使用,即“再利用性”(reusability)。分析结果显示,56%数据集不完整,原因是数据丢失或元数据不充分;64%数据集的储存方式部分阻碍或彻底阻碍了数据再利用,原因是缺少主要的元数据,数据以加工过的形式而非原始形式存储,或使用了不适当的文件格式。

  澳大利亚国立大学生物研究学院博士生多米尼克·罗什(Dominique Roche)说,“对于大多数科研人员来说,公开数据存档及开放科学是新事物,许多科学家缺乏这方面的训练。生物学家经常与大体量且复杂的数据集打交道,这些数据的重要性可能不亚于论文本身,但需要凭借良好的组织技能对其进行处理和展示后才能为他人所用。所幸的是,此次研究发现的很多问题能够以较快速、简便的方法解决。”研究人员建议,论文作者应向期刊提交基础但完整的数据描述符(data descriptor),采用标准的文件格式,将数据集存储在稳定、可搜索的在线数据库中,而不是作为论文附录等。(王悠然/编译)

 

分享到: 0 转载请注明来源:中国社会科学网 (责编:张赛)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们