登录后查看更多精彩内容~
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 一大碗年糕 于 2022-7-11 22:09 编辑
关于论文复现代码和源码(详见链接哈哈):https://mp.weixin.qq.com/s/HrO7nZALzxZ1JbhRIvQxSA
前段时间由于科研需要Email了一位NCAR的教授请求了点数据,由于数据比较大,教授说可以通过NCAR Data Sharing Service共享(数据存在NCAR服务器教授的个人文件夹上,通过Globus Connect Personal来和collaborator共享,无需NCAR员工accout即可访问),来回弄了几次最后终于搞定了。科学下载的话速度还是很快的能达到30m/s左右,只能感叹大数据时代下源代码和数据的珍贵,正巧前端时间也有人问复现论文或者算法的过程中怎么找源代码和数据资源。特别是对于大气科学相关的研究,有啥常用的平台呢?于是就有了这期关于数据及源码托管的“水文”哈哈。 Github: 对于源代码来说,首当其冲的毋庸置疑肯定是的世界最大同性交友网站(雾)Github,各种工具包算法的首选托管平台。大家都熟知就不多介绍了哈哈 Figshare: Fighare是一个基于云计算网络的在线数字资源库,科研人员可以保存和分享他们的研究成果,包括数据、数据集、图像、视频、海报和代码,从而使得他们的研究,甚至包括初步研究,曝光并获得认可。由于 Fighare 遵循开放数据原则,用户可以自由访问数据和上传内容。因此,科研人员可以通过Fighare 公开他们的数据,Fighare 上的所有条目都有 DOI,方便引用。 Zenodo: Zenodo与前面说的FigShare都是知名的数据分享平台,一站式发布研究成果和资助信息。Zenodo对数据格式没有限制,且数据可以终身保存,最多可以存储 50GB 的数据。支持各种内容,包括刊物、演示文稿、论文集、项目、图像、软件(包括与 GitHub 的集成)以及所有语言的数据。 Science Data Bank: 科学数据银行(Science Data Bank,简称ScienceDB)是中国科学院计算机网络信息中心自主研发的致力于打造科学数据长期共享与出版的国际化通用存储库,面向国际学术界、学术期刊和出版商等提供数据出版和获取服务。ScienceDB一直大力推动其在学术期刊、科学数据中心、重大科研项目、科研机构、高校、科研个人等方向的应用推广。截至目前,ScienceDB已被Springer Nature,Scientific Data,Elsevier,Cell Press和美国地球物理学会(AGU)旗下期刊收录到其推荐的通用型数据存储库名单;获得Web of Science的Data Citation Index收录认证、Google Dataset Search收录索引;成为Nature、Elsevier等出版商旗下6000余本国际期刊推荐的数据存储库。 Dryad: Dryad是一个国际开放访问的研究数据存储库,尤其是科学和医学出版物(主要是进化、遗传和生态生物学)的基础数据。Dryad 是一个精心策划的通用存储库,它使数据可发现、可自由重用和可引用。由于Dryad最开始是面向生态生物学及环境等,数据集多与生态气候学,古气候相关,涉及气候变化居多。 快速逆向作图: 其实类似的提取图片数据的方法也很多,通过python,matlab等代码也可以实现,只不过origin这个已经有UI界面功能也相对比较完善了。 对于论文源代码,尤其是涉及机器学习和大气科学交叉的研究,可以从以下几个比较知名的网站看看: Paperwithcode 自动把论文连接到实现代码的 GitHub 资源库和数据集,并根据 GitHub 的收藏量排序。每篇论文可能有多个合并的条目。但是收录的文章可能有延时,缺少最新的文章。 Code Ocean 不仅提供提供源码托管,也提供收费算力, 可以直接为文章托管代码的网站,部分源码比较新,托管的文章水平也不错。
|