网站首页 > 技术文章 正文
车栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
来自谷歌大脑的David Ha,向你推荐了一个种子库。
这里的种子,是给AI程序猿准备的,不是因为他们单身。
是因为他们需要给自己的模型,喂食大量的数据。
名叫Academic Torrents的种子库里,包含了各式各样的数据集,总计27.31TB的资源。最近,五岁的它登上了Hacker News的顶端。
互相取暖,可以加速
开发团队说,这是一个分布式系统,以推动大规模数据共享为目标。
有了种子,有了播撒种子的人类,再加一个搜索功能,大家就能迅速找到、下载到自己需要的数据集了。
虽然,很多数据集在别处也找得到,但Academic Torrents集合了每个数据集的许多镜像,这些镜像一起工作,下载会更快。当然,下载的人越多,速度也越快。
另外,Academic Torrents里面的数据集也比较全。比如Netflix Prize比赛的数据集,原始地址已经用不了,但在这里还能找到其他可用的地址。
BT下载,或许是数据集最好的传播形式了。
下载完成之后,seed一下,后人又可以从你这里下载,下载之后再seed……
BT和数据,更配咯
虽然,学术种子库和普通种子库相比,技术上并没有什么不同,但BT协议对于数据共享,依然有特别的意义。
p2p下载中,镜像数据的过程是透明的,可以有效保持数据的正确性。这一点,对于研究人员尤为重要。
而当原始地址失效之后,人类从其他地址下载数据集,可能会遇到数据损坏的问题。BT客户端,就可以验证数据集有无发生变化,也可以修复损坏的部分。
果然,数据集和BT,很配吧。
沉迷学习,沉迷训练
除了数据集之外,这里还有论文和课程资源。
Academic Torrents也提供了创建列表的功能。每个用户,都可以按照自己的喜好,把资源分门别类收藏起来。
每个列表都有自己的RSS信息流,当列表里的某个资源有了更新,就可以自动完成下载。
当然,也可以看到别人创建的列表,并订阅之。
一想到别人家的模型,吃着美味的数据,训练得有条不紊,你是不是也有理由开始努力了呢?
你也去看看吧
其实,Academic Torrents不止得到了David Ha的推特翻牌而已。
官网上说,许多学校也都在用这个种子库了。看,明晃晃的校徽:
各位可从以下链接前往种子库:
http://academictorrents.com/
以及它的代码:
https://github.com/AcademicTorrents
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
?'?' ? 追踪AI技术和产品新动态
- 上一篇: RNN网络实现识别mnist数据集
- 下一篇: R数据分析:如何用R做多重插补,实例操练
猜你喜欢
- 2024-09-24 行业篇:自动驾驶场景下的数据标注类别分享
- 2024-09-24 AI预标注,人工智能基础数据服务行业的新引擎丨曼孚科技
- 2024-09-24 基于Movielens-1M数据集和相似性矩阵实现的电影推荐算法(附源码)
- 2024-09-24 AAAI 2022 | GAN的结构有“指纹”吗?从伪造图像溯源生成网络结构
- 2024-09-24 人工智能时代,数据标注产业将迎来黄金时期?丨曼孚科技
- 2024-09-24 R数据分析:如何用R做多重插补,实例操练
- 2024-09-24 RNN网络实现识别mnist数据集
- 2024-09-24 要为学习神经网络奠定基础,你需要认真读读R深度学习
- 2024-09-24 CL0P组织利用Seed传输窃取的敏感数据 (上)
- 2024-09-24 详解SEED数据服务平台(5):批改与批注
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)