外设堂

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
外设堂 首页 业界动态 AI 查看内容

DeepSeek完美收官:开源劳苦功高的3FS!

2025-2-28 13:19| 发布者: 大胖鸟| 查看: 317| 评论: 6|来自: 快科技

摘要: 在不舍与兴奋中,我们迎来了DeepSeek开源周第五天。今天DeepSeek开源的项目是:Fire-Flyer文件系统,即3FS。据了解,3FS是一个高性能并行文件系统,它是所有Deepseek数据访问的助推器,能应对AI训练和推理工作负载的 ...
在不舍与兴奋中,我们迎来了DeepSeek开源周第五天。今天DeepSeek开源的项目是:Fire-Flyer文件系统,即3FS。


据了解,3FS是一个高性能并行文件系统,它是所有Deepseek数据访问的助推器,能应对AI训练和推理工作负载的挑战。

它利用现代SSD和RDMA网络提供共享存储层,能简化分布式应用程序的开发,具有以下主要特性:

1、分离式架构:结合了数千个SSD和数百个存储节点的网络带宽,使应用程序可以不受位置限制地访问存储资源

2、强一致性:实现了链式复制与分配查询(CRAQ)协议,确保数据的强一致性,简化应用程序开发

3、文件接口:提供基于事务性键值存储(如FoundationDB)支持的无状态元数据服务,使用通用的文件接口,无需学习新的存储API

4、多样化工作负载支持

4.1  数据准备:高效组织数据分析管道的输出和管理大量中间结果

4.2  数据加载:支持计算节点间的训练样本随机访问,消除预取或打乱数据集的需求

4.3  检查点保存:支持大规模训练的高吞吐并行检查点保存

4.4  推理KVCache:提供比基于内存缓存更具成本效益的替代方案,同时提供高吞吐量和更大容量

另外,3FS的核心性能指标表现在聚合读取吞吐量上,具体体现就是在由180个存储节点组成的集群中,可实现  6.6 TiB/s 的聚合读取吞吐量。

在基准测试表现中,在25节点集群的 GraySort 基准测试中,吞吐量可达 3.66 TiB/分钟;在单客户端节点的 KVCache 查找峰值吞吐量超过40 GiB/s。

尤其值得一提的是,3FS对于V3和R1中训练数据预处理、数据集加载、嵌入向量搜索和KV Cache查找等工作,都立下了汗马功劳,可谓功高盖主!

网友们表示,3FS和Smallpond为AI数据处理设定了新基准,将改变数据处理的游戏规则。这对于AI演化来说,相当于从自行车升级到了高铁!大家说,3FS牛不牛!


发表评论

最新评论

引用 半自働 2025-3-5 07:45
666
引用 He1De 2025-3-3 00:21
看看
引用 大树在生长 2025-3-2 09:23
围观
引用 CraZy_ZyQ 2025-3-1 16:04
看看
引用 心静则安 2025-3-1 00:37
看看
引用 adamburns 2025-3-1 00:08
参与一下

查看全部评论(6)

手机版|外设堂 ( 辽ICP备13014379号 )辽公网安备 21010202000549号

GMT+8, 2025-8-20 15:10 , Processed in 0.144767 second(s), 15 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

返回顶部