DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s

发布时间:2025-02-28 19:22:10 来源:互联网

本站 2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。

本站附上开源地址:https://github.com/deepseek-ai/3FS。

基于 3FS 的数据处理框架 Smallpond:https://github.com/deepseek-ai/smallpond。

3FS 性能亮点

    集群高吞吐: 在 180 节点集群中,3FS 实现了高达 6.6 TiB/s 的聚合读取吞吐量。

    基准测试优异: 在 25 节点集群的 GraySort 基准测试中,3FS 达到了 3.66 TiB / min 的吞吐量。

    单节点高性能: 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s。

    架构先进: 3FS 采用去中心化架构,并具备强一致性语义。

    3FS 应用场景

    3FS (Fire-Flyer File System) 是一款高性能的分布式文件系统,旨在解决 AI 训练和推理工作负载带来的挑战,利用现代 SSD 和 RDMA 网络提供共享存储层,简化分布式应用程序的开发。

    其核心优势在于高性能、强一致性和易用性,能够有效支持各种 AI 工作负载,包括数据准备、数据加载、检查点设置和推理缓存。

    3FS 在 DeepSeek 的 V3 / R1 版本中得到广泛应用,涵盖了训练数据预处理、数据集加载、检查点保存 / 重新加载、嵌入向量搜索以及推理过程中的 KVCache 查找等关键环节。

    Smallpond

    此外,DeepSeek 还开源了基于 3FS 的数据处理框架 Smallpond,是一款构建于 DuckDB 和 3FS 之上的轻量级数据处理框架。它拥有高性能数据处理能力,可扩展至 PB 级数据集,并且操作简便,无需长期运行的服务。

    相关阅读:

      《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》

      《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》

      《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》

      《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》

本周热门教程

1
如何在星空无限传媒官网免费观看最新电视剧?不看广告,画质超清!

如何在星空无限传媒官网免费观看最新电视剧?不看广告,画质超清!

2025/02/28

2
一枪战三母最经典的一句话:揭秘这句经典台词背后的深刻寓意与影响

一枪战三母最经典的一句话:揭秘这句经典台词背后的深刻寓意与影响

2025/02/23

3
《教室里的激情》韩国:教育与师生关系背后的情感冲突与成长挑战

《教室里的激情》韩国:教育与师生关系背后的情感冲突与成长挑战

2025/02/25

4
91在线精品:提供最新最全的高清视频资源,让您畅享高清视听体验!

91在线精品:提供最新最全的高清视频资源,让您畅享高清视听体验!

2025/02/23

5
美国老太太与欧美老人文化差异:从家庭观念到衰老态度的全方位对比

美国老太太与欧美老人文化差异:从家庭观念到衰老态度的全方位对比

2025/02/28

6
《性船》菲律宾无删减版本为何引发如此广泛的讨论?背后隐藏的深层次原因是什么?

《性船》菲律宾无删减版本为何引发如此广泛的讨论?背后隐藏的深层次原因是什么?

2025/02/23

7
《教室爱欲》无删减版:为何这部作品引发了如此大的社会争议?

《教室爱欲》无删减版:为何这部作品引发了如此大的社会争议?

2025/02/28

8
如何使用AE制作精美片段视频?轻松掌握技巧,制作出专业感十足的视频效果

如何使用AE制作精美片段视频?轻松掌握技巧,制作出专业感十足的视频效果

2025/02/25

9
如何找到理想的图书馆女友:她的内涵与气质究竟有何魅力?

如何找到理想的图书馆女友:她的内涵与气质究竟有何魅力?

2025/02/25

10
《隔壁女邻居3》BD高清版在线观看,高清画质呈现更真实精彩剧情

《隔壁女邻居3》BD高清版在线观看,高清画质呈现更真实精彩剧情

2025/02/23