DualPipe

DeepSeek开源第四弹“教”优化梁文锋参与研发

【DeepSeek开源第四弹“教”优化梁文锋参与研发】财联社2月27日电，DeepSeek开源周（OpenSourceWeek）第四弹来了，DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略，并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术，通过这些阐述可以清晰了解团队是如何精细地优化计算和通信，最大限度利用GPU能力的。这三项优化并行策略其中包

新闻 2025年02月28日 0 点赞 0 评论 25 浏览

DeepSeek开源周（OpenSourceWeek）第四弹来了，DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略，并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术，通过这些阐述可以清晰了解团队是如何精细地优化计算和通信，最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe，这是一种用于V3/R1模型训练中计算与通信重叠的双向流水

新闻 2025年02月28日 0 点赞 0 评论 20 浏览

DeepSeek开源第四弹“教”优化梁文锋参与研发

2月27日消息，DeepSeek开源周（OpenSourceWeek）第四弹来了，DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略，并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术，通过这些阐述可以清晰了解团队是如何精细地优化计算和通信，最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe，这是一种用于V3/R1模型训练中计算与通

新闻 2025年02月28日 0 点赞 0 评论 19 浏览

回顾DeepSeek“开源周”：越是开源，越能扩大生态

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月最后一天，DeepSeek开源周正式收官。连续五天，这家公司刷新自己在大模型开源生态中的技术地位。五天一共对应五个开源代码库，分别是FlashMLA，DeepEP，DeepGEMM，DualPipe和EPLB对应的优化并行策略，以及推进器3FS和轻量化数据处理工具Smallpond。在Github，这些项目累计获得星星数量接近2.8万颗。首日的F

新闻 2025年03月01日 0 点赞 0 评论 17 浏览

DeepSeek开源周第四日发布：优化并行策略

新京报贝壳财经讯（记者罗亦丹）北京时间2月27日10点5分，DeepSeek发布了其“开源周”第四日的内容：优化的并行策略，其中包括DualPipe，一种用于V3/R1训练中计算与通信重叠的双向管道并行算法，以及EPLB，一种针对V3/R1的专家并行负载均衡器。此外，DeepSeek还公开分享了其训练和推理框架的性能分析数据，从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。编辑寇德

新闻 2025年02月28日 0 点赞 0 评论 16 浏览

DualPipe

首页

DualPipe

列表

默认

浏览次数

发布日期

DeepSeek开源第四弹“教”优化梁文锋参与研发

DeepSeek开源第四弹“教”优化，梁文锋参与研发

DeepSeek开源第四弹“教”优化梁文锋参与研发

回顾DeepSeek“开源周”：越是开源，越能扩大生态

DeepSeek开源周第四日发布：优化并行策略

DualPipe 首页 DualPipe

列表 默认 浏览次数 发布日期

DeepSeek开源第四弹“教”优化 梁文锋参与研发

DeepSeek开源第四弹“教”优化，梁文锋参与研发

DeepSeek开源第四弹“教”优化 梁文锋参与研发

回顾DeepSeek“开源周”：越是开源，越能扩大生态

DeepSeek开源周第四日发布：优化并行策略

DualPipe

首页

DualPipe

列表

默认

浏览次数

发布日期

DeepSeek开源第四弹“教”优化梁文锋参与研发

DeepSeek开源第四弹“教”优化梁文锋参与研发