DeepEP

DeepSeek“开源周”收官,连续五天到底都发布了什么?

界面新闻记者 | 宋佳楠2月28日,国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。回顾这五日,其最先开源的是FlashMLA,这是专为英伟达Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。在自然语言处理等任务里,数据序列长度不一,

回顾DeepSeek“开源周”:越是开源,越能扩大生态

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月最后一天,DeepSeek开源周正式收官。连续五天,这家公司刷新自己在大模型开源生态中的技术地位。五天一共对应五个开源代码库,分别是FlashMLA,DeepEP,DeepGEMM,DualPipe和EPLB对应的优化并行策略,以及推进器3FS和轻量化数据处理工具Smallpond。在Github,这些项目累计获得星星数量接近2.8万颗。首日的F

"源神启动"?DeepSeek开源周连放大招!

DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。2月21日,DeepSeek发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。开源周首日:FlashMLA 开启高效 AI 加速新时代DeepSeek开源周的第一个项

DeepSeek重启API充值 还有3个项目即将开源

《科创板日报》2月25日讯(记者 张洋洋)时隔19天,DeepSeek重启充值。今日,《科创板日报》记者在DeepSeek API开放平台注意到,DeepSeek已重新开放API充值。deepseek-chat模型优惠期结束,调用价格已变更为每百万输入tokens 2元,每百万输出tokens 8元。此前因服务器资源紧张,DeepSeek曾一度停止充值。尽管近期以来,海内外云厂商、运营商和国家级平

DeepSeek“开源周”第二天开源EP通信库

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-t

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NV