FlashMLA

DeepSeek开源FlashMLA,意味着什么?

国产AI公司深度求索(DeepSeek)开源周正式启动,并公布首个开源代码。2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为FlashMLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。此前2月21日午间,DeepSeek宣布,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解

微软“退租门”震颤科技链:DeepSeek开源突围能否对冲港股AI板块寒流?

财联社2月25日讯(编辑 胡家荣)港股市场科技板块显著调整,DeepSeeK概念股普遍走低。截至发稿,涂鸦智能-W(02391.HK)、金山云(03896.HK)、美图公司(01357.HK)跌幅居前,市场情绪受多重外围因素影响持续低迷。注:DeepSeeK概念股的表现 微软数据中心调整引发连锁反应消息面上,美国科技巨头微软的基础设施布局变动。道明银行旗下投行TD Cowen最新报告显示,微软已取

开源第一弹!DeepSeek重磅发布

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽&580 TFLOPS的计算性能。”DeepSeek说。简单来说,FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效

"源神启动"?DeepSeek开源周连放大招!

DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。2月21日,DeepSeek发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。开源周首日:FlashMLA 开启高效 AI 加速新时代DeepSeek开源周的第一个项

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。2月28日,DeepSeek最新宣布,开源面向DeepSeek全数据访问的推进器3FS(Fire-Flyer File System)。据介绍,这是一款并行文件系统,可利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,加速和推动DeepSeek平台上所有数据访问操作。至此,DeepSeek开源周正式结束,此前

开源第一弹!DeepSeek重磅发布

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽580 TFLOPS的计算性能。”DeepSeek说。简单来说,FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的

回顾DeepSeek“开源周”:越是开源,越能扩大生态

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月最后一天,DeepSeek开源周正式收官。连续五天,这家公司刷新自己在大模型开源生态中的技术地位。五天一共对应五个开源代码库,分别是FlashMLA,DeepEP,DeepGEMM,DualPipe和EPLB对应的优化并行策略,以及推进器3FS和轻量化数据处理工具Smallpond。在Github,这些项目累计获得星星数量接近2.8万颗。首日的F

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可