FlashMLA

DeepSeek开源FlashMLA，意味着什么？

国产AI公司深度求索（DeepSeek）开源周正式启动，并公布首个开源代码。2月24日，DeepSeek宣布启动“开源周”，首个开源的代码库为FlashMLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化，目前已投入生产。此前2月21日午间，DeepSeek宣布，从下周开始，他们将开源5个代码库，以完全透明的方式与全球开发者社区分享他们的研究进展，每日都有新内容解

新闻 2025年02月25日 0 点赞 0 评论 16 浏览

微软“退租门”震颤科技链：DeepSeek开源突围能否对冲港股AI板块寒流？

财联社2月25日讯（编辑胡家荣）港股市场科技板块显著调整，DeepSeeK概念股普遍走低。截至发稿，涂鸦智能-W(02391.HK)、金山云(03896.HK)、美图公司(01357.HK)跌幅居前，市场情绪受多重外围因素影响持续低迷。注：DeepSeeK概念股的表现微软数据中心调整引发连锁反应消息面上，美国科技巨头微软的基础设施布局变动。道明银行旗下投行TD Cowen最新报告显示，微软已取

新闻 2025年02月25日 0 点赞 0 评论 14 浏览

开源第一弹！DeepSeek重磅发布

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽&580 TFLOPS的计算性能。”DeepSeek说。简单来说，FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效

新闻 2025年02月25日 0 点赞 0 评论 27 浏览

"源神启动"？DeepSeek开源周连放大招！

DeepSeek于2025年2月24日正式启动“开源周”，计划连续5天每天开源一个项目。2月21日，DeepSeek发文称，构建了一支探索AGI（通用人工智能）小团队，从下周起将开源5个代码库，以完全透明的方式分享研究进展。DeepSeek于2025年2月24日正式启动“开源周”，计划连续5天每天开源一个项目。开源周首日：FlashMLA 开启高效 AI 加速新时代DeepSeek开源周的第一个项

新闻 2025年02月26日 0 点赞 0 评论 19 浏览

DeepSeek开源周这次又打开了什么魔盒？将如何影响AI开发？

国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。2月28日，DeepSeek最新宣布，开源面向DeepSeek全数据访问的推进器3FS（Fire-Flyer File System）。据介绍，这是一款并行文件系统，可利用现代固态硬盘（SSD）和远程直接内存访问（RDMA）网络的全部带宽，加速和推动DeepSeek平台上所有数据访问操作。至此，DeepSeek开源周正式结束，此前

新闻 2025年03月01日 0 点赞 0 评论 23 浏览

开源第一弹！DeepSeek重磅发布

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽580 TFLOPS的计算性能。”DeepSeek说。简单来说，FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的

新闻 2025年02月25日 0 点赞 0 评论 28 浏览

回顾DeepSeek“开源周”：越是开源，越能扩大生态

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月最后一天，DeepSeek开源周正式收官。连续五天，这家公司刷新自己在大模型开源生态中的技术地位。五天一共对应五个开源代码库，分别是FlashMLA，DeepEP，DeepGEMM，DualPipe和EPLB对应的优化并行策略，以及推进器3FS和轻量化数据处理工具Smallpond。在Github，这些项目累计获得星星数量接近2.8万颗。首日的F

新闻 2025年03月01日 0 点赞 0 评论 19 浏览

DeepSeek发布开源周首个成果可优化英伟达GPU效率

新京报贝壳财经讯（记者罗亦丹）北京时间2月24日上午，DeepSeek发布了其“开源周”的第一项成果：FlashMLA（直译为快速多头潜在注意力机制）的代码。据了解，MLA（多头潜在注意力机制）正是DeepSeek降低大模型成本使用的关键技术之一，其可以显著减少大模型训练和推理过程中的内存占用，而FlashMLA则是针对Hopper GPU（一种英伟达GPU架构）开发的高效MLA解码内核，其针对可

新闻 2025年02月25日 0 点赞 0 评论 23 浏览

FlashMLA

首页

FlashMLA

列表

默认

浏览次数

发布日期

DeepSeek开源FlashMLA，意味着什么？

微软“退租门”震颤科技链：DeepSeek开源突围能否对冲港股AI板块寒流？

开源第一弹！DeepSeek重磅发布

"源神启动"？DeepSeek开源周连放大招！

DeepSeek开源周这次又打开了什么魔盒？将如何影响AI开发？

开源第一弹！DeepSeek重磅发布

回顾DeepSeek“开源周”：越是开源，越能扩大生态

DeepSeek发布开源周首个成果可优化英伟达GPU效率

FlashMLA 首页 FlashMLA

列表 默认 浏览次数 发布日期

微信扫一扫：分享

FlashMLA

首页

FlashMLA

列表

默认

浏览次数

发布日期