DeepSeek“开源周”收官,连续五天到底都发布了什么? 界面新闻记者 | 宋佳楠2月28日,国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。回顾这五日,其最先开源的是FlashMLA,这是专为英伟达Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。在自然语言处理等任务里,数据序列长度不一, 新闻 2025年03月01日 0 点赞 0 评论 32 浏览
回顾DeepSeek“开源周”:越是开源,越能扩大生态 界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月最后一天,DeepSeek开源周正式收官。连续五天,这家公司刷新自己在大模型开源生态中的技术地位。五天一共对应五个开源代码库,分别是FlashMLA,DeepEP,DeepGEMM,DualPipe和EPLB对应的优化并行策略,以及推进器3FS和轻量化数据处理工具Smallpond。在Github,这些项目累计获得星星数量接近2.8万颗。首日的F 新闻 2025年03月01日 0 点赞 0 评论 22 浏览
广湛高铁建设获突破性进展 重要并行段路基填筑完成 中新网佛山2月28日电 (记者 王坚)广湛高铁广佛段GZSG2标临近贵广铁路既有线六线并行段路基填筑于28日完成,标志着该项目建设取得突破性进展。施工现场。中铁六局 供图 广湛高铁是我国“八纵八横”高速铁路网沿海大通道的重要组成部分,全长401公里,设计时速350公里。该项目建成通车后,可实现广州中心城区至湛江中心城区90分钟互达,助推粤西沿海地区阳江、茂名、湛江深度融入粤港澳大湾区联动发展。据项 新闻 2025年03月01日 0 点赞 0 评论 27 浏览
DeepSeek开源第四弹“教”优化 梁文锋参与研发 【DeepSeek开源第四弹“教”优化 梁文锋参与研发】财联社2月27日电,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包 新闻 2025年02月28日 0 点赞 0 评论 26 浏览
DeepSeek开源第四弹“教”优化 梁文锋参与研发 2月27日消息,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通 新闻 2025年02月28日 0 点赞 0 评论 21 浏览
DeepSeek开源第四弹“教”优化,梁文锋参与研发 DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水 新闻 2025年02月28日 0 点赞 0 评论 24 浏览
DeepSeek开源周第四日发布:优化并行策略 新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。此外,DeepSeek还公开分享了其训练和推理框架的性能分析数据,从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。编辑 寇德 新闻 2025年02月28日 0 点赞 0 评论 22 浏览
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库 【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NV 新闻 2025年02月25日 0 点赞 0 评论 24 浏览
今日头条平台治理开放日:多项治理举措并行,迎接AI发展挑战 2月24日,今日头条“平台治理开放日”活动在北京举办。相关业务负责人与学界专家围绕网络虚假谣言、同质化发文、AI低质内容等领域的治理进行了深入探讨,分享了今日头条在正面传播、平台安全、内容生态等三方面治理工作上的举措、成果及规划。营造优质、清朗、绿色、安全的平台“作为内容资讯平台,今日头条有责任、有义务让我们的用户看到真实、有用的信息”,在开放日上,今日头条内容策划负责人刘姗姗表示,“一方面要消灭 新闻 2025年02月25日 0 点赞 0 评论 32 浏览
DeepSeek概念震荡走弱 每日互动等多股跌超10% 【DeepSeek概念震荡走弱 每日互动等多股跌超10%】财联社2月24日电,每日互动、优刻得、青云科技、并行科技跌超10%,此前航锦科技跌停,首都在线、威派格、美格智能、杭钢股份等多股跌超5%。 新闻 2025年02月24日 0 点赞 0 评论 24 浏览