GitHub

"源神启动"?DeepSeek开源周连放大招!

DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。2月21日,DeepSeek发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。DeepSeek于2025年2月24日正式启动“开源周”,计划连续5天每天开源一个项目。开源周首日:FlashMLA 开启高效 AI 加速新时代DeepSeek开源周的第一个项

DeepSeek开源第四弹“教”优化,梁文锋参与研发

DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水

DeepSeek开源第四弹“教”优化 梁文锋参与研发

2月27日消息,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通

DeepSeek开源第四弹“教”优化 梁文锋参与研发

【DeepSeek开源第四弹“教”优化 梁文锋参与研发】财联社2月27日电,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek于2月27日在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包

点赞收藏!DeepSeek在GitHub星标量已超OpenAI

国产大模型深度求索(DeepSeek)正在与大洋彼岸的人工智能巨头OpenAI“掰手腕”。2月7日,据全球最大代码托管平台GitHub显示,在两个月内,DeepSeek的Star量(星标)已经超过了OpenAI。截至18时,DeepSeek旗下热度最高的项目DeepSeek-V3大模型Star量达到7.82万,超越同平台中OpenAI最热门项目(6.93万)。Meta旗下的llama星标量最高超过

DeepSeek开源惠四方(科技名家笔谈)

作者李国杰肖像画。  张武昌绘受到热烈欢迎业界纷纷部署近期,中国杭州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站,GitHub的星数即GitHub平台项目页面上的Star按钮被用户主动点击的次