进军文生图 DeepSeek发布多模态模型Janus-Pro 新京报贝壳财经讯(记者罗亦丹)北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像 新闻 2025年02月05日 0 点赞 0 评论 27 浏览
DeepSeek“开源周”第二天开源EP通信库 新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-t 新闻 2025年02月26日 0 点赞 0 评论 22 浏览
英伟达盘前跌逾13% 新京报贝壳财经讯(记者罗亦丹)受DeepSeek R1爆火引发英伟达算力需求预期将变弱的冲击,北京时间1月27日晚上6时50分(美东时间5:50),英伟达盘前暴跌13.37%。消息面上,不依赖巨量算力投入的国产大模型DeepSeek走红,登顶苹果应用商店中国区和美国区免费应用下载排行榜,引发算力股下跌。校对 柳宝庆 新闻 2025年02月05日 0 点赞 0 评论 25 浏览