罗亦丹

阿里云AI相关收入连续六个季度三位数增长 将发布深度推理模型

新京报贝壳财经讯(记者罗亦丹)2月20日,阿里巴巴集团公布新季度业绩,其中阿里云季度营收317.42亿元,同比增长13%,公共云收入持续两位数增长。AI相关收入连续六个季度三位数增长,调整后EBITA(指折旧和摊销、利息、税收前的净利润)增长33%至31.38亿元。阿里巴巴集团CEO吴泳铭在财报会上表示,阿里将于近期发布基于千问Qwen2.5-Max的深度推理模型。1月底,阿里发布了AI基础大模型

进军文生图 DeepSeek发布多模态模型Janus-Pro

新京报贝壳财经讯(记者罗亦丹)北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像

DeepSeek“开源周”第二天开源EP通信库

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-t

英伟达盘前跌逾13%

新京报贝壳财经讯(记者罗亦丹)受DeepSeek R1爆火引发英伟达算力需求预期将变弱的冲击,北京时间1月27日晚上6时50分(美东时间5:50),英伟达盘前暴跌13.37%。消息面上,不依赖巨量算力投入的国产大模型DeepSeek走红,登顶苹果应用商店中国区和美国区免费应用下载排行榜,引发算力股下跌。校对 柳宝庆

DeepSeek开源周第四日发布:优化并行策略

新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。此外,DeepSeek还公开分享了其训练和推理框架的性能分析数据,从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。编辑 寇德

ChatGPT开放联网搜索功能,无需注册

新京报贝壳财经讯(记者罗亦丹)北京时间2月6日凌晨,OpenAI宣布向所有用户开放ChatGPT联网搜索功能,无需注册。此前,该功能仅面向付费用户开放,有声音认为这对搜索引擎如谷歌等将造成冲击。ChatGPT交互界面。来源:OpenAI官方编辑 杨娟娟校对 赵琳

​DeepSeek API推出错峰时段,R1模型打2.5折

新京报贝壳财经讯(记者罗亦丹)2月26日下午,DeepSeek在其API(接口)平台上发布提醒信息称,北京时间每日00:30-08:30为错峰时段,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%,在该时段调用享受更经济更流畅的服务体验。校对 柳宝庆

DeepSeek上线讯飞开放平台,首发大模型精调服务

新京报贝壳财经讯(记者罗亦丹)2月10日,讯飞开放平台宣布包括“满血版”DeepSeek-V3和DeepSeek-R1在内的DeepSeek全系大模型现已正式上线,支持公有云API调用和专属模型一键部署。值得注意的是,其推理API限时免费开放,且首发了DeepSeek大模型精调服务,支持开发者根据业务场景数据精调定制,打造专属DeepSeek大模型。编辑 张晓翀 校对 穆祥桐

百度收购YY Live 超110亿元回笼资金将用于AI研发

新京报贝壳财经讯(记者罗亦丹)2月25日晚,港交所公告显示,百度与欢聚集团达成收购协议,百度以21亿美元价格收购欢聚集团在国内的视频娱乐直播业务YY Live。公告显示,新协议达成后,此前存入托管账户的16亿美元(合人民币超110亿元)已全额退还百度,并将投入云与AI基础设施建设。公开资料显示,2020年11月,百度曾与欢聚集团达成协议,以36亿美元价格收购YY Live,并将部分款项存入托管账户

OpenAI首席执行官奥特曼:不发o3模型,将发布GTP5

新京报贝壳财经讯(记者罗亦丹)北京时间2月13日凌晨,OpenAI首席执行官山姆奥特曼发文更新了OpenAI的未来产品路线图,他表示已经意识到了OpenAI的模型和产品变得多么复杂,“我们和您一样,厌倦了模型选择器,希望回到神奇的统一智能上来。”他表示,接下来不再将o3作为独立模型发布,而将发布GPT-4.5。后续,将统一o系列模型和GPT系列模型,将发布GTP-5作为集成许多技术(包括o3)的系