罗亦丹

OpenAI等公司将投资五千亿美元建立AI基础设施

新京报贝壳财经讯(记者罗亦丹)北京时间1月22日上午6:00,美国总统特朗普宣布,软银、OpenAI、甲骨文联合成立一家新的AI公司Stargate(星门),未来四年将投资5000亿美元用于建设AI基础设施。OpenAI随后发布官方通告称,将立即开始部署1000亿美元。ARM、微软、英伟达、甲骨文和OpenAI是关键的初始技术合作伙伴。OpenAI将继续与微软合作,训练领先的模型并提供出色的产品和

进军文生图 DeepSeek发布多模态模型Janus-Pro

新京报贝壳财经讯(记者罗亦丹)北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像

英伟达盘前跌逾13%

新京报贝壳财经讯(记者罗亦丹)受DeepSeek R1爆火引发英伟达算力需求预期将变弱的冲击,北京时间1月27日晚上6时50分(美东时间5:50),英伟达盘前暴跌13.37%。消息面上,不依赖巨量算力投入的国产大模型DeepSeek走红,登顶苹果应用商店中国区和美国区免费应用下载排行榜,引发算力股下跌。校对 柳宝庆

OpenAI首席执行官奥特曼:不发o3模型,将发布GTP5

新京报贝壳财经讯(记者罗亦丹)北京时间2月13日凌晨,OpenAI首席执行官山姆奥特曼发文更新了OpenAI的未来产品路线图,他表示已经意识到了OpenAI的模型和产品变得多么复杂,“我们和您一样,厌倦了模型选择器,希望回到神奇的统一智能上来。”他表示,接下来不再将o3作为独立模型发布,而将发布GPT-4.5。后续,将统一o系列模型和GPT系列模型,将发布GTP-5作为集成许多技术(包括o3)的系

DeepSeek上线讯飞开放平台,首发大模型精调服务

新京报贝壳财经讯(记者罗亦丹)2月10日,讯飞开放平台宣布包括“满血版”DeepSeek-V3和DeepSeek-R1在内的DeepSeek全系大模型现已正式上线,支持公有云API调用和专属模型一键部署。值得注意的是,其推理API限时免费开放,且首发了DeepSeek大模型精调服务,支持开发者根据业务场景数据精调定制,打造专属DeepSeek大模型。编辑 张晓翀 校对 穆祥桐

ChatGPT开放联网搜索功能,无需注册

新京报贝壳财经讯(记者罗亦丹)北京时间2月6日凌晨,OpenAI宣布向所有用户开放ChatGPT联网搜索功能,无需注册。此前,该功能仅面向付费用户开放,有声音认为这对搜索引擎如谷歌等将造成冲击。ChatGPT交互界面。来源:OpenAI官方编辑 杨娟娟校对 赵琳

百度收购YY Live 超110亿元回笼资金将用于AI研发

新京报贝壳财经讯(记者罗亦丹)2月25日晚,港交所公告显示,百度与欢聚集团达成收购协议,百度以21亿美元价格收购欢聚集团在国内的视频娱乐直播业务YY Live。公告显示,新协议达成后,此前存入托管账户的16亿美元(合人民币超110亿元)已全额退还百度,并将投入云与AI基础设施建设。公开资料显示,2020年11月,百度曾与欢聚集团达成协议,以36亿美元价格收购YY Live,并将部分款项存入托管账户

百度地图携手北京市政府推出全国首个英文版地图

新京报贝壳财经讯(记者罗亦丹)1月22日,记者获悉百度地图积在北京市政府指导下,协同北京市政务服务和数据管理局,推出了全国首个英文版地图Beijing Map,北京首发上线,为外籍友人提供更便捷、更精准的出行解决方案。2024年1月至10月北京入境游客达317万人次,同比增长198.8%。对于如何为外籍人士在京工作、学习、生活、旅游提供便利?2024年上半年,北京市政府曾介绍,“北京搭建了覆盖全市

DeepSeek开源周第四日发布:优化并行策略

新京报贝壳财经讯(记者罗亦丹)北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。此外,DeepSeek还公开分享了其训练和推理框架的性能分析数据,从而帮助开源社区更好地了解通信与计算重叠策略和底层实现细节。编辑 寇德

DeepSeek“开源周”第二天开源EP通信库

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-t