OpenAI

MiniMax刘华:构建多模态开源生态,研发不再围绕稠密架构

《科创板日报》2月23日讯(记者 陈美)2月21-23日,为期三天的2025全球开发者先锋大会在上海举行。会上,MiniMax副总裁刘华带来了一场关于多模态大模型发展的深度分享。刘华指出,自2017年Transformer架构问世以来,其对大语言模型的诞生起到了直接的推动作用。然而,在历经七八年的发展之后,Transformer 架构遭遇了瓶颈。即,Transformer 处理任务时,其任务长度与

“DeepSeek没必要成为中国版OpenAI,因为OpenAI也不是大模型终局”

2月21日-23日在上海举行的2025GDC全球开发者先锋大会上,中国公司深度求索(DeepSeek)旗下生成式AI产品DeepSeek成为当之无愧的热点话题,几乎每个参会的观众、开发者都在谈论DeepSeek。为什么会是DeepSeek成功破圈、DeepSeek是否会成为中国的“OpenAI”?DeepSeek给现场的开发者们带来哪些思考?澎湃科技记者在大会期间和AI从业者们聊了聊。“DeepS

OpenAI竞争对手Anthropic新一轮融资规模或上调至35亿美元

OpenAI竞争对手、人工智能初创公司Anthropic正在敲定35亿美元的新一轮融资,这轮融资令这家聊天机器人Claude的母公司估值达到615亿美元。知情人士透露,该公司最初计划筹集20亿美元资金,但在与投资者洽谈过程中上调了融资规模。这家由OpenAI前员工于2021年创立的公司此前估值为180亿美元。(华尔街日报)

Anthropic发布“最智能”AI模型:首发“混合模式”,更像人类大脑!

财联社2月25日讯(编辑 黄君芝)在资金雄厚的初创公司和科技巨头争先恐后地在人工智能(AI)领域争做“领头羊”之际,美国初创企业Anthropic表示,它已经开发出了该公司迄今为止“最智能”的人工智能模型——Claude 3.7 Sonnet。 据悉,这家亚马逊支持的初创公司周一发布了Claude 3.7 Sonnet, 它的独特之处在于其所谓的“混合模式”,即把推理能力与实时解答的传统模式相结合

微软回应“退租数据中心”:资本支出没变 可能做出某些调整

财联社2月25日讯(编辑 史正丞)随着市场传言“微软退租数据中心”引发美股市场算力、电力板块震动,美国科技巨头被迫在周一交易时段紧急回应。作为这一事件的背景,上周五道明银行旗下投行和金融服务机构TD Cowen发布“渠道调查”研报称,微软已经取消了在美国“数百兆瓦”容量的数据中心租约,同时也已经停止转化所谓的资格证明,这些协议通常会成为正式租约。这个话题刺痛了华尔街尚未愈合的创伤——美国的长期算力

配音视效开始应用,演员编剧依旧反对,好莱坞准备拥抱AI浪潮?

【环球时报特约记者 董铭】随着奥斯卡颁奖典礼的临近,人工智能(AI)再度成为好莱坞热议的关键词,尤其是“美国春晚”超级碗上大量AI公司的广告,OpenAI、深度求索(DeepSeek)应用的迅速普及以及世界首富埃隆·马斯克对于AI大模型的鼓吹,曾“闻AI色变”的好莱坞似乎也在改变态度,一些人开始主动拥抱AI了。“完美无瑕的英语版”“在好莱坞,反对人工智能似乎成了新的名人时尚”,《好莱坞报道者》评论

【特稿】退租数据中心后 微软称800亿美元算力支出不变

退租数据中心后 微软称800亿美元算力支出不变卜晓明美国微软公司一名发言人24日说,公司不会更改2025财政年度内在算力领域投入超过800亿美元的计划。此前,分析师发布研报称,微软取消部分数据中心租约。这名发言人承认,微软可能就某些领域的基础设施进行“战略性加快建设或调整”。微软今年初宣布上述800亿美元投资计划,用于建设数据中心,以训练人工智能(AI)模型并加持人工智能应用。美国道明证券高宏公司

Anthropic发布首款混合推理模型:擅长解决实际问题,得分远超OpenAI

被视为OpenAI竞争对手的美国AI(人工智能)初创公司Anthropic宣布推出“迄今为止最智能的首款混合推理模型”。当地时间2月24日,由美国科技巨头亚马逊投资支持的Anthropic宣布推出新模型Claude 3.7 Sonnet,并将其称为“市面上首款混合推理模型”。根据用户的选择,Claude 3.7 Sonnet既可以快速地给出回应,也可以向用户提供扩展后的分步思考。用户可以免费使用C

大模型竞争愈发激烈:Anthropic推出混合推理模型,可控制模型思考时间

2月25日,由亚马逊支持的AI初创公司Anthropic推出首个混合推理模型Claude 3.7 Sonnet。它可以产生近乎即时的反应和对用户可见、可扩展的逐步思考。API用户还可以控制模型思考时间。Anthropic表示,正如人类使用一个大脑进行快速反应和深度思考一样,推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一方法可以为用户创造无缝体验。Claude 3.7 Sonnet既是

扎克伯格豪掷2千亿美元筹划巨型数据中心,应对行业竞争

2月26日,据媒体报道,Meta公司CEOE马克·扎克伯格正筹划一项耗资2000亿美元的巨型数据中心项目,旨在为其人工智能业务提供强大的基础设施支持。这一举措被认为是Meta在生成式AI领域与OpenAI等竞争对手展开激烈角逐的重要战略。据The Information报道,Meta正在商讨建设一个全新的数据中心园区,预计成本将超过2000亿美元。这一规模远超Meta以往的任何数据中心项目,并可能