law

马斯克向左 梁文锋向右

2月18日,创立xAI的埃隆·马斯克发布了号称“地球上最聪明AI”的Grok3大模型,展示了其在多项测评中超越o3-mini,摘得桂冠的技术实力。而同一天,DeepSeek的梁文锋和Kimi的杨植麟分别在专业网站上发布了自己参与的论文,这两篇论文均与如何减少长文本计算量,加快训练效率有关。这反映了中美AI大模型路线上最本质的差异:Grok3采用20万张英伟达H100芯片训练而成,达成优异性能的同时

兴业证券:AI应用“多点开花”或将推动更多“AI+”领域延伸扩散

【兴业证券:AI应用“多点开花”或将推动更多“AI+”领域延伸扩散】财联社2月20日电,兴业证券发布研报称,随着2023年初ChatGPT问世引爆全球人工智能产业趋势,推动AI成为全球科技板块的核心主线,但行情的演绎主要集中在上游算力端。在Scaling Law和全球算力需求高增逻辑下,以光模块、AI芯片为代表的上游算力作为“卖铲人”显著受益。而AI应用落地进展相对低于预期,中游软件服务和下游应用

MiniMax刘华:构建多模态开源生态,研发不再围绕稠密架构

《科创板日报》2月23日讯(记者 陈美)2月21-23日,为期三天的2025全球开发者先锋大会在上海举行。会上,MiniMax副总裁刘华带来了一场关于多模态大模型发展的深度分享。刘华指出,自2017年Transformer架构问世以来,其对大语言模型的诞生起到了直接的推动作用。然而,在历经七八年的发展之后,Transformer 架构遭遇了瓶颈。即,Transformer 处理任务时,其任务长度与

中信建投:在深度推理的阶段 模型的未来算力需求依然会呈现爆发式上涨

【中信建投:在深度推理的阶段 模型的未来算力需求依然会呈现爆发式上涨】财联社2月5日电,中信建投研报表示,DeepSeek R1训练和推理算力需求较低,主要原因是DeepSeek R1实现算法、框架和硬件的优化协同。过去的预训练侧的scaling law正逐步迈向更广阔的空间,在深度推理的阶段,模型的未来算力需求依然会呈现爆发式上涨,充足的算力需求对于人工智能模型的性能进步依然至关重要。

郭明錤:DeepSeek加速生成式AI产业迈入新阶段

【郭明錤:DeepSeek加速生成式AI产业迈入新阶段】财联社1月31日电,天风国际证券分析师郭明錤发布报告指出,DeepSeek-R1发布后,有以下两个重要的AI产业新趋势值得关注。就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现,加速了趋势发生。一、Scaling Law边际效益放缓时,AI算力仍可透过优化训练方式持续成长并有利挖掘新应用。二、API/To