Qwen

美股收盘:特朗普引发尾盘异动 三大指数踉跄收涨 中概股上演“金蛇狂舞”

财联社1月31日讯(编辑 史正丞)昨夜今晨,原本一个安静祥和、默默上涨的美股交易日,在收盘前最后半小时迎来令人困惑的“特朗普时刻”。 截至收盘,标准普尔500指数涨0.53%,报6071.17点;纳斯达克综合指数涨0.25%,报19681.75点;道琼斯工业平均指数涨0.38%,报44882.13点。(标准普尔500指数分钟线图,来源:TradingView) 由于事发突然,美股市场在最后半个小时

中国电子云上线DeepSeek-R1/V3全量模型

2月10日,中国电子发布消息称,其所属中国电子云CECSTACK智算云平台正式上线MoE架构的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸馏系列Qwen/Llama模型,并提供私有化部署方案。

阿里通义多款大模型接入荣耀手机

【阿里通义多款大模型接入荣耀手机】《科创板日报》28日讯,《科创板日报》记者获悉,荣耀已与阿里在AI领域展开合作。目前千问(Qwen)、万相(Wan)等多款语言、视觉理解、图像生成模型已接入荣耀YOYO 智能体。(记者 黄心怡)

宝兰德:相关产品目前已接入DeepSeek、QWen等通用大模型

宝兰德2月5日在互动平台表示,公司相关产品目前已接入DeepSeek、QWen、ChatGLM、文心一言等通用大模型且已有成功案例,助力行业用户打造面向垂直领域的AI Agent应用,同时针对底层算力也已适配基于昇腾系列NPU卡,能够充分调度、使用昇腾NPU算力进行训练和提供推理服务。

通义开源视觉理解模型Qwen2.5-VL可操控手机、视频通话

新京报贝壳财经讯(记者罗亦丹)1月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本,并已在魔搭社区、HuggingFace等平台开源。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中的得分领先GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的A

国产大模型又有重磅!阿里发布通义千问旗舰版模型,采用开源策略

红星资本局1月30日消息,据“阿里云”微信公众号,1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。据介绍,Qwen2.5-Max模型是阿里云通义团队对MoE(混合专家)模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分。这是继DeepSeek之后又一国产AI大模型,且同样是开源模型。阿里云发布新AI大模型

阿里发布QwQ-Max推理模型:会展示完整思维链,擅长数学理解和编程

2月25日消息,今日阿里Qwen团队在社媒平台宣布发布新推理模型——深度思考 (QwQ) 。 深度思考 (QwQ) 由 QwQ-Max-Preview 支持,这是一个基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI 智能体等。 这是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型。类似DeepSeek R1和kimi的推理模型,QwQ可同时支持深度思考

李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

《科创板日报》2月6日讯 (记者 毛明江 黄心怡)今日一则关于人工智能领域的新闻引发广泛关注。据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科创板日报》记者调查和

阿里云发布通义千问旗舰版模型Qwen2.5-Max

1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。 据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。 目前,开发者可在Qwen Chat平台免费体验模型,企业和机

中科曙光:曙光云全国产DeepSeek超融合一体机发布

中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容,满足各种业务场景需求。