阿里千问衍生模型数量破10万 居全球开源模型榜首 【阿里千问衍生模型数量破10万 居全球开源模型榜首】财联社2月25日电,根据全球最大AI开源社区Hugging Face最新显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万,持续领先美国Llama等开源模型,稳居全球最大开源模型榜首。自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B 新闻 2025年02月26日 0 点赞 0 评论 22 浏览
阿里千问衍生模型数量破10万,居全球开源模型榜首 全球最大AI开源社区Hugging Face最新显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万,持续领先美国Llama等开源模型,稳居全球最大开源模型榜首。自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。(科 新闻 2025年02月26日 0 点赞 0 评论 17 浏览
中科曙光:曙光云全国产DeepSeek超融合一体机发布 【中科曙光:曙光云全国产DeepSeek超融合一体机发布】财联社2月14日电,中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模 新闻 2025年02月15日 0 点赞 0 评论 30 浏览
电厂 | 李彦宏走向自己的反面 “我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。”从2023年3月16日文心一言启动邀测至今的约两年时间里,百度创始人李彦宏始终站在“大模型闭源”的一端,在多个公开场合表达自己“开源会越来越落后”“开源就是智商税”的理念。李彦宏于2024百度世界大会,图源/百度 「电厂」查阅公开资料发现,最晚在2024年下半年的一次百度内部讲话中,李彦宏还公开重申了自己对闭源的坚持, 新闻 2025年02月15日 0 点赞 0 评论 30 浏览
中科曙光:曙光云全国产DeepSeek超融合一体机发布 中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容,满足各种业务场景需求。 新闻 2025年02月15日 0 点赞 0 评论 31 浏览
裁员近四千人也无法撼动Meta股价连涨17天:投资者看好AI回报 一系列利好消息推动社交媒体巨头Meta的股价连续收涨17个交易日,不过,公司最新一轮裁员在员工中引发了不满。当地时间2月11日,Meta(Nasdaq:META)股价涨0.33%收于每股719.80美元,总市值1.82万亿美元。自从1月17日以来,Meta股价连续17个交易日上涨,刷新了自己在2015年9月创下的连续11个交易日上涨的纪录,也刷新了纳斯达克100指数所有成分股的连涨纪录,17个交易 新闻 2025年02月15日 0 点赞 0 评论 29 浏览
熊节、塞尔吉奥·阿马德乌:DeepSeek为什么要开源?这可能与人工智能的领导权息息相关 【文/观察者网专栏作者 熊节、塞尔吉奥·阿马德乌】 人工智能领导权之争——中国与开源为什么技术领导权如此重要?如何定义人工智能(AI)领域的技术领导权?人工智能是一项横跨多个领域的技术,其进步会对经济、社会和国家安全产生深远影响。技术领导权首先提供了一系列竞争优势,因为发明和创新赋予开发者其他人所不具备的收益和利益。其次,技术领导权是一个关键的地缘政治因素,因为它能够影响全球标准、规范和法规的制定 军事 2025年02月15日 0 点赞 0 评论 32 浏览
DeepSeek为什么要开源?可能与人工智能领导权息息相关 文/观察者网专栏作者 熊节,华东师范大学国际传播研究院全球南方研究中心主任文/观察者网专栏作者 塞尔吉奥·阿马德乌,巴西UFABC大学教授,前巴西国家信息技术研究所所长【本文由deepseek翻译,经观察者网编辑加工润色后发布。】人工智能领导权之争——中国与开源为什么技术领导权如此重要?如何定义人工智能(AI)领域的技术领导权?人工智能是一项横跨多个领域的技术,其进步会对经济、社会和国家安全产生深 军事 2025年02月15日 0 点赞 0 评论 36 浏览
国家超算互联网宣布免费开放3个月DeepSeek API接口 2月11日晚间,国家超算互联网平台宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API 接口。据了解,目前超算互联网已连接国内 14 个省的 20 多家超算和智算中心。目前平台上已有各类算力商品超 6500 款,其中 新闻 2025年02月12日 0 点赞 0 评论 28 浏览
中国电子云上线DeepSeek-R1/V3全量模型 2月10日,中国电子发布消息称,其所属中国电子云CECSTACK智算云平台正式上线MoE架构的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸馏系列Qwen/Llama模型,并提供私有化部署方案。 新闻 2025年02月11日 0 点赞 0 评论 41 浏览