中国电子云上线DeepSeek-R1/V3全量模型 2月10日,中国电子发布消息称,其所属中国电子云CECSTACK智算云平台正式上线MoE架构的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸馏系列Qwen/Llama模型,并提供私有化部署方案。 新闻 2025年02月11日 0 点赞 0 评论 53 浏览
中科曙光:曙光云全国产DeepSeek超融合一体机发布 【中科曙光:曙光云全国产DeepSeek超融合一体机发布】财联社2月14日电,中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模 新闻 2025年02月15日 0 点赞 0 评论 36 浏览
国家超算互联网宣布免费开放3个月DeepSeek API接口 2月11日晚间,国家超算互联网平台宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API 接口。据了解,目前超算互联网已连接国内 14 个省的 20 多家超算和智算中心。目前平台上已有各类算力商品超 6500 款,其中 新闻 2025年02月12日 0 点赞 0 评论 32 浏览
正对着DeepSeek狂抄?Meta被曝整个AI部门深陷恐慌 中国人工智能公司深度求索(DeepSeek)在大模型上取得的成功,目前已经深深撼动了硅谷同行们的信心。 1月23日,在美国匿名职场论坛TeamBlind上,一名Meta公司员工发布涉深度求索的帖子“Meta生成式人工智能部门陷入恐慌”,引起广泛讨论。该员工在文中称,从深度求索开始,就已经让Meta的Llama 4在各项测试中处于落后,“更糟糕的是,这家不知名中国公司仅为此花费了550万美元。” 5 军事 2025年02月05日 0 点赞 0 评论 31 浏览
阿里千问衍生模型数量破10万,居全球开源模型榜首 全球最大AI开源社区Hugging Face最新显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万,持续领先美国Llama等开源模型,稳居全球最大开源模型榜首。自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。(科 新闻 2025年02月26日 0 点赞 0 评论 21 浏览