Llama

中科曙光:曙光云全国产DeepSeek超融合一体机发布

中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容,满足各种业务场景需求。

跌至全球第三!英伟达市值蒸发近6000亿美元,规模创美股史上最大

近期,英伟达的股票被干爆了,原因就来自DeepSeek这款AI模型的杀入。按照相关人士的说法,DeepSeek的性能,足以媲美OpenAI的ChatGPT,以及Meta的Llama 3.1。无论聊天还是提问,DeepSeek都能做到游刃有余。最关键的是,DeepSeek的部分芯片,用的还是华为的昇腾910C芯片。如此看来,英伟达这次怕不是要遭到抛弃了?话说DeepSeek在AI界掀起的风浪究竟有多

电厂 | 李彦宏走向自己的反面

“我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。”从2023年3月16日文心一言启动邀测至今的约两年时间里,百度创始人李彦宏始终站在“大模型闭源”的一端,在多个公开场合表达自己“开源会越来越落后”“开源就是智商税”的理念。李彦宏于2024百度世界大会,图源/百度 「电厂」查阅公开资料发现,最晚在2024年下半年的一次百度内部讲话中,李彦宏还公开重申了自己对闭源的坚持,

中国电子云上线DeepSeek-R1/V3全量模型

2月10日,中国电子发布消息称,其所属中国电子云CECSTACK智算云平台正式上线MoE架构的671B全量DeepSeek-R1/V3模型,以及DeepSeek-R1的蒸馏系列Qwen/Llama模型,并提供私有化部署方案。

中科曙光:曙光云全国产DeepSeek超融合一体机发布

【中科曙光:曙光云全国产DeepSeek超融合一体机发布】财联社2月14日电,中科曙光官微2月14日消息,近日,曙光云发布全国产DeepSeek大模型超融合一体机。在模型适配方面,它不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模

国家超算互联网宣布免费开放3个月DeepSeek API接口

2月11日晚间,国家超算互联网平台宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API 接口。据了解,目前超算互联网已连接国内 14 个省的 20 多家超算和智算中心。目前平台上已有各类算力商品超 6500 款,其中

正对着DeepSeek狂抄?Meta被曝整个AI部门深陷恐慌

中国人工智能公司深度求索(DeepSeek)在大模型上取得的成功,目前已经深深撼动了硅谷同行们的信心。 1月23日,在美国匿名职场论坛TeamBlind上,一名Meta公司员工发布涉深度求索的帖子“Meta生成式人工智能部门陷入恐慌”,引起广泛讨论。该员工在文中称,从深度求索开始,就已经让Meta的Llama 4在各项测试中处于落后,“更糟糕的是,这家不知名中国公司仅为此花费了550万美元。” 5

阿里千问衍生模型数量破10万,居全球开源模型榜首

全球最大AI开源社区Hugging Face最新显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万,持续领先美国Llama等开源模型,稳居全球最大开源模型榜首。自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。(科

DeepSeek为什么要开源?可能与人工智能领导权息息相关

文/观察者网专栏作者 熊节,华东师范大学国际传播研究院全球南方研究中心主任文/观察者网专栏作者 塞尔吉奥·阿马德乌,巴西UFABC大学教授,前巴西国家信息技术研究所所长【本文由deepseek翻译,经观察者网编辑加工润色后发布。】人工智能领导权之争——中国与开源为什么技术领导权如此重要?如何定义人工智能(AI)领域的技术领导权?人工智能是一项横跨多个领域的技术,其进步会对经济、社会和国家安全产生深