模态
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型,已上架超4万个开源模型
2月21日,在今天开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括基于300亿参数、全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。(澎湃新闻记者 胡含嫣)
阶跃星辰发布多模态理解大模型Step-1o Vision 节前还将上新更多模型
《科创板日报》1月21日讯(记者 黄心怡)既发布推理模型Step R-mini之后,阶跃星辰再发布Step-1o Vision多模态理解大模型。据了解,Step-1o系列是阶跃星辰研发的端到端文本、视觉、语音三模态生成理解一体化模型。一个月前,阶跃星辰发布了1o家族的首个模型Step-1o Audio,这也是国内首个千亿参数端到端语音大模型。在Step-1o Vision多模态理解大模型上线的同时
智谱预告今年将全系列开源
【智谱预告今年将全系列开源】《科创板日报》2月3日讯,《科创板日报》记者今日获悉,2025年将是国内大模型独角兽智谱的开源年,其很快会发布全新大模型(包括基座模型、推理模型、多模态模型、Agent等),并将其开源。(记者 李明明)
豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源
【豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源】视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。 目前,该项目代码与模型已开源。
进军文生图 DeepSeek发布多模态模型Janus-Pro
新京报贝壳财经讯(记者罗亦丹)北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像
百度沈抖:虽然DeepSeek横空出世,但大模型的混战还没有完全结束
2025年2月12日,百度智能云事业群组(ACG)召开全员会。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖提到了ACG在2024年的业绩表现,也提到了当下DeepSeek爆火,对ACG乃至整个模型赛道的影响。在应用层,ACG旗下着重对代码助手、智能客服、数字人三个领域做了布局。沈抖先是肯定了整体的回款率,也提及了应用层的毛利有所改善,但他也坦言,虽然DeepSeek横空出世,但大模型的混战还