视觉

通义开源视觉理解模型Qwen2.5-VL可操控手机、视频通话

新京报贝壳财经讯(记者罗亦丹)1月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本,并已在魔搭社区、HuggingFace等平台开源。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中的得分领先GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的A

互联中国公益行动丨高精度3D视觉技术点亮数字未来

从平面到立体,从二维到三维,高精度3D视觉技术正在引领新一轮视觉革命。跟踪式激光三维扫描系统、口腔数字印模仪……在杭州市萧山区中国视谷的展厅中,各种前沿的设备和技术让人目不暇接。据了解,3D视觉技术核心优势在于其极高的精确度,目前已在汽车工业、航空航天、医疗康复、数字文博等行业和领域应用,并在改变各行各业的工作方式。先临三维公司品牌经理刘海华介绍,“通过三维扫描,只需几分钟扫描头就可以获取不规则物

阶跃星辰发布多模态理解大模型Step-1o Vision 节前还将上新更多模型

《科创板日报》1月21日讯(记者 黄心怡)既发布推理模型Step R-mini之后,阶跃星辰再发布Step-1o Vision多模态理解大模型。据了解,Step-1o系列是阶跃星辰研发的端到端文本、视觉、语音三模态生成理解一体化模型。一个月前,阶跃星辰发布了1o家族的首个模型Step-1o Audio,这也是国内首个千亿参数端到端语音大模型。在Step-1o Vision多模态理解大模型上线的同时

嫦娥六号月背采样、类脑互补视觉芯片等入选2024中国十大科技进展

中新网南京1月22日电 (记者 孙自法)中国科学院、中国工程院主办的“两院院士评选2024年中国/世界十大科技进展新闻”,1月22日在江苏南京揭晓发布,嫦娥六号月背采样、世界首款基于原语的类脑互补视觉芯片等10项成果入选2024年中国十大科技进展新闻。两院院士评选2024年中国十大科技进展新闻揭晓发布。中新网记者 孙自法 摄 2024年中国十大科技进展新闻具体内容分别是:——嫦娥六号首次在月球背面

望月千年终将抵达

“探索”载人月球车。“望宇”登月服。组图/央视新闻北京时间2月12日21时53分,人们迎来今年月亮最圆满的时刻。图/视觉中国A03

济南二院专家谈眼病|如何提高斜弱视视力?

齐鲁晚报·齐鲁壹点 郭蕊 通讯员 郭兆瑞斜弱视严重地影响着儿童的视力,对于儿童斜弱视要做好防治发现弱视要及时治疗,在治疗的同时,还要辅助提高弱视孩子的视力,如何提高孩子的视力呢?济南市眼科医院(济南市第二人民医院)眼五科(眼肌病、儿童眼病专业)主任、主任医师傅特为您详细讲解。1、提高视力如何提高斜弱视视力?提高视力是斜弱视治疗的根本目的。精细目力训练可有效促进患者的视觉发育,达到增视效果。精细目力