ME News 消息,4 月 2 日(UTC+8),智谱AI近日发布了新一代基础模型GLM-5V-Turbo,该模型旨在弥合视觉感知与软件工程之间的差距。与仅依赖文本提示的标准大语言模型不同,GLM-5V-Turbo原生支持处理设计稿、截图等视觉输入,被定位为“视觉编码模型”。据文中观点,该模型具备原生多模态编码能力,能够理解图像、视频、设计稿和文档布局等多种输入,并在视觉与编程能力的平衡方面,于核心基准测试中取得了领先性能。(来源:ME)