盖世汽车获悉,5月13日,小米正式发布Xiaomi OneVL,这是一个面向自动驾驶的一步式潜空间语言视觉推理框架。该框架首次将VLA模型、世界模型与潜空间推理等多条技术路线整合到同一体系下,在保持强大推理能力的同时,显著提升了推理速度与精度。
据介绍,Xiaomi OneVL采用了“语言推理+视觉未来预测”的双重监督机制,将可解释性与世界模型的未来预测能力共同融入潜空间推理过程。
其核心思路在于:自动驾驶所需压缩的信息并非仅限于语言层面的推理,而是对未来视觉世界变化的整体理解。驾驶决策更多依赖于车辆运动、道路几何、障碍物演变等时空因果关系,单纯压缩语言可能会丢失关键结构信息,而压缩对未来视觉画面的预测则能更有效地保留影响驾驶结果的核心要素。
基于这一思路,小米提出了三项关键技术,核心思路是让模型在内部以自身“语言”进行思考,学习预测未来视觉画面,并将整个推理链条压缩至一步完成。在多个主流推理与规划基准测试中,Xiaomi OneVL全面刷新了现有潜空间推理方法的性能记录,其精度超越显式思维链方法,速度则与“仅答案”预测模式相当。
小米集团雷军表示,该模型及代码将全面开源,欢迎全球开发者与研究人员共同参与,推动自动驾驶大模型的进一步发展。
盖世汽车获悉,具身智能基础设施提供商Zenbot已于近日正式完成近亿元天使轮融资。 本轮融资由长盈精密、科达利(002850.SZ)、肇民
2026年5月12日,以“普罗精工寰宇共生”为主题的普罗宇宙机器人全球合作伙伴大会隆重举办。会上,普罗宇宙机器人重磅发布全球首创高精度融合数
题:携手十年,沪连谱写共进“双城记” 从黄浦江畔到黄渤海之滨,5月11日至13日,上海市代表团到沈阳、大连考察,在“十五五”开局起步之年,
一企业家历时10年研制的“绿色替代”被纳入潮州农业产业规划 日前,竹编土工格栅应用座谈会在北京召开。会上,一种以天然竹片编织、经焗制处理而
近日,面向年轻消费群体的国产数码相机品牌——彩族,正式推出全新C25相机。聚焦用户实际拍摄需求,重点搭载前后双屏设计、2100万真实像素、6
摘要:法大大发布睿契(Richee.ai)桌面智能体,直击律师及法务工作低效、案源难增等痛点,兼顾实务提效与品牌拓客,让律师专注更有成效的创
5月13日,在哈尔滨东站站台,乘客准备搭乘K5153次“插秧专列”出行。 5月13日,K5153次“插秧专列”从哈尔滨东站始发至抚远站,“
日前,悦达起亚5月购车钜惠活动正在火热进行中。即日起至5月31日,消费者购买新狮铂拓界、奕跑、K3等车型,可享全国一口价以及多重购车权益等福
前向感知,尤其是激光雷达,长期占据辅助驾驶硬件讨论的焦点。 线数高低的比拼、对主动安全的增益,直观的数据肉搏和刺激的刹停避障,的确更具传播
近日,亿纬锂能与印度能源企业GodawariNewEnergyPrivateLimited正式签署8GWh储能大电池订单,并规划未来五年潜在
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com