首页 > 汽车活动 > 汽车活动 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

汽车活动更多>>

比亚迪580KW超级电机铭牌曝光:转速30500转/分钟全球第一 2024年全年销量3143.6万辆,增长4.5%,47.5%新能源渗透率,585.9万辆全球第一出口量 丰田纯电车型终端售价“崩盘” 消息称bZ3裸车只要9万多 小鹏汽车新总部2025年启用,办公空间翻三倍,打造智能车库 恢复序幕与尾声,李六乙版话剧《雷雨》令人耳目一新 新华文创携手FILA FUSION推出系列活动,用非遗开启新年 游戏成为文旅新引擎?上海游戏赋能商旅文体展融合发展的实践 晨光加速年轻化布局:联动腾讯视频《斩神》,力拓二次元千亿蓝海 广州“贺·岁”今日开展,系海昏侯相关展览首次在广州展出 信也科技顾鸣:东南亚数字金融市场正在加速接近成熟地区 福特游骑侠Ranger FX4沙狐版来袭,越野性能再升级,售价28.58万起 “一车抵三车” 长安启源E07迎来OTA升级 优雅的英国敞篷跑车,2门4座布局,V8发动机、665马力、加速3.5s 宏光MINIEV四门版来袭,小巧便捷,女友直呼开车出门超方便! 溜背造型+掀背尾门,后置后驱+5.9秒破百,体验东风风行星海S7 搭载全球最强电机 比亚迪唐L实车曝光:自带车顶无人机舱 三菱翼神改装AIRBFT气动避震底盘升降案例 双电机、四驱、650马力,27英寸大屏,这内饰看着可太有档次了! 2025年温州永嘉县事业单位引进博士研究生公告 2025年杭州市上城区丁兰街道卫生服务中心编外工作人员招聘公告 2025年金华市兰溪市“人才直通车”(事业综合)人才引进公告 2025年徐州泉山经济开发区投资发展有限公司总经理选聘公告 2025年沅陵县招聘专职森林消防员公告(10人) 2025年龙州县公安局招聘辅警工作简章(11人) 2025年东源县乡村公益性岗位安置人员招聘的公告 2025年阳江市阳东区区内选调教师公告(22人) 中国农业科学院:将打造“三农”领域国家高端智库 零跑汽车去年四季度净利首次转正,预计2024年营收增长不低于80% 千年前的帝王与市井,祝勇新书在故宫解码宋代文化 全球大师“添砖”:环南昆山-罗浮山引领区建筑艺术计划发布