八大胜在线体育_八大胜在线注册
  • 首页
  • 八大胜
    • 中心介绍
  • 新闻公告
    • 学院资讯
  • 科学研究
    • 科研动态
  • 合作交流
    • 学术交流
  • 八大胜在线
  • 首页
  • 八大胜
    • 中心介绍
  • 新闻公告
    • 学院资讯
  • 科学研究
    • 科研动态
  • 合作交流
    • 学术交流
  • 八大胜在线

新闻公告

  • 学院资讯

学院资讯

  • VLA新的推理范式!一致性模型CEED
  • NVIDIA建议GDDR6视频内存GPU激活ECC,以防止
  • 新功能的Apple 26地图应用程序已暴露。
  • 它已经闲置了4年以上,政府已经采取了
  • Meta花费了35亿美元,以在Ray-Ban Glass母公司
  • Anhui省级文化交流的“小孟利星球计划”
  • 伦敦黄金的交易的利润率是多少?什么时
  • 苹果iPhone 16 Pro Max 5G手机256GB黑色钛金属价

学院资讯

VLA新的推理范式!一致性模型CEED
作者:365bet体育日期:2025/07/16 浏览:
本文的第一作者是香港科学技术大学(广州)机器人科医生的一年级学生Song Wenxuan。研究的主要方向是VLA模型。共射击作者是香港科学技术大学的研究助理Chen Jiayi。该项目的负责人是Ding Pengxiang,这是一项医生的研究,对Zhejiang University和West Lake大学的联合培训。他们还是Intelligence,OpenHelix和Llava-Vla领域开放项目资源的研究团队。相应的是广州香港科学技术大学的Li Haoang教授。他将在CVPR2025中获得CVPR2025最佳纸张候选者。近年来,由于对多模式和能力的广泛了解,视觉语言行动(VLA)模型已成为机器人领域的重要方向。尽管相关TE有重大发展Chnologies,VLA模型在实际扩展中受到速度速度瓶颈的严格限制,尤其是在高频和良好操作等活动中。为了应对这个问题,一些研究建议使用雅各比的解码来代替传统的自回归解码以提高推理的效率。但是,由于雅各比的解码通常需要大量迭代,因此其加速的效果相对限于训练。因此,我们建议使用派遣蒸馏训练策略,该策略使该模型同时预测许多正确的动作令牌,从而实现了加速度。 Kasabay,我们设计了一种混合标签的给药机理,以减轻疏散过程中可能出现的误差积累问题。尽管上述过程带来了可接受的加速作用,但我们更加知道,雅各比的解码中仍然有许多不良步骤,这已成为一个主要瓶颈以限制整体效率。为了充分解决这个问题,本文提出了一种提前出口解码策略,这进一步通过适度放松的收敛条件来提高构想的平均效率。 Pamagat ng papel: CEED-VLA: Consistency Vision-Language-Action Model na may Maagang-Sexit Decoding Project Home Page: https://irpn-eai.github.io/ceed-vla/ Paper Link: https://arxiv.org/pdf/2506.13725 Code Link: Ipinapakita ng mga resulta na ang Pamamaraanwe建议,它已经达到了加速许多基线模型的4倍以上,同时保持了模拟和实际机器人活动的高任务成功率。这些实验证实了这种方法在通过灵活性加速机器人的多模式决策处理过程中的效率,它显示出很棒的应用程序前景。通常,我们做出以下三个主要贡献:(1)我们提出了一种速度-VLA加速度的一般方法,该方法是SIG在保持操纵性能的同时,很大程度上提高了识别速度。 (2)我们引入了一种恒定的蒸馏机制,并将混合标签给药与自动锻炼中的损失结合在一起,以实现有效。 。图1:比较加速解码的各种方法的效果图2:CEED-VLA的CEED-VLA架构的结构图,我们提出的框架是通过预先训练的VLA模型(例如LLAVA-VLA和OpenVLA)的几代人练习的。然后,我们设计了一个很好的故事,并引入了一种管理混合标签小说的方式,以培训学生的模型,同时确保准确性和速度提高。最后,我们提出了早期退出解码技术,以进一步提高推理速度。模拟环境和现实世界中的实验表明,此过程显着提高了模型的理解速度以及敏捷活动的成功率,而无需轻松蛋白g工作的速度。为VLA的目标模型练习相同的操作,以使雅各比轨迹的固有性在训练中的培训,我们首先通过使用jacobi解码来预测机器人数据集C.训练C.实践 - 具有两个目标:Boottrap可以预测许多前进的代币,从而收集完整的Jacobi轨迹。 Upang Matiyak Na Ang Modelo Ay Maaaring Makabuo Ng Mga Aksyon Na Naaayon Sa Pangwakas Na Layunin sa anumang sa anumang haumang haumang hakbang sa tilapon,ang pagkakaiba -iba -iba -iba -iba ng kl kl ay ipinakilala bilang bilang bilang pagkawala ng pagakakapare -pareho -pareho -pareho -pareho。在简介中。混合标签AR监督:为了维持模型自动化产生的常规能力,CEED-VLA使用教师模型数据和管理数据来确保动作的准确性。训练的最终目的是两种损失的重量。训练过程如下:图4 deco早期的一致性图5的丁字算法:解码雅各比解码的四种方法可以使动作令牌的对齐输出在特定的过程中的理解速度提高了程度,但严格的连接条件改善了。到目前为止,我们建议提前出口解码策略:当未满足Hinjacobie的复发条件时,通过早期发布预测的中间预测的输出模型。由于操纵活动的独特结构,解码提前出口可以显着提高识别速度,同时保持成功率,从而使模型能够以较高的频率控制机器人以满足实时活动的需求。仿真环境基准实验(仿真基准)图6:模拟的主要实验结果在最具挑战性的活动中仿真结果Calvin ABC-D和Libero-Lengthy Benchmark表明CEED-VLA的速度超过了预见的速度以上实施频率而不会失去成功率。现实世界图9:真实的机器实验部署设置图10:毛巾堆叠任务的比较上面的图显示了LLAVA-VLA模型的真实性能。达拉斯机器人臂的操作很低,因此很难完成诸如幼犬毛巾之类的灵巧操作任务。它通常无法捡起或只是抓住一侧,从而导致任务失败。下图显示了CEED-VLA模型的实验效应。由于增加了推理的频率,机器人臂可以平稳而成功地完成灵巧的操作任务。图11:CEED-VLA现实世界中的实验结果。 CEED-VLA显着提高了理解和控制频率的速度,从而使模型可以学习和执行高频动作,因此,令人惊叹的活动中基线的成功率大大提高了70%以上。
上一篇:NVIDIA建议GDDR6视频内存GPU激活ECC,以防止RowHamme
下一篇:没有了
相关文章
  • 2025-07-16VLA新的推理范式!一致性模型CEED
  • 2025-07-15NVIDIA建议GDDR6视频内存GPU激活ECC,以防止
  • 2025-07-14新功能的Apple 26地图应用程序已暴露。
  • 2025-07-13它已经闲置了4年以上,政府已经采取了
  • 2025-07-12Meta花费了35亿美元,以在Ray-Ban Glass母公司
友情链接:
地球科学常用网站:
  • 中国地质调查局
常用学术网站:
  • 国家自然科学基金委员会
联系电话:020-66889888
Copyright © 2024-2026 八大胜在线体育_八大胜在线注册 版权所有

网站地图