强化学习赋予高泛化性和鲁棒性 海量仿真数据高效训练双向训练框架串联多技能高质量真机数据对齐提升长程任务成功率 强大的场景落地能力 端到端技术架构:指令下达后,上层视觉语言模型(VLM)对桌上混乱摆放的商品进行分析,编排出商品的操作顺序,下层操作模型拆解出单个商品的子任务并依次执行高度的泛化能力:仅仅依靠20条真机数据,模型就成功实现了99%+的成功抓取率柔性物体的强适应能力:在仿真环境中模拟多种柔性物体的操作场景,同时结合真机数据进行微调优化。甚至在被打断、干扰的情况下,也能自适应调整策略,重新进行打包动作