Product_Psi R0_zh - 灵初智能

强化学习赋予高泛化性和鲁棒性

海量仿真数据高效训练
双向训练框架串联多技能
高质量真机数据对齐提升长程任务成功率

强大的场景落地能力

端到端技术架构：指令下达后，上层视觉语言模型（VLM）对桌上混乱摆放的商品进行分析，编排出商品的操作顺序，下层操作模型拆解出单个商品的子任务并依次执行
高度的泛化能力：仅仅依靠20条真机数据，模型就成功实现了99%+的成功抓取率
柔性物体的强适应能力：在仿真环境中模拟多种柔性物体的操作场景，同时结合真机数据进行微调优化。甚至在被打断、干扰的情况下，也能自适应调整策略，重新进行打包动作