一种基于“先想象后执行”的物体-动作一致性模仿学习框架