作为机器人通过学习获得前馈动作的方法,用 Spline 函数表示控制输入的时间波形,在动作行为的反复试行中通过评价函数让输入波形变化,进行“探索性的学习”。为进行高效地搜索,采用启发式(heuristics)方法的算法,进行逐次修正和高效搜索。 由启发式方法反复进行试行错误实验,对于给定条件,可以生成良好的动作。可是,如果树枝间距等控制条件发生变化情况下,用以前的条件得到的前馈动作在新的条件下已经不适合了,所以必须再次进行试行错误,以不断适应于环境的变化。因此,本节通过插补几个控制条件下得到的经验值,论述在未经历条件下进行控制的方法。然后,一边用它们进行反馈控制,一边让树枝间距和高度都不相同时...