Stefano V. Albrecht, Cillian Brewitt, John Wilhelm, Balint Gyevnar, Francisco Eiras, Mihai Dobre, Subramanian Ramamoorthy
自動運転のための車両の行動の長期予測と自車両の経路計画を行うIGP2(Interpretable Goal-based Prediction and Planning )を提案する。IGP2は合理的な逆計画(rational inverse planning)を行うことで、他車両のゴールを認識し、そのゴールの予測に基づいてモンテカルロ木探索(MCTS)することで自車両の最適な行動を計画する。これにより他車両の説明可能かつ長期間の予測および自車両の計画を行うことができる。IGP2には比較的標準的な計画法が使われており、POMDP-based planner[34]などの他のテクニックに置き換えることで、IGP2のアプローチの根底にある一般原則は、自動運転だけでなく、ロボットと人、ロボットとロボットが相互に関わる領域に活用することができる。
車両がレーン追従、レーンチェンジ、右左折、停止など有限数からなる高レベルの行動セットの一つを使うという仮定を置いて予測を行う方法がある。これらは観測された軌跡をもとに現在の行動を検出する。そのため、検出された高レベル行動が有効な期間だけに制限される。
すべての車両は各時刻でlane-follow, lane-change-left/right, turn-left/right, give-way, stopのいずれかのManeuver\(w\)を実行すると仮定する。また道路の情報にもどついた動作macro actionsを設定する。
IGP2アルゴリズムは次の手順で自車両のmacro actionを計算する。
microscopicな都市の交通シミュレーションによりIGP2を評価した。オクルージョンがある場合でも他車両のゴールをロバストに認識した。また重要な機会を逃すことなく、走行することで、消極的な方法と比べて走行時間の短縮が行えていることを示した。
車両の動作が決められたシナリオは4つで用意した。シナリオの全てで他車両はマニュアルのヒューリスティックに基づいてゴールに向かって走行する。各車両の加速度およびステアリングのためのコントローラは独立であり、車間維持のためにIDM(Intelligent Driver Model)が使われている。自車両は青色。他車両の予測経路を確率の高い順から2個表示している。各経路の色の濃さは、その道を進む確率である。各車両の縦位置を±10m、速度を[5, 10]msの範囲で変更して、100個のシナリオを作成した。
各シナリオでIGP2は以下のように行動した。
(a) S1 自車両のゴールは東側に位置する青色の円である。車両\(V_1\)は自車両と同じ道路を走行している。車両\(V_1\)は左車線から右車線へレーンジェンを行ったところである。交差点から侵入する車両\(V_{2}\)がいるため、車両\(V_1\)が自車両が向かう東に行く場合、レーンチェンジをすることは不合理である。このことから車両\(V_1\)が交差点を右折するという信念にむかって自己の予測にバイアスをかける。自車両はこのまま進むと速度を落とすことになるので、レーンチェンジを決断する。
(b) S2 自車両のゴールは西側に位置する青色の円である。車両\(V_1\)は東から、車両\(V_2\)は西から交差点へ侵入しようとしている。車両\(V_1\)は交差点で曲がるために速度を落とし、右折するために待つ。もし車両\(V_1\)が直進や左折をする場合、速度を落とすことは不合理なので、車両\(V_1\)が右折する信念は大幅に高まる。車両\(V_1\)は車両\(V_{2}\)が交差点をすぎるまで待つと予測します。このことから自車両は交差点に侵入し左折を行える機会がある。
(c) S3 自車両のゴールは緑色の円である。車両\(V_1\)は内側から外側へレーンチェンジをし、速度を落とすところである。車両\(V_1\)が南の出口に向かう信念は増加する。このことから自車両は車両\(V_1\)が交差点を出る前にラウンドアバウトに侵入することができる。
(d) S4 自車両のゴールは紫色である。左の交差点の信号が赤のため、交差点前に車が2台止まっている。車両\(V_1\)はその2台の後ろを走行している。車両\(V_{2}\)は反対車線を走行している。車両\(V_1\)が右の交差点前で止まるとする。このとき、車両\(V_1\)のゴールが北や西のゴールであることは合理的ではないので、新しいゴールを車両\(V_1\)を止まった場所に生成し、ゴール分布をその新しいゴールに向かってシフトさせる。車両\(V_1\)は自車両を先に入れることを望んでいると解釈できる。
4つシナリオにおいて正しいゴールに割り当てられた平均確率を次に示す。図より証拠が増えるに連れて、正しいゴールへの確率が増加していることがわかる。殆どの場合に置いて車両がゴールに到達するまでに、正しいゴールへの確率が1に近づく結果となった。
IGP2および次に示すアルゴリズムでシナリオS1~S4を走行させ、走行時間の比較を行った。表2より、IGP2-MAPが一番、IGP2が2番目に走行時間が短いことがわかる。
Algorithm | Description |
---|---|
IGP2MAP | IGP2のMCTSにおいて、最も有望なゴールとそれに基づく予測のみを使うアルゴリズム |
CVel | ゴール認識による予測の代わりに現在の速度を使って定速およびレーン追従の予測を使うアルゴリズム |
CVel-Avg | CVelと似ているが、過去2秒間の速度の平均を定速およびレーン追従の予測を使うアルゴリズム |
Cons | CVelと似ているが、優先道路にいるすべての対向車両がすぎるまで待機する消極的なアルゴリズム |
シナリオS3およびS4の車両\(V_1\)の行動を想定外の状況が起きるように変更した。
改変したシナリオで実験を行ったところ、IGP2が無事故であったが、IGP2-MAPは衝突した。
重要な課題として以下のケースが考えられる。
Contingencies from Observations: Tractable Contingency Planning with Learned Behavior Models
なし