運転行動モデリング(DBM)は,自動運転の分野で, 車両がとるべき安全な運転行動を予測する技術として広く利用され ています.統計によると,信号のない交差点で事故が起こりやすく, そのような場所での運転行動モデリングは非常に重要です.
近年,教師データを用いたモデリング手法である逆強化学習 (Inverse Reinforcement Learning, IRL)がDBMの技術として注目されています.しかし,既存の逆強化学習に基づくDBM手法では, 無信号交差点で重要視される, 滑らかな運転と適切な停止行動の両立ができません.既存の手法では,滑らかなパスを生成できる手法(Viterbiアルゴリズム) では車両は一時停止線付近で長時間停車してしまう問題,停止時間を精度よくモデル化する手法(確率的生成)では, 極端な加減速を頻繁に行う実際の運転行動にそぐわないパスが生成 される問題があります.これらは,人間の運転行動と異なるため, たとえ安全な運転行動といえども, 快適な運転行動とはいえません.
本研究は, 適切な停止行動と平滑な運転を両立したパスを生成するために, 停止線の位置に応じて対象無信号交差点を3つの部分に分割し, それぞれモデリングを行う,逐次MDP (sequential MDPs) を提案しました.また,特に一時停止無信号交差点で重要となる, 一時停止線周辺での停止行動について, ポアソンモデルを用いることで人間の運転行動に近い停止行動を生 成する手法を実現しました.実際の運転データを用いた実験の結果, 提案手法は無信号交差点において, 適切な停止行動と平滑化された運転を両立したパスを生成できるこ とが示されました.さらに追加実験により,提案手法のモデリング性能における,ベースラインに対しての統計的優位性について検証した結果をiv2021で発表しました(Yang et al., IV 2021).
関連論文
Shaoyu Yang, Hiroshi Yoshitake, Motoki Shino, Masamichi Shimosaka.
Driving Behavior Modeling at Unsignalized Intersection with Inverse Reinforcement Learning on Sequential MDPs.
第21回(社)計測自動制御学会システムインテグレーション部門講演会(SI2020)講演論文集, 2020.
Driving Behavior Modeling at Unsignalized Intersection with Inverse Reinforcement Learning on Sequential MDPs.
第21回(社)計測自動制御学会システムインテグレーション部門講演会(SI2020)講演論文集, 2020.
Shaoyu Yang, Hiroshi Yoshitake, Motoki Shino, Masamichi Shimosaka.
Smooth and Stopping Interval Aware Driving Behavior Prediction at Un-Signalized Intersection with Inverse Reinforcement Learning on Sequential MDPs.
The 2021 IEEE Intelligent Vehicles Symposium (IV 2021)