Saturday, 2025/05/24

  • 東京工業大学
  • 情報理工学院
  • 情報工学系
  • Switch Language
    • ja日本語
    • enEnglish (英語)

下坂研究室

Shimosaka Research Group pursuing MIUBIQ (machine intelligence in UbiComp Research)

  • ホーム
    • メンバー
    • 所在地
  • ニュース
  • プロジェクト
  • 発表論文
  • 受賞
  • アーカイブ
    • コード
    • データセット
Navigation
プロジェクト 高次元連続状態空間における高速かつ安定な運転行動モデリング

高次元連続状態空間における高速かつ安定な運転行動モデリング

2021/03/15 | プロジェクト | 1549 views |

高次元連続空間における高速・安定な運転行動予測

 近年,自動車の適切な運転行動予測の研究が盛んに行われており,先進運転支援システム(ADAS)への応用が期待されています.運転行動予測では,適切な行動に対して高い値を返すような報酬関数を設計し,獲得する報酬を最大化するような制御入力列を求める方法が一般的です.中でも,iterative Linear Quadratic Regulatorやモデル予測制御などの手法が広く用いられていますが,これらは初期解に基づく空間のごく一部の局所的探索を行うため,大域的な視点で報酬の高い行動列の獲得が容易ではありません.

 一方で,安定した解を探索する方法として,空間全体を覆う木を生成するRapidly exploring Random Tree (RRT)が挙げられますが,自動車モデルの表現に必要な高次元空間を網羅するには多くの計算コストを要します.さらに,計算コストを抑えつつ非ホロノミックな運動系を扱えるようRRTを拡張した研究としてテンプレートベースRRT (Ma et al. ITSC2014) がありますが,RRTが抱える探索の非効率性の問題,として,1)単一木の網羅性の低さ,2)大量の枝・葉を有するRRTにおける報酬和の更新速度の遅さ,が残されています.

 その解決のために,本研究では.従来のテンプレートベースRRTに枝刈りと木の複数並列複数生成を組み合わせた,並列逐次枝刈り型RRTを提案しました.必要のない部分を枝刈りすることで,集中して報酬の見込みの高い場所を探索することが可能になります.

また,単体の木を生成していた既存のRRTとは異なり,小さい木を複数並列生成する方法により,コストを抑制しつつ効率的に空間を網羅することが期待できます.

これら二つのプロセスにより,高次元空間において高速性と安定性を両立した運転行動予測を実現します.性能比較実験では,幹線道路と交差点を想定したタスクにおいて,提案手法が既存手法よりも高速性と安定性が向上していることを実証しました.

運転行動モデリングのための高次元連続状態空間における逆強化学習

実際の運転行動では,緩やかな加減速や快適なハンドル操舵など,人の嗜好に沿った行動規範を扱う必要があるため,報酬関数が複雑になる傾向にあります.よって,それらの人手での設計には限界があり,直接上記の探索手法を用いることができません.その解決方法としてInverse Reinforcement Learning (IRL) が研究されています.IRLでは,実際の運転データから直接複雑な報酬関数を学習することができるため,近年注目を集めています.運転データには,ドライバの嗜好によって,図のような複数の最適な行動が含まれる場合があります.既存手法である最大エントロピーIRL (Ziebart, AAAI2008) は,確率的表現により,これらの準最適な行動を考慮した報酬の学習が可能なため,様々な意思決定タスクへの応用がなされています.

しかし,最大エントロピーIRLでは,分配関数の計算が必要であり,その計算コストは空間の次元数に対して指数的に増加するため,高次元連続空間での計算が困難です.運転行動予測では,位置や速度のみではなく車体角度や角速度など,多くの状態変数を扱う必要があるため,空間が高次元となる傾向があります.よって,最大エントロピーIRLはそのような高次元空間を扱えず,自動車モデルの詳細な表現ができません.また,最大エントロピーIRLを近似し,高次元空間への適用を試みる研究も行われていますが,安定性と高速性と両立した学習には,効率的なパスプランニングと適切なパラメータ更新の組み合わせが求められ,既存の方法ではそれらを成し遂げられてはいません.
本研究では,パスプランニング手法として,先述した並列逐次枝刈り型RRTを適用し,効率的に報酬の高いパスの探索を行います.また,得られた木を元にパスの尤度を独自に定義し,それらを用いてパスをサンプリングすることで,RRTをベースとした重点サンプリングによるパラメータ更新を定式化しました.これら二つの組み合わせにより,最大エントロピーIRLを精度よく近似した,高速・安定な学習モデルを提案します.

また,車線変更と交差点での右左折タスクを用いた性能評価実験を行い,提案手法が既存のIRLモデルと比較して,高速かつ安定して教師データの行動規範が復元可能なことを確認しました.

Publications

逐次枝刈り型RRTの並列化による高速かつロバストな運転行動予測
細馬 慎平, 須ヶ﨑 聖人, 竹中 一仁, 平野 大輔, 孫 理天, 下坂 正倫
第38回 日本ロボット学会学術講演会 予稿集, オンライン開催, 10 2020

RRT-based maximum entropy inverse reinforcement learning for robust and efficient driving behavior prediction.
Shinpei Hosoma, Masato Sugasaki, Hiroaki Arie, and Masamichi Shimosaka.
2022 IEEE Intelligent Vehicles Symposium (IV 2022), pp. 1353-1359, Aachen, Germany, 6 2022.

  • tweet

Comments are disabled for this post

Social Networks

  • twitter
  • rss

Recent News

  • 情報処理学会第84回UBI研究会で発表した論文が優秀論文賞を受賞しました 2025/03/05
  • LLMによるシーン中の物体の形容記述を用いた景観画像の印象予測 2025/03/04
  • 情報処理学会第87回全国大会にて研究室学生が受賞した山下記念研究賞の授賞式が行われます 2025/03/04
  • PerCom2025にて,周期的なUWBチャネルインパルス応答からのデバイスフリー行動認識について発表します 2025/02/15
  • 情報処理学会UBI研究会第85回研究発表会にて複数SISO Wi-Fiチップを用いたAoA推定,複合ウェアラブルセンサによる物体操作認識の検討 ,に関して2本の論文について発表します 2025/02/15
  • UBIシンポジウム2025にて都市動態予測に関するポスター発表を行います 2025/02/14
  • 訪問者の興味関心に基づいた大学の雰囲気分析についてIEEE Big Data 2024にて発表を行います 2024/12/13
  • 情報処理学会UBI研究会第84回研究発表会にて形容記述を用いた景観画像の印象予測に関する論文を発表します 2024/11/18
  • GPSログ・乗換検索履歴を活用した群衆混雑の予報に関する論文が 鉄道サイバネ・シンポジウムにて学生優秀論文賞を受賞しました 2024/11/18
  • 高精度な屋内測位のためのBLEビーコンの逐次的な配置最適化についてIPIN2024にて発表しました 2024/10/23

Search

Copyright 2015 · Shimosaka Research Group at TITECH