【要点】

・2026年1月、ハルビン工業大学(HIT)の研究チームが宇宙機ランデブー・ドッキングの自律制御手法を報告した。
・報告によると、提案手法は模倣学習(専門家の操作例から学ぶ学習法)を用い、精密な動力学モデルへの依存を抑えることを狙う。・手法名はIL-SRDで、専門家デモ(最適化手法等で作成した操舵データ)から6自由度(位置3軸+姿勢3軸)の制御系列を学習する。 ・制御生成にはTransformer(時系列データの依存関係を学習するモデル)を用い、長い時間範囲の予測での安定性向上を課題に据えた。 ・「anchored decoder target」と呼ぶ仕組みで、状態に基づく制約をかけ、逐次予測で不自然な操作が出ることを抑えるとしている。 ・さらに、時間方向の誤差蓄積を抑えるための時間集約(temporal aggregation)を組み込み、長時間の予測安定性を高める構成とした。 ・シミュレーション評価では、精度とエネルギー効率を両立するモデルフリー制御を示し、未知外乱がある条件でも性能を維持したと述べている。 ・研究チームは、宇宙ステーション組立、軌道上サービス、デブリ除去などの自律運用に資する基盤技術として位置付けている。

【編集部コメント】

軌道上のランデブー・ドッキングはモデル誤差や外乱の影響が大きく、運用コストも課題になりやすい。専門家データから制御方策を学ぶ模倣学習は、従来のモデル依存型制御を補完する選択肢として整理できる。一方で、シミュレーション結果と実機・実運用での成立性は条件が異なるため、今後は実機系の検証や安全要件に沿った評価設計が焦点となる。

【出典情報】

公式リリース

なし

参照情報(報道)
Quantum Zeitgeist: Learning Six Degree Freedom Spacecraft Docking
Quantum Zeitgeist
arXiv: Learning Six Degree Freedom Spacecraft Docking
arXiv