本文へ
ここから本文です

「好奇心」によって性能を改善した対話型AIを開発 - 次世代タスク指向対話システムの高度化に貢献 -

【本学研究者情報】

〇大学院工学研究科 教授 伊藤彰則
研究者ウェブサイト

【発表のポイント】

  • チケット予約など、人から頼まれたタスクを遂行するためのシステムをより賢くする対話型人工知能(AI)(注1の新しい手法を開発しました。
  • AI自体がシステムの学習時に報酬を受け取り、新しい状況を探求するための「好奇心」を持つことで、より効率的な対話が可能になります。
  • 複数のAI学習者(エージェント)を競合させ、最も優れたエージェントを選び出すことで、対話の成功率を向上させました。

【概要】

ChatGPTなどに代表される、自然言語を使う対話型AI技術は、ここ数年で劇的に発展し、チャットボットをはじめとした様々なシステムに活用されるなど、日常のタスクの自動化や効率化が進んでいます。しかし、現状の対話型AIは、タスク達成に不要な質問をしてしまうなど、必ずしもタスク達成の効率が十分ではありませんでした。

東北大学大学院工学研究科の牛雪澄大学院生と伊藤彰則教授らの研究チームは、映画のチケット予約などのタスクを効率的に行うための新しい対話システムを開発しました。このシステムは、AIがユーザと対話しながら、適切な行動を学習する技術を使っています。

対話システムが適切に行動するためのシステム開発手法に、将棋や囲碁のAIにも使われている強化学習(注2があります。今回の研究では、強化学習に「好奇心駆動型の探索方法」を導入しました。さらに、強化学習を行うAIエージェント(注3を複数競合させ、もっとも適切に振る舞うことのできたエージェントを選別することで、対話によるタスク達成の成功率を向上させ、また達成までの対話回数を減らすことに成功しました。

本研究の内容は、9月17日に、米国電気電子学会(IEEE)の学術誌「IEEE Access」に掲載されました。

図1. 様々な対話システムの性能比較(強化学習の一種であるQ学習の派生であるDQN(Deep Q-Network) 、DDQ(Deep Dyna-Q)など多数の学習法と比較)。横軸はタスク達成のための平均ターン数(システムとのやり取りの数、小さい方が良い)、縦軸は平均タスク達成率(大きい方が良い)。本研究の提案法(RCC-DDQ:好奇心駆動型の探索方法)は、少ないターン数で高いタスク達成率を得ることができた。

【用語解説】

注1. 対話型人工知能(AI):人間同士は、言葉で対話をしながら仕事を進めたり、あるいは楽しんだりします。それと同様に、言葉によって人間と様々なやり取りをするためのAIが対話型AIです。電話応答のオペレーターの代替やヘルスケアといった実用的な分野から、エンターテインメント分野まで、様々な応用があります。

注2. 強化学習:強化学習(Reinforcement Learning)は、人工知能(AI)の一分野で、エージェント(学習者)が環境と相互作用しながら最適な行動を学習する方法です。エージェントは行動を選択し、その結果として報酬(または罰)を受け取ります。このプロセスを繰り返すことで、エージェントはどの行動が最も良い結果をもたらすかを学習します。強化学習は、ゲームのAI、自動運転車、ロボット制御、金融取引など、さまざまな分野で応用されています。エージェントが環境との相互作用を通じて、複雑なタスクを効率的に解決できるようにします。

注3. エージェント:強化学習におけるエージェントは、環境と相互作用しながら最適な行動を学習する主体です。エージェントは行動を選択し、その結果として得られる報酬を基に学習を進めます。例えば、迷路を解くロボットでは、ロボットがエージェントであり、環境(迷路)の中を動き回りながら、最適な脱出方法を試行錯誤によって学習します。同様に、本研究でのエージェントは、ユーザと対話をしながら、ユーザの要求を最も効率的に満たす対話方法を試行錯誤によって学習します。

【論文情報】

タイトル:A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning
著者:Xuecheng Niu, Akinori Ito, Takashi Nose
*責任著者:東北大学大学院工学研究科 大学院生 牛 雪澄
掲載誌:IEEE Access
DOI:10.1109/ACCESS.2024.3462719

詳細(プレスリリース本文)PDF

問い合わせ先

(研究に関すること)
東北大学大学院工学研究科通信工学専攻
教授 伊藤 彰則
TEL: 022-795-7084
Email: aito.spcom*tohoku.ac.jp
(*を@に置き換えてください)

(報道に関すること)
東北大学大学院工学研究科情報広報室
担当 沼澤 みどり
TEL: 022-795-5898
Email: eng-pr*grp.tohoku.ac.jp
(*を@に置き換えてください)

このページの先頭へ