2023年 | プレスリリース?研究成果
【TOHOKU University 虎扑电竞er in Focus】Vol.023 言語哲学発、チャットGPT経由、脳科学行き
本学の注目すべき研究者のこれまでの研究活動や最新の情報を紹介します。
東北大学大学院情報科学研究科 坂口 慶祐 准教授
大学院情報科学研究科 坂口 慶祐 (さかぐち けいすけ)准教授
チャットGPTが大きな話題です。もう少し先のことかと思われていたAI(人工知能)時代が一気に到来したかの感もありますが、どうなのでしょう。コンピュータによる自然言語処理を専門とする坂口さんは、とりあえず使っていく中で、大きな可能性を見出すとともに、新しい問題や限界も見えてくるとはずと見ています。
チャットGPTとは?
アメリカのITベンチャーOpenAIが開発したAIによる対話サイト(チャットボット)がチャットGPTです。チャットで質問を送ると、AIが機械学習によって得られた回答を返してくれます。2022年11月に公開され、自然な会話ができることから世界中で話題となっています。
坂口さんによると、人間と自然な対話ができるAIの自然言語処理能力を高め、現時点までに積み上げられてきた機能を集約させたのがチャットGPTなのだそうです。誰でも無料で簡単に使えるインターフェースで公開したことで大きな反響を呼んだのでしょう。
対話も自然で、人を傷つけるようなことはできる限り言わないようにフィルターがかけられている点も大ヒットの理由の1つだろうと、坂口さんは評価しています。
ただし、事実関係で間違ったことを、途中から流暢に語り出したりします。細かなところは正しくても、途中で文脈に合わないことが挿入されていたり、一箇所ずれると、全体の辻褄を合わせるために嘘を重ねていくなど、言うなれば「口八丁」の傾向が見て取れます。使うにあたっては、事実確認(ファクトチェック)が必要です。
大まかな仕組みとしては、インターネットから機械的にダウンロードしたたくさんのテキストを覚えるなかで、特定の単語の後に続きやすい単語を抽象化して覚えているのだそうです。そういうふうに、テキスト中での単語のつながり方の確率である自然言語モデルを学習し、文脈に応じて確率が高くなるように文章を組み立てているのです。なので、基本的にどんな言語にも対応できます。唐突に日本語に出合っても、次に続く単語を予測できるのです。
ただ、ウェブ上に流れているテキストは圧倒的に英語が多く、学習しているテキストの言語も英語が占める割合が高いので、必然的に英語の方が得意です。そのため、政治的にも偏りがあったり、西洋の文化や宗教の価値観に沿った文章になりやすい弊害があるとの指摘もあるそうです。
坂口さんお勧めのチャットGPT活用法は、英語学習とプログラミング学習について気軽に質問できる家庭教師代わりに使うことです。前者については、GPTの言語モデルは、英語と和訳がペアになっている文書を学習することで英語と日本語の表現の対応をパターンとして覚えています。ウェブ上にあるプログラムのソースコードなども覚えているため、プログラムのミスも指摘してくれるので、プログラミング学習にも使えるのだそうです。
GPTに最近のことを聞くと、すみません2021年9月以前の知識しかありませんと、正直に答えたりするそうです。このようなフィルターも、人を傷つけるような発言をしないフィルターとともに実装されているようです。GPTは、大量のデータを用意した上でGPU(画像処理装置)を動員して学習させており、莫大な時間と経費がかかっているようです。学習効率はまだまだ悪いことから、最新の事情には疎いのです。ただし現状でも、昨日の記事を見せた上で意見を聞くと、それなりの答えはするとのこと。その点、人間は常にアップデートできるところがすごいというのが坂口さんの実感だそうです。
今のところOpenAI社の一人勝ち状態ですが、自然言語モデルを効率よくトレーニングする方法が見つかれば、費用、コストの面でOpenAI社を脅かす新しいスタートアップが登場する余地もあるかもしれません。
ドットをつなぐ人生
坂口さんは、早稲田大学第一文学部の哲学科を卒業しました。人間が言語を巧みに操れるのはなぜなのか、周りの空気を読んだり、みなまで言わなくてもわかったり、曖昧な表現を理解できるのはなぜなのかが不思議だったり、言葉の意味が気になっていたとか。そこで最初は過去の哲学者が考えていたことから勉強を始めたそうです。
学部卒業後は、英語の勉強も兼ねて、イギリスのエセックス大学の修士課程に留学しました。専攻は心理?神経言語学で、英語の過去形を処理する時間の違いをネイティブとノンネイティブで比較する実験などをしていたそうです。学部時代の哲学とは違い、実験を通して仮説を科学的に検証する作業が新鮮だったといいます。
しかし、ひとつひとつの実験で確かめられることはごく限られていました。問題意識として持っていた、人間の言語処理能力のメカニズムをすべて明らかにすることは難しそうだと感じていました。そんなこともあり、帰国後は理化学研究所脳科学総合研究センターの研究チームに技術補佐員、I B Mでシステムエンジニアとして働いた後に、奈良先端科学技術大学院大学情報科学領域の修士課程に入り、コンピュータに言葉を処理させる研究に舵を切りました。博士課程はアメリカのジョンズ?ホプキンズ大学に進学しました。
自然言語処理の大きなゴールの1つは言語の翻訳や人間とのスムーズな対話です。チャットGPTはその一里塚と言えます。奈良先端大の大学院に入ったとき、最初にやりたいと思っていたことがまさにこういう対話式アプリケーションだったのです。
しかしGPTにはまだ限界もたくさん見られます。AIチャットボットの研究開発一時凍結も話題になりました。OpenAI社は個人情報を学習に使ったりはしないと言っていますが、確認しようがありません。個人の権利意識が高いヨーロッパの国々には、1社への依存は危険ということで奨励をためらう傾向もあるようです。
悪用の危険性ということで言えば、政治的な煽動に利用されたり、マーケティング用の文章で不利益を誘導される可能性もあります。アメリカでは、機械学習の過程でアート等の著作権を侵害しているという訴えが多発しているようです。日本の著作権法は2018年の法改正で、権利者の許諾なしにAIに著作物を読み込ませて学習させることができる方向で法整備が行われました。先ごろ来日したOpenAI社の最高経営責任者(CEO)も、開発拠点の1つを日本に開設する可能性を示唆していました。
こうした状況の中で坂口さんは、現在はGPTのような大規模言語モデルに対する包括的な評価や人工知能の倫理などを研究対象としています。当面は、リアルタイムの情報を対話形式でスマートにやり取りするシステムの構築を目指しています。
しかしやはり、言葉とそれを操る人間の能力への興味は抑えがたいそうです。坂口さんに言わせれば、AIと人間の脳の違いは、たとえるなら飛行機と鳥にあたるそうです。どちらも空を飛ぶが、細かい原理や仕組みは違っています。GPTはものすごい電力を消費していますが、それよりもはるかに精緻なことをこなしている人間の脳はきわめて省エネにできています。いつかはまた、人間の脳の仕組みに迫る研究をしたいと語ります。
坂口さんの好きな言葉の1つは、アップル社の創業者スティ―ヴ?ジョブスの、「未来を見据えてドット(点と点)をつなげることはできない。過去を振り返ってドットをつなげることができるだけだ」だそうです。傍から見るとジグザグな人生を送ってきたように見えけれど、何事もチャレンジで、今はそのすべてが人生の糧になっているそうです。
文責:広報室 特任教授(客員) 渡辺政隆
関連リンク
問い合わせ先
東北大学総務企画部広報室
Email:koho*grp.tohoku.ac.jp(*を@に置き換えてください)