テンミニッツTV|有識者による1話10分のオンライン講義
ログイン 会員登録 テンミニッツTVとは
社会人向け教養サービス 『テンミニッツTV』 が、巷の様々な豆知識や真実を無料でお届けしているコラムコーナーです。
DATE/ 2018.02.09

ディープラーニングだけではないAI進歩の秘密

 ディープラーニング(深層学習)によって、人工知能(AI)の画像認識精度が人間を超えたと騒がれたのが2015年。その成果はグーグルの「アルファGO」が囲碁チャンピオンを連破したことで世界に知られ、「AIにとってかわられる職業」が話題になりました。しかし、AIの進化に貢献したのはディープラーニングだけではありません。東京大学大学院工学系研究科技術経営戦略学専攻特任准教授でAI研究者の松尾豊氏に聞いてみましょう。

ディープラーニングで見直された「強化学習」

 松尾氏は、人工知能を研究開発する上でのレベルを4段階にまとめています。レベル1は「単純な制御プログラム」、レベル2は「古典的な人工知能」、レベル3は「機械学習ができる人工知能」、レベル4は「ディープラーニングを採り入れた人工知能」です。

 研究者たちがいま取り組んでいるのはレベル3とレベル4の段階なのですが、一般の家電で「AI」を称しているのはレベル1、質問対応ソフトや診断プログラムなどはレベル2で、一般人はあまりちゃんと区別せずに「AI」の言葉を使っています。

 また、すでにレベル4まで来ているなら、レベル3に戻る必要はないと思う人もいるでしょう。実はディープラーニングにより画像認識精度が上がったことと、ウェブなどにたまったビッグデータの組み合わせによって、機械学習の中でも「強化学習」が再度クローズアップされているのです。

偶然のラッキーをリピートするのが強化学習

 強化学習は、もう100年も前から研究が続けられてきた分野で、大雑把に言うと「行動を学習するしくみ」です。人間でいえば、サッカーボールを蹴っているうちにだんだん上手になるようなこと。「習うより慣れろ」と言われる習熟のプロセスには、たまたまうまく蹴ることができたときに、「今のはうまくいった」と感じて、その蹴り方を繰り返すというしくみが含まれているのです。

 「今のはうまくいった」と感じることは、脳の「報酬」になります。報酬が与えられることにより、行動が強化され、だんだん上手になっていく。これが強化学習のしくみなのですが、コンピュータにそれを覚えさせるには、「状況」と「行動」、そして「よかったか/悪かったか」をセットしなければなりません。

 これまでの強化学習では、「状況」を記述するのに、人間が定義した変数を使ってきました。ところが、ディープラーニングと組み合わせる方法にすると、画像認識で出てきた特徴量が使えます。違いはそこだけなのに、生まれた変化には非常に大きなものがあります。

状況がわかって、報酬があれば、熟練はできるのだ

 ディープラーニングと強化学習を組み合わせ、ゲームを学習するAIを作ったのが、ディープマインドという会社です。2013年にその技術を開発し、2014年にはグーグル社に買収されています。

 「ブロック崩し」も「スペースインベーダー」も、スコアを報酬と見ることにより、同じプログラムで学習させることができます。これまでだと、いちいち「これがインベーダー」「これがミサイル」「これが自分」という定義をしてやらないといけなかったのが、画像入力だけでOKになりました。

 この技術を応用すればロボットの行動に「熟練」が見られるようになることは、すぐに予測がつきます。2015年5月、カリフォルニア大学バークレー校は「試行錯誤しながら組み立て作業を行う」ロボットのBRETTを発表しました。

 考えてみると熟練は、人間だけが行なえる複雑なことではなく、犬でも猫でもできることです。AIに今までこれができなかったのは状況をつかむことができなかったから、と松尾氏は解説しています。

 状況がわかり、報酬のうまみをたっぷり浴びたAIは、これからどんなロボットに成長していくのでしょうか。
~最後までコラムを読んでくれた方へ~
雑学から一段上の「大人の教養」はいかがですか?
明日すぐには使えないかもしれないけど、10年後も役に立つ“大人の教養”を 5,300本以上。 『テンミニッツTV』 で人気の教養講義をご紹介します。
1

ぺゼシュキアン新大統領誕生とイラン最高指導者の持つ意味

ぺゼシュキアン新大統領誕生とイラン最高指導者の持つ意味

ペゼシュキアン大統領とイラン・イスラエル(1)新大統領誕生の背景とその意味

2024年8月、イランにぺゼシュキアン新大統領が誕生した。改革派であり、前評判の高くなかった氏の当選は、最高指導者ハメネイ師の意向によるものとの見方が一つ。また、新大統領の政策は核合意の再開に向けたもので、EU等の西側...
収録日:2024/08/07
追加日:2024/09/20
山内昌之
東京大学名誉教授
2

山上憶良が「沈痾自哀文」で問いかけた因果応報の問題

山上憶良が「沈痾自哀文」で問いかけた因果応報の問題

山上憶良「沈痾自哀文」と東洋的死生観(1)因果応報と日本仏教の課題

『万葉集』にさまざまな歌を残した山上憶良は、8世紀の「知の巨人」と目されている。例えば彼は、「善行を積んできた自分が報われず、老いの醜態をさらす惨めな状況になったのはなぜか」という問いを「沈痾自哀文」に残した。こ...
収録日:2024/04/02
追加日:2024/07/12
上野誠
國學院大學文学部日本文学科 教授(特別専任)
3

『失敗の本質』より先に指摘した日本型組織の弱点

『失敗の本質』より先に指摘した日本型組織の弱点

『タテ社会の人間関係』と文明論(7)日本型組織とリーダーシップの問題

日本軍研究で知られる『失敗の本質』よりも前に、日本型組織の弱点を指摘していた『タテ社会の人間関係』。日本の軍隊と英米の軍隊を例にとって、人間関係を重視する日本型組織の特徴を鋭く指摘、さらに法然と弟子の話を取り上...
収録日:2024/05/27
追加日:2024/09/19
4

どうすれば「最高の睡眠」は実現するか…健康な睡眠とは?

どうすれば「最高の睡眠」は実現するか…健康な睡眠とは?

「最高の睡眠」へ~知っておくべき睡眠常識(1)健康な睡眠のための方法

人生の約3分の1を、人は寝て過ごす。人間にとって不可欠な「睡眠」について、まだ分かっていないことが多く、睡眠ストレスや寝不足に悩む人は多い。現代人はどのように生活すれば最高の睡眠を得られるのだろうか。その前に、そ...
収録日:2021/06/23
追加日:2021/09/14
西野精治
スタンフォード大学医学部精神科教授
5

『風と共に去りぬ』で表現されたアイルランド移民の精神史

『風と共に去りぬ』で表現されたアイルランド移民の精神史

アメリカの理念と本質(5)アメリカのアイルランド問題

アイルランド本国で始まったアングロ・サクソンからの差別は大西洋を越えても消えず、逆にアメリカへ移民するアイルランド人たちに不撓不屈の精神を植え付けた。名作『風と共に去りぬ』には、その姿がビビッドに描かれている。...
収録日:2024/06/14
追加日:2024/09/17
中西輝政
京都大学名誉教授