超初心者のための「ディープラーニング」入門講座

超初心者のためのディープラーニング入門講座
人工知能が人間の知能に追いつくのはまだ先のことと思われていました。しかし「ディープラーニング」の登場により人工知能の進化は一気に加速しています。

ディープラーニングと言う言葉。なんだか話題になっているけれど、どういうことかと聞かれるとよくわからない。そう思っている人も多いのではないでしょうか。ディープラーニングに関する本を手に取ってみたら何やら数式や用語が並んでいて閉じてしまった、という人もいるかもしれません。この記事ではディープラーニングの概要を数式抜きで見ていきます。

ディープラーニングが何かズバリ知るためには人工知能の歴史やディープラーニングに関連する技術についても知る必要があります。「ディープラーニングとはこういうもの!」と一言で言い表すのはちょっと難しいのです。

そういった周辺知識の解説にも触れながら、ディープラーニングの正体とそれがどんな場面で活用されているかを見ていきましょう。

 

超初心者のための「ディープラーニング」入門講座

スポンサーリンク

 

目次
1. ディープラーニングって何?
1-1. 人工知能とディープラーニングの関係
1-2. 機械学習とは?
1-3. ニューラルネットワークって何?
1-4. ニューラルネットワークの仕組み
1-5. ディープラーニングの解説

2. ディープラーニングの理解が深まる知識
2-1. 教師あり学習
2-2. 教師なし学習
2-3. バックプロパゲーション(誤差逆伝搬法)
2-4. 過学習

3.各企業の人工知能への取り組み
3-1. IBM
3-2. Microsoft
3-3. Google
3-4. Facebook
3-5. Amazon

4. 人工知能を取り巻く事情
4-1. 特化型人工知能(Narrow AI)と汎用人工知能(Artificial General Intelligence)
4-2. 人工知能と人工知能でないもの
4-3. 人工知能と創造性
4-4. ディープラーニングをはじめよう(書籍紹介等)

まとめ

 

ディープラーニングって何?

ディープラーニングって何?

人工知能とディープラーニングの関係

人工知能(AI)とは文字どおり人工的に作られた知能のことで、これを人間の知能に少しでも近づけるために様々な研究がなされています。その研究の中で開発された技術の一つ一つを人工知能と呼ぶこともあります。

「ディープラーニングの説明じゃないのか!どうしていきなり人工知能の話が出てくるんだ!」と思った方もいるかもしれません。

ディープラーニングというのは人工知能の精度をより良くするための技術の一つなのです。さて、人工知能とディープラーニングがどういう関係にあるのか具体的に見てみましょう。

人工知能とディープラーニングの関係

人工知能を実現するための技術はたくさんあります。その中でも「機械学習」という技術によって人工知能の精度はうんと上がってきています。

そして、その機械学習の分野を支える技術のうちの一つが「ニューラルネットワーク」です。

ニューラルネットワークの中には「ディープニューラルネットワーク」そして「ディープラーニング」といった技術が存在します。

ディープラーニングが何なのかを理解するためには、人工知能、機械学習、ニューラルネットワークといった言葉の意味を知っておく必要があるということを理解頂けたでしょうか。難しそう?大丈夫です。一つ一つ分かりやすく説明していきます。


 

機械学習とは?

機械学習というのは機械に自分で物を覚えさせる技術のことです。

例えば、「りんご」をコンピューターに覚えさせたいとします。機械学習が登場する前の技術では、人間がコンピューターに対して”りんごがどういうものか”を一つ一つ地道に教えなければなりませんでした。
機械学習とは? src=

「りんごは丸い」「りんごは赤い」「りんごは果物」など、りんごの特徴を教えてあげれば、コンピューターはりんごがどんなものなのかを把握することができます。

しかし、上図のコンピューターは青いりんごをりんごとは認めません。何故なら「青いりんごも存在する」ということを人間から教えてもらっていないからです。そう言った特徴を漏れがないように全ての概念に対して登録するという作業は非常に面倒です。

そこで、この登録をコンピューター自身でやってもらおう!というのが「機械学習」なのです。


 

ニューラルネットワークって何?

機械学習は大きく「分類問題」と「回帰問題」の二つに分類されます。「分類問題」というのは、例えば与えられた画像がりんごなのかさくらんぼなのかブドウなのかといったことを判別するものです。要は連続的な数字では扱えないものの分類ですね。一方「回帰問題」では株価データやデータ予測など数字に関することを扱います。

機械学習の技術には様々な種類がありますが、その一つに「ニューラルネットワーク」というものがあります。ニューラルネットワークを使うとコンピューターは人間と似た仕組みで物を覚えられるようになります。

さてここで問題です。下の画像はなんの画像でしょう。

超初心者のためのディープラーニング入門講座

流石に分からないという人はいないと思いますが、これは猫です。ではどうしてこれが「猫」だと分かったのですか?

「なんでと言われても….」という感じですよね。今まで何回も猫を見てきたからわかるのでしょう。しかし、生まれた時から猫を知っていたわけではありませんよね。あなたの脳は幼い時から今までに猫の「特徴」を学習してきたはずで、その特徴をもとにこの画像が猫であることを判別したのです。

ニューラルネットワークも似たようなものだと思ってください。

ニューラルネットワークでは、コンピューターに猫の画像を入力してあげるとそこからいくつもの特徴を数字で割り出します。この数値を特徴量と呼びます。その状態で人間がコンピューターに「これは猫だよ」と教えてあげるとコンピューターは学習し、次回からはその特徴量をもとに画像を判別出来るようになるのです。この作業を何回も何回も繰り返すことで、コンピューターはより正確に猫を判別出来るようになっていきます。


 

ニューラルネットワークの仕組み

ニューラルネットワークは具体的にどんな仕組みなのでしょうか。

人間の脳は300億以上の脳神経細胞(ニューロン)が結合して情報を処理しています。脳科学の「たった一つの学習理論」によれば、驚いたり、悲しんだり、物を考えたり、会話したりといった全てのことは全部同じパターンで処理されているというのです。そこでその処理方法をコンピューターで真似すれば、人間と同じように複雑な思考が実現できるよね、というのがニューラルネットワークです。

まず、コンピューターでも脳と同じように形式的なニューロンを配置します。

そして入力された情報を入力用のニューロンが処理して、次の中間的なニューロンに渡し、最終的に出力用のニューロンが処理結果を出します。その過程で中間層のニューロンは入力情報の特徴を数字で割り出します。
超初心者のためのディープラーニング入門講座

中間層のニューロンを増やせば増やすほど複雑な処理を行うことができるようになります。


 

ディープラーニングの解説

とうとう、お待ちかねディープラーニングの登場ですね!

前項で説明したニューラルネットワークの中間層を何層にも増やせばそれだけ深い思考ができるようになるのでした。

このように何層もの中間層を持たせた状態で機械学習を行うこと、またはその技術を「ディープラーニング」と呼びます。

それぞれの層は違った観点から入力情報を分析し、特徴量を計算していきます。

超初心者のためのディープラーニング入門講座

(※何層もの中間層を持たせた多層構造のニュートラルネットワークは、ディープニュートラルネットワークと呼ばれます。)

図では一枚の猫画像を入力していましたが、実際には大量の猫画像を入力して特徴量を計算していくことで、より正確な判断基準を得ることができます。

この時、画像の入力と共に「これは猫ですよ」と教えてあげることを「教師あり学習」と言います。それを教えずに画像のみ入力する手法を「教師なし学習」と言います。「教師なし学習」は株価の予測やデータマイニングなど正解が人間にもわからないことを学習させる時に使います。


 

ディープラーニングの理解が深まる知識

超初心者のための「ディープラーニング」入門講座

教師あり学習

画像の入力と共に「これは猫ですよ」と教えてあげるのが「教師あり学習」です。

また画像と「これは猫です」という答えの組み合わせを「訓練データ」と呼びます。コンピューターの思考を訓練させるためのデータだからです。

教師あり学習においてコンピューターは入力された訓練データを用いて何故そうなるんだろう(なぜこの画像は猫なんだろう)ということを分析していきます。すなわち、ディープラーニングで何段階にも渡って割り出した特徴量を猫の特徴量として関連付けていくのです。そして以後はその情報を判断基準としていきます。

しかしこのとき訓練データが1つだけだと、他の全く似ていない猫の画像を猫と認識できないでしょう。そこで通常訓練データは何千万という膨大な量を入力します。教師あり学習は分類問題で活躍しますが、膨大なデータを入力するときに解答を一緒に用意しなければならないのが欠点です。

 

教師なし学習

猫の例において画像の入力と共に「これは猫ですよ」と教えてあげないのが「教師なし学習」です。

教師なし学習では正解のないデータを膨大にコンピューターに読み込ませ解析させます。

コンピューターは入力されたデータから特徴量を算出し、その特徴量を用いて分類、傾向、規則性、相関性などを解析します。

入力データに答えを必要としない教師なし学習は「データマイニング」でよく用いられます。データマイニングとは大量なデータを用いてコンピューターに未知の情報を取り出させる技術で、ディープラーニングと同じくらいよく耳にするかもしれません。


 

バックプロパゲーション(誤差逆伝搬法)

高校生の時、試験勉強で何度も計算問題を解かされた苦い思い出がある人は多いでしょう。やたらと途中計算式の多い問題を間違えた時に、どこで間違えたのかを探すのは一苦労な作業ですよね。

ニューラルネットワークにおいて、コンピューターが間違った回答をだしてしまったとき、どこで間違えたのかを探すのが「バックプロパゲーション(誤差逆伝搬法)」です。バックプロパゲーションでは間違えた回答と正解との誤差を出力側から逆方向に流して各ニューロン層の誤りを分析していきます。

バックプロパゲーション(誤差逆伝搬法)


 

過学習

ディープラーニングはニューラルネットワークの中間層を何層にも増やすことでより正確な分析をしようというものでした。

しかしこの中間層を増やしすぎると訓練データを分析しすぎるあまりに「訓練データこそが正しい」という過信的な状態を作ってしまい、未知のデータに対しての回答の精度が下がってしまうのです。この問題を「過学習」といいます。

この過学習を解決する手法に、これもまたディープラーニングの一種である「畳み込みニューラルネットワーク(CNN)」というものがあります。もし詳しく知りたい方は、以下のリンクや、専門書などを参照してみてください。

畳み込みニューラルネットワークの仕組み


 

各企業の人工知能への取り組み

超初心者のための「ディープラーニング」入門講座

IBM

IBMは「IBM Watson(通称Watson)」を有しています。

Watson

Watsonは自然言語処理に長けており、顧客とのコミュニケーションを通してそういった情報を獲得できるのが強みです。対話ということでいえば、銀行のQ&AサービスなどでもWatosnは活用されています。膨大なデータの解析と機械学習をふんだんに行うことで、投げかけられた疑問に対して最適な答えを順位付けして提示します。IBMは何度も学習を行うことでどんどん賢くなっていくのです。

IBMはWatsonを「コグニティブシステム」と主張しています。このWatsonは企業だけでなく個人も使用することができます。
cognitive

またさらには、Watsonを使用するためのAPIが「IBM Bluemix」で提供されています。Bluemixを使えば、個人で開発しているアプリやWebサイトに人工知能の機能を付加することができるわけです。ただし、Watson自体はデータを持ちません。なのでしばらく学習させてやる必要があります。

IBM Bluemix

(※API・・・アプリケーションプログラミングインターフェース。あるアプリケーションが管理するデータを呼び出すための規約、関数等の集合の一覧。)

Watsonの大きな強みは、規則的でないデータすなわち「非構造化データ」を扱えるということです。非構造化データは例えば、人が話す言葉や画像などを指します。ネット上には非構造化データがあふれています。むしろほとんどが非構造化データと言っても過言ではないでしょう。

そういった中でWatsonはネット上のデータをディープラーニングで自立学習するため、圧倒的な力を発揮するのです。Watsonは言語を理解できるため、なんと2011年2月16日にアメリカ合衆国の「ジョパティ!」というクイズ番組で人間に勝利を遂げました。

Watsonはソフトバンクのコミュニケーションロボット「Pepper」ともコラボしています。がん治療に用いるゲノム解析、保険金支払い審査業務、人材マッチング、自動車運転などでも活躍しています。


 

Microsoft

Microsoftと聞くと何を思い浮かべるでしょうか。Word、Excel、Powerpoint、Windows、Surface、色々ありますね。昔からITの分野で様々な良品を提供してきたMicrosoftですが、もちろん(AI)の分野でも負けないように絶賛奮闘中です。

Microsoftは「Microsoft Cognitive Services」という人工知能アルゴリズムを活用したサービスを提供しています。

Microsoft Cognitive Services

Microsoftの強みはBingという検索エンジンのクローリング技術や検索技術を持っていることです。また、Microsoftは「ResNet」という技術をもっており、これは画像認識の分野でとても良い正答率を誇っています。(誤解答率3.57パーセント)

Microsoftは自社の会話エンジンも開発しています。そのひとつが「りんな」です。ご存知の人も多いのではないでしょうか。りんなとはtwitterやLINEを通して誰でもコミュニケーションをとることができますので是非試してみてください。LINEのトークユーザーはなんと380万人を超えているそうです。

りんな


 

Google

Googleはディープラーニングを使用したライブラリ「TensorFlow」を無料で公開しています。

TensorFlow

またディープラーニングの技術を「Googleの猫」「DQN」「AlphaGo」はGoogleのインターネット広告やGoogleフォト、Gmailなどに導入しています。

Googleはインターネット業界だけでなく、自動車業界にまで参入しようとしています。

Googleは自動運転車を開発しており、この自動車はハンドル、アクセル、ブレーキの操作が不要になります。運転は人工知能がしてくれるというわけです。自動車の本体には、トヨタ自動車のプリウスやレクサスが使われます。完成が待ち遠しいですね。

追記:Googleがハンドル、アクセル、ブレーキの操作不要の自動運転車の開発を凍結したと発表がありました。

Googleは自社開発をやめ、「Waymo」というベンチャーを立ち上げることになりました。Waymoは、既存の自動車メーカー向け自律走行ソフトウェアの開発に集中します。

同社は、今はまだそのタイミングではないと悟ったのではないでしょうか。現段階でハンドルもペダルもない車が発売されたとして、それを買いたい人はおろか、乗りたいと思う人はいるでしょうか?

消費者は、まだその段階には至ってないのです。

出典:Googleが自動運転車の自社開発を凍結した本当の理由


 

Facebook

Facebookは自然言語や写真をメインとして膨大な情報を保有しています。人工知能という面でいうと、家庭用のシンプルな人工知能を開発するという姿勢です。

2016年の6月にはFacebookはディープラーニングを用いたテキスト解析機能「Deep Text」を発表しました。Deep Textは20ヶ国語を理解し、スパムコンテンツを排除し、品質の高いコンテンツを判別して上位に掲載します。Deep Textの高度な自然言語処理機能と、Facebookが保有する膨大な言語データを組み合わせれば、将来の期待は大きいものです。

参考:Alexa「Deep Text」とは? Facebookの新しい人工知能は何がスゴいのか


 

Amazon

Amazonはご存知の通り、便利なオンラインショップの代表格です。Amazonはショッピングを手助けする方法としての人工知能(AI)を提案しています。Amazonは人工知能技術を用いて開発された「Alexa」と「Amazon Echo」を発売しています。

クラウドベースの人工知能であるAlexaは自然言語で会話をすることができます。このAlexaは将来的に単純な質疑応答だけでなく、豊富な機能を携える予定だということです。

Alexa

また「Alexa」を使った音声コントロール端末「Amazon Echo」は日常生活のありとあらゆることに対応し始めており、その利便性は日に日に高まっています。

Amazon Echo


 

人工知能を取り巻く事情

超初心者のための「ディープラーニング」入門講座

特化型人工知能(Narrow AI)と汎用人工知能(Artificial General Intelligence)

現在のAIの進歩は目覚ましいように思えますが、皆が薄々感じているように、現在一つのAIは特定の機能に限り力を発揮している場合が多いです。

一方で、今後さらに期待されるものとして、自分で学習し、あらゆることをこなせるようになるAIがあります。

機能が限られるAIを「特化型人工知能」、そうでないAIを「汎用型人工知能」と呼びます。「汎用型人工知能」を実現するために、人間の脳を考察し、その仕組みをコンピューターで再現しようという取り組みがなされています。

「特化型人工知能」は弱いAI、「汎用型人工知能」 は強いAI実現のための重要なステップともされています。


 

人工知能と人工知能でないもの

人工知能(AI)って何?と突然聞かれた時、あなたはなんと答えることができますか?

人工知能(AI)はとてもぼやっとしたもので、抽象的な概念であるといえます。いわばファッションやグルメと同じような表現といっても過言ではないかもしれません。どこからがどこまでが人工知能なのかをハッキリ定義するのは非常に難しいことです。

極論をいうと、5倍にして返すプログラムに「7」を入力して「35」を出力していることは、AIといって良いのでしょうか。それはしかし実際のところ人工知能でないと感じる人は多いはずです。

今後、人工知能技術が発達していくに従って、人工知能と名乗るために必要な要素は「学習機能を持っている」ことだとされています。

単に決め事を自動で実行しているだけでは人工知能を名乗る資格はないということですね。

人工知能というものを理解していない人が多いだけに、推論や問題解決ではなくただの処理を行う機能もAIと呼ばれがちです。人工知能と呼ばれているものでもAI以外の機能だけで説明ができてしまうことだってありますね。


 

人工知能と創造性

AIが発達すると人間の仕事はなくなってしまうのでしょうか。例えば広告業界について考えてみます。広告の仕事はどのような顧客層を狙い撃ち、どのような頻度や場所で顧客に訴えるかといったマーケティング的な要素と、どんな表現で顧客の心を打つかというクリエーティブ的な要素を持ち合わせています。

マーケティング的な要素は人工知能に任せてもいい気はしますが、その統括を行えるのは今の時点では人間です。

また、クリエーティブ的な要素をAIで実現しようとするとやはりまだ高い障壁が存在します。大衆の感性は時代特有の経験の中で刻々と変化していきます。どのようなコンテンツが人の心を打ち、ネット上でバズるのかは実際に時代の中に身を置いて自分の心で感じている人間の方が感覚的にわかっているものです。そうした条件の中でAIが人間のクリエーティブな仕事を取り上げてしまうのはまだもう少し時間がかかりそうです。


 

ディープラーニングをはじめよう(書籍紹介等)

この記事を読んでいただいた皆様は「ディープラーニングや人工知能がどんなものか」「現状どんな使われ方をしているのか」をざっと理解できたのではないかと思います。もっと詳しいことが知りたい、という方は書籍を手に取ってみるのも良いかもしれません。AIやディープラーニングはホットでありながらなかなかピンと理解するのが難しい分野ですので、解説書も多様なものが出版されています。

多々書籍が存在する中で、参考までに、筆者オススメの参考書籍をご紹介します。

「人工知能は人間を超えるか(角川EPUB選書)」松尾 豊 (著)

aibook

(こんな可愛い女の子の表紙カバーもついています)

少し難しめですが、人工知能の今と未来について冷静かつ客観的に考察を加えている本です。現在の人工知能がどんなものかざっと把握するにも適した本です。

「まるわかり! 人工知能 最前線(日経BPムック)」日経コンピュータ

人工知能を取り巻く環境とビジネスでの応用事例を解説しています。この記事では拾えなかった部分も丁寧に解説しているので読んでみるとよいかもしれません。

また、自分でディープラーニングを試してみたいという方に、オススメのwebサイトをご紹介します。

「ディープラーニングの有名ライブラリ5種を最短距離で試す半日コース(TransFlow,Chainer,Caffe,DeepDream,画風変換)
ディープラーニングの有名なライブラリを原理や仕組みの理解抜きでとりあえず触ってみようというブログ記事です。とりあえず触ってみる、ということはとても大事なことで、文章だけでは実感がわかないことも自分の手で実際に実行してみることで味方が大分変わると思います。興味のある方は是非覗いてみてはいかがでしょうか。

BRIAN ENO’S THE SHIP –A GENERATION SHIP
電通内のデジタル制作チーム「Dentsu Lab Tokyo」が人工知能の可能性を追求するために発足させたプロジェクトでBrian Eno氏とコラボし、PVを制作しています。

過去1世紀以上の歴史上の出来事の画像を学習させた知能に対し、現在のニュース画像を入力することでそれに紐付いた過去の画像を出力するというものです。Webサイトで表示される画像はタイムリーかつランダム。

人工知能と人間のクリエーティブを融合させた事例を体感したい方にオススメのサイトです。開くとPCが熱くなるのも、まだまだ人工知能が成長途中であることをふと感じてしまう瞬間です。


 

まとめ

超初心者のための「ディープラーニング」入門講座

 

1. ディープラーニングって何?
1-1. 人工知能とディープラーニングの関係
1-2. 機械学習とは?
1-3. ニューラルネットワークって何?
1-4. ニューラルネットワークの仕組み
1-5. ディープラーニングの解説

2. ディープラーニングの理解が深まる知識
2-1. 教師あり学習
2-2. 教師なし学習
2-3. バックプロパゲーション(誤差逆伝搬法)
2-4. 過学習

3.各企業の人工知能への取り組み
3-1. IBM
3-2. Microsoft
3-3. Google
3-4. Facebook
3-5. Amazon

4. 人工知能を取り巻く事情
4-1. 特化型人工知能(Narrow AI)と汎用人工知能(Artificial General Intelligence)
4-2. 人工知能と人工知能でないもの
4-3. 人工知能と創造性
4-4. ディープラーニングをはじめよう(書籍紹介等)

 
ディープラーニングと言う言葉。そして人工知能がどんなものか、ざっと理解していただけたと思います。

かつてのインターネットと同じように、第4次産業革命とも呼ばれる人工知能革命。

もはや、これらを知らないではすまされません。

日常からビジネスまで人工知能はすぐそこに来ています。新しい時代を知り、あなたの世界を広げていきましょう。

Dreamer編集チーム
Dreamer(goodluckjapan.com)はあなたの人生がよりプラスに働く。そんなメディアを目指しています。

スポンサーリンク

この記事が気に入ったら
いいね!しよう

Dreamerから最新記事を毎日お届けします