はじめに
こんにちは。
今回は中学生でもわかるように「深層学習」とは何なのか、について解説していきます。
「深層学習」は人工知能のことを指すと勘違いされている方が多い印象です。
しかし、この表現には語弊があります。
そういった勘違いを解くために、この記事を通して深層学習とは何なのかをしっかり確認していきましょう。
- 深層学習が何なのか
- 深層学習が注目される理由
- 深層学習でできること
深層学習(ディープラーニング)とは何なのか
最初に言っておくと、深層学習は機械学習の一部です。
まずは、「AI」「機械学習」「深層学習」の関係から確認してみましょう。
これらは下の図のような包含関係があります。
この図からわかるように、深層学習は機械学習の一部であり、もっと言うとAIの一部ということです。
「深層学習 = AI」と勘違いしている方のために一応説明しておきました。
では、その深層学習とは一体何なのか。
ずばり、深層学習の正体は、”複雑な関数による演算”です。
見覚えありますね。
【簡単解説】深層学習(ディープラーニング)とは何なのかで、機械学習はただの関数であると説明していたのに対し、深層学習はより複雑な関数のことを指します。
つまり、「数値を入力したら何かしらの計算を行い、別の数値に変換して出力するもの」です。
ただ1つ、機械学習の説明と異なる部分は「複雑な関数」という点です。
「深層」という言葉からわかるように、深層学習が表す関数は深い層を持ちます。
「層」も何かしらの関数のことを指しています。
こちらは図を見てもらった方が早いので、こちらを見てください。
この図のように、1つ1つの層(関数)がいくつも並んだものが深層学習の正体です。
関数を複雑にすることで、より多くの分野で応用できるようになるわけですね。
この辺については次の章で確認します。
とりあえずここでは、「深層学習とは、層(関数)がいくつも並んだ合成関数である」と押さえておきましょう。
深層学習が注目される理由
深層学習は、「たくさんの層から成る合成関数である」ということを見てきました。
では、なぜ関数を複雑にすることで、ここまで注目されるのでしょうか。
それは、層を深くすることによって、通常の機械学習よりも表現力が高くなるからです。
もっと言うと、様々な関数に近似することが可能になるから、ということです。
現代では、画像や文章、音など、ありとあらゆるものを数値で表現することが可能です。
例えば、光の三原色で任意の色を表すことができますね。
その色の粒を大量に並べることで画像を表すことができます。
数値で表せるということは、何かしらの関数を使うことで別の数値に変換できる、ということです。
犬の画像を表す数値をある関数に入力することで、「dog」という文字を表す数値に変換できれば、これはすごいことですよね。
しかし、そんな都合のいい関数など普通はありません。
ここで、深層学習を使うことで、こういった魔法のような関数を生み出すことができるわけです。
では、犬の画像を「dog」に変換する関数に、猫の画像を入力した場合はどうなるでしょうか。
この関数は、犬の画像を「dog」に変換できるだけであるため、猫の画像を入力した場合は、でたらめな数値に変換してしまいます。
これだと不便ですね。
しかし、深層学習は機械学習と同様に「学習」することができます。
つまり、関数を調整することができるわけです。
この「学習」を行うことで、犬や猫のみならず、鳥や車、人間などの画像までも正しく認識できるようになります。
これは関数を複雑し、表現力が上がったおかげで可能となっているんですよね。
これが深層学習の強みです。
意識していないだけで、現代社会には深層学習を利用した機能が溢れています。
画像認識や音声認識などは基本的にはすべて深層学習によって実現していると考えていいぐらいです。
まとめると、深層学習が注目される理由は、「深層学習により複雑な関数を近似することで、画像や音などの情報を別の情報へと変換できるから」ということです。
ちなみに深層学習も機械学習と同様に、コンピュータの性能が大幅に向上したことにより、現実的に実装することが可能になりました。
結局のところ、数十年前から提案されていたことであっても、当時のコンピュータのレベルでは実現できなかっただけなんですよね。
現代はコンピュータのレベルと共に、できることが年々増えてきているという現状です。
こちらの本で、深層学習・人工知能の歴史を学ぶことができます。
Kindle Unlimitedに入会している方は無料で読めるので、是非一度は読んでみてほしいです。
深層学習でできること
ここでは、深層学習でできることを見ていきます。
まず、大前提として、深層学習は近年ものすごい勢いで進化している分野です。
年々新たなアイデアなどが登場しているような時代ですので、自分でもいろいろ探してみるとなかなか面白い思います。
画像認識
1つ前の章でもちょこっと説明したように、画像の情報から、その物質を特定することができます。
こちらは深層学習の火種となっている分野であるため、最も標準的なものです。
音声認識
音声は、次に紹介する自然言語処理と組み合わせることで、波形から文字へと変換することができます。
Siriやアレクサなどがその応用例ですね。
こちらも近年進化が激しい分野です。
自然言語処理
自然言語は、私たちが日常で使うような言葉のことを指します。
日本語のような、決まった規則を表すことが難しい言語であっても、言葉の意味を解析することができます。
こちらも近年進化が激しい分野です。
つい最近だと、GPT-3 が人間と同じように言語を扱えると話題になりました。
>> GPT-3とは 【シリコンバレーで超ホットな最新技術】
ロボット制御
これは、深層強化学習と呼ばれる分野で研究されているものです。
ロボットが人間のように体を自由に動かすことができるように研究が進められています。
【簡単解説】機械学習とは何なのかで紹介した、囲碁を打つロボットAlphaGoなどがこちらに当たります。
画像生成
こちらはGANと呼ばれるアルゴリズムを使うことで、乱数から画像を生成するという面白いものです。
GANは、深層学習の研究者であるヤンルカンが「機械学習において、この10年間で最も面白いアイデア」と形容したほどです。
近年では、GANの亜種が多く存在し、人間でも見破れないほど高度な画像を生成できるところまで来ています。
簡単なGANで生成した画像(ちょっと前に自分で試したやつ)はこんな感じです。
学習不足のため不気味な画像になっていますが、イメージだけでも伝わってもらえればOKです。
ここまで見てきたものはザックリとしたものですので、実際はもっと幅広く深層学習は活躍しています。
これからも様々な応用例が出てくると思うので、アンテナを張っておくと時代を先取りできるかもしれませんね。
おわりに
ここまで、深層学習の概要と、深層学習でできることを見てきましたが、どうだったでしょうか。
深層学習は、近年、機械学習の中でもとにかく進化が激しい分野なので、勉強してみると面白いですよ。
また、画像認識などはちょこっと勉強するだけで自分でも試すことができるので、興味がある方は是非勉強してみてください。
では、今回はここまでとします。
お疲れさまでした。