パソコン

【AIとは何か?】人工知能の仕組みを絶対に分かるように説明します【画像認識】

人間の脳細胞が透けて見える画像

こんにちは!サトシ(@satoshi365_blog)です!

 

この記事では、「AI」の仕組みについて説明していきます!

 

AIって最近どこででも聞くけど、どういう仕組みなんだ?

と疑問に思ったことはありませんか?

「AI」の仕組みというと、いかにも難しそうですよね。

 

この記事では、「AI」の仕組みを分かりやすく、ざっくりと説明していきます。

なので、できるだけ専門用語やプログラムなどは使わないように書いていきます!

 

理解してみると分かるのですが、意外と「AI」の仕組みは簡単です。

もし理解できたら、「AI」を使ってみることにもチャレンジできますよ^^

 

それでは、書いていきます!

そもそも「AI」ってナンだ?

「AI」とは人工知能(Artificial intelligence)の略で、1956年からあったそうです。

この頃の「AI」は今と比べると「ショボい」ものでした。

 

「ショボい」ものでも「AI」って呼んでいいのか?

と思うかもしれません。

 

でも実は、人間を目指して作られたものは全部「AI」と呼ぶことができます。

「こんにちは」とメッセージが来ると「こんにちは」と返す、というだけでも「AI」と呼ぶことができます。

 

では、なんで今「AIブーム」が来ているのでしょうか?

 

それは、つい最近「ディープラーニング」というテクニックが生まれたからです。

最近話題になっている「AI」は、ほとんどが「ディープラーニング」のことです。

 

なので、この記事では「ディープラーニングを使った画像認識の仕組み」について書いていきます。

 

どうして今までは画像認識ができなかったのか

画像認識とは、「ある画像をコンピューターに見せて、それが何の画像かを認識させる」というものです。

 

今まで画像認識ができなかったのは、「その画像のどこに注目するべきか、コンピューターに教える必要があったから」です。

 

少し分かりにくいので、例えを出して説明していきます。

 

ここに「6」と書いてある画像があります。

なんでその画像が「6」であるか、あなたはコンピューターに説明できますか?

サトシ
サトシ
下の方に丸い部分があるよね?
コンピューター
コンピューター
「下の方」ってどこらへん?「丸い」ってどんな形?
サトシ
サトシ
え...

「なんでそれが「6」だと分かるのか」を説明するというのは意外と難しいのです。

 

このように、今までは「6」がどんな形かを全部教える必要がありました。

しかも、書く人によって「6」の形が変わるので、もっと難しくなります。

 

この問題をディープラーニングが解決しました。

ディープラーニングは「その画像のどこに注目するべきか」を自分で学ぶからです。

 

というわけで、ディープラーニングが生まれるまで、画像認識はとても難しかったのです。

画像認識の仕組みを解説

今回は「数字が書いてある画像をコンピューターに見せて、その数字を当てる」という数字の画像認識を説明します。

 

画像認識の仕組みは、「たくさんの画像を見て、答えを学んでいく」というものです。

サトシ
サトシ
これは「1」っていうんだよ?これは「7」、これは「9」!

覚えてね!

コンピューター
コンピューター
ブーン(学んでいる音)

というのを何万回も繰り返します。

 

もう少し詳しい画像認識の流れはこんな感じです。

  1. 数字が書かれた画像を見る
  2. 画像にどの数字が書かれているか考える
  3. 「注目すべきところ」を学ぶ(調整する)
  4. 次の数字の画像にも同じことを繰り返す

これを何万回も繰り返して、「注目すべきところ」を学ばせていきます。

 

数字が書かれた画像を見る

まずは、数字が書かれた画像を見ます。

 

コンピューターは画像全体を見れないので、このようにマスに区切って見ます。(ホントはもっと細かい。)

 

どの数字が書かれているか考える

画像にどの数字が書かれているか考えます。

 

でも、まだコンピューターは何も学んでないので「注目すべきところ」を知りません。

だから、適当に「ここらへんに注目しとけば良さそう」と考え始めます。

そんなわけで、最初は

コンピューター
コンピューター
分かったぞ!

これは「1」だ!!!

と間違えてしまいます。

 

注目すべきところを学ぶ(調整する)

答えは「6」だとコンピューターに教えてあげます。

 

すると、このように「注目すべきところ」を調整していきます。

コンピューター
コンピューター
ここら辺に注目してたら「6」だと気付けたかも。ここら辺はあんまり大事じゃなさそう。

このように少しずつ「注目すべきところ」を学んでいきます。

 

次の画像にも同じことを繰り返す

さっきと同じように、次の画像を見ます。そして、どの数字が書かれているかを考えます。

 

でも、今回は適当には考えません!

ひとつ前の画像で学んだ「注目すべきところ」を使います!

これを繰り返して「数字の画像の注目すべきところ」を学んでいきます。

そして、数字を正しく読めるようになっていきます。

 

まとめ

実際に画像認識のシステムを作る流れはこんな感じです。

  1. 数字の書いてある画像をたくさん集める
  2. 画像認識のプログラムを作る
  3. たくさんの画像から、「数字の画像の注目すべきところ」を学ばせる

そしてこの記事では、画像認識のプログラムの仕組みについて書きました。

 

画像認識の仕組みを知った今、どんなものに「AI」を使えるのか、イメージできるようになったと思います。

 

また、ディープラーニングは学習したことしか出来ません。

今回のシステムでは、「どの数字が書いてあるか考える」ことしかできません。

だから、「AI」が人類の敵になる、というのはずっと先のことでしょう。

 

この記事を理解できたなら、間違いなく画像認識のプログラムを作ることができます。

興味がある方はぜひ試してみてください^^

 

少しでも参考になったら、とてもうれしいです!

ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装 [ 斎藤 康毅 ]
created by Rinker
¥3,740
(2020/03/30 06:14:27時点 楽天市場調べ-詳細)

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です