この講座は、機械学習について学んでいく講座の1回目です。
機械学習って言葉は聞いたことはあるけど、「AI」との違いがわからなかったり、機械学習がどんなものなのかがわからない人に対して、機械学習とはなんぞやっていうのをイメージできるようにしていきます。
機械学習とは、AIが人間のような高度な判断を実行するのに必要な「法則」をコンピュータに探してもらう方法のことです。
例えば、画像に写っているのが猫なのか犬なのかを人間は判断できますが、コンピュータにif文などのプログラムで判断させようとするとかなり大変なので。人間が判断した結果のみのデータをコンピュータに与えて法則を自分で見つけてもらう手法が機械学習です。
機械学習には、データの与え方や、答えの出し方によって様々な種類に分けられます。
今回は、機械学習とはどんなものなのかをわかるようにするために、機械学習の学習方法の種類にも解説することでイメージを深めていきましょう。
AIについての記事はこちらです。
機械学習とは
機械学習(ML:Mashine Learning)とは、AIを作り出すための技術のことです。
AIと機械学習って何が違うの?と思われる方もいると思いますが、AIの中に、機械学習という技術があり、その中に更に深層学習と呼ばれる学習方法があるようなイメージです。
冒頭でも上げたとおり、画像に写っているのは「犬」なのか「猫」なのかを人間がどう判断しているのかを機械に学習してもらうための技術が機械学習です。
機械学習と呼ばれる技術を導入することで、機械が人間と同じように、判断し行動できるようにして最終的に作られたものがAIだとおもってください。
今回は、AIを支える技術である機械学習の学習法方にはどんな種類があるのか、それぞれをよりわかりやすく解説していきます。
機械学習の種類
機械学習の種類は大きく分けると、教師あり学習と教師なし学習、強化学習の3種類です。
その違いは学習方法による違いです。
機械学習の基本は、大量のデータをコンピュータに与えることで、次はコンピュータ自身が答えを導き出せるように学習させます。
与えるデータと、答えの出し方で3種類に分けることができるのです。
教師あり学習は、与えるデータに問題と答えのどちらも載せてあげて、コンピュータが次の問題に対して自分で答えられるようにする学習方法で、教師なし学習は、与えるデータに問題のみを載せて与え、コンピュータが特徴や法則を自分で見つけ出す学習方法です。
強化学習は、データを自分でとっていくイメージです。沢山の選択肢からどの選択をするのが一番利益が大きいかを学習させる方法です。
それぞれを深堀りしていきましょう!
機械学習の種類①:教師あり学習
教師あり学習とは、コンピュータに与えるデータ(入力データ)に問題と答えどちらも与えます。
例えば、猫と犬の画像を大量に与えて、答え1枚目は猫、2枚目は犬、、、といったように答えも与えてあげるのが教師あり学習です。
教師あり学習というよりも、答えあり学習のようなイメージです。
教師あり学習を更に答えデータの種類によって、回帰と分類の2種類に分けることができます。
回帰は、入力データから、出力データ一つを選択する教師あり学習で、分類は与えられた正解をもとに、出力するデータが「正しいもの」なのか「正しくないもの」なのかをはんだんして、分類する学習です。
例をあげて考えやすくしてみましょう。
回帰とは
大量のデータから、一つの数値を出力する教師あり学習のこと。
- 過去1年間分の株価のデータをコンピュータに与えて、明日の株価を予想する学習方法。
- 今日の最高気温とスポーツドリンクの販売数をデータとして大量に与え、明日のスポーツドリンクの販売数を予測する
分類とは
出力するデータが、文字列や範囲の狭い整数のように、いくつかの選択肢のうち一つとして解釈できるようになる教師あり学習。
- 機械の稼働状況を入力データとして、機械の状態が「正常」なのか「異常」なのかを予測する学習。
- 猫と犬の画像を大量にデータとしてコンピュータに与えて、その画像が「犬」か「猫」かを予測する学習。
機械学習の種類②:教師なし学習
教師なし学習は教師あり学習が「答えあり学習」と説明したように、「答えなし学習」をイメージしていただくとわかりやすいです。
大量のデータを与えるときに問題のみを与え、与えられたデータの中からコンピュータ自身が特徴や法則を見つけ出してくれるような機械学習です。
教師なし学習は、クラスタリングと次元削減の2種類に分けることができます。
例を出して解説していきましょう。
クラスタリング
クラスタリングは、犬と猫の画像を大量に与え、画像の特徴や傾向を学習させ、「もし似ている度合いで2つのグループに分けるのであればこんなグループ分けかな」と出力させる方法です。
教師あり学習との違いは、コンピュータに与えるのは画像だけで、その画像に写っているのが「犬」なのか「猫」なのかは与えないため、もし仮にうまくグループ分けできたとしてもコンピュータはグループAが犬の画像データだとはわからないです。
次元削減(次元圧縮)
次元削減(次元圧縮)は、学生の「氏名、国語、数学、英語、理科、社会」の6つの列から成り立つ学生の試験データをコンピュータに与え、「理系能力」と「文系能力」にざっくり学生の傾向を把握したいときに用いる学習方法です。
「より良い列のまとめ方」に従って様々な学生の成績を「理系能力」と「文系能力」にまとめることができます。
機械学習の種類③:強化学習
強化学習は、たくさんの選択肢の中からどの選択肢を選択したときの利益が一番大きくなる選択肢を学習する機械学習です。
囲碁ロボットや、将棋ロボットには強化学習が用いられています。
教師あり学習との違いは、一つの選択に対しての利益ではなく、最終的に一番大きくなればOKってのが大きな違いです。(囲碁、将棋であれば最終的な勝利が利益)
- 教師あり学習
⇒ 大量のデータを、入力データと出力データの両方与えて入力データから正解を導き出せるようにする学習方法 - 教師なし学習
⇒ 大量のデータから、入力データ自体の特徴や傾向を見つけ出す学習方法 - 強化学習
⇒ たくさんの選択肢のなかから、最終的に一番利益の高くなるような選択をできるように学習していく方法。
まとめ
今回は、機械学習の学習方法について3種類に分けて解説しました。
機械学習とは何なのかと聞かれたら、「機械が大量のデータから人間が判断しているような法則を学習する技術のこと」と答えられる様になったのではないでしょうか。
機械学習の種類を学習方法で分けると3種類になる点についてもご理解いただけたかと思います。
この講座では機械学習入門の第一回なので、次回は機械学習で必要になってくる統計学の基礎知識について学んでいきましょう!
- 機械学習とは ⇒ 人間が行っている判断に法則を見つけ出す学習技術のこと
- 機械学習の学習方法は3種類
- 教師あり学習
- 回帰 ⇒ 出力するデータが数値
- 分類 ⇒ 出力するデータが文字列か範囲の狭い整数の中から
- 教師なし学習
⇒ 大量のデータから、入力データ自体の特徴や傾向を見つけ出す学習方法- クラスタリング ⇒ 似ているデータ同士をグループ分けすること
- 次元削減 ⇒ 表データなどで、各列の特徴を調べて、多数の列項目を少数の列項目に削減すること
- 強化学習
⇒ たくさんの選択肢のなかから、最終的に一番利益の高くなるような選択をできるように学習していく方法。
- 教師あり学習