機械学習(Machine Learning)とは?非エンジニアが振り返ってみた。 | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

機械学習(Machine Learning)とは?非エンジニアが振り返ってみた。

今の人工知能技術に欠かすことの出来ない機械学習とは何か?
ウィキペディアには

機械学習(きかいがくしゅう、英: machine learning)とは、人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである。

とあります。

昨今の人工知能のトピックには必ずと言っていいほど「機械学習」よる◯◯、という解説がされることが多く、現時点での最新技術を導入したことで人工知能が完成に向かっているかのようなイメージがありますが、実は「機械学習」の技術自体はけっして新しいものではなく、コンピュータ黎明期と同じ頃まで遡ることが出来ます。

スポンサーリンク

機械学習のはじまり

機械学習の父、アーサー・サミュエルによれば、機械学習の主な目的は、「明示的なプログラムを書くことなくコンピュータを動作させる」ことにあります。
1952年、アーサー・サミュエルはボードゲーム、チェッカーで自分より強いコンピュータを作り、そのプログラムを人間と対戦させようと考えました。
3508ArtSamuel
画像出典:Stanford InfoLab

しかし、自分より強いプレイヤーをプログラムするって、どのような方法があるのでしょうか…?
かつては(そして今でも殆どの場合)、コンピュータになにがしかの処理をさせたければ、それをプログラムする必要がありました。
そもそもプログラマーにさえわからないことを、プログラムで記述しコンピュータに実行させることは不可能のように思われます。
※アーサー・サミュエル自身もあまり上手なチェッカープレーヤーではなかったそうです。

しかし彼は「Samuel Checkers-playing Program」を作成し、この到底解決しそうにない問題に答えを出します。
コンピュータ自身にチェッカーの対局をさせ、数千ものゲームを行わせることで勝ちに結びつくパターンや負けのパターンを認識させるという方法で、最終的にこのプログラムは1962年にはコネチカット州チャンピオンを倒すまでに成長しました。
この「Samuel Checkers-playing Program」こそが、世界初の学習型プログラムと言われています。

学習手法いろいろ

学習させたい用途、目的によって有効な学習手法は変わり、機械学習は大きく3つに分類できます。

教師あり学習(Supervised Learning)

教師あり学習はアルゴリズムにあらかじめデータセットを入力し、それをもとに学習していくのでsupervised learningと呼ばれます。
入力データは訓練データと呼ばれ、ラベル付け(例えば「スパムであるかないか」)されているか、あるいは結果(ある時点での不動産価値など)が明らかなものが必要です。
訓練データをもとに、ラベルの付いていないデータのラベル値をいくつかのパターンを使って予測します。
教師あり学習は一般に、過去のデータから将来起こりそうな事象を予測する用途に使われます。

教師なし学習(Unsupervised Learning)

これは教師あり学習とちがい、学習対象のデータを与えるけれど、ラベルは与えない、というものです。
アルゴリズム自身が、データの意味を突き止めなくてはならず、この学習手法の目的は、データを探索してデータそのものがどのような構造、特徴を持っているのかを理解することです。
教師なし学習は、商取引データなどの分析に対して実用化が進んでいます。
例えばよく似た属性を持つコンバージョンに至ったアクセスが抽出できれば、そのセグメントに特化したマーケティング活動が展開できます。
教師なし学習のアルゴリズムは、以前から大手ECサイトでの商品のレコメンドエンジンなどにも利用されています。

強化学習(reinforcement learning)

強化学習は連続したやりとりのなかで試行錯誤を通じて、学習させるものです。
強化学習は教師あり学習に似ていますが、ラベルは提示されません。では何が与えられるかというと、「評価・報酬」になります。
強化学習では何が良い状態なのかを明確にする必要があります。求めている動作が明確でないと何を基準に連続した取り組みをしていけばいいのかがわからなくなってしまいます。

有名なのがGoogleのDQN(Deep Q Network) です。
シンプルなテレビゲームであるブロック崩しを学習し、最初はほぼ失敗ばかりのコンピュータが、ゲームを繰り返していくとだんだん上手になっていきます。
ここではブロックを崩して得られるポイントを報酬とし、膨大な回数のトライ&エラーを繰り返していることになります。
行動の報酬を定義するだけで、機械が勝手に上達をしていく強化学習は自律的なロボットの制御などへの利用が期待されています。

人工知能がビジネスに与える影響は?

1950年台にはすでに誕生していた機械学習の技術ですが、ここ数年で飛躍的に実用化が進み、幾つもの成功を収めつつあります。

その要因としてあるのがコンピュータ自体の性能向上、回線インフラの整備、クラウドコンピューティング、そしてスマートフォンやウェブサービスの普及によって蓄積されているビッグデータです。

企業におけるデータ分析業務においても、状況を計測し、課題を抽出、対策する、ということは従来のBI(ビジネスインテリジェンス)ツールで行えましたが、機械学習によりこれまで利用できなかった(存在しなかった)ビッグデータの活用が可能となったことで、人工知能でしかなし得ない予測と自動(リアルタイム)化によるビジネスプロセスの変化が起きています。

私たちが開発・提供するSiTestは10万サイト以上に及ぶユーザー行動データを機械学習しサイトを評価、改善点を提案しますが、一般的なアクセス解析ツールではひも付けが難しいこれらのデータを用いた改善点抽出は、正に機械学習の技術なくしては実現し得ないものです。
report_aireport_image
2020年頃には、機械学習の商用化はほぼ完成を迎えると予測されており、人工知能がさらに膨大なデータを収集し社会基盤のひとつ(エコシステム)となる日はそこまで来ています。
ぜひSiTestでその将来性とビジネスにもたらすインパクトを実感してみてください。