ディープラーニングを使った画像認識サービスはどう活用される? | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

ディープラーニングを使った画像認識サービスはどう活用される?

AWS re:Invent 2016に「Amazon AI」傘下のサービスとして、ディープラーニング技術を用いた画像認識サービス「Amazon Rekognition」を発表しました。
今回のブログは、「Amazon Rekognition」(以下Rekognition)のような画像認識サービスどのように活用されるのかを考えていきたいと思います。

スポンサーリンク

「Amazon Rekognition」4つの機能

Rekognitionには以下4つのする機能が提供されています。

■Object and Scene detection(物体およびシーンの検出)

Object and Scene Detection
Object and Scene detectionは、画像内の物体を識別するために使用するための機能です。
例えば、多くの物体があるリビングルームは沢山の物が置いてある事が多いですよね。
Reocognitionは、Object and Scene Detection機能により、花、コーヒーテーブル、椅子などの一般的な物体を識別します。

■Facial Analysis(顔分析)

Face-detection
Facial Analysisは、開発者は以下のような写真の特徴にアクセスできます。
 ・人口統計データ
 ・感情表現
 ・顔のランドマーク
 ・画質
 ・一般的な属性

例:広告技術サービスで、動的かつパーソナライズされたコンテンツをユーザーに表示することが可能になります。

■Face Comparison(顔の比較)

Face Comparison
2つの画像の顔が同一人物である可能性を測定できます。
類似性スコアを使用して、ユーザーをほぼリアルタイムで参照写真と照合することができます。
 
例:
・IoTとデバイスメーカーなら、アプリケーションに直接顔認証を組み込むことができる。
・ホスピタリティ企業では、VIPと特定されると、その人にVIP用の追加のカスタマサービスを提供する。

■Facial Recognition(顔認識)

Face Recognition
大規模な画像のコレクションの中から似た顔を見つけることができます。
高速かつ正確な検索により、参照している顔と最も一致している顔が返されます。

画像認識はコンピュータにとっては難しい業だった

写真やビデオは世界において、生活に不可欠な一部をなしています。
それらは見切れないほどのペースで量産されています。私たち人間は一目見ただけで、人・場所・物の織りなす物語全体を捉えることができますが、コンピュータには簡単な事ではありません。
search
「コンピュータがそれを特定するためには、子供が経験を通じて理解するような量と質の訓練データをアルゴリズムに与えていく必要があるからです。それがどれくらいの量かと言いますと、写真を理解できるようコンピュータに「教える」ために10億枚近い画像をダウンロードし、167カ国の約5万人の作業者が、10億枚近い画像を整理しラベル付けに携わるほどの量になった。」と、コンピュータビジョンの専門家であるフェイフェイ・リーは語っています。

同じくRekognitionのような画像認識ツールも膨大な量の例を見た後で画像を学んでいます。
始めは途方もないデータを与えなければいけませんが、学習段階が完了すれば、新しい画像を学習したネットワークで評価することはとても高速です。
また、ディープラーニングの登場でさらにこの研究が加速したのは明白です。

ディープラーニングとは

ニューラルネットワークを用いた機械学習のことです。
脳の神経細胞を模した学習アルゴリズムで、識別に至る構造が2010年頃は7~8層程度でしたが、現在は20層以上の多層のニューラルネットワークになっています。
このディープラーニングの発展により、音声認識、画像認識、自然言語処理など様々な分野で活用されるようになりました。
下記の図によると、2010年はエラー率が16%だったのが、2015年にはディープラーニングの性能も向上し5.3%と人間の画像認識レベルとほぼ一緒になっているのが分かります。
2017-01-26_19h58_49
 
参考:
 

個人に合わせて価値を提供するサービスを小売業にも

これは単にインターネット上だけの話ではありません。実店舗でもAIの画像認識技術は、顧客の満足度を高めるために一役買っているようです。Amazonは小売顧客サービスの分野についてもこの画像認識の技術活用を提案しています。
例えば、店舗に商品を探している買い物客にRekognitionのFacial Analysis機能を使用します。
店舗はその機能を使って顧客の感情を判断し、見越してコンタクトをとることができる、といったイメージです。

さらに、Amazonの他にもドイツの企業向けソフトウエア大手SAP社は小売業者とタッグを組んでいます。
顧客が来店すると即座にその人物を認識して好き嫌いを判別し、より貴重なショッピング経験を作り出すのを手助けする技術開発に取り組んでいます。
「英高級ブランド大手バーバリーグループは、顧客が来店すると名前を尋ね、それをアプリに入力すると個人データにアクセスできる。
そこでは顧客の前回の購入履歴、普通の水と炭酸水のどちらを好むかなどが確認できるほか、公開されているソーシャルメディアの一部にもアクセスできる。」
と企業向けソフトウエア大手SAPのロリ・ミッチェル・ケラー氏は実用例を紹介しています。

データとテクノロジーを通じた「パーソナライゼーション(個人に合わせた最適化)」がインターネットの世界を超えて現実世界に進出してきています。
今回お話しした画像認識サービスのように、現実世界で顧客と接触しない領域でサービスが始まっています。
顧客に何の価値をどんな形で提供していくのか。戦略を練って挑む企業はこれからさらに多くなりそうです。

参考資料

・「Amazon Rekognition」
 https://aws.amazon.com/jp/rekognition/
・「Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー」
 http://www.slideshare.net/nlab_utokyo/deep-learning-49182466
・「コンピュータが写真を理解するようになるまで」
 http://digitalcast.jp/v/22850/


03-6441-3336

いますぐ無料で
お試しください。

SiTestの革新的な機能を、
1か月間無料でお試しいただけます。

お名前【必須】
メールアドレス【必須】
電話番号【必須】

利用規約はこちら