人工知能を使った画像判定サービス・その精度は? | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

人工知能を使った画像判定サービス・その精度は?

人工知能を使った画像の判定、特に被写体やモチーフが何であるかということを認識するサービスは数多くリリースされています。
認識する画像の特徴を抽出し判定するもの、データと結びつけてユーザーと対話するものなど、そのコンセプトは様々ですが、ますます認識精度が向上し実用的なサービスが提供されはじめています。

How old do I look?

http://www.how-old.net/
機械学習による人工知能が画像の被写体の年齢を推定してくれるサイトです。
検索窓から個人名を入力し、検索結果の候補の画像から被写体を選ぶ方法と、
自分の持っている画像ファイルをアップロードして測定する方法があります。

キング牧師
screencapture-how-old-net-1477292281776
38歳の頃の写真なので、36歳の判定は結構イイ線をいっています。

ビル・ゲイツ
screencapture-how-old-net-1477292456112
こちらは57歳の写真に対して52歳と判定されました。

マービン・ミンスキー
screencapture-how-old-net-1477292875633
81歳の頃の写真ですが、86歳…おしい感じです。

ちなみに実在の人物写真でなくても検出してくれる場合があります。
「アナと雪の女王」の登場人物エルザは23歳と判定されました。
設定では21歳なのでかなり近いです。

画像解析できるマン

http://usagee.co.jp/computer-vision/
画像の被写体が「食べ物」かそうでないかを認識する人工知能です。

画像解析できるマンでは「食べ物」と「食べ物ではないもの」の両方の画像を人工知能に膨大に教え込ませることで画像認識を行います。
gazou6

リリースしてから、「ごはんじゃないのにごはん」の画像や、その逆の画像を探す遊びが流行りました。
ごはん?ごはんじゃない?画像認識技術を使った「ごはん」画像判定サービスが人気すぎて開発者大慌て!
人工知能による認識の正誤を笑いに変える、遊びのセンスこそ人間らしさだと感心しますが、人工知能もユーモアを身につける日が来るのでしょうか

Aipoly Vision

http://aipoly.com/
Aipoly Visionは目が見えにくい方や、色を判別しにくい方などのサポートを目的に開発されている、スマートフォンのカメラで対象を映し出すだけでそれが何であるか教えてくれるアプリです。
撮影は不要で、カメラで画面に映し出すだけでスピーディーに検出してくれ、ほぼリアルタイムにそれが何かを(幾つかの候補で)教えてくれるので非常にユーザビリティが良好です。
下の画像のように、マウスを認識するだけでなく、
IMG_9727製品にロゴやメーカー名が入っているとその特徴を読み取って伝えてくれます。IMG_9726

また手のひらと
IMG_9739
手をそれぞれに判定するあたり精度はかなり高いようです。
IMG_9740
対象と分析結果が違った場合、間違いを修正しフィードバックする事もできますが、過学習による偏りや、学習する結果にブレが出てくる危険性もありそうです。
そのあたりを人工知能がどのように処理するのか興味深いですね。

TapTapSee

http://www.taptapseeapp.com/
TapTapSeeもスマートフォンのカメラで画像を映し出し、2度タップすることでそれが何であるかを認識してくれます。
※TapTapSeeは、当初から視覚障害者が使うことを想定して作られており、あらかじめiPhone音声読み上げ機能「VoiceOver」を起動しておく必要があります。

TapTapSeeの特長はその説明の細かさです。
IMG_9750
『写真1は黒ibuffaloコードレスマウスです』
ただ単に「マウス」といった物体の種類を返すのではなく、「黒」「iBUFFALO」「コードレス」といったモノに対しての描写が正確で過不足がないと感じます。
IMG_9752
『写真2は白とオレンジのパズルマットの黒と銀の静止自転車です』
オフィスの一角にあるエアロバイクの説明など、逆に人間の方がざっくりとした説明をしてしまうのではないでしょうか
被写体の移り方を変えると記述の内容が変わります。
IMG_9753
『写真1はグレート黒のエアロバイクです』
もちろん、全くの誤認識が無いわけではありません。
IMG_9751
『写真3はアニメコミックです』
参考書をアニメコミックと認識してしまっていますが、かえってカバーデザインの意図を正確に読み取っているような気もします…

認識の速度はそれほどでもなく、Aipoly Visionには及びませんが、被写体の文字、色、形状にもとづいた認識精度は驚異的な高さで、実用的に使えるアプリだと感じました。

最後に

Aipoly VisionとTapTapSeeはすでにユーザーの抱えた問題を解決するために実用的な取り組みが開始されているということで、人間を人工知能がサポートするという未来像に向かって期待が持てます。
画像認識のスピードと細かさ、といったところにそれぞれ優位性があり、ユーザーのニーズによって使い分けることができそうです。
以前のエントリ「人工知能を取り入れた画像・動画向けWebサービスを試してみた。」では、特に解析系のサービスについては人工知能が人間の業務を奪うかも?と述べましたが、同時に人的コストを低減しローコストで人間のサポートが可能になるということも期待されている将来像です。
特にヘルスケア分野への人工知能の進出は目覚ましいものがあり、引き続き注目していきたいと考えています。