Googleがモザイク画像から元の被写体を復元。
Googleの人工知能を使った画像解析技術は、もはや画像の内容を判別するというレベルを超えつつあります。
今回発表された新たな画像復元技術は、一体どのようなものなのでしょうか?
RAISR(Rapid and Accurate Image Super-Resolution)
Googleはすでに2016年11月に「RAIZER」という人工知能の機械学習による技術を発表しています。
Google+などにも活用されている技術で、リアルタイムに低解像度の画像ファイルを高画質にしてくれる技術です。
スマートフォンやタブレットなどで、ユーザーがピンチアウト(画面や画像を引き伸ばすアクション)を行ったときに低解像度のファイルでもきれいに見せることを可能にし、画像容量を抑えたままアップロードしたファイルを、ほぼリアルタイムで画像処理し高解像度版を復元します。
Googleが推奨するAMP(Accelerated Mobile Pages)との親和性も高そうで、回線の細いモバイルでのインターネット接続でも快適なユーザビリティが得られそうです。
Google’s RAISR sharpens low-resolution images using machine learning(YouTube)
RAISIRは、画像処理の精度とスピードを上げるために2つのアプローチの機械学習が行われています。
デジタル画像はドットの集合から成り立っていますが、引き伸ばした際に足りないピクセルはコンピュータが予測して埋めていくことになります。
原則的に、デジタル拡大した結果がぼんやりとした質感になるのは避けられないことでした。
(このピクセルの補完に人工知能を用いて話題となったのがワイフです。)
RAIZERは低解像度画像と高解像度画像、低解像度画像とアップサンプリングしたものの両方のデータをセットで学習することで精度とスピードを向上させています。
Pixel Recursive Super Resolution
今回発表された技術はなんと8×8ドットの解像度の画像を、32×32の解像度まで引き上げるというもの。
元から大きな画像を更に引き伸ばすのは、質感はともかくある程度画像の被写体が何であるかは判別できている場合がほとんどで、それほど驚かされることはないでしょう。
今回の研究は、誰かわからない状態の画像からそれなりの人物画像を復元するというもので、最初に与えられている情報は皆無とさえ言えます。
画像出典:Google Brain
上の画像の右側が本来の画像、左側が圧縮された画像で、真ん中が今回の研究で生成された画像です。
全くの同一人物、という精度には程遠いですが、髪型や表情などはほとんど同じ。
この技術では、「conditioning network」と「prior network」という2種類のニューラルネットワークを使用しており、conditioning networkで高解像度のサンプルと比較することで、被写体が顔なのか部屋なのかを判断。
そして画像解析ではおなじみのCNN(Convolutional Neural Network/畳み込みニューラルネットワーク)を使用するprior networkが、8×8画像を補完します。
最後に
こういった技術は、インターネットユーザーが楽しく遊んで話題にすることが多く、はやく一般でも試せるデモンストレーションが待ち遠しいですね。
私も実際にどんな顔が復元されるのか、彼の画像で試してみたいと思っています。
-
お問い合わせ
SiTest の導入検討や
他社ツールとの違い・比較について
弊社のプロフェッショナルが
喜んでサポートいたします。 -
コンサルティング
ヒートマップの活用、ABテストの実施や
フォームの改善でお困りの方は、
弊社のプロフェッショナルが
コンサルティングいたします。
今すぐお気軽にご相談ください。
今すぐお気軽に
ご相談ください。
(平日 10:00~19:00)
今すぐお気軽に
ご相談ください。
0120-315-465
(平日 10:00~19:00)
グラッドキューブは
「ISMS認証」を取得しています。
認証範囲:
インターネットマーケティング支援事業、インターネットASPサービスの提供、コンテンツメディア事業
「ISMS認証」とは、財団法人・日本情報処理開発協会が定めた企業の情報情報セキュリティマネジメントシステムの評価制度です。