Googleがモザイク画像から元の被写体を復元。 | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

Googleがモザイク画像から元の被写体を復元。

Googleの人工知能を使った画像解析技術は、もはや画像の内容を判別するというレベルを超えつつあります。
今回発表された新たな画像復元技術は、一体どのようなものなのでしょうか?

RAISR(Rapid and Accurate Image Super-Resolution)

Googleはすでに2016年11月に「RAIZER」という人工知能の機械学習による技術を発表しています。
Google+などにも活用されている技術で、リアルタイムに低解像度の画像ファイルを高画質にしてくれる技術です。
スマートフォンやタブレットなどで、ユーザーがピンチアウト(画面や画像を引き伸ばすアクション)を行ったときに低解像度のファイルでもきれいに見せることを可能にし、画像容量を抑えたままアップロードしたファイルを、ほぼリアルタイムで画像処理し高解像度版を復元します。
Googleが推奨するAMP(Accelerated Mobile Pages)との親和性も高そうで、回線の細いモバイルでのインターネット接続でも快適なユーザビリティが得られそうです。

Google’s RAISR sharpens low-resolution images using machine learning(YouTube)

RAISIRは、画像処理の精度とスピードを上げるために2つのアプローチの機械学習が行われています。
RAIZER
デジタル画像はドットの集合から成り立っていますが、引き伸ばした際に足りないピクセルはコンピュータが予測して埋めていくことになります。
原則的に、デジタル拡大した結果がぼんやりとした質感になるのは避けられないことでした。
(このピクセルの補完に人工知能を用いて話題となったのがワイフです。)
RAIZERは低解像度画像と高解像度画像、低解像度画像とアップサンプリングしたものの両方のデータをセットで学習することで精度とスピードを向上させています。

Pixel Recursive Super Resolution

今回発表された技術はなんと8×8ドットの解像度の画像を、32×32の解像度まで引き上げるというもの。
元から大きな画像を更に引き伸ばすのは、質感はともかくある程度画像の被写体が何であるかは判別できている場合がほとんどで、それほど驚かされることはないでしょう。
今回の研究は、誰かわからない状態の画像からそれなりの人物画像を復元するというもので、最初に与えられている情報は皆無とさえ言えます。

google-brain-pixel-recursive-super-resolution
画像出典:Google Brain
上の画像の右側が本来の画像、左側が圧縮された画像で、真ん中が今回の研究で生成された画像です。
全くの同一人物、という精度には程遠いですが、髪型や表情などはほとんど同じ。

この技術では、「conditioning network」と「prior network」という2種類のニューラルネットワークを使用しており、conditioning networkで高解像度のサンプルと比較することで、被写体が顔なのか部屋なのかを判断。
そして画像解析ではおなじみのCNN(Convolutional Neural Network/畳み込みニューラルネットワーク)を使用するprior networkが、8×8画像を補完します。

最後に

こういった技術は、インターネットユーザーが楽しく遊んで話題にすることが多く、はやく一般でも試せるデモンストレーションが待ち遠しいですね。
私も実際にどんな顔が復元されるのか、の画像で試してみたいと思っています。