ディープラーニングで用いられる6つの距離計算 | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

ディープラーニングで用いられる6つの距離計算

機械学習・ディープラーニングでは学習データを分類するためにクラスタリングを行いますが、クラスタリングには学習データ同士の距離を計測し、分類を行います。
今回は代表的なデータ点間の距離測定方法6つをご紹介します。

ユークリッド距離


数学におけるユークリッド距離(ユークリッドきょり、英: Euclidean distance)またはユークリッド計量(ユークリッドけいりょう、英: Euclidean metric; ユークリッド距離函数)とは、人が定規で測るような二点間の「通常の」距離のことであり、ピタゴラスの公式によって与えられる。この公式を距離函数として用いればユークリッド空間は距離空間となる。ユークリッド距離に付随するノルムはユークリッドノルムと呼ばれる。古い書籍などはピタゴラス計量(英: Pythagorean metric)と呼んでいることがある。

Wikipedia:ユークリッド距離

ユークリッド距離_odf

式で表すと難しいですが、要は2点p、q間の直線距離(ベクトル長さ)です。

三角形ABCにおける斜辺Cの長さを求めよ。

という問題であれば、ピタゴラスの定理(三平方の定理)という名前で中学数学に出てきていましたね。

標準ユークリッド距離

標準ユークリッド距離_odf

ユークリッド距離に対して、各次元ごとに標準偏差で割り、値の分散を標準化した上でのユークリッド距離を標準ユークリッド距離と呼びます。

マハラノビス距離


マハラノビス距離(-きょり、Mahalanobis’ Distance)とは、統計学で用いられる一種の距離である。「普通の距離を一般化したもの」という意味でマハラノビス汎距離(-はんきょり)ともいう。プラサンタ・チャンドラ・マハラノビスにより1936年導入された。

Wikipedia:マハラノビス距離
Wikipedia:マハラノビス距離

マハラノビス距離

変数同士に相関がある場合に用いられます。ユークリッド距離では全方向に対する距離は同一に扱われますが、マハラノビス距離では相関が強い方向の距離は実際の距離よりも相対的に短くするという考え方になります。

マンハッタン距離


マンハッタン距離(マンハッタンきょり、Manhattan distance)またはL1-距離は、幾何学における距離概念のひとつ。各座標の差(の絶対値)の総和を2点間の距離とする。
ユークリッド幾何学における通常の距離(ユークリッド距離)に代わり、この距離概念を用いた幾何学はタクシーの幾何 (taxicab geometry) と呼ばれる。19世紀にヘルマン・ミンコフスキーによって考案された。

Wikipedia:マンハッタン距離

マンハッタン距離_odf

マンハッタンや京都等の碁盤の目上の道路をタクシーで移動する時に実際に走る距離のことです。
これはなんとなくわかりますね。
チェスのルークの移動距離はこのマンハッタン距離で測られるそうです。

チェビシェフ距離


チェビシェフ距離(英: Chebyshev distance)またはL∞-距離は、幾何学における距離概念のひとつ。各座標の差(の絶対値)の最大値を2点間の距離とする。名称はパフヌティ・チェビシェフに由来する。チェス盤距離(英: chessboard distance)とも呼ばれる。

Wikipedia:チェビシェフ距離

チェビシェフ距離_odf

斜めに移動するという概念を縦横に移動するのと同じと考えた距離概念です。なんだか難しそうですが、同心円状に距離が伸びていくようなイメージです。
チェスのルーク以外の距離はこのチェビシェフ距離で表します。

ミンコフスキー距離

これまでに紹介したユークリッド距離、マンハッタン距離、チェビシェフ距離はミンコフスキー距離によって一般化できます。

ミンコフスキー距離_odf

p = 1 のとき
ミンコフスキー_マンハッタン距離_odf
となり、これはマンハッタン距離となります。

p = 2 のとき
ミンコフスキー_ユークリッド距離_odf
となり、これはユークリッド距離となります。

p = ∞ のとき
ミンコフスキー_チェビシェフ距離_odf
となり、これはチェビシェフ距離となります。

まとめ

機械学習の中身のアルゴリズムもユークリッド距離やマンハッタン距離は中学校までに習うようなものがベースとなっているので、意外とわかりやすいものが使われることもあるんですね。
他にも類似度や集合の類似度、文字列の距離などの学習データを用いて、機械学習を賢くしていきます。
普段使ってるサービスやアプリ等でも、このような機械学習データを用いて予測やレコメンドされているものがあるかもしれませんね。

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

グラッドキューブは
「ISMS認証」を取得しています。

認証範囲:
インターネットマーケティング支援事業、インターネットASPサービスの提供、コンテンツメディア事業

「ISMS認証」とは、財団法人・日本情報処理開発協会が定めた企業の情報情報セキュリティマネジメントシステムの評価制度です。

いますぐ無料で
お試しください。

SiTest の革新的な機能を
お試しいただけます。
利用規約

お名前【必須】
メールアドレス【必須】
電話番号【必須】