これなーに?
マハラノビス距離のメモだよ。
マハラノビス距離って?
2次元以上のベクトル空間において、ある点とある点の距離を平均や分散を考慮して計算するよ。
異常検知などで、ある点とある点の距離から異常か正常かを判断したい場合に、ユークリッド距離は一緒だけど、マハラノビス距離でみると離れていることに気づけるみたいなパターンがあるよ。
↓ こういうの。青の点1と赤の点2は、平均の黒の点からのユークリッド距離は一緒。
だけど、点の集合から考えると青は内側で、赤は外側なので赤の方が異常値だって分かるね。
xとy座標の2次元のマハラノビス距離は、以下の式。
真ん中の以下の式は分散・共分散行列の逆行列。
の場合、
になるよ。
はxの分散、はxとyの共分散、はyの分散。
xとyのそれぞれの分散やxとyの共分散を考慮して距離を計算するから、散り具合がわかる。
なので、ユークリッド距離が同じでも、変数の散り具合で異常判定などができるって感じね。
具体的な計算例だと、
中心座標が(4.8, 5.1)、観測座標が(6.7, 7.8)、xの分散()が2.6、yの分散()が2.5、xとyの共分散()が2.0の場合のマハラノビス距離は、