Essential Matrix (基本行列) と R, T の復元
SfM のエントリ作成にあたって,せっかくなので構成要素となる小さなアルゴリズムをまとめています.このエントリでは,2つの項目を書き留めておきます.
0.このエントリで扱う内容
1.Essential Matrix (基本行列) とは何か?
2.Essential Matrix がわかった時に,それからカメラモーション (R, T) を取り出す方法.
1.Essential Matrix (基本行列) とは何か?
それでは,まず基本行列の説明です.かなり前にエピポーラ幾何を説明する下記のエントリを書いたんですが,その中で Essential Matrix (基本行列) に触れていました.
で,このエントリの中で,
「視点を変えても同じものが写っていた時には満たされるべき条件・数式があって,それが何か?」を表すのがエピポーラ幾何です.
という記述をしています.で,この表現から一歩進んで数式に落とすべく下記の図を考えてみます.これ以降,このエントリでは正規化画像座標系で考えています.
図中に記入しましたが,
1.2つのカメラの視線ベクトルをどちらかの座標系で表現する.
2.一方の視線ベクトルとカメラの並進ベクトルが作る平面の法線ベクトルを計算する.
3.他方の視線ベクトルと2で計算した法線ベクトルが直行する.
という3つの条件から,最後の数式が出てきます.ただ,この数式のままだとベクトルの外積とかが入ってきててややこしいです.なので," t X R " の部分をもう少し扱いやすくするために行列演算で置き換えます.下記がその過程と結果です.
上記の結果から,ベクトルの外積演算が行列の積演算に置き換わることがわかりました.行列積への置き換えを使って,エピポーラ幾何から生成した数式を書き換えると,下記のようになります.
で,上図の最後に置き換え結果を記しましたが,この E が Essential Matrix (基本行列) になります.置き換えの過程を見てもわかる通り, E は2つのカメラの位置関係 R, T にのみ依存しています.
2.Essential Matrix がわかった時に,それからカメラモーション (R, T) を取り出す方法.
で,散々回りくどくEssential Matrix (基本行列) の説明とか式導出をしてきましたが,「で,Essential Matrix が求まってなにが嬉しいの?」 という質問にはまだ答えられてませんでした.ミソとなるのは,1の項の最後に書いた「E は2つのカメラの位置関係 R, T にのみ依存しています.」という部分で,画像の対応点を見つけて計算しE がわかれば,
「2つのカメラの位置関係(R, T)がわかる!」
ということになります.2の項では,Eがわかった時に,
「Eからどうやって R と T を計算するか」
という点を見ていきます.
2.1.Essential Matrix の特徴・特性
でEssential Matrixの特徴ですが,全部で3つの特徴があります.うち2つは先ほどの導出からわかります.
で,3つめがちょっとわかりにくいのですが,「0でない2つの特異値の値が同じ」というものがあります.
上記の証明では,歪対称行列を特異値分解すると,下記の形になることを使っています.(が,ここをなんでやねん?するのは諦めました(笑))
で,歪対称行列が上記のように特異値分解できることとがわかったので,あとはここから「0でない2つの特異値が同じで,残りの特異値は0である」ことを示すために,直行行列Wを使って使ってZを変換してあげています.この変換を経て E = U diag(1, 1, 0) W UTRと表すことができて,「0でない2つの特異値の値が同じ」であることがわかりました.
2.2.Essential Matrix からの R, T の計算
2.1ではEssential Matrix を特異値分解すると,E = U diag(1, 1, 0) VT となることがわかりました.
今度は
E が与えられた時に,Eを特異値分解してE = U diag(1, 1, 0) VTが求まったとした時に,そこからどうやって R, T を計算するか?
が問題になります.
ただ,先ほどの証明の過程で出てきた数式を使えば,
E = U diag(1, 1, 0) VT = U diag(1, 1, 0) W UTR
[t]x = UZUT
となることがわかっているので,結果的に求まる解は
1.[t]x = UZUT, -UZUT(もしくは,Uの3つめの列ベクトルでも同じ.)
2.R = UWTVT, UWVT
となります.ここで,Tに関してもRに関しても2つ解がでてきます.これは,特異値分解の箇所で符号が定まらないことが原因で(Rの場合はWとWTの場合で符号が反転します.),どの組み合わせを用いてもここまでの議論が成立します.そのため,最終的に求まるカメラ行列は4つになります.「この4候補の中から正しい解を選択する」というロジックが最後に必要になります.
2.3.Essential Matrix を分解するコードサンプル
下記,別のエントリで出てくる SfM のコードの一部ですが,実際に基本行列を分解して R, T を求めています.分解した結果として,2つづつの並進ベクトル,回転行列を呼び出し元に返しています.
bool decompose_E_to_R_T_internal( const cv::Matx33d& E, cv::Matx33d& R1, cv::Matx33d& R2, cv::Matx31d& T1, cv::Matx31d& T2) { // Use OpenCV SVD. cv::SVD svd(E, cv::SVD::MODIFY_A); // Result check. double singular_value_ratio = std::abs(svd.w.at<double>(0) / svd.w.at<double>(1)); // If two singular values are too far apart, this caluclation fails. if (singular_value_ratio < 0.7 || 1.5 < singular_value_ratio) { return false; } cv::Matx33d W(0,-1,0,1,0,0,0,0,1); R1 = cv::Mat(svd.u * cv::Mat(W) * svd.vt); T1 = cv::Mat(svd.u.col(2)); cv::Matx33d Wt(0,1,0,-1,0,0,0,0,1); R2 = cv::Mat(svd.u * cv::Mat(Wt) * svd.vt); T2 = cv::Mat(-svd.u.col(2)); return true; }