- 締切済み
画像処理における行列演算の意味
たとえば100×100画素の画像があるとします。その輝度値情報は100×100の行列になります。 その行列について共分散行列を出して、そこから導かれる固有値、固有ベクトルは物理的、数学的にどういった意味を持っているのでしょうか? よくわかりません。どうぞよろしくお願いいたします。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- sinisorsa
- ベストアンサー率44% (76/170)
多数のパターンサンプルにより、パターン集合の統計的な性質を 求め、その上で、個々のパターン(画像)の特徴を効率よく表す のがKL展開や主成分分析です。また、隠れた特徴が見つかる かもしれないと期待するわけです。 100×100画素の画像は、1画素がベクトルの1つの要素 となり、10000個の特徴を持っていることになりますが、 もっと少ない特徴で画像を表すことができる。->特徴抽出 なお、共分散行列は、ベクトルの各要素間の分散と共分散を 表す行列です。行列についての共分散行列という表現はしません。
- sinisorsa
- ベストアンサー率44% (76/170)
100×100画素の画像が大量にあるものとしましょう。 100×100画素の画像は1万次元ですから、次元数以上。 これらの画像を1万次元ベクトルをして、これの共分散行列 を求める」なら画像集合の統計的な性質の一つが与えられます。 共分散行列の固有ベクトルは、基底ベクトルを与えます。 その基底ベクトルの方向の分散が固有値です。 画像をより少ない特徴量で表す(次元削減)場合には、固有値の大きい 方から基底ベクトル(固有ベクトル)を選ぶと、元の画像と 次元削減後の画像の間の2乗平均誤差が最小になります。 このような考え方は、KL展開(カルフーネン・レーブ展開)として 知られています。(多変量解析の主成分分析とも同様) パターン認識の前処理として、よくつかわれています。
- porepore47
- ベストアンサー率28% (22/77)
画像そのものは、一般的にはランダムな数値の並びですから、この演算自体には数学的な本来の意味以外には、物理的意味はありません。 画像を解析するときに、この様な演算が意味があると思う場合に使います。 画像になんらかな方向性が含まれるとか。 画像を統計的な特徴量に変換して、パターン認識をするなどの用途で使いますが、これがどういう意味があるかは、その画像しだいですね。
- rabbit_cat
- ベストアンサー率40% (829/2062)
どういう操作をしているのか、よく分からないで、もうちょっとだけ、具体的に何をやっているのか書いてくれませんか? >その行列について共分散行列を出して、 行列の共分散行列 というのは、どういう意味ですか? また、 100×100画素の画像が1枚だけあるんですよね。 1枚しかないもの(確率変数でないもの)の分散というのはどういう意味ですか? たとえば、近くの画素間どれくらい相関があるのかを、画像全体にわたって取るということですか?
補足
回答ありがとうございます. 僕もよくわかっていないのですが行っている処理としては 元の100×100の輝度値の行列に対してそれぞれの要素から全画素の平均値を引きます. その行列をXとして,Q=XXt←(転置)として共分散行列を定義しています.それに対して計算を行うといったことです. 正直この共分散行列をだす意味も良く分かっていない次第です. 申し訳ないです.的を射ない質問で.よろしくお願いします.
補足
回答ありがとうございます。 KL展開の手法はなんとなくわかります。 画像が複数ある場合にその中の統計的性質をみると。 その場合には100×100をラスタースキャンして1万次元にする→それをn枚並べて1万×n行列にする→それに対し共分散行列を求めて、処理すると、画像集合の性質がわかってくる。というものですよね。 それを一枚の100×100について行うとどういう意味をもつのでしょう? 画像集合の統計的性質ではなく、一枚の画像の行成分についての統計的性質が得られたりするのでしょうか?