情報理論について
大学2年生です。
図書館で借りた情報理論の本を読んでいて、数学的な記述の部分でわからないところがありましたので、教えていただけたらと思います。
以下、分からない部分の文章です。
*****
情報源アルファベットを
A = {a_1, a_2, a_3, …, a_M}
で表し、時点 i の情報源の出力を X_i (i = 0, 1, 2, …) で表す。
X_iは情報源アルファベットの元のいずれかであるが、どれであるかは確率的に定まるので確率変数である。
まず、時点(n-1)までの情報源系列
X_0 X_1 X_2 … X_(n-1)
について考える。この情報源系列の統計的性質は、X_0, X_1, …, X_(n-1)の結合確率分布
P( x_0, x_1, …, x_(n-1) ) = [X_0 = x_0, X_1 = x_1, …, X_(n-1) = x_(n-1)となる確率]
が与えられれば、完全に定まる。ここに、
x_0, x_1, …, x_(n-1)
は情報源アルファベットAの任意の元を表している。
*****
この文章においての
x_0, x_1, …, x_(n-1)
というものが、どういう立場のものなのかがいまいち分かりません。
・・・と言いますか、文章にあるように定義については分かりますが、なぜ必要となるのかが納得できないといった方が的確かもしれません。
どういうことかといいますと、
時点 i の情報源の出力を X_i としたのにかかわらず、次いで、時点 i における任意の情報源アルファベットの元を x_i と表すことにしてますが、「これらは言い方が異なるだけで、結局は同じものを示しているのでは?」、「なぜ同じものを違う記号で二度も違う記号であらわしているのか?」と分からないのです。おそらく私の認識が間違っているためにこのような疑問があると思うので、どうか教えていただければと思います。
もう少しで納得できるような気がします。
どなたか私が、
「こうしなければ確かに駄目だよね」
と、納得できるような解説をお願いします。
回答お待ちしております。
お礼
ありがとうございました。