こんにちは!くるです!
今回は「マルコフ情報源」と呼ばれる情報理論において重要な概念について説明していこうと思います!
マルコフ情報源とは?
マルコフ情報源の例
マルコフ情報源とは簡単に言えば、「過去に依存する情報源」です。
例えば、A君が最近買った本が次のようなものであったとしましょう。

これを見たら、「A君が次に買うのは恐らく漫画だろう」と予想できますよね。実際には教科書を買うかもしれませんが。
これがマルコフ情報源です。(厳密に言うと違いますが、イメージ的にはこういうことです)
別の例を見てみましょう。
例えば、大学生のB君の過去5日間の大学への通学手段が次のようなものであったとします。

これだけを見れば、恐らくB君は次の日は「自転車で行く可能性が高いが、バスかもしれない」と予想できます。
これもマルコフ情報源です。
このようにマルコフ情報源は日常のあらゆるところに存在します!

現実の色んなものを考えてみると、「過去と現在」が繋がっているものがほとんどですよね?
このように、過去に依存して現在の選択が変化するようなもののことを「マルコフ情報源」と呼ぶのです。
情報源とは
情報源が何なのか分からないかもしれないので、補足しておきます。
例えば、先ほどのA君の例を考えてみましょう。
本のジャンルを「漫画、雑誌、教科書、小説」の4種類に分け、この集合を$S$としましょう。
この集合$S$が情報源です。

これは「A君が買う本」についての情報源です。
B君の例も見てみましょう。
通学手段を「徒歩、自転車、バス、電車」の4種類に分け、この集合を$S$とすると、集合$S$が情報源です。

これは、「B君の通学手段」についての情報源です。
「選択肢(情報)の源」で情報源と呼ぶわけです。

マルコフ情報源には大きく分けて2種類あります。
それは「単純マルコフ情報源」と「m重マルコフ情報源」です。
単純マルコフ情報源
単純マルコフ情報源は「1個前の情報だけに依存する情報源」です。
例えば、「赤、緑、青の玉が2つずつ入っている袋から玉を取り出す」ことを考えましょう。
ただし、1個取り出したら、もう1個取り出すまで袋には戻さないというルールを付けて置きます。

まず、最初に赤を取り出しました。

このとき、次に何を取り出す確率が高いかは、外に出ている玉に依存します。
今は赤玉が取り出されているので、「青か緑を取り出す確率が高い」と予想できます。
では、次に青を取り出したとしましょう。

このとき、「赤か緑を取り出す確率が高い」と予想できます。
この例での情報源$S$は次のようになります。

このように、「1個前の情報だけに依存している」ような情報源のことを単純マルコフ情報源と呼びます。
1個前”だけ“というのがポイントです!

m重マルコフ情報源
m重マルコフ情報源は「m個前の情報までが依存する情報源」です。
単純マルコフ情報源のときと同じように、「赤、緑、青の玉が2つずつ入っている袋から玉を取り出す」ことを考えましょう。
しかし、今回は常に2つ玉が取り出されているとします。
例えば、初期状態で、青、赤の順で玉が取り出されているとしましょう。

このとき、次に何を取り出す確率が高いかは、外に出ている2つの玉に依存します。
今は青と赤が取り出されているので、「緑を取り出す可能性が一番高い」と予想できます。
では、次に緑を取り出したとしましょう。

赤と緑が取り出されているので、次は「青を取り出す可能性が一番高い」と予想できます。
この例での情報源$S$は単純マルコフ情報源の例と同じです。

単純マルコフ情報源の時と違い、この情報源は過去2個前までに取り出された玉に依存して、次取り出される玉の可能性が変化します。
そのため、この情報源のことを2重マルコフ情報源と言います。
3個前まで依存するなら3重マルコフ情報源、4個前まで依存するなら4重マルコフ情報源です!

このように、「m個前の情報までが依存する情報源」のことをm重マルコフ情報源と呼ぶのです。
マルコフ情報源と条件付き確率
さて、マルコフ情報は「過去に依存する情報源」だと説明してきましたが、「過去に依存する」というワードで何か思い浮かぶものはないでしょうか?

条件付き確率っすね!
その通り!

条件付き確率はまさしく、「過去に起きたものに依存して、現在の確率が変化するもの」です。
マルコフ情報源を数学的に扱うときはこの条件付き確率を使います。
例えば、単純マルコフ情報源のところの例で考えてみましょう。今、赤玉が取り出されているとします。

このとき、青玉を取り出す確率は$\frac{2}{5}$、緑玉を取り出す確率は$\frac{2}{5}$、赤玉を取り出す確率は$\frac{1}{5}$です。
他にも青玉が取り出されている場合、緑玉が取り出されている場合の条件付き確率を考え、それらを次のように行列を使って表してみましょう。

この行列のことを状態遷移確率行列なんて言ったりします。
このように、マルコフ情報源は条件付き確率を使って、確率的に過去と現在の関係を考えるものなんです。
これ以上はかなり専門的な話になるので、ここまでにしておきます。
お疲れ様でした!

大学の教科書よりもはるかに分かりやすい参考書を調査してまとめてみました。良かったら参考にしてください。