1.6　情報理論のビジュアル編集

Top > 1.6　情報理論

<h2 id="j28f17c2">1.6.0</h2><ul class="list1 list-indent"><li>p.49下「ちなみに、これ以上短い符号は使うことができない。なぜなら、結合した文字列を符号に分割する曖昧さを残してはならないからである。」<br />←曖昧さとは、例えば状態eに"11110"という符号を割り当てると、それぞれの符号そのものは区別でき平均符号長も短くなるが、例えば"1111010"という文字列は"11110 10"(eb)または"111101 0"(fa)と2通りの解釈ができてしまう<br /><br /></li><li>N個の物体の箱への入れ方<br />N個の物体に番号を付けるなど区別して並べる方法はN!通り。並べた物体を最初のn1個を1番目の箱に入れ、次のn2個の物体を2番目の箱に入れ、とやっていく。1番目の箱の中の物体の並びはn1!通りあって、1番目の箱の並びそれぞれに対して2番目の箱の中の並びはn2!通りあって、...となり箱の中の並びは区別しないで同じとみなすので、これらの積で総数を割る必要がある。よって<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(text-align: center)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(W=\frac{N!}{\prod_{i}^{} n_i!})</div></li></ul><ul class="list1 list-indent"><li>式(1.97)<br />式(1.96)から<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\ln{n_i!}\simeq n_i\ln{n_i}-n_i)</div></li></ul><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\begin{eqnarray} \\ H &=& \frac{1}{N}\ln{N!}-\frac{1}{N}\sum_{i}\ln{n_i!} \\ &\simeq& \frac{1}{N}(N\ln{N}-N)-\frac{1}{N}\sum_{i}(n_i\ln{n_i}-n_i) \\ &=& \ln{N}-1-\sum_{i}\frac{n_i}{N}\ln{n_i}+1 \\ &=& \ln{N}-\sum_{i}\frac{n_i}{N}(\ln{n_i}-\ln{N}+\ln{N})　（引いて足した） \\ &=& \ln{N}-\sum_{i}\frac{n_i}{N}\ln{\frac{n_i}{N}}-\ln{N}　　　(\because\sum_{i}n_i=N)  \\ &=& -\sum_{i}\frac{n_i}{N}\ln{\frac{n_i}{N}} \end{eqnarray})</div><p><br /></p><ul class="list1 list-indent"><li>式(1.99)あたり<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(text-align: center)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\begin{eqnarray} \tilde{H}&=&-\{p(x_1)\ln{p(x_1)}+p(x_2)\ln{p(x_2)}+\ldots+p(x_M)\ln{p(x_M)}\}\\ & & +\lambda\{p(x_1)+p(x_2)+\ldots+p(x_M)-1\} \end{eqnarray})</div></li></ul><p><br /></p><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(text-align: center)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\frac{\partial}{\partial p(x_1)}\tilde{H} = -\left(\ln{p(x_1)}+p(x_1)\frac{1}{p(x_1)}\right)+\lambda = 0)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\ln{p(x_1)} = \lambda-1 )</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax( p(x_1) = \mathrm{e}^{\lambda - 1})</div><p>同様にして</p><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\ln{p(x_k)} = \mathrm{e}^{\lambda - 1})</div><p>また、</p><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\sum_{i}p(x_i) = 1 )</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(Mp(x_k) = 1)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(p(x_k) = \frac{1}{M})</div><ul class="list1 list-indent"><li>(1.101)平均値の定理<br /><br />下図でBCDFの面積がACDEと等しくなるようなx_iが存在する。</li></ul><p><span class="plugin" contenteditable="false" style="cursor:default" _filename="平均値の定理.png" _alt="" _width="" _height="" _size="%" _align="" _wrap="0" _around="0" _nolink="0" _noicon="0" _noimg="0" _zoom="0">&ref(平均値の定理.png);</span></p><ul class="list1 list-indent"><li>(1.108)あたり<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\int_{-\infty}^{\infty}\{-p(x)\ln{p(x)}+\lambda_1p(x)+\lambda_2xp(x)+\lambda_3(x-\mu)^2p(x)\}\mathrm{dx}-(\lambda_1+\lambda_2\mu+\lambda_3\sigma^2) \\ =\int_{-\infty}^{\infty}F(x,p(x))\mathrm{dx}-(\lambda_1+\lambda_2\mu+\lambda_3\sigma^2))</div>とすると<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\frac{\partial F}{\partial p(x)} = -\ln{p(x)}-p(x)\frac{1}{p(x)}+\lambda_1+\lambda_2x+\lambda_3(x-\mu)^2=0)</div><div class="plugin" contenteditable="false" style="cursor:default">#mathjax(p(x)=\mathrm{exp}\{-1+\lambda_1+\lambda_2x+\lambda_3(x-\mu)^2\})</div></li></ul><br /><ul class="list1 list-indent"><li>(1.112)<div class="plugin" contenteditable="false" style="cursor:default">#mathjax(\begin{eqnarray} \\ H[{\bf y}\mid{\bf x}] &=& -\iint p({\bf y},{\bf x})\ln{p({\bf y}\mid{\bf x})}\mathrm{d{\bf y}}\mathrm{d{\bf x}} \\ &=& -\iint p({\bf y},{\bf x})\ln{\frac{p({\bf y},{\bf x})}{p({\bf x})}}\mathrm{d{\bf y}d{\bf x}} \\ &=& -\iint \{p({\bf y},{\bf x})\ln{p({\bf y},{\bf x})}-p({\bf y},{\bf x})\ln{p({\bf x})}\}\mathrm{d{\bf y} d{\bf x}} \\ &=& -\iint p({\bf y},{\bf x})\ln{p({\bf y},{\bf x})}\mathrm{d{\bf y}d{\bf x}}+\int p({\bf x})\ln{p({\bf x})}\mathrm{d{\bf x}} \\ &=& H[{\bf x},{\bf y}]-H[{\bf x}]    \end{eqnarray})</div></li></ul><h2 id="df3e9f5d">1.6.1　相対エントロピーと相互情報量</h2><ul class="list1 list-indent"><li><span style="color:red; background-color:yellow">TODO</span>:演習1.36</li><li><span style="color:red; background-color:yellow">TODO</span>:データ圧縮と密度推定（・・・）は密接に関係しており・・・: ？？？<br /><br /><br /></li></ul><div class="plugin" contenteditable="false" style="cursor:default">#pcomment</div>

*1.6.0 [#j28f17c2]
-p.49下「ちなみに、これ以上短い符号は使うことができない。なぜなら、結合した文字列を符号に分割する曖昧さを残してはならないからである。」
←曖昧さとは、例えば状態eに"11110"という符号を割り当てると、それぞれの符号そのものは区別でき平均符号長も短くなるが、例えば"1111010"という文字列は"11110 10"(eb)または"111101 0"(fa)と2通りの解釈ができてしまう
&br;
-N個の物体の箱への入れ方
N個の物体に番号を付けるなど区別して並べる方法はN!通り。並べた物体を最初のn1個を1番目の箱に入れ、次のn2個の物体を2番目の箱に入れ、とやっていく。1番目の箱の中の物体の並びはn1!通りあって、1番目の箱の並びそれぞれに対して2番目の箱の中の並びはn2!通りあって、...となり箱の中の並びは区別しないで同じとみなすので、これらの積で総数を割る必要がある。よって
#mathjax(text-align: center)
#mathjax(W=\frac{N!}{\prod_{i}^{} n_i!})

-式(1.97)
式(1.96)から
#mathjax(\ln{n_i!}\simeq n_i\ln{n_i}-n_i)

#mathjax(\begin{eqnarray} \\ H &=& \frac{1}{N}\ln{N!}-\frac{1}{N}\sum_{i}\ln{n_i!} \\ &\simeq& \frac{1}{N}(N\ln{N}-N)-\frac{1}{N}\sum_{i}(n_i\ln{n_i}-n_i) \\ &=& \ln{N}-1-\sum_{i}\frac{n_i}{N}\ln{n_i}+1 \\ &=& \ln{N}-\sum_{i}\frac{n_i}{N}(\ln{n_i}-\ln{N}+\ln{N})　（引いて足した） \\ &=& \ln{N}-\sum_{i}\frac{n_i}{N}\ln{\frac{n_i}{N}}-\ln{N}　　　(\because\sum_{i}n_i=N)  \\ &=& -\sum_{i}\frac{n_i}{N}\ln{\frac{n_i}{N}} \end{eqnarray})

&br;

-式(1.99)あたり
#mathjax(text-align: center)
#mathjax(\begin{eqnarray} \tilde{H}&=&-\{p(x_1)\ln{p(x_1)}+p(x_2)\ln{p(x_2)}+\ldots+p(x_M)\ln{p(x_M)}\}\\ & & +\lambda\{p(x_1)+p(x_2)+\ldots+p(x_M)-1\} \end{eqnarray})

&br;
#mathjax(text-align: center)
#mathjax(\frac{\partial}{\partial p(x_1)}\tilde{H} = -\left(\ln{p(x_1)}+p(x_1)\frac{1}{p(x_1)}\right)+\lambda = 0)
#mathjax(\ln{p(x_1)} = \lambda-1 )
#mathjax( p(x_1) = \mathrm{e}^{\lambda - 1})

同様にして
#mathjax(\ln{p(x_k)} = \mathrm{e}^{\lambda - 1}) &br;
また、
#mathjax(\sum_{i}p(x_i) = 1 )
#mathjax(Mp(x_k) = 1)
#mathjax(p(x_k) = \frac{1}{M})

-(1.101)平均値の定理&br;
下図でBCDFの面積がACDEと等しくなるようなx_iが存在する。

&ref(平均値の定理.png);

-(1.108)あたり
#mathjax(\int_{-\infty}^{\infty}\{-p(x)\ln{p(x)}+\lambda_1p(x)+\lambda_2xp(x)+\lambda_3(x-\mu)^2p(x)\}\mathrm{dx}-(\lambda_1+\lambda_2\mu+\lambda_3\sigma^2) \\ =\int_{-\infty}^{\infty}F(x,p(x))\mathrm{dx}-(\lambda_1+\lambda_2\mu+\lambda_3\sigma^2))
とすると
#mathjax(\frac{\partial F}{\partial p(x)} = -\ln{p(x)}-p(x)\frac{1}{p(x)}+\lambda_1+\lambda_2x+\lambda_3(x-\mu)^2=0)
#mathjax(p(x)=\mathrm{exp}\{-1+\lambda_1+\lambda_2x+\lambda_3(x-\mu)^2\})

#br

-(1.112)
#mathjax(\begin{eqnarray} \\ H[{\bf y}\mid{\bf x}] &=& -\iint p({\bf y},{\bf x})\ln{p({\bf y}\mid{\bf x})}\mathrm{d{\bf y}}\mathrm{d{\bf x}} \\ &=& -\iint p({\bf y},{\bf x})\ln{\frac{p({\bf y},{\bf x})}{p({\bf x})}}\mathrm{d{\bf y}d{\bf x}} \\ &=& -\iint \{p({\bf y},{\bf x})\ln{p({\bf y},{\bf x})}-p({\bf y},{\bf x})\ln{p({\bf x})}\}\mathrm{d{\bf y} d{\bf x}} \\ &=& -\iint p({\bf y},{\bf x})\ln{p({\bf y},{\bf x})}\mathrm{d{\bf y}d{\bf x}}+\int p({\bf x})\ln{p({\bf x})}\mathrm{d{\bf x}} \\ &=& H[{\bf x},{\bf y}]-H[{\bf x}]    \end{eqnarray})
*1.6.1　相対エントロピーと相互情報量 [#df3e9f5d]
-&color(red,yellow){TODO};:演習1.36
-&color(red,yellow){TODO};:データ圧縮と密度推定（・・・）は密接に関係しており・・・: ？？？
#br
#br
#br

#pcomment

広告

1.6　情報理論のビジュアル編集

広告

サイドメニュー

目次

トップページ

第１章　序論

1.1　例：多項式曲線フィッティング

1.2　確率論

1.3　モデル選択

1.4　次元の呪い

1.5　決定理論

1.6　情報理論

第２章　確率分布

2.1　二値変数

2.2　多値変数

2.3　ガウス分布

2.4　指数型分布族

2.5　ノンパラメトリック法

第３章　線形回帰モデル

3.1　線形基底関数モデル

3.2　バイアスーバリアンス分解

3.3　ベイズ線形回帰

br

メニュー

掲示板

アクセスカウンター

recent

最新の10件

freeze

広告

広告