【解答】
四つのアルファベットa~d から成るテキストがあり、各アルファベットは2ビットの固定長2進符号で符号化されている。このテキストにおける各アルファベットの出現確率を調べたところ、表のとおりであった。各アルファベットの符号を表のような可変長2進符号に変換する場合、符号化されたテキストの、変換前に対する変換後のビット列の長さの比は、およそ幾つか。
アルファベット a b c d
出現確率 40 30 20 10
可変長2進符号 0 10 110 111
元々は、2ビットの固定長2進符号なので、4文字ならば 2 x 4 = 8 ビット使用することになる。
今回の場合、aを表すには、1ビットで済むことになる。同様にbは2ビット、cは3ビット、dも3ビットとなる。
さらに、それぞれの出現確率を考えると、1文字を表すのに
0.4 x 1 + 0.3 x 2 + 0.2 x 3 + 0.1 x 3 = 1.9ビット
必要となることが分かる。
そこで、4文字であれば 4 x 1.9 = 7.6ビット使用することが分かる。
固定長が8ビット、可変長が7.6ビットであれば、 7.6 / 8.0 = 0.95となり、長さの比は固定長:可変長=1:0.95となる。