ハフマン符号

提供:人工言語学Wiki

ハフマン符号とは情報を可逆的に圧縮する手法の一つである。一般に、情報には頻出するパターンとあまり出現しないパターンがあるため、頻出パターンに短い符号を、頻出でないパターンに長い符号を割り当てることで、全体として元の情報より短くなるようにする。

詳細はWikipediaの同名の項目(ハフマン符号)を参照。

人工言語への応用

一般に、機能語に属する単語は頻出しやすく、内容語に属する単語は比較的出現頻度が低くなるため、機能語には短い語形、内容語に長い語形を割り当てることで、文全体の長さが短くなることが期待される。

関連項目

ハフマン符号は接頭符号である。