ハフマン符号

提供:人工言語学Wiki
2023年12月26日 (火) 22:15時点におけるSlaimsan (トーク | 投稿記録)による版 (旧wikiからの移行。)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

ハフマン符号とは情報を可逆的に圧縮する手法の一つである。一般に、情報には頻出するパターンとあまり出現しないパターンがあるため、頻出パターンに短い符号を、頻出でないパターンに長い符号を割り当てることで、全体として元の情報より短くなるようにする。

詳細はWikipediaの同名の項目(ハフマン符号)を参照。

人工言語への応用

一般に、機能語に属する単語は頻出しやすく、内容語に属する単語は比較的出現頻度が低くなるため、機能語には短い語形、内容語に長い語形を割り当てることで、文全体の長さが短くなることが期待される。

関連項目

ハフマン符号は接頭符号である。