CLAコード
CLA v1 | 番号 | CLaKIS CC2015-1 |
提案日 | 2015/7/21 | |
発行日 | 2015/7/21 | |
執筆者 | おかゆ, Yuhr | |
CLA v2 | 番号 | CLaKIS CC2021-1 |
提案日 | 2021/8/5 | |
発行日 | 2021/8/5 | |
執筆者 | 佐藤陽花 | |
CLA v1 CLA v2 |
仕様書 | CL-KIITA/CLACode_SRI :spec/cla_old.md |
CLA v3 | 番号 | CLaKIS CC2021-2 CLaKIS CC2021-3 CLaKIS CC2021-4 CLaKIS CC2021-5 |
提案日 | 2021/8/17 | |
発行日 | 2021/9/2 (SD: 未発行) | |
執筆者 | 佐藤陽花, Ziphil, フルヒト, Xirdim, AI, ѕkytomo | |
仕様書 | CL-KIITA/CLACode_SRI :spec/cla_code.md |
CLA (ConLAng) コードとは、ISO 639 の形式に倣った日本語圏の人工言語コミュニティーで使われる人工言語の識別符号である。
CLAコードを用いることで、辞典データなどのデータベース上で人工言語を取り扱いやすくなる。英語圏では、似た試みとして[kreativekorp.com https://www.kreativekorp.com/clcr/]がISO-639-3互換コードを発行・管理している。
CLAコードには、おかゆ氏の管理していたCLA v1と、CLA v1を改良・移管した佐藤陽花氏の管理するCLA v3がある。初版のCLA v1は 2015年7月21日におかゆ氏により提案され[1]
、それ以降 Google Form を利用して申請および承認がなされていた。(改訂に伴い申請受付が停止された。ただし既に承認されたコードは現在も有効)。
この状況を受け、佐藤陽花氏による私案 (後述) をもとに、佐藤陽花氏, Ziphil 氏, Xirdim 氏, フルヒト氏を始めとするメンバーによって、第 3 版 (CLA v3) が考案された。
2021 年 8 月 31 日には、CLA v3 のコードを申請および一覧できるサイト Conlang Portal がオープンし、また、2021 年 9 月 2 日には CLA v3 仕様書が発行された。 2022-11-23にconlang portalをホスティングしていたherokuの無料プランが終了しconlang portalは閉鎖した。以降2023-12-24現在までCL-KIITAのdiscordサーバーで佐藤陽花氏が人力でCLA v3を発行している。
CLA v1
概要
CLA コードは 3 文字および 5 文字の ASCII ラテン小文字で規定される。 初めの 3 文字はその言語に割り当てられたコードを表し、後ろの 2 文字は (存在すれば) その言語の属する人工言語語族 (世界や作者などによる暫定的な分類) に割り当てられたコードを表す。 特に重複などの無い限りは、3 文字のみで表記することができる。
ある言語のコードを決定する際には、その言語名をその言語によって綴ったものをさらにラテン小文字転写したものをもとに、重複のないよう決定する。
申請
以下の Google Form により申請できた。
https://docs.google.com/forms/d/1hIGV5PnCTZZIABk6K2pomHGfjLW8aL5cvNfYlPxS338/viewform
懸念
- ISO コードと衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
- 略号の競合で喧嘩が起こる可能性がある。
- 開発中止となった人工言語の CLA コードの処理をどうするか。
- 語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。ひとつの救済策として「無所属/未定コード」を用意する方法がある。「**」をそれとすることで、そのような言語の申請のハードルを下げられるかもしれない。もちろん、「**」はもっとも広い語族となりうるため、その中で言語コードの衝突が起こる可能性も他に比べて高くなる。そのため、「**」語族の言語は、衝突が起こりうる際、委員会から語族コードの決定要請がなされる(この救済策は草稿段階である)。
一覧
ver 0.6 (2015/07/22)
順番は申請順。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
シャレイア語 (qixaléh) | xal | zp |
ロジバン (lojban) | jbo | lg |
クレリカ (qreriqa) | qre | hr |
アルテナ語 (altenam qeras) | alt | ll |
シヴァン (xivan) | xiv | am |
アルカ (arka) | ark | rx |
(三代目)リパライン語 (lineparine) | lpa | lp |
ヴェフィス語(四代目リパライン語) (Vaifise) | vef | lp |
ver 0.7 (2015/07/25)
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
ワコファル語 (wakofal syal) | wkf | ll |
イジェール語 (Etube Id'erin) | idz | id |
トキポナ (toki Pona) | tpn | ** |
ver 0.8 (2015/08/13)
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
カルコレーシュ語 (Calcoradetár) | cal | ca |
ver 0.9 (2016/01/17)
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
凪霧(nagili) | alt | rx |
vlm | vl | |
モヤシ語(moiacis) | mic | mc |
レテシミ語(letesimi) | lsm | mc |
ver 0.95 (2016/10/12)
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
ビウ語(biwe) | biw | vl |
ヴォレモ(Volxemo) | vlm | vl |
ver 2017-11-13
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
レクステンス(lekustens) | lst | ls |
ver 2021-08-03
順番は申請順。 新たに追加されたコードだけを掲載する。
言語名 | CLA言語コード | CLA語族コード |
---|---|---|
フィダーヌス語(Heb Fidana) | fid | ht |
ミ・デア語(Żea Mi-Dea) | nkl | md |
アポート語(uptohgikulecsepi) | upt | ni |
デーレ語(aulakk derle) | del | et |
ボウニム語(bohnimik) | bnm | xr |
オ゛ェジュルニョェーッ語(Ƣeznē'bix) | fez | fb |
CLA v2
CLA v1 に対する上記の懸念を解決するため、オ゛ェジュルニョェーッ語の創作を率いる佐藤陽花氏により提案された私案である。なお運用には至っていない(ただし例示としてオ゛ェジュルニョェーッ語にのみコードが付与されている(fez/fb
))。
開発中止となった人工言語の CLA コードの処理
ISO コードにおける消滅言語の取扱いに倣い、存属する。
略号の競合で喧嘩が起こる可能性
各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。
「無所属/未定コード」の処理
上記常設委員会の設立のほか、「無所属/未定コード」に関連する以下のような CLA コードのコード定義の変更を行う。
- 語族領域 ... それぞれの言語(群)ごとの設定や世界観に伴った語族によってコードを付与するための領域。
/
をプレフィックスとし、ASCII ラテン小文字 2 字の語族コードが充てられる。 - 製作者領域 ... 語族別ではなく、製作者/製作団体のコード附与を希望する製作者/製作団体に付与するための領域。
~
をプレフィックスとし、ASCII ラテン小文字 2 字の製作者コードが充てられる。 - 無所属領域 ... 語族領域にも製作者領域にも属さないことを希望した言語のための領域。
#**
が充てられる。 - 未定領域 ... どのコード付与を希望するか未だ決まっていない言語のためのための領域。
?**
が充てられる。
CLA v3
概要
上記の CLA v1 の問題を受け、新たに制定された CLA コードである。 Conlang Portal で管理されている。
CLA v3 は、以下の 4 階層構成になっている。
- 製作者コード (3 桁) … 製作者や製作団体を表す階層。
- 語族コード (3 桁) … 同一の製作者や製作団体が作る複数の言語をグループ化するための階層。世界観や語族などが相当する。
- 言語コード (2 桁) … 言語を表す階層。
- 方言コード (2 桁) … 言語に方言変種がある場合に、その方言を表す階層。
コードを表記する際は、これらを逆順に _
で繋げて表記する。
例えば、製作者コードが ccc
, 語族コードが fff
, 言語コードが ll
, 方言コードが dd
であれば、コード全体は dd_ll_fff_ccc
となる。
語族コードと方言コードは指定しないことが可能で、その場合は ~
で表す。
言語コード体系識別コード
番号 | CLaKIS CC2021-6 |
提案日 | 2021/8/17 |
発行日 | 2021/9/2 |
執筆者 | 佐藤陽花 |
仕様書 | CL-KIITA/CLACode_SRI :spec/sys_disc.md |
注意:全ての言語コードの完全上位概念であるので、原則としてマッピングすることはできない。
言語コードをデータ記述ファイルやプログラム上に記載するとき、或いは文書上で表記するときにどの言語コード体系に準拠して記載されているかを示し、判別するための 4 字コード。書式は[a-z]{3}[a-z0-9]
であり、主なものは次の通り。
iso1
自然言語:ISO639-1iso2
自然言語:ISO639-2iso3
自然言語:ISO639-3cla1
人工言語:CLA コード、従来版cla2
人工言語:CLA コード、私案版cla3
人工言語:CLA コード、正規改訂版glot
自然言語:Glottologietf
自然言語:IETF 言語タグlisr
自然言語:Lingasphere Registerverb
人工言語:Verbix
システムでどのコード体系のどの版を受け入れるかは個別のシステムごとに指定される
推奨は iso1
,iso3
,cla1
,cla3
の 4 種
記法
各種言語コードとともに記載する場合は、プリフィックスとして言語コードに前置し、一つのコードとして扱う。この場合、余分な空白等は加えず、また識別コードを{
}
で囲う。
- ex1)
{cla3}~_fz_fzb_brl
: CLA コード改訂版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード - ex2)
{cla1}fez_fb
: CLA コード従来版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード - ex3)
{cla2}fez/fb
: CLA コード私案版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード
懸念解決の実際
CLA v1 に対する上記の懸念は、CLA v3の制定時に次のように解決された(CLA v2における提案を基にしたものである)。
ISO コードとの関係について
- 懸念:ISO コードとの衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
- v2提案:なし
言語コード体系識別コードの制定により解決された。
開発中止となった人工言語の CLA コードの処理
- 懸念:開発中止となった人工言語の CLA コードの処理をどうするか。
- v2提案:ISO コードにおける消滅言語の取扱いに倣い、存属する。
v2提案が変更なく採用されたことにより解決された。
略号の競合で喧嘩が起こる可能性
- 懸念:略号の競合で喧嘩が起こる可能性がある。
- v2提案:各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。
CLA コードを管理する組織は、提案による常設委員会でなく、SCJ傘下の情報関連事業部門であるCL-KIITAのCLA コード部門となった。CL-KIITAの機構・システムにより解決された。
「無所属/未定コード」の処理
- 懸念:語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。
- v2提案:上記常設委員会の設立のほか、「無所属/未定コード」に関連する CLA コードのコード定義の変更を行う。
CLA v3に記載された通りコード全体を4階層構成としたことにより解決された。