総合辞書アプリケーション(草案)
ここでは辞書の中でもアクセントやコロケーションなど単語にかかわる様々な概念を一つのアプリケーションで閲覧・編集・作成が出来るソフトについて考えている。ここではそれの仕様を一覧として記していこうと思う。
諦めかけている"Aliory Language Maker"の構想について
まずアリオリーランゲージメーカ(以下、ALM)の構想について説明したいと思う。まず名前は"A priori"や"A posteriori"などの単語の中で共通している"A -riori"の"r"を"l"に、"i"を"y"に書き換えたものである。ALMの構想を始めたのはPDICの使いにくい仕様からだ。今のご時世に「見出し語、発音、訳語、例文」だけという構成は古い気がする。そして編集機能もあまりよろしくなく一括編集をする際は条件を指定できない(自分の技量不足なのもあるだろうが)そういった仕様にイライラしていたのを覚えている。
そこでALMではそう言った使いにくさを克服するために以下の仕様にしようと思って作り始めた。
- 万人が使いやすいようなソフトに仕上げる
- 総合辞書(統合辞書)として機能するようにする。
だが、ここで自分の技量が足りないことに気が付いてしまった。小さい所は知っているが大きい部分を自分は知らなかったのだ。仕方なくPDICよりも使いやすい辞書ソフトを探して見つけたのが"ZpDIC"だった使い始めて自分は"ZpDIC"は辞書の神様が生み出したのではないかと思うくらい使いやすくてわかりやすかった。その上単語の自動生成までできてしまうことに驚いた。そこで満足してしまってEclipseの中のALMのソースファイルのことなど忘れかけていた。
でもALMで作りたかったソフトを忘れたくはないなのでここにそのALMで実装したかったものを記してゆく。
実際に求めていた機能の一覧
単語面
- 単語の作成・編集・削除
- タグや品詞による検索システムと各項目の検索
- 単語の綴り自動生成機能
- 各項目へのリンクによる指定(識別番号を挟んだリンクのデータ)
(構造は以下のよう)
- 識別番号
- 図鑑データ(リンクの識別番号)
- 見出し語
- 発音(akrantiainシステムで自動生成)
- タグ
- 訳語データ
- 品詞
- 訳語の配列
- 概要データ(コンセプトや意味や語義、慣用句やことわざ、用法や使用上の注意などのデータ。むしろこっちがメイン)
- 見出し
- 内容(簡易的なHTML機能があるとなお良い)
- 歴史データ
- 見出し(時期)
- 内容(簡易的なHTML機能があるとなお良い)
- 派生形データ
- 種類
- 派生形の配列
- 関連語データ
- 種類
- 関連語の識別番号の配列
リンク面
- リンクデータの作成・編集・削除(構造は以下のよう)
- 識別番号
- リンク(URLやパス情報)
例文面
- 例文の作成・編集・削除
- 内容が似ている例文へのリンク
- 識別番号
- 原文データ
- 訳文データ
文法書面
- 文法書の項目の作成・編集・削除
- 文法書の項目の統合機能
- 識別番号
- 分類
- 見出し
- 内容
機能面
- 人工言語にも対応させたテキストマイニング(テキストの計量的な内容の分析)を行う機能 ["KH Coder"のような機能の人工言語版]
- テキストマイニング(テキストの計量的な内容の分析)時に、辞書データを参照できるような機能
- 言語単位(TPやPTP)を元に言語の完成度を数量化する機能 ["ZpDIC"には搭載済み]
- 全ての単語間で出てきた表記の比率を表示する機能 ["ZpDIC"には搭載済み]
- ある表現の書き換え機能(綴りから発音表現の生成など) ["akrantiain"で処理可;"ZpDIC"には搭載済み]
- 作成・編集・閲覧機能の良さ
- 他の辞書のデータを各項目毎で別々に閲覧できるシステム
- 他の辞書データとの比較をしながらの編集