雑記帳2026: Canna-Dictionary の巻

2014/09/02

Canna-Dictionary の巻

CannaIM と併せて、Canna 辞書のメンテも少しづつ始めています。主にニュースの見出しから人力で単語を拾いだして登録していますが、動詞は結構登録されているので、名詞の登録がメインとなりそうです。単語の拾い出しぐらいは形態素解析ソフトで自動化したいところですが、ソフトの出力を使うのはライセンス的にどうなんでしょ。

付属のものを含め、Canna 用にいくつか辞書が公開されていますが、非商用な仮名漢字変換用の辞書はほかと混ぜて使えるゆる〜いライセンスのほうがよいと考えます (オープンデータ的)。そのため、今回発生した追加単語や CC0 データを元にして、CC0/Pulic domain の辞書も作ってみることにしました。こちらもぼちぼち進めましょう。

ところで、 pubdic+ (iroha.t) のライセンスは Public domain か BSD 系かどちらなんでしょ…

3 件のコメント:

arigayas2014年9月4日 20:31
ライセンスはわかりませんがWikipediaの項目は名刺登録に使えるんでしょうか？
返信削除
返信

コメントを追加