ラベル Canna の投稿を表示しています。 すべての投稿を表示
ラベル Canna の投稿を表示しています。 すべての投稿を表示

2021/08/19

Canna はさっぱりの巻

コメント欄でのご指摘を受けて、CannaIM を gcc2 でビルドできるように修正しました。B_CURRENT_IMAGE_SYMBOL が gcc2 で動かない件はパッチを出さないといけないかな…

CannaIM で、Haiku のファイルシステムレイアウト変更後一番やりたかったのは、ユーザー辞書とシステム辞書のパス変更(ユーザー辞書は /home/config~、システム辞書は /etc~)でしたが、できそうでやはりできない状態です。ほかに 3.7 に上げてから、なぜかユーザー辞書が学習しないという問題もあります。

かんな辞書の方はかれこれ数年毎朝ネタだけは積み上げているのですが、たまったテキストをチェックして辞書に展開するのが追い付いていないです。

いろいろと放置気味ですみませんが、Haiku に IM を移植するときなどの参考にしてもらえれば幸いです (hanya さんのところのほうが参考になるかな?)。


2015/10/14

SetMenu() (その 2) の巻

メニューの件は、前回案を採用することにしてBPopUpMenu改造してみました。いまのところポップアップメニューの対象はパレット全体ですが、将来的にはツールアイコンを設置してその中に限定したほうが良いかもしれません。

メモ
// ラジオモードを解除するために、第 2, 3 引数を false にしておく。
BPopUpMenu *m = new BPopUpMenu(name,  false, false);
m->AddItem(menuItem);
...
// Window に AddChild() しないので、target を指定しておく。
// Window を target にする場合は、AttachedToWindow() 内で
m->SetTargetForItems(target);
...
// target にメッセージを送信するため、第 2 引数をtrueにする。
m->Go(where, true);

ぼちぼち、単語登録などの各種拡張機能を GUI へ移していこうと思います。

2015/10/03

SetMenu() の巻

とりあえず、メニューとアイコンは復活したものの、新たな問題が。


どうも、イベントが IM アクティベート後の 1 度しか流れてないようで、たとえば AboutWindow を 2 回表示しようとしてもできないようです。ただし、1 度 Roman にもどして再び Canna に戻せば再び 1 度だけ AboutWindow が表示できます。

CannaLooper::_HandleMethodActivated() で、
fOwner->SetMenu(fMenu, this);
になっていたので、BMessager(NULL. this) にしてみたり色々試してみましたがうまく動かないようです。前回案や、EGBridge for BeOS のように、パレットからメニューを出す仕様がが良いかもしれません。

2015/09/05

Ticket #661 の巻 (その 2)

Ticket #661 の巻 について、理髪さんより、cookie 関連のメッセージ関数の型が、Int32 と Pointer の両方があって統一されていないからではないかというご指摘を頂きました。

まず、Pointer 型に統一を試みてみましたが、ここがなんとなく気になりビルドを断念。
次に、Int32 型に統一して、gcc2 で CannaIM のアイコンとメニューが動作することを確認しました。x86_64 ではどうかなとやってみたところこちらも問題なく動きました。

64bit 版でも int32 で動いたので、cookie の値はどうもポインターではないようです (fprintf がなぜ %lx なのかは気になる)。コードはあまり追いかけていないですが実際はどうなのでしょうか。もし Pointer なら、初期化リストを使うのでなく、コンストラクタ内でキャストして代入する必要がありそうです。

2015/08/29

Ticket #661 の巻

だいぶ間が空きましたが、ようやくすごしやすい気温となり、ぼちぼち再開です。それにしてもどうも今年は極端というか…台風も固まって来るし。

CannaIM の GUI をいじろうとして、メニューが出ないことに気がつき調べてみたところ、古いバグの再発のようです。Ticket を reopen しましたがどうなるでしょうか? 暫定対策として、メニューは諦めて、パレットにもっていくのもありかもしれません。

辞書データーのネタは、順調に月1000個ぐらいのペースでたまっていますが、辞書への反映がなかなか追いつかないところです。ぼちぼち進めましょう。

2015/06/20

Writing CannaIM manual の巻

Hi, I'm writing CannaIM manual. if you have any idea, please comment or mail to me freely. It will be included next CannaIM release.

CannaIM のマニュアル作成中です。ご意見をお寄せください。

2015/05/26

Canna 1.03 の巻

ようやく、2014 年収集分の単語入力が終わったので、久々に canna パッケージ作成中ですが、HaikuDepot でアップグレードした場合、データをいったんシステムから config/settings/Canna にコピーする現状のダーティな実装では、コピー先の辞書がアップグレードされないという問題が。アップグレード前に config/settings/Canna を消せばよいのですが、パッケージのアンインストールでは消えてくれないし、ユーザー任せにしても、README は読んでくれないだろうなぁ。

これを根本的に治すには、ユーザー辞書とシステム辞書のパスを分離して、システム辞書のアップグレードについてはパッケージ管理システムにまかせればよいのですが、残念ながら辞書パスの分離が今のところできないので、辞書フォルダー内に version 文字列を含むファイルを置き、起動時に比較することで上書きコピーするという暫定案をひねりだしました。

HaikuDepotを使わない方は、こちらから zip! をダウンロードして、展開後、ターミナルから install.sh を実行してください。x86_gcc2, x86_gcc4、x86_64 でビルドできます。パッケージはもう少しお待ちください。

2015/03/04

Canna 辞書の巻

久々に Canna のバイナリ辞書を更新してみました。こうやって比べて見ると、3 ヶ月で 1200 語ほどしか単語増えてないですね。毎月 3000 〜 4000 語ぐらい単語が集まるのですが、実際に登録するときにほとんど落とされてしまうようです。すでに、2015 年分の単語ストックが 7000 語以上ありますが、2014 年に集めた単語もまだ1400 語ほど登録待ちが残っていますのでぼちぼち進めていきましょう。

※R1A4版 の Canna 辞書が必要な方は連絡ください。
  • iroha.t
    27481 entries with 42009 words (Canna 3.7p3)
    34290 entries with 52843 words (2014/11/24)
    35339 entries with 54051 words (2015/03/04)
  • chimei.t
    1566 entries with 1592 words (Canna 3.7p3)
    72801 entries with 80460 words (2014/11/24)
    72884 entries with 80551 words (2015/03/04)
  • jinmei.t
    23991 entries with 49917 words (2014/11/24)
    24039 entries with 49998 words (2015/03/04)

2014/11/24

Canna-Dictionary の巻

hiroshi-manabe/japanese_verb_adj_list からの形容詞および動詞のとりこみがようやく終わりました。新しい辞書はこちらからどうぞ。

現在の項目数および単語数
  • iroha.t
    27481 entries with 42009 words (Canna 3.7p3)
    34290 entries with 52843 words (2014/11/24)
  • chimei.t
    1566 entries with 1592 words (Canna 3.7p3)
    72801 entries with 80460 words (2014/11/24)
  • jinmei.t
    23991 entries with 49917 words (2014/11/24)
iroha.t で 7000 項目ほど増えていますが、半数以上が上記のリストからなので自分で追加した物はまだまだ少ないかな。これからもぼちぼち追加しましょう。あとの 2 つは前にも書いたように外部データからの追加がほとんどです。

辞書の予定
  • 固有名詞辞書 (企業名、学校名、団体名、登録商標名) の追加。
    空港名、港湾名、ビル名、寺社名、温泉名などは地名 or 固有名詞? 個人的にはこれらは地名辞書に入れたいかな。
  • iroha.t の人名と地名の chimei.t、jinmei.t への移動、または chimei.t、jinmei.t の iroha.t とダブっている単語の削除。
    どこまで残すかという問題はあるけど、そのままだと変換候補がだぶっちゃうんだよね。候補のだぶりは IM 側で強制的に除去するという手もあるけど、それでいいのか?

2014/11/09

Canna と Izumo の巻

Canna からフォークした日本語入力システムのようです (Github)。

個人的に期待したいのは、
  • 内部 (辞書) UTF-8 化
  • ユーザー辞書ディレクトリとシステム辞書ディレクトリの分離。ユーザー辞書はホームディレクトリの下に置きたいなぁ。
かな。

あと、スタンドアローンモードも残してくれれば言うことなし…

2014/09/24

mkbindic の巻

辞書のリリース準備にこれこれと mkbindic してみたら、見事に全部エラー (泣)。
Error in RkParseWrec
mkbindic: fatal error. exit
UTF-8 から EUC に変換した辞書ファイルが読めなかったりするので、すわ文字コード関係かとちびりつつ、ファイルを切り詰めながら調査した結果、文字コードではなく品詞を修正することでなんとか通るようになりました。

間違い探し (答えはリポジトリ見てね)
あんないにん #t35 案内人
まつかわけいこく #Cn 松川渓谷
つまぶき ##JNS 妻夫木
とりあえず mkbindic は通るようになりましたが、iconv で警告が出る辞書ファイルがあるので、あとで確認がいるかもしれません。う〜ん。

Haiku でも mkbindic を使えるようにしないとね…

2014/09/08

小ねたの巻

辞書のネタをいくつか集めてみました。

前にも書いたように、日本語入力用辞書はいろいろなデーターを混ぜて使うので、個人的にはライセンスは CC0 / Pulic domain が望ましいと考えます。BSD や GPL のようなライセンスでは、ベースファイルとしては使えても、リミックスは面倒そうで…

個人で非公開で使う分には、ライセンスはあまり気にならないので、いろいろ取り込んで強化 (?) してみるのも楽しいですね。プルプル〜

2014/09/02

Canna-Dictionary の巻

CannaIM と併せて、Canna 辞書のメンテも少しづつ始めています。主にニュースの見出しから人力で単語を拾いだして登録していますが、動詞は結構登録されているので、名詞の登録がメインとなりそうです。単語の拾い出しぐらいは形態素解析ソフトで自動化したいところですが、ソフトの出力を使うのはライセンス的にどうなんでしょ。

付属のものを含め、Canna 用にいくつか辞書が公開されていますが、非商用な仮名漢字変換用の辞書はほかと混ぜて使えるゆる〜いライセンスのほうがよいと考えます (オープンデータ的)。そのため、今回発生した追加単語や CC0 データを元にして、CC0/Pulic domain の辞書も作ってみることにしました。こちらもぼちぼち進めましょう。

ところで、 pubdic+ (iroha.t) のライセンスは Public domain か BSD 系かどちらなんでしょ…