[mecab-users 385] MeCab英語辞書

Zurück zum Archiv-Index

佐々木裕 sasak****@googl*****
2009年 12月 19日 (土) 10:30:03 JST


工藤さん、

ご無沙汰しています。

MeCabの英語辞書とモデルを整備中でして、そのうち公開しようと
しているのですが、英文を処理するためには、MeCabを微修正して、
空白や記号の位置で単語を切るようにする必要があります。
(時として空白や記号を含む単語もあります。)

今はかなり荒っぽく、viterbi.cppを下記のように修正しています。

      for (size_t pos = 0; pos < len; ++pos) {
        if (end_node_list_[pos]) {
-         if ( (pos == 0) ||
-               (!isalnum(sentence[pos-1])) || (!isalnum(sentence[pos]))
-              )
-          {

そこで相談ですが、MeCabを英語モードでも使えるようなオプションを追加して
もらえたりしないでしょうか。
--
佐々木裕@豊田工大
-------------- next part --------------
HTMLの添付ファイルを保管しました...
Download 



mecab-users メーリングリストの案内
Zurück zum Archiv-Index