[mecab-users 242] Re: UTF8 ファイル分析出力

Zurück zum Archiv-Index

Taku Kudo taku****@chase*****
2007年 3月 4日 (日) 00:10:19 JST


工藤です

> その際 入力出力ファイルともにEUCであればうまく読めるのですが、どちらかを
> UTF8にすると、分析上問題を生じたり出力結果が読めなかったりします。
>
> 辞書をUTF8でコンパイルすることも試しましたがやはり出力ファイルが文字化けして
> しまいます。Editorは、UTF8を読めるKWriteを使用しています。

どのように utf8 の辞書を作成しましたか?
あと,どのバージョンの mecab をお使いですか?

0.94 でしたら,-D オプションで辞書の文字コードを確認することができます.

% mecab -D
filename:       /usr/local/lib/mecab/dic/ipadic/sys.dic
version:        102
charset:        euc-jp
type:   0
size:   378914
left size:      1316
right size:     131



mecab-users メーリングリストの案内
Zurück zum Archiv-Index