| ENGLISH | JAPANESE |
このドキュメントは『炭』(Sumibi辞書)のダウンロードとインストールについて解説したものです。
SKKJISYO関連のみ読みこんだものです。
Wikipedia日本語版だけを約10000ファイル読みこんだ辞書です。商用利用が可能です。
長期間使ってみた感覚では、日常的な喋り言葉以外の用途に使うには十分な変換精度を持っていると思います。
喋り言葉の変換精度を上げるためにはこのsmall辞書を起点にして『はてな』などの喋り言葉が多く含まれるコンテンツを多く読み込む必要があります。
Wikipedia日本語版だけを約50000ファイル読みこんだ辞書です。商用利用が可能です。
長期間使ってみた感覚では、smallよりもさらに、変換精度が上がっています。
但しsmallと同じように喋り言葉の変換精度は高くありません。
順次、作成していく予定です。コンピューターの性能次第で完成時期が決まります。
インストール方法は gzipで圧縮を解いて、SumibiServerSetupで示す方法でMySQLに流し込んで下さい。
Sumibi用辞書データ sumi_bincho_1_* は以下のコンテンツ(素材)を利用して作成されています。
この辞書群を加工してSKK-JISYO.sumibi_starterという辞書を作成し、それをsumiyakiツールで読みこんだ状態をSumibi辞書の初期状態としています。SKK-JISYO.sumibi_starterを作成する手順については CVS上のdict/Makefile で自動化されています。
| 辞書名 | ライセンス |
| SKK-JISYO.L | GPL |
| SKK-JISYO.geo | GPL |
| SKK-JISYO.jinmei | GPL |
| SKK-JISYO.propernoun | GPL |
| SKK-JISYO.station | GPL |
| SKK-JISYO.zipcode | public domain |
| SKK-JISYO.office.zipcode | public domain |
ライセンスは、GFDLです。
Wikipedia:著作権情報に解説が掲載されていますので、参照してください。
上記のページには『ウィキペディアのコンテンツは、他の人々に対して同様の自由を認め、ウィキペディアがそのソースであることを 知らせる限りにおいて、複製、改変、再配布することができます。』と解説されています。
つまり、Sumibi辞書がWikipedia日本語版を含んでいても、その旨を明記すれば再配布可能です。