Powered by SmartDoc
ENGLISHJAPANESE

Q&A

$Date: 2006/11/23 01:48:55 $
Kiyoka Nishiyama
http://www.sumibi.org/

目次

[Sumibi][sumibi.el(STABLE)][SumibiWebAPI(STABLE)][sumibi.el(testing)][SumibiWebAPI(testing)][SumibiServerSetup][Q&A][PrivacyPolicy][sumi][sumiyaki][RomajiTable]

Sumibi.orgサイトについて

このサイトは何をするサイトですか?

『手ぶらで海外に行きたい、でも日本語でメールを送りたい』を実現するためのサイトです。

Sumibi.org(炭火.org) は海外の日本語入力できないパソコンからでも、日本語でメールやブログを書いたりできる無料サイトです。

海外のインターネットカフェ等の日本語入力(IME)の入っていない英語版Windowsなどから簡単に日本語入力できます。やっぱりお友達やご家族にはちゃんとした日本語でメールを出したいですよね。

また、すばやく日本語でGoogle検索ができるので、海外から日本語で調べものができます。留学先の大学や、図書館の英語Windows等からでも、日本語でGoogle検索できます。日本語での資料検索などにお役立て下さい。

Sumibi.orgサイトは海外からYahooやGoogleで『sumibi』と検索すると、このサイトが出てきます。海外から日本語でメールを送りたい時はWebメールサービスに入っておくと便利ですね。有名な無料WebメールサービスはYahoo!メールgooメール等があります。自分に合ったものを選びましょう。

無料ですか?

はい、無料です。海外に行くたびに無料の日本語変換サイトがあればいいなと思っていたので、作ってしまいました。

[ソフトウェア技術者の方へ]

SumibiはGPLライセンスを採用したオープンソースソフトウェアです。無保証、再配布ともに自由です。さらに、気にいったらご自分のサイトに組みこむことも可能です。

使い方について

平仮名を入力するには?

hiragana.h という風にローマ字で入力した単語に .h を付けます。

なお、.h を付けなくても変換候補には平仮名の候補が必ず入っていますので、それを選択してください。

カタカナを入力するには?

katakana.k という風にローマ字で入力した単語に .k を付けます。

なお、.k を付けなくても変換候補にはカタカナの候補が必ず入っていますので、それを選択してください。

アルファベットのまま入力するには?

sumibi.l という風にローマ字で入力した単語に .l を付けます。(または .e でも同じ意味になります)

なお、.l を付けなくても変換候補にはアルファベットの候補が必ず入っていますので、それを選択してください。

『7時』など、数字の後の単語が変換されません。『7ji』になります。

数字と単語の間にスペースを入力します。

例) 7 ji kara 8 ji made , → 7時から8時まで、

セキュリティーについて

Sumibi.orgとの通信路は安全ですか?

Sumibi.orgのSumibiWebAPIではGoDaddy社提供の商用SSL証明書を使っています。

クライアントがSSL通信をサポートしており、対応するSSL証明書がインストールされていれば安全に通信できます。

SSL証明書を利用しているかどうかはあなたがどのような形でSumibi.orgにアクセスしているかで変わります。

sumibi.orgとの通信情報はどこへ行くのですか?

単純に捨てられ、記録には残りません。

SumibiのクライアントはHTTPのPOSTメソッドで変換依頼を出しており、それを受けたApache Webサーバーはリクエスト元の IPアドレス、ユーザーエージェント等combined形式(標準ログ形式)でアクセスを記録しています。

その中には、変換される文章等は含まれません。

Sumibiプロジェクトについて

名前の由来は?

日本語由来で覚えやすく、他に使われていない言葉から選びました。

『肉リリースには炭火』というキーワードにマッチするという点が決め手になりました。後に、辞書を炭と呼び、辞書を育てるツールとして『炭焼き』と名づけました。ユーザーは炭焼き職人となり、自分で作った炭で文章を変換する(炭火を起こす)というイメージで全体の整合が取れたところも気にいっています。イメージと一緒に覚えてもらえると良いかなと思います。

Sumibiの開発動機はなんですか?

沢山ありますが、既存の日本語入力メソッドに満足できなかったため開発をスタートしました。 SKK、yc.el( cannaクライアントです。)の二つをメインに使っていましたが、どちらも一長一短あり、両方のいいところをそれぞれ取り込めばもっと良い日本語入力システムが作れると考えたところから始まりました。

SKKの良いところは、文節の区切りの認識ミスがない所です。(単文節変換なので当然ですが...)。他にも、文節毎に送り仮名の開始位置を指定することで、手で直接書いているような小回りのきく操作感が得られるところが良いです。

yc.elの良いところは、漢字変換モードを取り去ったところです。UNDO機能なども良く出来ています。

この両方の特徴を同時に満たす方法は無いかと考えてたどりついたのが Sumibiです。

なぜ変換エンジンも作ったのですか?

ひとりでに賢くなる変換エンジンが作成できるかどうか実証してみたかったというのが理由です。

最近の日本語処理関連の書籍を読むと統計的アプローチの話題が沢山紹介されています。

コンピューターのパワーが上がってきた今、そろそろパソコンのパワーでも実現できるのではないかと考えました。

分かち書きのどこが良いのですか?

bunsetu de kugiru の様に分かち書きをすれば、文節の区切り間違いが入る余地が無くなります。Sumibiでは、文節区切りは人間が指定したほうが、結果的に人間のストレスが減って使いやすいのではないかという考え方にもとづいています。

MicrosoftのIMEや JustsystemのATOKなど有名な日本語入力システムは連文節変換方式を採用していますが、文節の区切り間違いは完全には無くなりません。また、文節の間違いを訂正する操作も煩雑でシンプルさを欠きます。

そこで、Sumibiでは変換前に人間が文節区切りを分かち書きで指示し、間違いの入る余地をなくします。結果的に、覚えるキー操作は減ります。

その副産物として、Webブラウザからでも使える日本語入力システムとして発展しています。

プロジェクトに貢献したいのですが、何か出来ることはありますか?

本サイト(Sumibi.org)は基本的にkiyoka(Sumibi作者)個人の資材で運用しています。運用のための資材等を提供頂けると大変助かります。ご提供いただいた企業様におきましては、Sumibi.orgに優先して広告掲載させて頂きます。

2006年6月現在、Sumibi Projectに機材などを御提供頂いている企業様は以下の通りです。本当にすばらしい企業様ばかりです。ありがとうございます。

企業名 提供機材等
インフォテリア株式会社 Sumibi.orgのホスティング用サーバーマシン( CPU:Athron64x2 RAM:4GByte )
GoDaddy.com Turbo SSL Secure Certificate (sumibi.orgドメインのSSL証明書)

Sumibi.orgのWebサービス利用について

Sumibi.orgのSumibiWebAPIを呼び出すのに許可は要りますか?

SumibiWebAPI には技術的にも手続き的にも制限を設けていません。御自由に呼び出してもらってかまいません。

但し、その場合はできるかぎりメーリングリストに入って頂き、ノウハウ等の情報共有を行なって頂ければ幸いです。

sumibi.orgのセキュリティーはどうなっているのですか?

最大限の努力を持って、セキュリティーを確保しています。但し、何事にも100%はありませんので、完全に保証はできません。

今後も最大限の監視体制でサーバー運用を行っていきます。サーバー運用は大変な作業であり、もしsumibi.orgのホスティングを行って頂ける方がいらっしゃればそちらに移らせて頂きたいと思っています。

求む、サーバー管理者!

Sumibi ServerのURL一覧はありますか?

変換サーバーのURL一覧です。

意味 対応配布バージョン URL
安定板 Sumibi x.偶数.x https://sumibi.org/cgi-bin/sumibi/stable/sumibi.cgi
テスト版 Sumibi x.奇数.x https://sumibi.org/cgi-bin/sumibi/testing/sumibi.cgi
不安定版 Sumibi CVSバージョン https://sumibi.org/cgi-bin/sumibi/unstable/sumibi.cgi

なぜこんなに変換レスポンスが悪いのですか?

理由は二つあります。

  1. 変換サーバー(Sumibi Server)がCGIで構築されている。

    CGIなのでクライアントからのリクエストにリアルタイムで応答するほどの速度は期待できません。

  2. チューニングが足りない。

    もっと効率の良いアルゴリズム・データ構造にすることによってレスポンスが改善するかもしれません。但し、今のところはシンプルさを優先し、チューニングは後回しの予定です。


CC-GNU GPL SourceForge.jp