よみがな検索システム
フォームに漢字や英語などを入れて「読み検索」ボタンを押すと、読み仮名が下のフォームに表示されます。
読みが難しい姓・名や住所、英語や略語など、「読み仮名」がわからない時にお使いいただけます。
読み仮名に誤りがある場合は、誤りがある旨をフォームに入力してボタンを押していただけると助かります。
- ※検索された読み仮名は必ずしも正しいものとは限りません。
- ※送りがなまで含めると精度が上がります。
- ※ご使用の際不具合等が発生しても、当方は一切責任を負いません。
- ※英語や略語は現在試験的に導入しています。
「よみたんAPI」使用方法
「よみたんAPI」はWeb APIとなっています。基本的には、
http://yomi.harmonicom.jp/yomi.php
に、GETリクエストでクエリーを渡すことで、読みがなが帰ってくるようなしくみです。
http://yomi.harmonicom.jp/yomi.php?ic=UTF-8&oc=UTF-8&k=h&t=%E6%BC%A2%E5%AD%97
たとえば上記のURLにアクセスすると、UTF-8で「かんじ」と読みがなを返します。
クエリーの「ic」は入力文字コード、「oc」クエリーは出力文字コードが入ります。文字コードは「UTF-8」「EUC-JP」「SJIS」「JIS」が使えます。デフォルトはUTF-8です。
「k」クエリーに「h」を入れるとひらがな、「k」を入れるとカタカナを返します(無指定だとひらがなが出ます)。
「t」クエリーには、変換したい漢字等が入ります。変換したい漢字等は、URLエンコード(%AD%E3のような形式)にしてください。
出力結果については、改行コードやtabコード、半角記号のほとんどが消去されます。
また、半角英字はすべて小文字に変換されます。
ローマ字読みできる英字は読み仮名に変換されます。
Flashでチェックされる「crossdomain.xml」というファイルを置いて、すべてのドメインからのアクセスを許可するように設定してありますので、Flash等からも「よみたんAPI」が使用できます。
注意
「よみたんAPI」をWebサイトやアプリケーション上でお使いになる際は、以下の点にご留意いただければご自由にお使いいただけます。
- ・当「よみたん」と同様のサービスに転用することはお断りいたします。
- ・「よみたんAPI」を使用していることを該当サイトやアプリケーションに当サイトへのリンク・URLとともに明記してください。
説明
PHPで形態素解析エンジン「MeCab(和布蕪)」のプログラムを叩いて読み仮名を取り出し、表示しています。
MeCabの読みがなモードでの出力がベースになっています。MeCabのバージョンは0.96です。
APIなのでAjaxなどから呼び出して使うこともできます。
辞書はIPA辞書を使っています。
ただ、IPA辞書には難しい漢字や人名、スラングなどはあまり登録されていないようです。
そこで、検索ログを見てて誤変換していそうな漢字があったときは、手作業でMeCabのユーザー辞書追加に追加しています。
2008年10月下旬現在、1091語を追加登録しています。





