日本語の形態素解析(字句解析)を行うAPIです。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。
http://api.hitonobetsu.com/mp/analysis?str=対象とする文章
文字コードはUTF-8、戻りはjson形式です(希望が多ければxmlもサポートするかもしれません)。
以下のようにcallbackを指定してjsonp形式とすることも可能です。
http:///api.hitonobetsu.com/mp/analysis?str=対象とする文章&callback=callbackの値
文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。
一度の解析は3000文字までとしてください。
読み、及び発音の精度が特に低いため今後改善していきたい。
surface | 表層形 |
---|---|
part | 品詞 |
subtyping1 | 品詞細分類1 |
subtyping2 | 品詞細分類2 |
subtyping3 | 品詞細分類3 |
conjugatedForm | 活用形 |
conjugatedType | 活用型 |
original | 原形 |
reading | 読み |
pronunciation | 発音 |
length | 文字列長 |
http://api.hitonobetsu.com/mp/analysis?str=眠い
[ { "surface":"眠い" "part":"形容詞", "subtyping1":"自立", "subtyping2":"*", "subtyping3":"*", "conjugatedForm":"形容詞・アウオ段", "conjugatedType":"基本形", "original":"眠い", "reading":"ネムイ", "pronunciation":"ネムイ", "length":2 } ]
サポートや動作保証はいたしません。自己責任の範囲でお使いください。
現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。
公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。
紹介やリンクは正直とても嬉しいです(義務ではありません)。
意見、感想等の連絡は開発者のTwitterアカウントにどうぞ
version | リリース日 | 概要 |
---|---|---|
0.1.2 | 2013.9.29 | URL抽出に対応(subtyping1にURLと入ります。日本語等の国際化ドメイン名には対応していません) |
0.1.1 | 2013.9.26 | 結果に文字列長を追加 |
0.1.0 | 2013.9.25 | 公開 |
使用している形態素解析エンジンはMeCab(和布蕪)です。
辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。