日本語の形態素解析(字句解析)を行うAPIです。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。
http://api.hitonobetsu.com/mp/analysis?str=対象とする文章
文字コードはUTF-8、戻りはjson形式です(希望が多ければxmlもサポートするかもしれません)。
以下のようにcallbackを指定してjsonp形式とすることも可能です。
http:///api.hitonobetsu.com/mp/analysis?str=対象とする文章&callback=callbackの値
文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。
一度の解析は3000文字までとしてください。
読み、及び発音の精度が特に低いため今後改善していきたい。
| surface | 表層形 |
|---|---|
| part | 品詞 |
| subtyping1 | 品詞細分類1 |
| subtyping2 | 品詞細分類2 |
| subtyping3 | 品詞細分類3 |
| conjugatedForm | 活用形 |
| conjugatedType | 活用型 |
| original | 原形 |
| reading | 読み |
| pronunciation | 発音 |
| length | 文字列長 |
http://api.hitonobetsu.com/mp/analysis?str=眠い
[
{
"surface":"眠い"
"part":"形容詞",
"subtyping1":"自立",
"subtyping2":"*",
"subtyping3":"*",
"conjugatedForm":"形容詞・アウオ段",
"conjugatedType":"基本形",
"original":"眠い",
"reading":"ネムイ",
"pronunciation":"ネムイ",
"length":2
}
]
サポートや動作保証はいたしません。自己責任の範囲でお使いください。
現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。
公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。
紹介やリンクは正直とても嬉しいです(義務ではありません)。
意見、感想等の連絡は開発者のTwitterアカウントにどうぞ
| version | リリース日 | 概要 |
|---|---|---|
| 0.1.2 | 2013.9.29 | URL抽出に対応(subtyping1にURLと入ります。日本語等の国際化ドメイン名には対応していません) |
| 0.1.1 | 2013.9.26 | 結果に文字列長を追加 |
| 0.1.0 | 2013.9.25 | 公開 |
使用している形態素解析エンジンはMeCab(和布蕪)です。
辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。