日本語の文章で語句の出現頻度解析を行うAPIです。名詞のみを対象とします(代名詞等一部除く)。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。
http://api.hitonobetsu.com/fword/analysis?str=対象とする文章
文字コードはUTF-8、戻りはjson形式です(希望が多ければxmlもサポートするかもしれません)。
以下のようにcallbackを指定してjsonp形式とすることも可能です。
http:///api.hitonobetsu.com/fword/analysis?str=対象とする文章&callback=callbackの値
文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。
一度の解析は10000文字までとしてください。
アルゴリズムは今後改善していきたい。
| word | 言葉 |
|---|---|
| number | 出現数 |
| length | 文字列長 |
http://api.hitonobetsu.com/fword/analysis?str=年末年始もプリキュア尽くしって、そんなにプリキュアが大事なの?
[
{
"word":"プリキュア"
"number":2,
"length":5
},
{
"word":"年末年始"
"number":1,
"length":4
},
{
"word":"大事"
"number":1,
"length":2
},
]
サポートや動作保証はいたしません。自己責任の範囲でお使いください。
現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。
公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。
紹介やリンクは正直とても嬉しいです(義務ではありません)。
意見、感想等の連絡は開発者のTwitterアカウントにどうぞ
| version | リリース日 | 概要 |
|---|---|---|
| 0.1.0 | 2013.12.30 | 公開 |
使用している形態素解析エンジンはMeCab(和布蕪)です。
辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。