日本語の文章で語句の出現頻度解析を行うAPIです。名詞のみを対象とします(代名詞等一部除く)。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。
http://api.hitonobetsu.com/fword/analysis?str=対象とする文章
文字コードはUTF-8、戻りはjson形式です(希望が多ければxmlもサポートするかもしれません)。
以下のようにcallbackを指定してjsonp形式とすることも可能です。
http:///api.hitonobetsu.com/fword/analysis?str=対象とする文章&callback=callbackの値
文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。
一度の解析は10000文字までとしてください。
アルゴリズムは今後改善していきたい。
word | 言葉 |
---|---|
number | 出現数 |
length | 文字列長 |
http://api.hitonobetsu.com/fword/analysis?str=年末年始もプリキュア尽くしって、そんなにプリキュアが大事なの?
[ { "word":"プリキュア" "number":2, "length":5 }, { "word":"年末年始" "number":1, "length":4 }, { "word":"大事" "number":1, "length":2 }, ]
サポートや動作保証はいたしません。自己責任の範囲でお使いください。
現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。
公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。
紹介やリンクは正直とても嬉しいです(義務ではありません)。
意見、感想等の連絡は開発者のTwitterアカウントにどうぞ
version | リリース日 | 概要 |
---|---|---|
0.1.0 | 2013.12.30 | 公開 |
使用している形態素解析エンジンはMeCab(和布蕪)です。
辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。