Guest（Login）

日本語形態素解析API

2013.9.29 ver0.1.2（URL抽出に対応）

About

日本語の形態素解析（字句解析）を行うAPIです。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。

Specifications

http://api.hitonobetsu.com/mp/analysis?str=対象とする文章

文字コードはUTF-8、戻りはjson形式です（希望が多ければxmlもサポートするかもしれません）。

以下のようにcallbackを指定してjsonp形式とすることも可能です。

http:///api.hitonobetsu.com/mp/analysis?str=対象とする文章&callback=callbackの値

文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。

一度の解析は3000文字までとしてください。

読み、及び発音の精度が特に低いため今後改善していきたい。

Return

surface	表層形
part	品詞
subtyping1	品詞細分類1
subtyping2	品詞細分類2
subtyping3	品詞細分類3
conjugatedForm	活用形
conjugatedType	活用型
original	原形
reading	読み
pronunciation	発音
length	文字列長

Sample

http://api.hitonobetsu.com/mp/analysis?str=眠い

[
    {
        "surface":"眠い"
        "part":"形容詞", 
        "subtyping1":"自立", 
        "subtyping2":"*", 
        "subtyping3":"*", 
        "conjugatedForm":"形容詞・アウオ段", 
        "conjugatedType":"基本形", 
        "original":"眠い", 
        "reading":"ネムイ", 
        "pronunciation":"ネムイ", 
        "length":2
    }
]

Rule

サポートや動作保証はいたしません。自己責任の範囲でお使いください。

現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。

公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。

紹介やリンクは正直とても嬉しいです（義務ではありません）。

意見、感想等の連絡は開発者のTwitterアカウントにどうぞ

History

version	リリース日	概要
0.1.2	2013.9.29	URL抽出に対応（subtyping1にURLと入ります。日本語等の国際化ドメイン名には対応していません）
0.1.1	2013.9.26	結果に文字列長を追加
0.1.0	2013.9.25	公開

Thanks

使用している形態素解析エンジンはMeCab（和布蕪）です。

辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。