Guest(Login

日本語形態素解析API

 ver0.1.2(URL抽出に対応)

About

日本語の形態素解析(字句解析)を行うAPIです。
140noteで使用する目的で作られたものですが、本APIそのものはTwitterとまったく関係ありません。

Specifications

http://api.hitonobetsu.com/mp/analysis?str=対象とする文章

文字コードはUTF-8、戻りはjson形式です(希望が多ければxmlもサポートするかもしれません)。

以下のようにcallbackを指定してjsonp形式とすることも可能です。

http:///api.hitonobetsu.com/mp/analysis?str=対象とする文章&callback=callbackの値

文字列が長くなる際は、POSTでの呼び出しを推奨します。その際もパラメータはstrとcallbackとなります。

一度の解析は3000文字までとしてください。

読み、及び発音の精度が特に低いため今後改善していきたい。

Return

surface表層形
part品詞
subtyping1品詞細分類1
subtyping2品詞細分類2
subtyping3品詞細分類3
conjugatedForm活用形
conjugatedType活用型
original原形
reading読み
pronunciation発音
length文字列長

Sample

http://api.hitonobetsu.com/mp/analysis?str=眠い
[
    {
        "surface":"眠い"
        "part":"形容詞", 
        "subtyping1":"自立", 
        "subtyping2":"*", 
        "subtyping3":"*", 
        "conjugatedForm":"形容詞・アウオ段", 
        "conjugatedType":"基本形", 
        "original":"眠い", 
        "reading":"ネムイ", 
        "pronunciation":"ネムイ", 
        "length":2
    }
]
			
			
			

Rule

サポートや動作保証はいたしません。自己責任の範囲でお使いください。

現在はアクセス制限をかけておりません。利用状況を見て、アクセス制限やサーバ増強等考えます。

公序良俗に反する、あるいは違法なサイトやサービスでの使用は禁止します。

紹介やリンクは正直とても嬉しいです(義務ではありません)。

意見、感想等の連絡は開発者のTwitterアカウントにどうぞ

History

versionリリース日概要
0.1.22013.9.29URL抽出に対応(subtyping1にURLと入ります。日本語等の国際化ドメイン名には対応していません)
0.1.12013.9.26結果に文字列長を追加
0.1.02013.9.25公開

Thanks

使用している形態素解析エンジンはMeCab(和布蕪)です。

辞書はIPAdic並びにWikipediaのデータを主としたユーザー辞書を用いています。