Webセルオートマトン – Yahoo! APIで形態素解析
Yahoo! APIを使う場合の大まかな流れは、「APIへリクエストを送るためのURLの組み立て→そのURLでデータを取得→XML解析して必要な情報を取得」ってところだと思いますが、個人的には最後の2つ「そのURLでデータを取得→XML解析して必要な情報を取得」については、simplexml_load_fileを利用するのが簡単です。
URLの組み立てについては、オフィシャルを見ると十分でしょう。
そんなこんなで、Yahoo!APIを使い形態素解析をしてくれるクラスを作成し、さらに、そのクラスを利用し、あるURLの文章の中で一番出現頻度の高い単語を取得する関数を作成しました。SimpleXMLクラスの扱いにちょっと戸惑いましたが、Yahooの形態素解析の場合は、簡単に次の方法で一番出現頻度の高い単語を取得できます。
$xml = simplexml_load_file(Yahooの形態素解析へのリクエストのためのURL);
$keyword = $xml->uniq_result->word_list[0]->word[0]->surface;
これで$keywordに一番出現頻度の高い単語が取得できます。
実際は、エラー処理などでもっと複雑になってます。
とりあえず、URLを渡すと文章を取得しその文章をYahooの形態素解析にかけて、一番出現頻度の高い単語を取得する関数が完成しました。
次は、単語を渡すとYahoo検索結果の1件目のURLを返す関数を作成したいと思います。
You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.