- ベストアンサー
形態素解析の解析内容をファイルに書き込む方法
- 形態素解析を使って文章を品詞ごとに分解し、各品詞ごとにファイルに書き込む方法について紹介します。
- 形態素解析の解析結果をもとに、名詞、助詞、形容詞などの品詞ごとにファイルを作成し、それぞれの品詞に適したファイルに書き込むプログラムを作成する方法を解説します。
- MECAPIを使用して形態素解析を行い、解析結果をファイルに書き込むPerlプログラムの作成方法について紹介します。MECAPIの詳細については、提供されたリンクを参考にしてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
単純なテキストファイルへの出力処理の話しかと思っていたらポイントは別のところにあったんですね。 Socketが使えるかどうかわかりませんがこんな感じでしょうか? **************************************************************************************************** #!/usr/bin/perl use Socket; my $host = "mimitako.net"; my $path = "/api/mecapi.cgi"; my $data = "sentence=ラーメンはおいしい。"; #----------------接続処理------------------- socket(SOCKET, PF_INET, SOCK_STREAM, 0); connect(SOCKET, pack_sockaddr_in(80, inet_aton($host))); select(SOCKET); $|=1; select(STDOUT); #------------HTTPリクエスト送信----------------- print SOCKET "POST $path HTTP/1.0\n"; print SOCKET "Host: $host\n"; print SOCKET "Content-Length: ".length($data)."\n\n"; print SOCKET $data; #------------サーバからのデータを受信 ----------------- my @aDT = <SOCKET>; print "Content-type: text/plain\n\n"; ## 配列@aDT内にあるXMLの内、surfaceとfeatureについて構文を解釈して単純な処理を行う print @aDT; exit; **************************************************************************************************** もう少し別のやり方があると思いますが、ぱっと思いついたのがこれでした。 ただし岡崎市中央図書館不正?アクセス事件のような事例もあるのでMECABは自分のサーバに立てるか他人のサーバなら許可を取ってやりましょう。 また、テキストファイル出力を行う際にダブりチェックはデータ量に比例して負荷が高くなると思います。量が少ないなら良いのですが、そうでないならDBサーバを利用した方が良いと思います。 でも、一つ目のリンク先でJavaScriptで処理できてるのならそこからデータを処理できるCGIを作ってサブミットした方が早いかと思います。
その他の回答 (2)
- salsberry
- ベストアンサー率69% (495/711)
MECAPI経由じゃないとだめですか? 普通のMeCabにPerlバインディングがありますから、それを使うほうが簡単ではないでしょうか。 http://mecab.sourceforge.net/bindings.html
補足
ご回答ありがとうございます。 残念ながら私が使用しているさくらサーバのライトプランではMECABはインストールできません。 この方法は自分が使用しているサーバ上にMECABが無いとできないんですよね。
- YkazubonY
- ベストアンサー率30% (26/86)
こういうのは、商用ソフトにしか存在しません。 住友電工情報システム株式会社 QuickSolutionをお勧めします。 http://www.sei-info.co.jp/QuickSol/ 大体が、形態素解析のプロに成れたら、自分で会社作れるだろが。
お礼
どうもありがとうございます。 サーバで実行したところ以下のようなエラーが発生したのですが、どうしたらよいのでしょうか。 以下エラー文 XML ページを表示できません スタイル シートを使用した XML 入力は表示できません。エラーを訂正してください。 [更新] ボタンをクリックするか、または後でやり直してください。 -------------------------------------------------------------------------------- ドキュメントの最上位では無効です。リソース 'http://dai-gokuh.sakura.ne.jp/mecab/api/mecapi.cgi' の実行エラーです。ライン 1、位置 1 HTTP/1.1 200 OK ^