絞り込み条件を変更する
検索条件を絞り込む
有料ブログの投稿方法はこちら

すべてのカテゴリ

1 件中 1 - 1 件表示
カバー画像

日本語の文章の解析は簡単?

(*)本文中にリンクが貼られているような記述がありますがココナラの投稿ではリンクは有効になっていません。(あらかじめご了承ください)日本語の文章の解析は簡単?先日、日本語の文章で使われる単語の傾向を調べたいという話をいただきました。 英語の場合は、単語と単語の間に必ずスペースがあるので、簡単なプログラムで単語を抜き出すことができます。しかし、日本語の場合は単語と単語の切れ目は日本語の文法を考慮しないと難しくなります。そこで、インターネットで検索したところ、単語の抽出をやってくれるパッケージがある事がわかりました。幾つか公開されているパッケージがある様でしたが、「MeCab」というバッケージがよく利用されている様なので、試してました。この記事では、簡単に MeCab について調べたことをまとめてみました。MeCab について詳細は、インターネットを「MeCab」検索すれば出てくると思いますのでここでは詳しくは触れません。一応、MeCab の公式ページと言われるリンクを貼っておきます。公式ページに行くと、Windows 版はインストレーションパッケージが配布されているので、ダウンロードしてインストールをすればすぐに利用できます。 Linux 版は、ソースコードが公開されているので、ダウンロードして自分でコンパイルをすれば使用できます。本体と日本語の解析に利用している辞書を作成してインストールします。公式ページのインストラクションを見れば、Linux のコンパイルも殆ど問題なくできます。MeCab の利用MeCab を使用する場合、MeCab の処理した結果を利用する場合が多いと思い
0
1 件中 1 - 1
有料ブログの投稿方法はこちら