サービス
サービスを探す
プロ人材を探す
仕事を探す
ブログを探す
サービス
サービスを探す
プロ人材を探す
仕事を探す
ブログを探す
- サービスを探す
- プロ人材を探す
- ノウハウ・素材を探す
- ブログを探す
- エージェントに人材を紹介してもらう
- 単発の仕事を探す
- 継続 (時給/月給) の仕事を探す
- エージェントに仕事を紹介してもらう
購入・発注したい方
受注・働きたい方
カテゴリ一覧
- PRO認定
- 人気のご利用シーン
- コンテンツ
弁護士検索・法律Q&A(法律相談)

pip install Mecab
pip install gensim
f= open('kokoro.txt', encoding="utf-8")
text = f.read()
f.close()
import MeCab
m = MeCab.Tagger()
def tokenize_text(text):
text = m.parse(text).strip()
return text
tokenized_text = tokenize_text(text)
from collections import Counter
words = tokenized_text.split()
counter = Counter(words)
# 最も頻繁に出現する10単語を表示
print(f'頻出単語: {counter.most_common(10)}')
from gensim.models import Phrases
from gensim.models.phrases import Phraser
# Phrasesモデルの学習
phrases = Phrases([words], min_count=10, threshold=100)
# 共起関係の抽出
bigram = Phraser(phrases)
transformed_text = bigram[words]
# 共起関係の確認
print(f'共起関係: {transformed_text}')