ポートフォリオを更新しました!

記事
ビジネス・マーケティング
・統計を扱っているがどのレベルのものを扱っているのか分からない…。
・実際に依頼するときのイメージが分からない…。
そういったご不安があるのではないかと考え、今後もポートフォリオを更新していこうと思っていますので、ぜひみていただければと思います!

今回は心理統計をもとに以下のような分析をしてみました!
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
【BIG5性格特性データの分析】

本分析では、BIG5性格特性(外向性、神経症傾向、調和性、誠実性、開放性)のデータを用いて、統計的手法を適用し、性格特性の分布や相関関係を明らかにしました。加えて、クラスタリング分析や主成分分析を実施し、データのパターンを探索しました。

1. データの前処理
CSVファイルをRで読み込み、欠損値の有無を確認。
欠損が見つかった変数(country, O10)を除外し、クリーンなデータセットを作成。
各性格特性のスコアを合算し、新たな変数として追加。

2. データの分布の可視化
ggplot2を用いて、BIG5の各特性(Extraversion, Neuroticism, Agreeableness, Conscientiousness, Openness)のヒストグラムを作成。
各特性のスコア分布を視覚的に確認し、データの偏りを把握。

3. 相関分析
各性格特性間の相関行列を作成し、数値的な関係を分析。
ggcorrplotを用いたヒートマップにより、特性間の関連性を可視化。

4. クラスタリング分析
BIG5のスコアを基にデータを標準化し、K-meansクラスタリングを実施。
factoextraを用いて、最適なクラスタ数を決定。
クラスタリング結果を可視化し、類似した性格特性を持つグループを抽出。

5. 主成分分析(PCA)
BIG5特性を要約し、データの次元削減を実施。
prcomp関数を使用し、主成分の寄与率を確認。
biplotを用いて、主成分得点と特性の関係を視覚化。

6. 回帰分析
仮に「英語を母国語とするか(engnat)」を目的変数とし、BIG5特性を説明変数とした重回帰分析を実施。
ggplot2を用いて、外向性とengnatの関係を可視化。
本分析では、BIG5の性格特性がどのように分布し、関連し合っているのかを明らかにするとともに、クラスタリングやPCAを通じてデータのパターンを探索しました。
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す