絞り込み条件を変更する
検索条件を絞り込む

すべてのカテゴリ

1 件中 1 - 1 件表示
カバー画像

タイタニック号沈没事故を例に機械学習における決定木を深ぼる

1997年、ジェームズキャメロン監督による映画「TITANIC」は個人的に大好きな作品。当時はまだVHSが現役の時代。3時間を超えるボリュームでビデオ2本(前半パート・後半パート)で販売されていました。今思うとかなり分厚いケースでした笑。当時はフィルムが擦り切れる位、何度も何度も観たな~。ストーリーもさることながら、当時では圧倒的なグラフィック映像で、またキャストも豪華俳優さんばかりで、また日本ではレオ様!とレオナルド・ディカプリオ旋風が巻き起こりましたね~。いやぁー、当時のディカプリオはマジで美少年そのものでした。こんな人、本当に実在するんだなって思うくらい。。今回はそんな映画の題材となったタイタニック号沈没事故を例に機械学習における決定木分類について深掘りたいと思います。そもそも決定木分類って?機械学習におけるデータ分析は大きく分けて教師あり学習・教師なし学習・強化学習の3つに別れ、教師あり学習には分類と回帰の手法があります。教師ありとは”答え”(正解データ)がある場合をいいます。例えば、今回タイタニック号沈没事故を例にすると、各乗客にはチケットクラス(1等、2等、3等)や年齢、性別、部屋番号、搭乗港等の特徴的な情報と生か死かという情報があります。これはデータ分析の視点で見ると、各乗客のこれらの特徴的な情報に対して、正あるいは死に振り分けられる、つまり正か死に分類ができると言え、これはつまり、各特徴的な情報と紐づけて正、死の2クラスの正解データに分類できます。そして、教師あり学習とは、この正解データがあるデータでの学習を指します。じゃあ、具体的に何を学習するのかというと、上
0
1 件中 1 - 1