絞り込み条件を変更する
検索条件を絞り込む
有料ブログの投稿方法はこちら

すべてのカテゴリ

44 件中 1 - 44 件表示
カバー画像

【連載】未来をデザインする統計学-元広告プランナー・ソフィアの四柱推命ノート

第1章 数字で割り切れない「違和感」の正体を探しに行くこんにちは、四柱推命鑑定士のソフィアです。少し前まで私は都内の広告代理店でメディアプランナーをしていました。膨大なグラフと睨めっこし、A/B テストの統計を武器に企画を通す──そうやって“確率”を最大の味方にしてきた私が、なぜ東洋の占いで人の背中を押すようになったのでしょうか。きっかけは、退勤途中に立ち寄ったJR東京駅構内の小さな書店でした。平積みのビジネス書に視線を泳がせていると、占い棚の端に並ぶ薄い新書が目に留まりました。たまたま手に取ったその本が、四柱推命の入門書だったのです。『四柱推命入門〜生年月日時を統計する〜』“占い”と“統計”が同じ行に並んでいる。好奇心のスイッチが入り、レジへ直行。ページをめくると、古い易経の図譜と並んで「生年月日時を数千万件単位で集計した結果」と注釈がありました。広告の世界で私が扱っていた消費データと、何が違うというのでしょう?ページをめくると「生年月日時を数千万件単位で整形し、パターンを抽出する」という章がありました。確率を武器にしてきた私にとって、占いが“巨大データ解析”として語られている事実は衝撃的でした。統計で未来を読む方法が、千年以上前に体系化されていた。この気づきが私の占いへの認識を180度ひっくり返したのです。1. 四柱推命は“確率の文系アプローチ”四柱推命は【年・月・日・時間】の四本柱を用い、木・火・土・金・水という五つの要素、五行の偏りで性格や変化のタイミングを可視化する仕組みです。誤解を恐れずに言えば、生年月日時という確定データを素材にした巨大なマーケティングモデル。花屋
0
カバー画像

おすすめ統計ツール(Pythonを含む)と使用方法(4)

はじめに統計解析に必要な計算式も厳密には数学的に導くことができます。したがって,概念的に理解して手計算を行うことも可能です。しかし,それはあまりに大変で,公式を利用するのも面倒です。そういった初学者にとっては,無償/有償のツールというのは大いにありがたいですよね。ただし,統計解析ソフトの使用にはいくつかの問題点もあります。例えば,かの有名なS◯SSであっても,その処理過程に統計学的な誤りが見出されます。まだ細かいことは述べませんが,計算を投げやりにしてしまうせいで,妥当性の低い統計解析になってしまうということがあり得るわけです。そういったことも踏まえて,今回の記事では,おすすめツールと無償ソフトを紹介したいと思います。
0 500円
カバー画像

標準偏差/標準誤差と平均値/中央値(番外編)

はじめに前回の記事で,標準偏差の細かい内容と平均値ー標準偏差と中央値ー四分位範囲の使い分けについて,次の記事で解説すると述べていました。今回はその内容を詳しく説明していきます。1.標準偏差とはなにか。標準偏差は,「データのばらつき」を表す指標です。簡単に言えば,偏差(実測値ー平均値)の平均値のことです(語弊あり)。しかし,よくよく考えてみると,データのばらつきを要約したいのだから,「データのばらつき(偏差)を平均すればよい」はずです。それでは実践してみます。1 2 3 4 5 6 7以上のデータの平均値は,4です。偏差はそれぞれ実測値から平均値を引いた差なので,以下のようになります。-3 -2 -1 0 1 2 3偏差の平均値を計算すると,0÷7=・・となります。これは平均値が分布の中心にあることが原因です。そのため,一旦すべてのデータを2乗して計算します。9 4 1 0 1 4 9偏差を2乗した値の平均値を計算すると,4です。しかし,この値は2乗(平方)したものなので,戻します。すると,±2が標準偏差となります。標準偏差は「平均値±標準偏差」として記述されます。この場合は「4±2」です。これが何を示すかと言うと,全データの約68%がこの間に含まれることを意味します。また,平均値±2標準偏差の間には全データの約95%が含まれ,平均値±3標準偏差の間に全データの約99.7%が含まれます。このような便利な指標ということで,データの要約値として「平均値ー標準偏差」が多用されるのです。2.標準偏差と四分位範囲の使い分け一方で,前回の記事で整理したように,四分位範囲というものも存在します
0
カバー画像

データの要約方法と正規分布の誤解(3)

1.データはどのように要約するか。(1)度数分布図統計学では,大量のデータをどのように要約し,集団の特徴を記述するのでしょうか。データを要約する方法として,一般的なものに「度数分布図(frequency distribution)」があります。これは,横軸にデータの値,縦軸にその頻度(度数)をとった棒グラフです。このように度数分布図(ヒストグラム)で表すと,データの「分布」が直感的に分かります。例えば,データの中央値や平均値,偏りなどがだいたい把握できますね。(2)代表値また,データをグラフではなく,数値で要約する場合,代表値を使用することがあります。具体的な概念は以下のとおりです。・平均値(mean)・・・データの総和をデータの個数で割った値・中央値(median)・・・データを小さい順に並べたときの中央の値・最頻値(mode)・・・最も頻繁に出現する値母集団の平均値→母平均,母集団の標準偏差→母標準偏差などと呼びます。対して,標本集団の平均値→標本平均のように区別します。(3)データのばらつき一方で,データの散らばり具合を測定する指標もあります。具体的な概念は以下のとおりです。・偏差(deviation)・・・各データ値と平均値の差・分散(variance): 偏差の2乗の平均・標準偏差(SD): 分散の平方根。元のデータと同じ単位になるため、理解しやすい。こちらも同様に,母標準偏差や標本標準偏差と呼ばれます。あまり重要ではないですが,母標準偏差はσ:シグマ,母分散はσ²:シグマ2乗と呼ばれることもあります。また,標準偏差は,「平均値±標準偏差」の形で表されることが多いです
0 500円
カバー画像

統計学の基本と無作為抽出の問題(2)

1.統計学とはなにか。統計学とは一言で言えば「データを整理し,わかりやすくするための学問」です。膨大なデータをそのまま眺めても,そこから有益な情報を直感的に読み取るのは難しいものです。例えば,日本人100人の体重を測定したとします。このデータをそのままリストとして眺めても,全体の傾向を把握するのは容易ではありません。そこで,データの代表的な特徴を示す「要約値」を求めることで,情報を簡潔に表現することができます。ここで,すでに専門用語が出てしまいました。要約値(要約統計量/基本統計量/記述統計量)とは,平均値や中央値,最頻値,最小・最大値,分散,標準偏差,四分位範囲・・・など,データの分布や特徴した値を指す。このうち,平均値や中央値,最頻値などは,データの中心を代表するものとして,代表値と呼ばれる。[1]たくさん呼び方があってややこしいですが,これは統計学の特徴でもあります。これら細かい概念については,一つずつ抑えていきましょう。話は戻り,先の日本人100人の体重の測定についてです。最も基本的な要約値の一つが,平均値(mean)です。これは,すべてのデータを足して個数で割ることで求められ,データの「中心的な値」を示します。たとえば,100人の体重の平均値が50kgだったとすると,「この100人の体重はおおよそ60kgである」と表現できます。  ※どの要約値や関連値についても,計算方法を理解する必要はあまりな    いです。機械計算できるので,概念の理解を先に行いましょう。しかし,「おおよそ」という表現に疑問を持つ人もいるかもしれません。つまり,「データがどのくらいバラついているの
0
カバー画像

統計解析法のマニュアル(1)

はじめに ーなぜ統計が必要なのか。近年では,文科省によってリカレント教育(学校教育から離れたあとでも,必要に応じて必要な内容を学び直すこと)が推進されていることもあり,大学院に進学する方が多くいらっしゃることと思います。大学院と研究は切っても切り離せないものであり,そうしたなかで大きな壁として立ちはだかるのが「統計」です。最近は,人文系の研究であっても,データサイエンスが活発化しており,研究デザインに統計処理を求められる場合も多くあります。その主な理由は,再現性と信頼性です。まず統計的手法を用いることで,研究結果の客観性を担保し,同じ手続きを踏めば他の研究者でも同様の結果が得られる可能性を高めることができます。これを再現性と呼びます。これにより,研究者の主観的な解釈ではなく,データに基づいた議論が可能となり,研究の信頼性が向上します。なお,当方は定量的な分析(数字を使った分析のこと)を無条件に持ち上げる立場ではありません。しかし,状況によっては様々な分析手法を組み合わせることも求められ,そのなかに統計解析も含まれることが想定されます。一見,難しそうに感じる統計ですが,適切に手順を踏んで,ゆっくり理解を深めれば全く別次元の世界の話というわけでもありません。本記事(シリーズ)は,特に数学の苦手な学生や研究者に向けて,的確な統計学の知識と技能を授けるものです。統計をはじめる際の大きな壁ただし,ここで大きな問題が立ちはだかります。それが「統計解析に関わる嘘」です。最も有名な例をあげるとすれば,「データに正規性がなければノンパラメトリック手法を使う必要がある」です。これはご存じの方もいる
0
カバー画像

ポートフォリオを更新しました!

・統計を扱っているがどのレベルのものを扱っているのか分からない…。・実際に依頼するときのイメージが分からない…。そういったご不安があるのではないかと考え、今後もポートフォリオを更新していこうと思っていますので、ぜひみていただければと思います!今回は心理統計をもとに以下のような分析をしてみました!ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー【BIG5性格特性データの分析】本分析では、BIG5性格特性(外向性、神経症傾向、調和性、誠実性、開放性)のデータを用いて、統計的手法を適用し、性格特性の分布や相関関係を明らかにしました。加えて、クラスタリング分析や主成分分析を実施し、データのパターンを探索しました。1. データの前処理CSVファイルをRで読み込み、欠損値の有無を確認。欠損が見つかった変数(country, O10)を除外し、クリーンなデータセットを作成。各性格特性のスコアを合算し、新たな変数として追加。2. データの分布の可視化ggplot2を用いて、BIG5の各特性(Extraversion, Neuroticism, Agreeableness, Conscientiousness, Openness)のヒストグラムを作成。各特性のスコア分布を視覚的に確認し、データの偏りを把握。3. 相関分析各性格特性間の相関行列を作成し、数値的な関係を分析。ggcorrplotを用いたヒートマップにより、特性間の関連性を可視化。4. クラスタリング分析BIG5のスコアを基にデータを標準化し、K-meansクラスタリングを実施。factoextraを用いて、最適なクラスタ数
0
カバー画像

T検定とは

みなさん、こんにちは!今日も統計的検定のお話しです。よく使われるT検定について説明します。T検定とは?T検定は、2つのグループの平均値に本当に差があるかどうかを判断するための統計手法です。研究や実務で頻繁に使用されます。T検定の2つのタイプ1. 対応のないT検定:別々のグループを比較2. 対応のあるT検定:同じグループの前後や異なる条件を比較それぞれのタイプを具体例で見てみましょう。例1: 対応のないT検定シナリオ: 新しい患者ケアモデルの効果を調べる- グループA: 従来のケアを受けた患者50名- グループB: 新しいケアモデルを受けた患者50名- 測定: 退院時の患者満足度スコア(0-100点)**結果**:- グループA平均: 75.3点 (標準偏差 8.2)- グループB平均: 82.1点 (標準偏差 7.8)- T検定結果: p < 0.001解釈: 新しいケアモデルを受けた患者の満足度が統計的に有意に高い。新モデルは患者満足度を向上させる可能性が高い。例2: 対応のあるT検定シナリオ: 新しい痛み管理教育プログラムの効果を調べる- 対象: 慢性痛のある患者40名- 測定: 痛みスコア(0-10点)をプログラム前後で測定結果:- プログラム前平均: 7.2点 (標準偏差 1.5)- プログラム後平均: 5.8点 (標準偏差 1.7)- T検定結果: p < 0.001解釈:教育プログラム後、患者の痛みスコアが統計的に有意に低下。このプログラムは痛みの軽減に効果がある可能性が高い。重要な注意点1. サンプルサイズ:    - 小さすぎると本当の差を見逃す可能
0
カバー画像

パラメトリック検定とノンパラメトリック検定

こんにちは!今日は、統計学でよく出てくる「パラメトリック検定」と「ノンパラメトリック検定」についてお話しします。なぜ2つの検定方法があるの?まず、簡単な例で考えてみましょう。あなたが病棟で「新しい痛み止めの薬」の効果を調べたいとします。20人の患者さんに使ってもらい、痛みの程度を0-10のスケールで評価してもらいました。さて、このデータをどう分析すればいいでしょうか?実は、データの特徴によって、適切な分析方法(検定方法)が変わってくるんです。それが「パラメトリック検定」と「ノンパラメトリック検定」の違いです。パラメトリック検定とノンパラメトリック検定の違い1. パラメトリック検定   - データが「釣鐘型」の分布(正規分布)をしているときに使います。   - 例えば、多くの人の身長や体重のデータは、この形に近くなります。2. ノンパラメトリック検定   - データの分布が釣鐘型でなくても使えます。   - 分布の形に特別な仮定を必要としません。なぜこの違いを知ることが大切なの?適切でない方法を使うと、間違った結論を導いてしまう可能性があるからです。例えば:- 釣鐘型でないデータにパラメトリック検定を使うと、実際には効果がない治療法を「効果がある」と誤って判断してしまうかもしれません。- 逆に、釣鐘型のデータにノンパラメトリック検定を使うと、本当は効果がある治療法を見逃してしまう可能性があります。具体例で見てみよう先ほどの「新しい痛み止めの薬」の例で考えてみましょう。1. データの確認   まず、20人の痛みのスコアをグラフにしてみます。2. 検定方法の選択   - もしデータが
0
カバー画像

先進的統計手法入門: Win比、制限付き平均生存時間、レスポンダー解析、標準化平均差について

こんにちは、CRASです。今回は、研究者の皆さんに役立つ最近の統計手法について、わかりやすく解説していきます。【論文情報】タイトル: Clinician's Approach to Advanced Statistical Methods: Win Ratios, Restricted Mean Survival Time, Responder Analyses, and Standardized Mean Differences著者: Melissa Lane, Tyson Miao, Ricky D. Turgeon掲載誌: Journal of General Internal Medicine発行年: 2024年この論文は、臨床医が最新の医学文献を適切に評価し、実践に活かすために必要な高度な統計手法について詳細に解説しています。特に以下の4つの統計手法に焦点を当てています:1.Win比 (Win Ratio)・複合アウトカムの分析に新しいアプローチを提供・臨床的優先順位に基づいてアウトカムを評価可能・PARAGLIDE-HFとEMPULSE試験を例に説明2.制限付き平均生存時間 (Restricted Mean Survival Time, RMST)・比例ハザード仮定が成り立たない場合の代替手法・カプランマイヤー曲線の下の面積として解釈可能・RIVER試験を例に、リバーロキサバンとワルファリンの比較を説明3.レスポンダー解析 (Responder Analysis)・連続変数を「反応あり/なし」の2値に変換する手法・結果の解釈が直感的になるが、情報の損失には注意が必要
0
カバー画像

比率を感じる円グラフ

グラフ作成を行う『グラフのくまりん』です。ポートフォリオに載せるため、棒グラフと円グラフのサンプルを作成していました。改めて、それぞれのグラフが持つ機能を感じます。円グラフは、直感的に比率を感じることができます。冒頭の写真を見ると、直感的にカレーとパスタの面積を広く感じ、売上の二大トップがカレーとパスタであることがわかります。直感的に分かりやすいからこそ、情報の雰囲気を他者と共有しやすいというメリットもあります。自分でデータの雰囲気を知りたいときも、プレゼンで周りと情報共有をしたいときも、どちらでも使える円グラフです。グラフのくまりんでは、お仕事の受注段階で、データ集計で知りたいことや知る目的、グラフを用いる状況などをふまえ、効果的なグラフの種類を選択して作図を行います。
0
カバー画像

ミスしたときに自分にやさしくする!【アラフィフ心理カウンセラー「うさぴょん」のココナラ電話相談】

日常生活や仕事でミスを犯すことは避けられません。しかし、そのミスに対する自分自身へのアプローチが、その後の行動や精神状態に大きな影響を与えます。ここでは、ミスしたときに自分にやさしくすることの重要性について考えてみましょう。 まず第一に、ミスは成長の機会であると捉えることが大切です。誰もが最初から完璧な仕事をすることはできません。ミスを通じて学び、次回に活かすことができれば、それが真の成功への一歩となります。ですから、ミスをただの失敗と見なすのではなく、成長へのプロセスと捉えることがポイントです。 次に、ミスをした際に自分に厳しく接するのではなく、やさしく接することが重要です。自分を責めすぎたり、ネガティブな感情に囚われることは、逆に次のタスクやプロジェクトに影響を与える可能性があります。ミスは人間らしいものであり、誰もが経験するものです。そのため、冷静になり、冷静な視点から問題を見つめ直すことが重要です。 また、自分にやさしくすることは、自己評価を保つ上でも役立ちます。ミスによって自分を否定することで、自信を喪失することがありますが、ポジティブなアプローチを取ることで自分の強みを再確認し、自己評価を維持することができます。 最後に、ミスをしたときに他人からのフィードバックを受け入れることも大切です。他人の意見やアドバイスを通じて、自分の行動や方法を改善する手助けになります。ただし、その際にも冷静な心を持ち、建設的な意見を取り入れることがポイントです。 ミスは避けられないものですが、その後の対応が重要です。ミスをチャンスととらえ、やさしく自分に接することで、より良い結果を生む手
0
カバー画像

仕事=楽しく生きること!【アラフィフ心理カウンセラー「うさぴょん」のココナラ電話相談】

仕事は私たちの日常生活において重要な一環です。しかし、仕事は単なる生計を立てる手段だけでなく、私たちの人生において喜びと充実感をもたらす冒険の始まりでもあります。「仕事=楽しく生きること」という考え方が、仕事をただの義務ではなく、充実と喜びに満ちたものに変えるのです。 まず、仕事を楽しむことは自己成長の手段でもあります。新しいスキルを磨き、知識を深める過程は、自分の可能性を広げる素晴らしい機会です。仕事を通じて挑戦に立ち向かい、成果を上げることで、自己満足感と達成感を得ることができます。毎日が新たな学びと成長の機会となり、これが仕事を楽しむ源になります。 また、仕事を楽しむことは人間関係を築く手段でもあります。同僚との協力やチームワークを通じて、仕事環境がより良くなります。共に目標に向かって努力し、成功や失敗を分かち合うことで、強固な絆が生まれます。仕事仲間との交流が楽しみであれば、仕事がただの義務ではなく、日常の中での楽しみとなります。 更に、仕事が楽しいと感じることは創造性を引き出す要素でもあります。モチベーションが高まり、新しいアイデアやアプローチが生まれやすくなります。仕事を楽しむことで、問題に対する柔軟で前向きな考え方が養われ、創造性が発揮されることでしょう。 総じて、「仕事=楽しく生きること」は、仕事を生き生きとさせ、日常に喜びをもたらす哲学です。仕事をただこなすだけでなく、その中で成長し、人とのつながりを深め、創造的なエネルギーを発揮することで、私たちはより充実した人生を築くことができるでしょう。
0
カバー画像

性格診断、未来から見るか、過去から見るか 最近の性格診断とビジネス活用を考える

①タイプ分けTMttps://coach.co.jp/whatscoaching/20170821.html コントローラー 行動的で自分が思ったとおりに物事を進めることを好む プロモーター アイディアを大切にし、人と活気あることをするのを好む サポーター 他人を援助することを好み、協力関係を好む アナライザー 行動に際して多くの情報を集め、分析、計画を好む②ビッグファイブttps://jinjibank.jp/knowhow/36510/倫理と直感、内向と外向、保守と創造、孤立と調和、直感と熟考③16タイプttps://www.16personalities.com/ja/%E6%80%A7%E6%A0%BC%E3%82%BF%E3%82%A4%E3%83%97④ロジックブレイン 3タイプttps://hrnavi.net/ttps://lb-media.jp/slider/special_feature0005/理性、感情、比較⑤エニアグラム 9タイプttps://www.enneagram.ne.jp/about/diagnosis熱中する人、達成する人、挑戦する人、助ける人、改革する人、信じられるものを求める人、平和を好む人、観察する人、個性を求める人⑥岡田斗司夫 4タイプ判定テスト』で自己分析ttps://blog.big5-basic.com/2023/01/26/four-types/注目、指令、法則、理想⑦みげか (≒北野唯我さんの天才を殺す凡人)未来創造、現在共感、過去再現性格診断には色々タイプがあり、分類や活用方法は色々ある。5年前から、みげか=未来現在過去
0
カバー画像

#OO6 100件中のリピート率が想像を超えてた…。

シャイニング晃✨✨お陰様で販売実績が100件を超えてました!職業病なのか定かではないのですが、数字で結果を出してみたくて仕方がない!ので、このブログを読んでいただいた方限定で男女比率とリピート率のみを公開したいと思います!統計をとってみた結果、自分の弱点が明白になりました!やって良かったです!やっぱり数字で出せば色々とわかってきますね。100件中の男女比率。男性のお客様 9名のうち出品者様は5名女性のお客様 38名のうち出品者様は22名計 購入専門のお客様は20名 出品者様は27名(へぇ…何となくそんな気はしてたけど、やっぱりそうなんや…。)本当に集客していないことがわかる…47名中リピートがなかったのは16名なんと!!リピート率は60%でした!!購入された半分以上のお客様がリピートしてくれています!これは販売実績が200件に行く前に70%にしたい…!問題点は集客数がたった47人しかいないという欠点が見えましたね。しかしですよ?ハッキリとわかった事は、建っているだけでドンドンお客様が入ってくるスタバやドトールじゃなくて、通いなれた愛される喫茶店でも結果は出せるということ。自分も美容室に関してはずーーっと同じ店にしか行きません。理由はいつ行っても同じ人がいるという安心感と変な髪型にしない信頼かな?シンプルにコミュニケーションがとりやすい、見慣れているので自分の好みを説明しなくても熟知しているってのが一番大きいですね!次はブログ!初めてココナラで出品した有料ブログになります。閲覧数は1ヶ月で184いいね!は8購入された数は3件でした。これは自分でもビックリ!!9月5日に出品した有料
0
カバー画像

#032 統計の活用

前回まで、統計の入口についてお話ししました。ここからはさらに統計というものを使っていくかについてお話しします。 私が思う限りでは、統計というものは、「さあて、今から統計を使うぞ!」と構えるのではなく、仕事などにおいて比較を行うシーンとか、今起きた現象が、普通に起こる出来事なのかを確認したいシーンなどで使うツールだと思います。統計ありきではなく、シーンありきです。そのシーンに適した統計的手法を選ぶことが重要だと思います。 わかりやすく言えば、四則計算という手法があったとき、1列20人の学生が3列に並んだ時の総勢を求めたいときは乗算、20個のミカンを4人で分けたいときは除算を使うという感じです。どのシーンにどの手法が当てはまるかを知っておけば、後はEXCELが計算してくれます。シーンと統計的手法のマッチングこそが、統計の活用だと思います。
0
カバー画像

【YouTube更新】不偏分散 ~なぜn-1で割るの?~

YouTubeに新しい動画をアップしました!統計を学んでいる人にとって基礎的な統計量のひとつ不偏分散計算する事はできても「なぜn-1で割るのか?」これを説明できる人は余り多くはないのではないでしょうか。この動画ではなぜ不偏分散はn-1で割るのかを徹底解説しています。ここを理解しておけば今後の統計の勉強についても理解が深まると思います。ぜひ最後までご覧ください!動画が少しでも「役に立った!」と思った方はぜひチャンネル登録・高評価よろしくお願いします!m(_ _)m
0
カバー画像

#027 正規分布

先人の知恵はすごかった...昔々、頭の良い学者さんは、いろいろなデータについてヒストグラムを描いて、「はて?データの内容が違っても、似たような形になるなぁ」と気づいたのでしょうか。それを突き詰めていって、正規分布というものを見つけました。 これは、実験などで得られたランダムなデータについてヒストグラムを描くと、山の形になるという法則です。実験データだけでなく、生徒の身長、売られている1斤分の食パンの重さ、Mサイズの卵の重さ、マラソン大会の参加者の完走時間、新品の電球の寿命など、いろいろなデータの集まりについて当てはまります。グラフの形は、裾が広い、狭いという違いはありますが、ほぼ同じになります。では、すその広さの違いは何によるのでしょうか?それは、データの「ばらつき度合い」の違いによります。ばらつきが大きければ裾は広く、小さければ狭くなります。そのばらつきのことを、「分散」と言います。
0
カバー画像

中小企業経営のための情報発信ブログ401:ビジネス統計入門

今日もブログをご覧いただきありがとうございます。昨日で仕事納めという人も多いでしょう。今日から1月3日までは本の紹介を行ないます(ブログを更新できない日もあるかと思いますが・・・)。今日は、関正行著「ビジネス統計入門」(プレジデント社)を紹介します。この本は、帯に「マーケティング、ファイナンスに必須なビジネス統計分析の手法を5日間で速習する」とあります。5日間、計12時間で、ビジネスに必要な統計分析の手法が手に入るなら学ぶ価値は十分にあります。 この本では、航空会社に勤務し、今年から本社経営企画部に配属されたミライが、アメリカのビジネススクールに留学後大学でビジネス統計を教えている先輩の東から、統計分析のレクチャーを受けるというストーリー形式になっています。ミライと東の会話を通じて、ビジネス統計の基礎を学ぶことができ、ここで挙げられている事例にEXCELを駆使すれば、グラフが作成できるようになっています。 ビジネスにおいて統計学や統計分析を学ぶ目的は、大きく分けて2つあります。1つ目は、統計的概念や考え方を知っておくことが、経営上の意思決定において判断要因となるさまざまな事象やデータに直面した際に、それらを正しく理解する手助けになるということです。2つ目は、ファイナンスやマーケティングという分野で扱われることになる「回帰分析」の考え方を理解することが、経営における各分野の相互理解を促進しそれらの有機的な統合を可能にするからです。 1日目 データの顔を知るー統計の基礎 ⑴1時間目・・・データの中心を知る=平均、メディアン、モード  平均=n個のデータの平均  メディアン=整列して
0
カバー画像

#025 統計という便利ツール

その後統計について調べる機会があり、いろいろと探っていると、2つの集団の平均の差に有意性(意味のある差。つまり誤差では無い差)が認められるかどうかは、計算で求められることを知りました。統計の世界では、5%の発生確率以下(コインを投げて4回続けて表が出るよりも少ない)であれば、「滅多に起こらない」と判断します。医学の世界では1%以下という場合もあるそうですが、一般的には5%以下だそうです。詳しい理論を語ることは私にはできませんが、昔の偉い学者さんが理論を作り上げたそうです。それ以外でもいろいろなシーンでの確率を計算して、偶然か、意味のある差かを計算で求めることができます。私もM社在籍中に、様々なデータに対して統計処理を行い、去年より良くなったとか、かわらないとか報告してきました。 皆さんも、車が動く理論は知らなくても、運転されている人も多いでしょうから(私はそうです)、統計理論を知らなくても、統計という便利なツールを使うことをお勧めします。政策立案時の意思決定の一助になること間違いありません。このように、データに基づいて政策決定することを「EBPM」(Evidence-based Policy Making)と言います。私は統計の専門家ではありませんが、ある程度はお手伝いできますので、ご相談ください。
0
カバー画像

【YouTube更新】統計検定データサイエンス基礎

2022年10月1日に受けた統計検定データサイエンス基礎について解説する動画です。最後まで見て頂ければ①どんな試験か②合格する為に何をすれば良いかを理解する事ができます。統計やデータサイエンスについて・良く知らないけど興味がある方・これから学習を始めようと思っている方にはぜひ見て欲しいです!動画が少しでも役に立った!と思った方はぜひチャンネル登録・高評価をよろしくお願いします!
0
カバー画像

#024 統計って...何ですか?

「統計」っていうと、めんどうくさいとか、わけがわからんとかいうコメントが返ってきそうですが、かくいう私もそうでした。変な式がいっぱい出てくる学問というイメージでした。 あるとき誰かの発表で、「3%増えているから、効果がありました」とか言う発言を耳にしたとき、「たった3%で?誤差じゃないの?」と思いました。でもそれに対して反論することができず、信じるしかありませんでした。また、アンケートをとって去年との比較をしたときに、平均値についてどのくらいの差がでたら、この一年で変わったと言えるのかな?という疑問がわきました。とにかく統計と言う言葉を知らずにアンケートを採っていました。今考えると恥ずかしい限りです。
0
カバー画像

統計検定 データサイエンス(基礎) 合格!

coconalaで統計問題の解説をご依頼頂く事が時々あるので自分の勉強の為にも受けてみました。100点満点中合格ライン:60点以上ぢゃぶや :80点無事合格しました~!2017年にできた試験らしく、事前にネットで調べてても詳しい情報が見つけられなかったのでここで少し試験の概要について紹介したいと思います。(データサイエンスそのものの説明は割愛しますが)PCでExcelを使う試験です。大問1つにつき何十~何百というサンプルが1式与えられるのでそのサンプルをExcelを使って解析しながら大問1つにつき4~5つ程度の小問に答えていきます。90分の試験時間で大問が8つあったので大問1つを11分、小問1つ当たりだと2~3分で解いていく必要があります。じっくり考える時間はあまりありません。ピボットテーブルや統計に関するExcel関数を主で使います。頭でわかっていても慣れていないと手がスムーズに動かないのでHP記載の例題を実際に解いて体に染み込ませておく事をオススメします。問題の中身は基礎的だけどかなり実用面を重視して作られたものだと想像できました。◆とあるサッカーチームの過去の試合のデータから どうしたら観客動員数を増やせるか考えたり◆キーワード抽出機能を使って記述式のアンケートを コンピュータで集計・解析したり◆工場で発生する不良率を推定したり 不良が発生した時にそれが複数のラインの内 どこから発生したのか推定したり問題が持ち帰れなかったのでこの↑程度の情報しかお伝えできませんが問題がどういう意図で作られてどういう結論に導こうとしているのか?それを想像しながら解いていくのが楽しかったです
0
カバー画像

中小企業経営のための情報発信ブログ312:高校生が学んでいるビジネス思考の授業

今日もブログを御覧いただきありがとうございます。今日は、大森武著「高校生が学んでいるビジネス思考の授業」(阪急コミュニケーションズ)という本を紹介します。 この本は2014年出版で若干古く今も書店にあるかどうかわかりませんが、ビジネス思考についてわかりやすく説明されていて役に立つ本です。著者の大森氏は早稲田高校の数学科・情報科の教諭です。2003年から高校のカリキュラムが変わり「情報科」が必修教科となり、ビジネスに必要なコミュニケーション能力や問題解決力の基礎はそこで身につけられるというのです。情報科というと「コンピュータの使い方を学ぶところ」というイメージがありますが、「情報をインプットしアレンジし、アウトプットするまでの一連の流れを扱う教科でコンピュータはその単なる道具に過ぎない」のです。2013年から、高校の情報科は「知識重視型」から「問題解決型」に方向転換されました。まさにここにビジネス思考と結びつくところがあるのです。この本では、考えるための7つの道具が挙げられています。7番目はコンピュータですが残る6つの道具は次の通りです。 Ⅰ:「デジタル論理式」 ここでは狭い論理=記号論理を使います。デジタルの論理です。内容は、①情報のデジタル化 ②2進法 ③デジタル容量の容量計算です。最終的には、「文章を論理式で表してそれが筋の通ったものかどうか判定する」のです。つまり、文章の骨格を抜き出し「かつ」「または」「ならば」「~でない」の4つの記号で論理式を表し、それが筋の通った論理かどうかを判断するということです。ここで例文が挙げられています。「あなたはわたしのことが好きじゃない
0
カバー画像

【Excel 関数】その平均、本当にただしいのか?これが統計の基本

YouTubeでも紹介しています。是非ご覧ください。なぜ、データベースを作成するのか? それは、整形されたデータを保存するためです。 しかし、そのデータを利用できなければ、なんの意味もありません。 その平均、本当にただしいのか?これが統計の基本 こんにちは。伊川です。 以前に統計学を、Excelで実装することを紹介しました。 データベース作成は、手段であって、目的ではないということです。 ここを、潜在意識の中で、しっかりと持ってください。 この意識がないと、綺麗なデータベースだけになってしまいます。 整形されたデータベースを利用して、分析する能力が必要です。 その根本となるのが、統計であり、その統計は、平均を疑うところから始まります。 果たして、その平均、その数字はただしいのか? 今回は、平均に特化して、平均の根本を、Excelを利用して説明したいと思います。 このブログはこんな人にお勧め Excelを利用して、統計を勉強したい人 平均は、AVERAGE関数のみだと思っている人 会社の集計が、なんかおかしいと思っている人 このブログを、読み終わるころには・・・・ 平均には、やり方が3つあります。 その3つは、相加平均、相乗平均、調和平均となります。 せめて、この3つは理解しておいた方がいいかと思います。 平均 カンタンそうで難しいと思います。 それぞれの平均に関して、どのように利用するのかということを理解しなければなりません。 意外と、相加平均と、相乗平均の使い方を理解していないと思います。 また、相乗平均は、人事評価にも、直結するところがあるかもしれません。 その辺も含めて、
0
カバー画像

第1章:平均は釣り合いの支点

「試験の平均点はいくつか」「今月の売上の平均」ように,平均は我々にとって非常に身近な概念である.ところで,平均とは何かというと,正しく答えられる人は少ないように思う. 結論から言えば.平均とは「釣り合いの支点」のことである.シーソーを思い浮かべると分かりやすい.二人の人がシーソーに乗ると,二人の体重が同じでない限りどちらかに傾く.しかしシーソーの支点を動かしていくと,必ずどこかで水平に釣り合うはずであり,これが平均の本質的な意味である. しかし,平均にはもう一つの落とし穴がある.それは,極端な値があればその方向に平均が引っ張られることである.これもシーソーをイメージしよう.極端な値があるということは,片方の棒がとてつもなく長いのである.これが釣り合うようにするには,長い先端の方向に支点を移動させるしかない. 多くの人は平均と聞くと「真ん中の値」「普通の値」のようなイメージをもつかもしれない.それもあながち間違いではないが,時に平均は普通でない値をとることがある.したがって平均より低いからといって劣っているとは限らないし,高いからといって優れているとも限らないのである.
0
カバー画像

【YouTube更新】統計_標準コーシー分布に従う事の証明

YouTube更新しました!今回の動画は統計の分野から標準コーシー分布に従う事の証明です。皆さんは標準コーシー分布をご存じでしょうか。確率分布関数なのですが期待値が有限でないという非常に面白い特徴を持った分布です。今回ココナラでご依頼を受けて解説した問題はとある確率変数が標準コーシー分布に従う事を証明せよというものです。統計を勉強されている方、興味のある方はぜひご覧ください。動画が少しでも役に立った!と思った方、ぜひチャンネル登録・高評価よろしくお願いします!
0
カバー画像

【YouTube更新】統計_標本平均の2乗を解く

coconalaでのご依頼ありがとうございます!今回の動画では統計の問題を解説しました。標本平均の2乗に対する期待値や分散について解いたものです。チェビシェフの不等式を用いた一致性の証明も行っています。私個人は統計を余り専門に勉強していた訳ではないですが、今回ご依頼の問題が面白かったのでこれを機に統計の勉強を本格的にやろうと思いました。いいきっかけを頂きありがとうございました!ぜひ動画をご覧頂き、少しでも「役に立った!」と思ったらチャンネル登録・高評価・コメントお待ちしております♪
0
カバー画像

[Javascript] 一次元配列から最大値、最小値、平均、合計、分散、標準偏差を算出する

はじめに 最近、Javascriptメインの統計に関する案件依頼があり、その際に使用した必要最低限の統計解析セットを紹介します。なお、分散及び標準偏差に関しましては、公式も含めこちらでの解説は割愛します。あくまでもJavascriptのコードの紹介となります。また、分散と標準偏差以外はワンライナーの関数式となり、それぞれ独立で利用可能です。前提として、共通の引数として使用する一次元配列は以下とします。const array = [10,15,20,5,35,25,30];■最大値コードレビューした際、よくfor文やforEachで順次確認するロジックを見かけます。降順にソートしたものの先頭が最大値になります。const max = arr => arr.sort((a,b) => b-a)[0];console.log(max(array));// 35■最小値 最大値と逆の考え方です。昇順にソートしたものの先頭が最小値となります。const min = arr => arr.sort((a,b) => a-b)[0];console.log(min(array));// 5■合計array.reduceは配列のそれぞれの要素に対して、順次ユーザー定義のコールバック関数を実行し、その処理によって配列の各値を一つの値にまとめます。この説明では分かりづらいですが、配列要素の合計を求めるのはこのメソッドの基本形です。const sum = arr => arr.reduce((a,b) => a+b);console.log(sum(array))
0
カバー画像

【機械学習を知ろう!】第2回 自動でグループ化してみよう!

こんにちは。山城です。【機械学習を知ろう!】の第2回は、データを自動でグループ分けしてくれる「クラスタリング」という機械学習を紹介します!例として、ある施設の会員の施設利用履歴データを使って、会員の性質毎にグループ分けをしてみます。まずは利用履歴を会員毎に統計します。統計値が取れたので、このデータを使ってクラスタリング(グループ分け)をしてみます。では機械学習でグループ分けをしてみましょう!クラスタリングはAI君にお任せしましょう(よろしく〜)あっ、もうできたようですね。。。ではクラスタリングの結果を見てみます!綺麗にグループ分けできました!さらにクラスター毎に平均をとって傾向を見てみましょう!クラスター2を見てみると、1ヶ月の間に利用回数が多く、会員期間が短い傾向があります。つまり、月の利用回数が多いと長続きせず退会しやすいとうことがことが分かります。このように、クラスタリングは自動でグループ分けをして傾向を分析(クラスター分析)することができるのです!次回は機械学習の一つ「次元削減」について書いていきたいと思います。お楽しみに!
0
カバー画像

【データ分析をしよう!】 第5回 自由評価の分析方法

こんにちは。山城です。【データ分析をしよう!】の第5回は、自由評価を分析する方法をご紹介します。皆さんは、アンケートなどで、それぞれ自由に点数をつけてもらったデータがあった時どうしますか?この場合、人により物差しが違うため、過小または過大評価になるため扱いに困りますよね。そこで、この物差しを一定にして、再評価を行います。例として、あるカレーが美味しかったか、アンケートをとったものがあるとします。この場合、「おいしい」の物差しは人それぞれ違うため、甘く評価した人や厳しく評価した人がいる可能性があります。そのため必ずしも「普通」が星3になるとは限りません。そこで、「標準化」という処理をすることで、物差しを一定にて個人差を無くします。この標準化した値を「z値」といいます。さあ、やってみましょう!アンケートを標準化すると‥   名前     z値    Aさん   -0.25    Bさん   -0.625    Cさん   0.5    Dさん    -0.625    Eさん   0.125    Fさん   0.875となりました。z値にすることで個人差を無くして正しく評価ができるようになりました!個人差が発生する可能性のある数値は、そのまま使用せず標準化を行うようにしましょう!次回からは、AIをテーマに色々紹介していきたいと思います!お楽しみに♪
0
カバー画像

統計を考える

衆議院選挙で自民党が単独過半数を獲得しました。立憲民主党が想像以上に苦戦しました。その一方で野党共闘に加わらなかった日本維新の会が躍進。選挙戦略も興味深いですね。さて、選挙の開票速報で当選確実が開票率1%程度で出ますね。一般の人はなんで?と思います。これ統計学なんです。母集団の推計は、率ではなく数で可能となります。だからサンプル(開票数)が500くらい集まれば、全体の結果がほぼわかるわけです。統計でいう検定で、危険率(外れる可能性)5%とか、1%とか言います。当選確実と言うからには危険率は非常に小さいのでしょう。「確実→危険率小→サンプル数大」という流れです。 会社のプレゼンテーションで分析結果を説明する場面が多いです。たまにサンプル数が小さいのに分析・説明している人を見ます。サンプル数10~30程度の分析です。これは危険率が高すぎで、文字通り「危険」。判断を誤る。最低でも50はないと信頼性に欠けると思います。特にクロス分析する場合は要注意。全体ではサンプル数がそこそこあっても、分解すると足りなくなるケースが多い。年齢別、地域別等に分けるときは注意しましょう。 基本的な統計知識は、会社員の基礎リテラシーだと思います。回帰分析や主成分分析などの多変量解析は不要ですが、平均値、検定、サンプリングの基礎知識は必須です。さらに相関分析くらいは出来た方がいい。これも要注意で、相関係数や決定係数が小さいのに、関係性を強調している人をたまに見かけます。相関分析も含めて、エクセルの基本分析ツールに入っていますので、扱えるようにしたいです。 ITやPCが便利になると、結果だけを信じるようになって
0
カバー画像

【データ分析をしよう!】 第4回 これって関係あるの?

こんにちは。たけのこよりきのこ派の山城です!【データ分析をしよう!】の第4回は、二つの要素の関係の強さを分析する方法をご紹介します。関係性を表す方法として、相関係数(比例または反比例を数値で表したもの)で関係の強さを出す方法があります。相関係数は、以下のように−1〜1の範囲で表されます。・-1に近いほど反比例する関係が強い・0に近いほど関係性がない・1に近いほど比例する関係が強い例として、ビールの販売数と平均気温の関係を測ってみたいと思います。まずはデータを散布図にしてみます。赤線は「回帰直線」と呼ばれるものです。相関係数は各数値と赤線までの誤差を元に計算します。【相関係数の求め方】計算がめんどくさいので、ここは機械に任せましょう。(はなほじ)なんやかんやあって、相関係数は0.315となりました。0.315は一般的には弱い相関があると判断されます。つまり、気温が上がると比例してビールは売れる傾向があることがわかります。このように、2つの要因の関係性の強さを、数値で表すことができるのです。※ただし、相関関係はあっても必ずしも因果関係があるわけではないので、他の要因も検討する必要があります。次回は、「自由評価の分析方法」をテーマにしたいと思います。お楽しみに♪
0
カバー画像

【データ分析をしよう!】 第3回 これって偶然?必然?

こんにちは。この前冬山キャンプをしたら寒くて死ぬかと思った山城です!【データ分析をしよう!】の第3回は、複数のグループの結果に差が出た時、たまたま差が出たのか、それとも何か原因がって差が出たのかを判断する方法について、ザックリと書いていこうと思います。統計学では、「その結果がどれくらいの確率で起こるか」を計算して、5%を基準として判断していきます。・5%以上の確率で起こる → 偶然・5%より大きい確率で起こる → 偶然ではない例として、英語のテストを1班7人と2班9人で行った結果が、1班 59, 67, 60, 78, 75, 80, 66      平均:69.292班 52, 78, 56, 71, 51, 58, 80, 60, 51   平均:61.89となったとします。平均点の差は偶然の差かそうではないかを判断してみましょう!この場合、統計学の「平均の差の検定」という手法で計算を行って判断していきます。  【平均の差の検定】眠くなるので計算過程は割愛します(ハナホジ)なんやかんや計算すると、この差が出る確率は5%より大きくなります。今回は確率が5%より大きいため、この差はたまたま起こったことと判断できます。ザックリ説明しましたが、さらに詳しく知りたい方はグーグル先生に聞いてみてください!次回は、「これとこれは関係ある?」をテーマにしたいと思います。お楽しみに♪
0
カバー画像

【データ分析をしよう!】 第2回 データ分析の進め方

こんにちは、山城です!【データ分析をしよう!】の第2回は、データ分析から結果を得るまでの進め方について書いていこうと思います。ノープランで闇雲にデータ分析を始めると、途中で目的を見失ってしまったり、期待した結果が得られなかったりします。そこで、まずは以下のデータ分析の進め方を押さえましょう。<データ分析の進め方>① ビジネスの理解と現状を把握する (明確にする)② データ分析をする目的を設定する (明確に設定する)③ データを集める         (集める手段があるか?)④ データの内容を理解する     (データの中身を確認する)⑤ 分析するためにデータを整理する (分析しやすい形にする)⑥ 分析を行う           (適した分析手法を選択する)⑦ 評価をする           (ビジネスに当てはめ結果を得る)⑧ 対策を立てる          (実行する)カッコ書きは、それぞれの重要な部分になります。この流れをしっかり意識してデータ分析を行っていきましょう!あくまでも「データ分析」は手段であり、結果を元に実行して初めてビジネスに価値が生まれますので、その事を忘れないようお願いします。サクサク読めるよう、大まかに説明しましたが、専門的に知りたい方は、「CRISP-DM」でググってみてください!次回は、「これって偶然?必然?」をテーマにしたいと思います。お楽しみに♪
0
カバー画像

【データ分析をしよう!】 第1回「データ分析」ってナンダ?

こんにちは、山城です!【データ分析をしよう!】の初回は、「データ分析」の意味について書いていこうと思います。「データ分析」とは、何らかの結果として得て収集した情報を、分類・統計などの処理を行い、情報を見える化して対策を見出すことです。「体感ではなんとなく分かるけど、実際はところどうなの?」「この結果は偶然?必然?」「これとこれは何か関係があるの?」など知りたいことを具体的にデータから証明と推定をしていきます。そして得られた傾向を解釈して、対策を行って行くことが重要となります。「誰かを説得したい!」「課題を見つけて対策を考えたい!」「無駄を省いて効率化したい!」などの目的がある方にとっては、もってこいの分野ですね♪なるべく難しい言葉は使わず、誰でも分かるようなブログを目指していますので、ぜひ継続して読んで頂きデータ分析の世界を体感してみてください!
0
カバー画像

めざまし占いは乙女座が冷遇されている説

2020年1月~5月までの間に、各星座が何回1位を取ったか集計しました。占いは意外と不平等なようだw
0
カバー画像

ADHDの症状は、必ずしも常にあるものではない。

このお話は、以前、少し似たような話をしたのですが、アメリカでの出来事からです。あるチェスプレイヤーは、子どものころにADHD(注意欠陥多動性障害)と診断されていました。しかし、この子どもが、23歳になるころ、チェスプレイヤーとして活躍しながら、ADHDを克服したような状態になっていました。ADHDの症状があると、強い刺激を求める行動がありますが、この場合は、チェスがその刺激になり、逆に、そのことに注意力、集中力を発揮したという記録があります。彼は。その後、アメリカで、ナショナルマスターになりました。多くの統計ではなく、ある人物の話ですが、このようなこともあるようです。という話でした。世の中には、たばこをたくさん吸っていても、とても長生きしている人もいるように、例外は必ずと言っていいほどあるのですが、注意欠陥が克服された話で、個人的に興味深い話でした。
0
カバー画像

賃金上昇率の低下

物価に対して賃金上昇率が追い付いていないばかりか社会保障などが値上がりして可処分所得ができない状態だ。社会保障費、こんなに上がっててびっくりしている病院のベッドに縛り付けられているお年寄り。こういう人は、全額自己負担にしてくれないかなあ。後期高齢者の看取り、無用な延命防止そういうわけで、区役所から住民税納税の督促があって社会保障費が高すぎて住民税払えませんと言ったらそれはお前の勝手だと言われた頭きたので、港区になんか住民税払うかよということで文京区にふるさと納税を送るああ、私の4代前は大正13年、東京府東京市小石川区長だった。そのご縁で文京区はいい所だ。若いころの下宿はあの辺で専門学校も大学もあの辺だったそうやってふるさと納税使ったら何も言ってこなくなった賃金上昇率の低下で今年のクリスマスは中止になりました
0
カバー画像

【お得】私がやってきたモニター&アンケート

ほとんどは募集締切案件ですが、まもなく締切のもの、始まったものもあります。各サイトでお確かめください。順不同。〇印は現在募集中のもの。 ①タクシー利用者モニター ②旅行・観光消費動向調査 ③都営交通モニター〇④東京メトロお客様モニター ⑤ビデオリサーチ各種モニター ⑥国土交通行政インターネットモニター ⑦厚生行政モニター ⑧「梅干し食べようプロジェクト」モニター ⑨インターネット都政モニター〇⑩宝くじ統計調査 ⑪NHKモニター〇⑫NHK BSモニター ⑬日テレモニター ⑭フジテレビモニター ⑮テレビ東京モニター ⑯放送大学モニター ⑰東京都消費生活調査(食品表示調査) ⑱足立区区政モニター ⑲消費者庁物価モニター調査   ⑳日経新聞モニター ㉑産経新聞モニター 懸賞・モニター・アンケートについて詳しく知りたい方は、⤵⤵⤵必ず当たるとは言いませんが、楽しめるような内容になっています。
0
カバー画像

犯罪を抑制する心理的要素7つ

犯罪心理学では、犯罪を促進する要因と抑制する要因が考えられます。促進する方は、「これ」があると犯罪に繋がる行動をしてしまうという事ですね。逆に抑制するというのは、犯罪をしなくなる原因になるものなんです。その抑制する要因とは?これらは、良い意味でその人に備わっている場合に犯罪率が下がるデータが出ています。①道徳性②人格③発達段階④自尊心⑤共感性⑥自己愛⑦社会的自己抑制もし、近くに犯罪を犯した人や、問題行動を行ている人たちがいるなら、これらの状態はどうかな?と考えていくことで、少し理解をしていくことが出来るかと思います。
0
カバー画像

第0章:ブログ始めました

   現代の世の中は数字に溢れており,我々はその海に溺れつつある.ガリレイは「自然は統計学で書かれた書物である」といい,ネイト・シルバーは「数字は自ら語らない.我々が代わりに話し,意味を吹き込むのだ(Nate Silver, Signal & Noise)」といった. もはや現代を生きる我々にとって,データサイエンスの知識は不可欠である.数字に踊らされないために,数字の意味を正しく効率的に理解するために,統計の知識が迫られている.このブログでは,平均・偏差値といった統計の基礎的概念から応用的概念まで,その本質を解説して行きたいと思う.
0
カバー画像

シリーズ<ココナラ Webスクレイピング分析>その2 (販売実績件数の割合)

 前回の続きをやっていきます。 前回記事↓ 前回の記事は、小難しい内容になってしまったので、今回は簡単な統計結果を紹介して終わらせます。 今回統計をとったのは「出品サービスの販売実績件数の割合」です。 前回同様、ココナラサーバーの負担を考慮してサービスのカテゴリは「IT・プログラミング・開発>作業自動化・効率化」に絞ります。 https://coconala.com/categories/230 早速、統計結果のグラフを示します(図1)。 横軸に販売実績件数、縦軸にその件数のサービスの総数を表しています。図1:販売実績の分布  図1を見て分かるように、販売実績0件が2000件と圧倒的に多いことがわかります。ココナラ出品者ならある程度分かるかと思いますが、「販売実績0から1にするのが一番大変」というのがはっきり分かりますね。 次にこれを円グラフにしてみましょう。 本記事のカバー画像と同じものですが、具体的に割合(パーセンテージ)で分かるように円グラフにしています(図2)。図2:販売実績件数別の割合 販売実績0件が約70%、1件が約10%、2件が4.5%、3~10件が9.6%、11~100件が5.7%、それ以上が0.4%となっています。 販売実績10件以上が6%ぐらいで、100件以上となるとほんの一握りどころか、ひとつまみの0.4%ですね。 次回は、出品者別で販売実績などを統計をとってみます。
0
カバー画像

ブログについて

はじめまして!データ分析サポートをさせていただきます山城と申します。このブログでは、「データ分析ってどんなことをするの?」「どんなことが分かるの?」などの素朴な疑問や、分析の手法・分析結果の見方などを、なるべく分かりやすく紹介していこうと思っています。ケース別でもご紹介していきたいと思いますので、依頼を検討されている方はぜひ参考にしてください!データ分析のメガネをかけて、世の中を見てみましょう!
0
44 件中 1 - 44
有料ブログの投稿方法はこちら