はじめに ーなぜ統計が必要なのか。
近年では,文科省によってリカレント教育(学校教育から離れたあとでも,必要に応じて必要な内容を学び直すこと)が推進されていることもあり,大学院に進学する方が多くいらっしゃることと思います。
大学院と研究は切っても切り離せないものであり,そうしたなかで大きな壁として立ちはだかるのが「統計」です。
最近は,人文系の研究であっても,データサイエンスが活発化しており,研究デザインに統計処理を求められる場合も多くあります。
その主な理由は,再現性と信頼性です。
まず統計的手法を用いることで,研究結果の客観性を担保し,同じ手続きを踏めば他の研究者でも同様の結果が得られる可能性を高めることができます。
これを再現性と呼びます。
これにより,研究者の主観的な解釈ではなく,データに基づいた議論が可能となり,研究の信頼性が向上します。
なお,当方は定量的な分析(数字を使った分析のこと)を無条件に持ち上げる立場ではありません。
しかし,状況によっては様々な分析手法を組み合わせることも求められ,そのなかに統計解析も含まれることが想定されます。
一見,難しそうに感じる統計ですが,適切に手順を踏んで,ゆっくり理解を深めれば全く別次元の世界の話というわけでもありません。
本記事(シリーズ)は,特に数学の苦手な学生や研究者に向けて,的確な統計学の知識と技能を授けるものです。
統計をはじめる際の大きな壁
ただし,ここで大きな問題が立ちはだかります。
それが「統計解析に関わる嘘」です。
最も有名な例をあげるとすれば,「データに正規性がなければノンパラメトリック手法を使う必要がある」です。
これはご存じの方もいることでしょう。
また,2016年3月8日,米国統計学会(American Statistical Association;ASA)は、科学研究におけるp値の誤用を指摘し批判しました。
No single index should substitute for scientific reasoning. (稿者翻訳: 単一の指標が科学的結論の代わりになるべきではない。) [1]
仮説検定の問題点は昔から指摘され,廃止を叫ぶ声も統計学会のなかでは多くあります。しかし,その手軽さから今でも中心的な手法にあり続けているのが現状です。
こうしたなかで,初学者は大いに惑わされ,諦念を抱きます。その主な理由は,「じゃあどうすればいいの?」という悩みに応えるものがないためです。
まとめ ー本シリーズの趣旨
本記事(シリーズ)は,そうした悩みを受けて執筆するものです。その内容は,基礎的な用語や概念,おすすめツール,結果の解釈などを中心とする予定です。
初学者に優しくするため,説明に難しい統計用語は使用しません。ただし,それらをまとめたページは作っておこうと考えています。
また,内容の誤りや説明の不備があれば,ご連絡ください。
ぜひいいね♡やフォローをしていただければ幸いです。
なお,研究の代行も承っておりますので,お急ぎの方はこちらをご利用ください。
最後までお読みいただき,ありがとうございました。
引用文献
[1] Wasserstein, R. L., & Lazar, N. A. (2016). The ASA statement on p-values: context, process, and purpose. The American Statistician, 70(2), 129-133.