リサーチ
アンケートの作り方 サンプルサイズの計算方法を徹底解説|統計の基本用語もおさらい
2020.09.11
アンケートと聞くと思い浮かぶのは「街頭アンケート」のようなものでしょうか。その中でも大切になってくるのは、「回答数」の存在。
アンケートで統計的調査をするために、「必要な回答数の求め方」を知っていることは非常に大切です。
本記事では、アンケートに必要な回答数の求め方を解説していきます。
アンケートの「サンプル」にまつわる基本用語をおさらい
まず初めに、アンケートの「サンプル」にまつわる統計学的な基本用語を1つ1つ説明していきます。
母集団とサンプル(標本)
ある地域に対してアンケート調査をしようと思った時に、その地域に住む人を1人残らずアンケート調査するのは難しいですよね。
そこで、母集団とサンプル(標本)という考え方が必要になってきます。
母集団とサンプルは、統計学の中でも基礎的な部類に入ってくる用語なので、きちんと押さえておきましょう。
母集団
母集団とは、統計対象(アンケートの対象)となる全ての集まりのことを指します。
例えば、アンケートの対象が「1年1組」であるとすれば、「1年1組」全体が母集団です。
サンプル(標本)
サンプル(標本)とは、母集団の情報を推測するために抽出した部分的な集まりのことを指します。
例えば、アンケートの対象が「1年1組」であるとすれば、「1年1組の情報を推測するために抽出された無作為な10人」この10人をサンプル(標本)と呼びます。
サンプル数とサンプルサイズ
次に、サンプル数とサンプルサイズについて説明します。
この2つの用語は意味がややこしいのもあって、混同して使われがちですね。
その時に、英語表記にすると違いが少しわかりやすくなります。
- sample size サンプルサイズ → 標本のサイズ → 標本の「大きさ」
- the number of samples サンプル数 → 標本の「数」
要するに、「数」なのか「大きさ」なのか、について気に留めながら、用語を押さえていきましょう。
サンプル数
サンプル数とは、母集団から無作為にサンプルを取り出した時に、「サンプルのセット」がどれくらいの数あるのか、といった指標です。
例えば、
- 1日目は工場の製品から50個のデータをサンプリングした
- 2日目は工場の製品から200個のデータをサンプリングした
この場合のサンプル数は、2となります。(1日目のサンプルの「セット」と2日目のサンプルの「セット」を合わせた数)
要するに、サンプル数を考える時には、その1つ1つのサンプルを「まとまり」で考えることが大切です。
サンプルサイズ
サンプルサイズとは、母集団から無作為にサンプルを取り出した時に、そのサンプルの「大きさ」がどれくらいなのか、といった指標です。
統計をやる時によく出てくる「n」はサンプルサイズのことと認識しておいてください。
上記の例でいけば、
- 1日目は工場の製品から50個のデータをサンプリングした
- 2日目は工場の製品から200個のデータをサンプリングした
この場合のサンプルサイズは、50と200ですね。
求めているのは、サンプルの大きさなので、1つ1つのサンプルに対してそのデータの数はどれくらいなのか、を把握することが大切です。
サンプリング調査と全数調査
アンケート調査は、その対象の一部を調査するのか、その対象の全体を調査するのかによって、2種類に分けられます。
たとえば、A小学校の全校生徒が3,000人いるとしましょう。(上図参照)
その3,000人全員に対してアンケート調査を行うのが「全数調査」です。
そこで、全員ではなく、無作為に取り出した一部分の200人にアンケート調査を行うのが「サンプリング調査」となります。
「サンプリング調査」と「全数調査」のそれぞれ持つ特徴について、より詳しく見ていきましょう。
サンプリング調査
サンプリング調査とは、調査対象の全体ではなく、その一部分だけを調査する手法です。
母集団全体の調査が困難な場合に「サンプリング調査」が行われます。
例えば、テレビの視聴率などは、サンプリング調査で視聴率を割り出しているのです。
テレビを持っている人全員に調査をかけるのはちょっと現実的ではありませんよね。
サンプリング調査の良い点は、労力をかけずに母集団の傾向を推測出来ることです。
一方、サンプリング調査の場合の結果はあくまで推測にしか過ぎず、母集団の本当の値を知ることが出来ないというデメリットもあります。
全数調査
調査対象の一部ではなく、すべてを調査することを全数調査といいます。
調査対象の全てを調査するので、値については限りなく精密なデータが取れますね。
限りなく精緻なデータを取るために、全体を調べているのは、総務省統計局が行う国勢調査などです。
限りなく精密なデータが取れる点は大きなメリットですが、その分非常に労力のかかる方法なので、注意が必要です。
アンケートに必要なサンプルサイズを算出する方法
アンケートの「サンプル」にまつわる基本用語についての説明をしてきました。
しかし、アンケート調査を実施する時に多くの人は「アンケートに必要なサンプルサイズの算出」に戸惑います。
アンケートに必要なサンプルサイズを適切に算出できなければ、そのアンケート調査の信憑性がなくなってしまう恐れも。
そのため、必要なサンプルサイズを適切に算出することは、アンケート調査の肝となってきます。
それでは、適切な算出方法について解説していきます。
調査したい「母集団」が何であるかを決める
必要なサンプルサイズを算出するためには、まず初めに、母集団が何であるかを決める必要があります。
このアンケート調査に関しては、一般的には母集団の一部分を抽出して行うケースがほとんどです。
このことを、上述した通りに「サンプリング調査」と言いますが、信憑性のある調査結果を得るためには、母集団の人数にあったサンプルサイズでサンプリング調査を行うのが大切です。
例えば、(後ほど紹介する許容誤差について、5%を認めることを前提に)
- 母集団が100人 → 必要なサンプルサイズは80人
- 母集団が100万人 → 必要なサンプルサイズは384人
また、1万人越えの母集団では370~380人にアンケート調査を実施することで、ある程度信憑性の担保のある調査結果を得れます。
許容誤差と信頼水準を決める
次に、信憑性の担保された調査結果を得るために必要な回答数を求めるためには、許容誤差と信頼水準を設定する必要があります。
許容誤差とは
許容誤差とは、言葉の通り「許容の出来る誤差」のことです。
要するに、サンプリング調査をする上で、全数調査で把握できるはずの母集団の実態から、どれくらいズレている可能性があるのかを示す指標ですね。
許容誤差が大きいほど、母集団の実態とのズレが大きくなる可能性が高くなるので、出来るだけ低い方が好ましいです。
一般的に、許容誤差は1~10%の間に設定されることが多いです。
しかし、許容誤差を低く設定すればするほど、その分必要となる回答数が多くなるので、労力がかかるようになる、ということは気に留めておいてください。
信頼水準(信頼度)とは
信頼水準とは、先ほど決めた許容誤差内の結果になる確率を示した指標です。
信頼水準が高ければ高いほど、必要となる回答数が多くなるので、調査時間やコストを加味した上で設定することが大切です。
一般的には90~99%の中で信頼水準が設定されますが、信頼水準が5%違うだけで、母集団の規模によりますが、100~300ほど必要な回答数が変わります。
そのため、信憑性の高いアンケート調査を行うことは大切ですが、無理なく数値を設定することで、費用対効果の高いアンケート調査を行えるようになります。
アンケートサンプル 許容誤差は5%を認めるのが一般的
これはよくあるネットリサーチなどの話ですが、許容誤差は5%を認めるのが一般的です。
許容誤差を1%に設定すると果てしない量の回答数を集めなくてはいけなくなります。
許容誤差を10%に設定すると信憑性が低くなる可能性があります。
そこで、間を取り、慣例的に許容誤差は5%を認めるのが一般的になりました。
必要なサンプルサイズを求める
上記設定した母集団、許容誤差、信頼水準から、信憑性に担保された調査結果を得るために必要なサンプルサイズを求められます。
そのサンプルサイズを求める方法は大きく分けて3種類あります。
- 計算式を用いる
- 早見表を使う
- WEB上の計算ツールを使う
以上の3点について、1つ1つ解説していきます。
計算式を使って算出する
必要なサンプルサイズを計算式を用いて算出する方法です。
- n:サンプルサイズ(調査に対して必要な回答数)
- p:回答比率(調査対象者の回答の比率)
- d:許容誤差(許容出来る誤差)
- λ:信頼水準(許容誤差の範囲内に収まる確率)
必要な数値を、【n=λ2p(1-p)/d2】に代入することで求められます。少々ややこしい式ですが、確実に数値を代入することで、回答を得れます。
例えば、回答比率0.7(p=0.7) , 許容誤差5%(d=0.05) , 信頼水準95%(λ=1.96)、
これを式に代入して計算すると、n=1.962o.7(1-0.7)/0.052≒323、となります。
要するに、それぞれ数値が定まっていた場合に必要なサンプルサイズ(サンプルサイズ)は323だったということです。
早見表を使う
初めに計算式による必要なサンプルサイズの求め方を紹介しましたが、正直計算が面倒という方もいますよね。
そんな方に向けて、必要なサンプルサイズを早見表を使って求める方法をご紹介いたします。
引用元 : https://research.nttcoms.com/service/sampling.html (NTTコム リサーチ)
具体的に見方を説明すると、
縦軸が回答比率、表の中の数値が許容誤差、横軸が標本数、となっています。
そこで、縦軸の回答比率が50%で、表の中から許容誤差を5%に設定すると、横軸の標本数が400と出ます。
このように、一瞬で必要な回答数を求められるようになっているのですね。
計算ツールを使う
最後に、WEB上の無料計算ツールを使った方法です。
- https://analysis-navi.com/?p=641(データ分析Navi様)
こちらの無料計算ツールは「許容誤差」「信頼水準」「回答比率」を打ち込むだけで、必要なサンプルサイズを求められます。
とくに、早見表を使ったサンプルサイズの求め方は業務上効率良くするためには、素早く確認ができて便利ですが、計算で求めるよりかは正確性に欠けます。
そのため、手計算が面倒な方は、WEB上の無料計算ツールを利用することで、より正確なサンプルサイズを判別可能です。
アンケートの予想回収率から配布数を計算する
最後に、アンケートの配布数を決めれば、アンケート調査の準備は完了です。
その際には、アンケートの予想回収率から配布数を決める必要があります。
例えば、1000人にアンケートを配布しても1000人全員がアンケートを回答してくれるは考えづらいですね。
仮に、1000人にアンケートを配布したとして200人が回答してくれれば回収率は20%となります。
引用元 : https://trim-site.co.jp/first/firststep/qa001.html 株式会社トリム
この表に従って、予想回収率と必要サンプル数を当てはめることで、アンケートの必要配布数を求められます。
例えば、予想回収率50%で必要サンプル数が400の場合は、必要配布数は800になりますね。
適切なサンプルがアンケートの信頼性を決める
これまでアンケートに必要な回答数(サンプルサイズ)について説明をしてきました。
「サンプル」に関する基本用語は横文字が多くてややこしいものが多かったでしょうか。
しかし、きちんと用語を理解することで、独学で学ぶ時にも、記事の内容が入ってきやすくなるので、頑張りましょう。
そして最後に、アンケートの信憑性は何で決まるでしょうか。
それはやはり「サンプル」の存在であると言えます。
適切なサンプルを適切な方法で数値設定を行い、アンケート調査を行うことで、初めて統計的に有意であると言える調査を行えるのです。
今回の記事で伝えた、アンケートに必要なサンプルサイズを求める方法・考え方とともに、ぜひあなたの会社のアンケート調査へと活かしてください。
まーけっちは、アンケート調査初心者の味方です!
私たち、まーけっちは、
- 初期設計から分析に至るまでの一貫した理論
- 各アクションごとの専門知識とノウハウ
を持って、アンケート実施に関する”全て”の業務をサポートできる日本でも有数の企業です。
「アンケート調査のサンプルサイズ設定の悩み」や、「予想配布率の予測もつかない」など、
アンケートに関する悩みに私たちまーけっちはマンツーマンでサポートをいたします。
どうすれば効率的に、統計的に有意なアンケート調査が出来るのか? 弊社が解決します!
もしアンケート実施に不安を抱えられているのであれば、まずは私たちにご相談ください。
◆戦略にリサーチにリソースが割けない!そんなときは?
戦略の意思決定を誤らないために、最低限重要なことだけを明確にできれば、
費用や時間がかからない簡単なリサーチでも十分です。
また、アンケートプロモーションでは、プロモーションと併せてリサーチをおこなうなど、リサーチとしてのコストをかけずに広告効果の補助として適切なリサーチ・マーケティングを行うことも可能です。
私達、株式会社まーけっちは、事業の成功に根差した、リサーチ・マーケティング支援を追及しています。
手法や戦略にご興味があるという方はお気軽にご相談下さい。
・資料の無料DLはこちら
◆無料で300人のプロフェッショナルを活用 人材の採用診断も
私達、株式会社まーけっちは、
経営方針や事業計画の徹底したヒアリングに基づき、採用計画や必要な人物像の策定からご提案まで行います。
正社員は勿論、副業・フリーランス人材の選定も、専門家がコミット!
「頼るべき仲間が見つかる」 自社採用は勿論、在宅や外部のワーカーの活用のための ビジネススキル・適性診断を開発しました。
期間限定で無償お試し可能! ご興味があるという方はお気軽にお問合せください。
採用スクリーニング診断とプロフェッショナルプラットフォーム
・資料の無料DLはこちら
◆代表プロフィール
株式会社まーけっち 代表取締役社長 山中思温
マーケティングリサーチのプラットフォームの企業で、 最年少で事業部を立ち上げ、広告予算ほぼゼロで、国内トップの実績を達成。
中小・スタートアップ企業のマーケティングに関する構造的課題を痛感し、それを解決するため、株式会社まーけっちを創業。大手企業・国家機関・スタートアップなど100社以上の戦略支援を行い、コミットと売り上げ貢献成果に定評がある。上智大学外国語学部卒。
ーー