調査のサンプリングの基本『無作為抽出』って何?

 

こんにちは、マーケティングリサーチャーの渡邉俊です。
今日はリサーチのサンプリングの基礎である『無作為抽出』についてお話しします。

統計に詳しい人であればご存知と思いますが、正しい調査結果を出す為に知っておかなければならないリサーチのサンプリングに関する基本な考え方です。

無作為抽出とは?

無作為抽出とは英語でランダムサンプリング(Random sampling)と言い、その名の通り『調査対象となる集団から無作為(ランダム)にサンプルを抽出する』ということです。

全数調査とサンプル調査

まずアンケートなどの定量調査のやり方には大きく分けて、

● 全数調査
● サンプル調査(標本調査)

の2つがあります。

全数調査というのはその名の通り、調査の対象となっている集団を構成する全員を調査することを言います。
代表的な全数調査は政府が行う”国勢調査”ですね。

あれは日本の国民人口の実態を明らかにする調査であり、日本に住んでいる人全員が対象となってますよね。

一方サンプル調査というのは、集団を構成する人の『一部』を調査対象として、もとの集団(母集団)全体を推定する方法です。
通常マーケティングで行う定量調査のほとんどは、このサンプル調査に当たります。

例えば会員数の多いスポーツジムで『会員100人にアンケートに回答してもらいました』というのは、100人の調査結果から会員全体の実態を推定していることですよね。

サンプル調査は”スピード重視”

もちろん、正確性の事を考えれば『全数調査』をやった方がよいです。

しかし全数調査は対象者全員に回答を依頼して分析する訳ですから、調査の効率は恐ろしいほど悪いです。
上記の国勢調査のように人手とお金と時間をかけて大々的にできるのであれば別ですが、ビジネスではそこまでお金をかけられず、何よりもスピードを重視しなければいけません。
その為、マーケティングではサンプル調査をやって物事を判断するのが普通なのです。

このサンプル調査は、皆さんの生活の中でも普通にやっているはずです。
夕飯に作った味噌汁の味が薄すぎないか、またはしょっぱすぎないかを確かめる為に、おたまで味噌汁をちょっとすくってズズッと飲んでみますよね。あれは列記とした『サンプル調査』です。

味噌の量が適切かどうかを調べるのに、鍋の中の味噌汁を全部飲み干す人はいないですよね(笑)

サンプル調査のメリットとデメリットまとめ

要するに『全数調査』は調査対象となる人全員に調査をするので、その結果が”対象となる集団全体の実態”という事になります。
但し集団全体が10人、20人規模ならば良いものの、1万人、10万人以上の規模ならば全数調査するのに膨大な手間暇とコストがかかるというデメリットがあります。

一方『サンプル調査』は調査対象とする集団の中から一部の方々を抽出して調査を依頼します。

このように一部の人を対象から抽出することを『サンプリング(Sampling)』というのですが、これによって調査・分析にかかる時間と手間、コストはゼロとは言えないもののかなり押さえる事ができます。

しかし、一部の人しか調査しない事で考えねばならないデメリットが『誤差』です。
全数を調査していない分、出てきた結果に大なり小なり誤差が発生する可能性があります。

ただ、その誤差が経営判断に差し障りのない『許容できる誤差』なのであれば大きな問題ではない訳です。

例えばあるスポーツジムの会員に『サービスの満足度』をアンケートで聞くとしましょう。
その際、もし会員全員にアンケートを取っていたら『満足した』と答えた人は全体の60%だったとします。(本来は全数調査しないと分からないのですが)

しかし実際に”会員の一部”だけにアンケートを取ったら『満足した』と答えた人は58%でした。
こういう結果だったら、あなたはどう感じますか?

2%くらいの誤差だったら、特にビジネスにおける判断に大した影響はないですよね?
ざっくり6割くらいの購入者が満足していることに変わりはない訳ですから。

これでもし実態よりも極端に大きな結果、または極端に小さな結果が出たら誤った判断をしてしまいますが、数%の誤差だったら何ら問題ない訳です。

※ちなみにアンケートをビジネスで巧みに使うコツをメール講座で紹介しています。
無料なのでよければ購読登録して下さい。

このようにサンプル調査に『誤差』は付きものなのですが、許容範囲内に押さえられるように予めしっかりしたサンプリングを行わないといけないのです。
そして、その時に基本となるのが今日のテーマである『無作為抽出(ランダムサンプリング)』です。

無作為抽出 = 作為的に調査サンプルを決めない

その誤差を最小限にとどめるのに必要なのが『母集団の中からサンプルを”無作為(ランダム)”に抽出する』という考え方です。
言い換えれば作為的(人為的)に調査するサンプルを決めないという事になります。

例えば大きなプールの中に赤と白のボールが混在して合計1,000個入っているとします。
しかし赤白それぞれが何個なのかは分からない為、それを調査で明らかにするとします。

皆さんだったらどうしますか?

上でも書いた通り、一番確実な方法は『全部のボールを出して数える=全数調査』です。赤白それぞれ『正』の字でも書いて数えれば正確な数を知る事ができるはずです。
ただそれは膨大な時間がかかってしまいますよね。

その為、例えばプールの中から100個のボールを何も考えずに『えいやっ』と取り出して、そこに赤白それぞれ何個ずつあるかを数え、その結果から全体の個数を推測するのが一番よいと思います。

もし結果が赤40個、白60個だったとしたら、全体では『赤:400個、白:600個』くらいかなと考えられますよね。

この時に重要なのが、よく混ざっていることを確認したうえで何も考えずに『えいやっ』と取り出すという事です。
または目隠しをした状態で100個選んでもいいです。

色を意識しながら100個選んでいたら、当然のことながら全体の個数を推測できる結果は出てこないですよね。

無作為抽出に必要なサンプルサイズ

また上記では試しに100個選びましたが、当然の事ながら選ぶ数が多ければ多いほど全数に近づいていくので誤差は少なくなります。
とはいえ全数検査の同じくらいの手間暇をかけてしまうとサンプル調査の意味がありません。

その為、『いくつくらいのサンプルサイズであれば誤差が少なくなるのか?』という疑問が湧くと思います。
これに関しては統計学的な考え方があり、以下の記事にまとめていますのでご覧ください。

基本的に全体が1000人程度の母集団であれば280人にアンケートが取れれば精度の高い結果が得られるはずです。
また、1万人、10万人規模の母集団であっても400人程度のサンプルサイズを確保できれば大丈夫です。

【注意】以下は無作為抽出ではありません

ただ無作為抽出を間違って理解している方も多くいらっしゃいますので、ここでは間違いの事例を挙げておきます。以下は全て無作為抽出ではありません。
どれもやってはいけない訳ではないのですが、特に②と③は、サンプルから母集団を科学的に推測する方法とは言えないので注意が必要です。

割付法

【事例①】
全国に展開しているスポーツジムの会員10万人(母集団)の中から1000人にアンケートの回答をしてもらう為、母集団の性別や年代の分布と同じになるように1000人の男女及び各年代の内訳を決めて、その内訳になるよう調査した。

これは無作為(ランダム)にサンプリングしている訳ではないので無作為抽出とは言わず、『割付法』という名前が付いています。

ランダムにサンプリングした場合、母集団の内訳と比較すると女性にサンプルが偏ってしまう、年配の方々のサンプルが多くなってしまうという時に行う方法です。

参考) 【アンケート調査の基礎】ウエイトバック集計をマスターする

機縁法

【事例②】
A社が販売している洗濯用洗剤の利用者200人に商品満足度を評価を調査する為、自社内でその商品を利用している人を見つけ、またその人の友人や知人で同じ商品を利用している人を紹介してもらい200人を集めた。

いわゆる伝手を頼りに対象者を集める方法で『機縁法』と呼ばれています。

一般的にはインタビュー調査を行う時によく使われる方法で、知人の紹介である分、調査への協力意欲が高いというのがメリットです。
一方自分と近い存在である分、回答者に『あまり悪い事は言えない』という気持が湧いてしまい、本音が出にくいというデメリットがあります。

また何度も同じ人に調査を依頼すると、対象者が調査に慣れてしまいます。
調査に慣れてしまっている人は、『こう聞かれたらこんな風に答えておけばいいな』と頭の中で回答をパターン化してしまうので、それはそれで本音が聞けません。

一番単純なサンプリング方法ではありますが、行うには十分な注意が必要です。

マスコミのインタビュー

【事例③】
テレビ番組で総理大臣の支持率を報道する為に新橋駅前のSL広場にいる人々達にマイクを向け、多数の回答を得た。もちろん拒否する人もいたので、その場合は『失礼しました』と謝り次の人を捕まえた。

この方法には特に名前がないのですが(笑)、マスコミのインタビューなどはこのようにやっていると思います。
しかし調査に協力してくれなかった人は断念し、協力してくれた人だけを選ぶのは基本的に『無作為』とは言えないですよね。

実は『無作為』って意外と難しい

上記までを読んでいただけると分かると思いますが、『無作為抽出』というのは結構難しいです。
サンプリングに人為的なものが100%入っていてはいけない訳ですから。

マーケティングの場合、モニターパネルを使ってアンケート調査をやれば無作為抽出に近い形でサンプリングできますが、それでも『アンケートモニターに登録している人』の中からサンプリングしている以上、100%無作為とは言えません。

日頃仕事で忙しい人や高額所得者はあまりモニターに登録していないですから。

また自分のお客様や会員様に対してアンケートをお願いする際に『ご協力いただいた方には〇〇をプレゼント!』と特典をつけたりしますが、あれも注意が必要です。

例えば『次回ご来店の時に使える割引券をプレゼント!』とすると、常連さんなどは喜んで協力してくれますが、”二度と来たくない、または遠方に住んでいるので来るのが難しい”という方の意見は集まりません。
結果として常連さんを中心としたにサンプリングとなってしまい、サービスの満足度などを聴こうものならかなり良い評価に結果が偏ってしまいます。

※ちなみに協力いただいた方へのプレゼントを『インセンティブ』と呼びます。マーケティング調査でどんなインセンティブをあげればよいのかは以下の記事で詳しく紹介しています。

従いまして無作為抽出はかなり難しいのですが、可能な限り無作為に近い状態でサンプリングをするという努力が必要です。

 

Lactivatorの動画講座を『Udemy』で配信中!

Lactivatorが定期的に開催しているマーケティングリサーチの講座が、オンライン学習サービス『Udemy』に登場! 1つの単元を約10分前後の動画で解説しているので、通勤途中でもカフェでも、あなたの好きな時間に好きなだけリサーチを学ぶことができます。 最初の10分は無料で視聴いただけますので、是非ご覧ください!

 

関連記事