マーケティングリサーチの学び場『Lactivator』代表。自動車会社でマーケティングリサーチに従事後、誰でも気軽にマーケティングを学べる場として2012年に本サイトを開設。また故郷:群馬県の活性化の為、2013年より上毛かるたの日本一決定戦『KING OF JMK』を主宰。著書『上毛かるたはカタル』も発売中。
●無料メールで学ぶマーケティング講座配信中⇒こちら
マーケティングリサーチャーの渡邉 俊です。
先日、ある報道番組でこんなアンケートを実施していました。
『あなたはインターネット上に誰かを誹謗中傷する書き込みをしたことはありますか?』
今の時代、ネットを覗くと有名人の方々を誹謗中傷するようなコメントがあちらこちらにあってうんざりしますよね。
ですが、この番組のアンケート結果によると、インターネット上に誹謗中傷する書き込みをした経験のある人は回答者のうちわずか3%程度とのことでした。
その為、この番組では『誹謗中傷しているのは、インターネット利用者の中のほんのわずかの人達なのです』と結論付けていました。
このデータを見ると、『なるほどそうか、ほんのわずかなのか・・・』と思ってしまいますが、果たしてこの数字は本当に信じてよいのでしょうか?
人には誰でも『答えにくい質問』がある
アンケート調査する時、回答者から見ると正直に答えたくない、または答えにくい質問というものがあります。
特に社会問題などを取り扱ったり、回答者のプライベートな部分に切り込んでいくアンケート調査に多いのですが、例えば以下のような質問です。
『あなたは不倫をした事がありますか?』
『あなたは覚醒剤を使ったことがありますか?』
『あなたは未成年の時に喫煙をしたことがありますか?』
などです。
前述の『あなたはインターネット上に誰かを誹謗中傷する書き込みをしたことはありますか?』もそうですね。
これらの質問は、もし自分が該当していたとしても「はい」と答えにくいですよね。
なぜならば、自分が「はい」と答えたことを公にされたくないからです。
『回答いただいた内容が誰のものであるかは特定されません』という注記があったとしても、実際には「いいえ」とウソをつく可能性が高いのです。
従いましてこのような場合、出てきた結果は本当の割合よりも小さくなってしまう傾向があるのです。
もちろんこれは真ではないので、データとして使うことはできないですし、もし使ってしまうと間違った方向に話が進んでしまいます。
しかしながら、社会問題に切り込んでいく為にはきちんと実態を把握しないといけません。
そのため、何とかして本当の結果が得られるようにする工夫が必要になってきます。
もちろん調査を実施する側が知りたいことは、誹謗中傷しているのは誰か?覚醒剤を使っているのは誰か?ではありません。あくまでその割合(数字)です。
全国民のうち、または特定の対象者のうち、何%の人が該当するのかという実態を把握するのが目的です。
誰が「はい」と答えたのかは全く重要ではないですし、知る必要もありません。
しかし回答者側には、「はい」と答えたことを知られたくないという心理が働いてしまうのですね。
『調査だから本当のことを答えよう!』なんて誰も思わないのです。
回答をランダム化する
このような調査を行う時に活用すべきなのが、『ランダム回答法』です。
これは回答者のプライバシーを守りつつも、きちんと真のデータ(数字)を知ることができる手法です。
ランダム回答法による調査手順
ここでは『あなたは不倫をした事がありますか?』の質問を例として説明しましょう。
またこの手法にはコインまたはサイコロが必要になりますので、事前に準備しておいて下さい。
ただ日本人はコインよりもサイコロの方がなじみ深い(かな?)と思いますので、ここではサイコロを使った方法を説明します。
以下がランダム回答法による調査の手順です。
① まず回答者にサイコロを振ってもらい、出た目が偶数なのか奇数なのかを確認してもらう。
② 偶数が出た人は、自分が「はい/いいえ」のどちらであろうと「はい」と回答する。
③ 奇数が出た人は、質問に対して正直に「はい」もしくは「いいえ」を回答する。
④ 「はい」と答えた人数から、回答者全員の半分を引いた値を計算する。
ご存知のようにサイコロを振って偶数の出る確率は50%です。
ここで重要なのは、偶数が出たのか奇数が出たのかはその回答者以外の人にはわからないようにすることです。
もちろん調査を実施する側にもそれを見れないようにしておきます。
このような状態であれば、本当に不倫をしたことがあって「はい」と回答したのか、サイコロが偶数だったので「はい」と答えたのか、調査を実施している側にはどちらなのか区別がつきません。
またそのような状況なので、回答者も安心して本当のことを回答することができる訳です。
データの処理の仕方
もちろんですが得られたデータをそのまま使うことはできません。以下のように特別な処理をする必要があります。
例えば300人に対して『不倫をしたことがありますか?』と質問したとします。
そしてその結果、180人が「はい」と回答したとします。
サイコロで偶数が出る確率は50%ですから、300人中150人は偶数が出たから「はい」と答えたと考えられます。
従いまして、「はい」と答えた180人から150人を引いた人数(=30人)が、本当に不倫をしたことがあって今回「はい」と答えたのだと推定できます。
ということは全体の回答者数が300人なので、不倫をした事がある人の割合は30人/300人=10%という風に計算できます。
もし「いいえ」と答えにくい質問である場合は、この逆をやればよいです。
サイコロで偶数が出たら「いいえ」と回答してもらうようにしておけばよい訳です。
またサイコロではなくコインを使う場合、コインをはじいて表が出たら「はい」と回答してもらう形にすればよいです。
ランダム回答法の弱点
ここまで説明すると、『なんて便利な方法なんだ!』と思われるかもしれません。
しかし、実は弱点もあります。
上記の手順でお分かりの通り、この方法はサイコロで偶数が出る確率が50%(またはコインをはじいて表が出る確率が50%)であることが前提となっています。
しかしながら回答者の数が少ないと、その確率は50%からかけ離れた値になってしまうのです。
『大数の法則』という言葉をご存知でしょうか。
Wikipediaなどを見ると、大数の法則とは、
”数多くの試行を重ねることにより事象の出現回数が理論上の値に近づく定理”
と書かれています。
要するに、サイコロで偶数が出る確率は50%ですが、あくまでこれは振る回数を無限にした時の「理論上の確率」であり、回数が少ない時には50%にならないということです。
もし回答者が10人しかいない場合、サイコロを振る回数は10回という事になります。
この場合、理論的に計算すると10人中6人以上がサイコロを振って偶数を出す確率は37.7%あります。もっといえば10人中7人以上が偶数を出す確率でも17.2%あります。
先ほどの不倫の質問ですが、もしこの質問を10人にしか聴かず、また本当に不倫をしたことのある人が10人中1人だけだったとします。
そしてサイコロを振った結果が偶数だった為に「はい」と答えた人が10人中8人いて、また不倫経験のある人は奇数が出たのに事実として「はい」と答えたとします。
この場合、「はい」と答えたのは10人中9人になり、この結果から回答者数の半分(=5人)を引いたら4人 になります。
つまり10人中4人、40%が不倫をした経験があるということになってしまいます。
このように、ランダム回答法は回答者数が多い時でないと正しい値が得られにくくなります。
大数の法則の通り、回答数が少ないとサイコロの偶数/奇数の確率が50%から離れた値になってしまうからです。
ランダム回答法の精度を確保できる回答者数の目安
では回答者数が何人いれば、ランダム回答法から得られた結果を信じてよいのでしょうか?
統計学的にこの質問に答えるのであれば、回答者数は『無限』です。
回答者数を無限に近づけるほどサイコロの偶数が出る確率は50%に近づいていくわけですから。
しかし、これは現実的に不可能ですよね。
確率計算をしてみた結果、回答者数が100人以上いればランダム回答法を使ってよいのではと思います。
というのは、サイコロの偶数が出る確率が100人中70人以上になる確率はほぼ0です。
また100人中60人以上となる確率も2.8%程度と小さいので、100人以上いれば偶数の出る確率はだいたい50%になるはずです。
このように、回答者数の確保が課題にはなりますが、それがクリアできればランダム回答法は正しい数値を測る良い手法です。
是非1度試してみて下さい。