多変量解析のススメ
マーケティングにおけるデータ活用の歴史
ここ10年間で、【ビッグデータ】、【データサイエンス】、【AI】、【DX】といった言葉が次々に生まれ、ビジネスにおけるデータ活用の重要性が増してきました。しかし、実は「マーケティングにおけるデータ活用」の歴史は古く、半世紀以上前から取り組まれていることはあまり知られていないように感じます。
例えば、[日本マーケティング・サイエンス学会(JIMS)]というマーケティングや消費者行動などを科学的に探求する学会をご存知でしょうか。こちらの学会は1966年に設立されています。つまり、もう50年以上前から、データを活用したマーケティング効果や予測などの研究が行われていました。
また、弊社インテージ(当時は社会調査研究所)が全国薬局・薬店パネル調査(SDI)と称して、購買データの収集を始めたのが1960年になります。最初は薬の販売データのみでしたが、購買データの価値が認識されるにつれて、今では食料品や日用雑貨など様々な商品の収集が行われております。かなり昔からデータの重要性が認識されていたことが分かると思います。
さらに、マーケティング・サイエンスの活用が体系的にまとめられた書籍「マーケティング・サイエンス」(著 片平秀貴、東京大学出版会)が1987年に出版されました。こちらの書籍を読むにはマーケティングの知識に加えて、経済学、数学などの知識が必要でありお世辞にも読みやすいとは言えませんが、未だに活用されているモデルや考え方も多く、今から読んでも学べることが多い書籍です。現在は絶版してしまったそうですが、もし手に取る機会があれば読んでみて下さい。30年前のレベルの高さが窺えると思います。
簡単ではありますが、研究・データ・書籍のご紹介を通じて、マーケティングにおいて、データ分析が昔から行われていたことをご理解いただけたと思います。その長い歴史で活用・改良を繰り返してきたのが「多変量解析」という分野になります。長い時間をかけて、マーケティングでは「このような場面では、この多変量解析手法を利用する」といった活用方法が整理されてきました。また、活用場面から多変量解析のモデルを改良するといったこともなされてきました。
近年のデータサイエンスに明るい方からすると「多変量解析は古典的では?今は機械学習でしょ。」と思われるかもしれません。しかし、マーケティングにおいては、現在でも至るところで利用されています。今回はよく用いられる多変量解析の4手法について「何がわかるのか、マーケティングにおいてどのように使われているのか」を概要のみになりますがご紹介していきます。
(重)回帰分析
わかること:ある対象に対して、他の要因が与えた影響の度合い 主な使われ方:売上に対して、各プロモーションがどの程度影響を与えたか(マーケティング・ミックスモデル)を評価する際など |
回帰分析は「ある対象に対して、他の要因がどの程度影響を与えたのか?」を理解するための分析手法になります。もう少し具体的な例だと、「売上(対象)が増加/減少した理由(要因)を知りたい」や「売上(要因)に広告(要因)がどの程度の影響を与えたか」といったビジネス課題のときに用いられます。
専門用語では、影響を受ける対象のデータを「目的変数」、影響を与える要因のデータを「説明変数」と呼びます。目的変数は他にも「被説明変数」や「応答変数」、説明変数は「独立変数」や「特徴量」と呼ばれることもあります。これは回帰分析が色々な分野で利用されており、各分野で呼び方が異なっているためです。言葉は異なっていますが、全く同じものを指しています。ですので、言葉が異なっていたとしても「必ずしも間違えではない」ことは頭の片隅にでも入れておくと混乱しなくて済みます。
また、回帰分析自体も「要因の数」で呼び方が変わります。要因が1つの場合は「単回帰分析」、要因が2つ以上の場合は「重回帰分析」と呼びます。しかし、要因が1つで回帰分析を行うケースは少ないので、重回帰分析を回帰分析と呼ぶことも多く見受けられます。
因子分析
わかること:人が持つ「潜在的な意識や価値観およびその強さ」が分かる。 主な使われ方:消費者の志向や価値観を理解し、製品コンセプトやプロモーションといったマーケティング施策立案に利用 |
因子分析は心理学の分野で発展してきた手法になります。マーケティングでは、消費者のアンケート意識データを用いて、消費者の価値観を理解するために因子分析を行います。因子分析は、データの背後にある「因子」を見つけ出し、さらにその強さを算出します。
因子を発見するための値を「因子負荷量」、因子の強さを算出した値を「因子得点」と呼びます。例えば、食材の購買価値観において「国産の食材を買うようにしている」「食材を買う時は、産地を確認するようにしている」といったアンケート意識データがあるとします。そのデータの背後には、目では確認できない消費者の「食材への安心」という価値観が存在しており、その価値観の強さが影響を与えることで、アンケートの結果が得られていると考えます。この背後に隠れている「食材への安心」が因子にあたります。ただ、因子分析はあくまで数字で因子の存在を示すため「食材への安心」といった具体的な名称までは提示してきません。そのため、因子分析の結果を適切に読み解く能力に加えて、因子のネーミングセンスも必要だったりします。
クラスター分析
わかること:データの特徴から似ているものを「グループ」として分類することで「どの対象の特徴が似ているのか」が分かる。 主な使われ方:価値観をベースとした消費者セグメンテーション、売上傾向をベースとした店舗セグメンテーションなど、主にセグメンテーションに利用 |
クラスター分析とは、いくつかの対象を似たものでグルーピングする分析手法です。コロナ禍でメディアが「コロナウイルスの集団感染の実態検証」の際に使っていたクラスター分析とは全く別物なので注意してください。ちなみにクラスターとは英語で「房、群れ、集団」という意味になります。
クラスター分析は、マーケティングでいう「セグメンテーション」を行う際に利用します。セグメンテーションとは、対象を同一もしくは似ているグループに分割することを意味します。一般的なセグメンテーションだと、「男性・20代~30代」「女性・40代~50代」といった性別や年齢である「デモグラフィック属性」で行うことが多いと思います。クラスター分析は、データの特徴が似ているものをグルーピングしていくので、様々なデータを用いてセグメンテーションをすることが可能になります。例えば、購買価値観のアンケートデータから価値観が似ている人々のセグメンテーションを行ったり、店舗のカテゴリー売上を使って、売上パターンが似ている店舗ごとに分類を行ったりすることができます。
コレスポンデンス分析(対応分析)
わかること:クロス集計の結果を視覚的に表現することで、項目間の関係を俯瞰して理解することができる。 主な使われ方:消費者イメージからのポジショニングマップの作成など |
コレスポンデンス分析は、クロス集計の結果を視覚的に表現する分析手法になります。別名で対応分析と呼ばれることもあります。よく行われる例だと、表側に「ブランド」、表頭に「イメージ」のクロス集計の結果を使って、消費者のイメージによるポジショニングマップの作成に用いられます。このようなマップを、専門用語では「知覚マップ」と呼んだりもします。知覚マップを作成することで、競合ブランドとのイメージの違いを俯瞰的に理解することが可能になります。ただ、出力として、ブランドとイメージの両方が同じマップに布置されることから、直感的に捉えてしまうと間違った結果の解釈をしてしまう場面があり、結果を読み解く場合は注意が必要になります。
最後に
今回は、それぞれの多変量解析手法の概要と、マーケティングにおいてどのように活用されているのかを簡単にご紹介しました。具体的に、どのようなデータが必要なのか、どのようなアウトプットが出力されるのか、多変量解析の実行方法、などについては、Web上に多くの情報が存在しているので参考にしてみてください。また、インテージが行っている無償セミナーの【i-college】「マーケティングに活かす多変量解析入門~回帰分析、因子分析、クラスター分析、コレスポンデンス分析~」では、もう少し詳しい説明をしていますので、もしご興味がありましたら参加いただけると幸いです。
i-college「マーケティングに活かす多変量解析入門~回帰分析、因子分析、クラスター分析、コレスポンデンス分析~」のご案内
次回は、3月24日(木)に開催します。詳細・お申込みはこちらからご確認ください。
転載・引用について
◆本レポートの著作権は、株式会社インテージが保有します。
下記の禁止事項・注意点を確認の上、転載・引用の際は出典を明記ください 。
「出典:「インテージ 知る Gallery」●年●月●日公開記事」
◆禁止事項:
・内容の一部または全部の改変
・内容の一部または全部の販売・出版
・公序良俗に反する利用や違法行為につながる利用
・企業・商品・サービスの宣伝・販促を目的としたパネルデータ(*)の転載・引用
(*パネルデータ:「SRI」「SCI」「SLI」「キッチンダイアリー」「Car-kit」「MAT-kit」「Media Gauge」「i-SSP」など)
◆その他注意点:
・本レポートを利用することにより生じたいかなるトラブル、損失、損害等について、当社は一切の責任を負いません
・この利用ルールは、著作権法上認められている引用などの利用について、制限するものではありません
◆転載・引用についてのお問い合わせはこちら