回帰分析(重回帰分析・単回帰分析)とは何か?わかりやすく解説 !

2023.05.15
21,135
  • share
  • share
  • share


マーケティング活動を有効に進めるうえで、効果の計測や分析は欠かせません。たとえ複数のマーケティング施策によって売上が増加したとしても、具体的にどの取り組みが効果的だったのかがわからなければ、再現できないためです。

そこで、特定の結果をもたらした要因を明らかにするための分析手法として用いられるのが、「回帰分析」です。

この記事では、回帰分析の基礎知識と、実際の分析方法の流れをわかりやすく解説します。

回帰分析とは


回帰分析とは、特定の結果に対してどの要因がどのような理由でその結果に至ったのかを分析する、分析手法の一つです。

結果を「目的変数」、要因を「説明変数」として関数の形で表し、それぞれを数値化して計算することで、因果関係を可視化できます。

また、それぞれの変数に数値を代入して、将来の予測をするために用いられることもあります。

回帰分析をすると何がわかるのか


回帰分析によってわかるのは、施策と結果との関連性や、数値から予測される未来です。

例としては、売上の増加に対して広告宣伝が与えている影響の程度や、広告宣伝によって将来的に増加が見込まれる売上額などが挙げられます。

回帰分析はマーケティング・教育・不動産など、さまざまな分野で活用されています。マーケティングの分野であれば、商品の売上を向上させるために広告宣伝を行なった際の、広告宣伝費と売上高の関係性の調査が可能です。

教育分野では、テストの成績が良い生徒がどの程度勉強に時間を割いているのか、勉強時間をどの程度増やせば成績が向上するのか、などを分析できます。

不動産分野であれば、特定の地域の住宅価格について、面積以外のどのような要因が価格に影響を与えているのかを分析できるでしょう。立地条件・交通アクセス・周辺環境・建物の築年数・設備など、複数の要因が住宅価格にそれぞれ与える影響の程度を算出可能です。

こういった分析により、効果的な広告宣伝や教育サービスの提供、顧客のニーズに合わせた住宅開発・価格設定などが行なえます。

回帰分析を活用すれば、あらゆるビジネスシーンで商品・商材をより効果的かつ最適に販売することや、業務改善の分析に活用することが可能です。

回帰分析には3つの分析方法がある


回帰分析には、代表的な3つの分析方法があります。いずれも頻繁に利用される方法であるため、ここで押さえておきましょう。

単回帰分析

単回帰分析とは、1つの目的変数に対して説明変数が1つである回帰分析を指します。結果と要因の因果関係を、シンプルに明らかにしたい場合に用いられる方法です。例えば、次のような場合が挙げられます。

例)
・九九の習熟度(目的変数)と学習時間(説明変数)の因果関係の検証
・両親の身長(説明変数)をもとにした子どもの身長(目的変数)の予測
など

単回帰分析の回帰式の一例としては「y=β0+β1x+u」が挙げられます。yが目的変数、xが説明変数、β0が切片(※1)、β1が傾き、uが誤差を表しています。

※1:説明変数がすべて0である場合の従属変数(※2)の値を表す定数項
※2:説明変数の関数

重回帰分析

重回帰分析とは、1つの目的変数に対して説明変数が複数存在する回帰分析です。回帰分析のなかでは特に有名な手法であり、複数の要素が1つの要素に対して、それぞれどのように関係しているのかを検証する際に利用されます。例えば、次のような場合が考えられるでしょう。

例)
・アイスクリームの売上の予測
・一定地域住人の寿命の予測
・顧客満足度の向上に直結する要因の把握
など

いずれの場合も、単回帰分析と比べて要因(説明変数)が複数あることがわかります。例えば、アイスクリームの売上であれば、宣伝広告のほか、店舗の立地や当日の気温といった要因が絡んでくるでしょう。また、顧客満足度の向上に関する要因であれば、価格や品質、サポートなどが考えられます。このように重回帰分析は、ビジネスシーンにおいて利用頻度が高い分析手法の一つです。

重回帰分析の回帰式は「y=β0+β1×1+β2×2……+βkxk+u」で表されます。x1~xkが複数の説明変数を表し、β1~βkは各変数の重みを表しています。

ロジスティック回帰分析

ロジスティック回帰分析とは、複数の要因から2値の結果が起こる確率を求める回帰分析です。2値の結果とは、「成功/失敗」のように答えが2つしかない値のことを指します。

ロジスティック回帰分析もビジネスシーンでよく用いられます。例えば、次のようなケースです。

例)
・学習時間による受験生の合格率の把握(合格/不合格)
・年収による持ち家の所有率の把握(持ち家/それ以外)
・特定の病気を引き起こす要因の予測(特定の病気に罹患/罹患していない)
など

ロジスティック回帰分析の回帰式は「y=1/(1+exp(-(β0+β1×1+β2×2……+βkxk+u)))」で表されます。

回帰分析のやり方


おもな回帰分析の実施方法・流れとしては、次のとおりです。

1.目的変数を決める
2.説明変数を見つける
3.分析に必要なデータを見つける
4.数式に当てはめて計算をする
5.計算式をもとに因果関係や結果を予測する

回帰分析はエクセルなどを使って自身で実施することも可能ですが、統計学・数学などの専門的な知識が欠かせません。また、分析結果の精度を高めるには、適切な変数を設定し、適切なデータを取得することが重要になります。

計算式に当てはめるだけだとしても、変数の適切さを素人目で判断することは難しいかもしれません。そのため、回帰分析を行なう場合には、専門性の高いプロにおまかせすることをおすすめします 。

回帰分析をやる際の注意点


回帰分析を実施する際に、特に注意すべき2点を解説します。いずれも分析結果に大きな影響をおよぼす要素のため、意識しましょう。

説明変数を正確に見定める必要がある

回帰分析では、説明変数の正確さによって結果が大きく異なります。正確なデータを用いずに分析を進めてしまうと、誤った結果になる可能性が高いため、注意が必要です。

とりわけ、重回帰分析やロジスティック回帰分析のように複数の説明変数を用いる場合、重要な説明変数の見落としが分析の失敗につながります。

説明変数を見落としていたとしても、一時的に回帰分析が正常に行なえる場合もあるでしょう。しかし、その場合には突発的な事情により、思わぬ結果を招くこともあります。

例えば、特定の商品がSNSで大きく注目を集め、突然売れて品切れを起こしてしまったケースで考えてみましょう。このケースでは説明変数として宣伝の効果が含んでいなかったため、正しく予測できなかったということになります。

このように、説明変数の正確な見定めは、分析結果の精度を向上させるうえで非常に重要です。

トレンドに注意する

「回帰分析はトレンドに弱い」という点も覚えておきましょう。トレンド(ブーム)が理由で良い結果が得られていた場合、変数として除去しておかなければ、適切な分析から遠ざかってしまいかねません。

トレンドが発生する理由としては、次のようなものが考えられます。

例)
・テレビで取り上げられた
・雑誌で紹介された
・インフルエンサーがSNSで発信した
など

また、周期性・季節性・ノイズも、不正確な分析結果をもたらす要因になります。

周期性 とは、一定の時間間隔で特定の現象が生じることです。4年に1度開催される五輪による経済効果などをイメージするとわかりやすいでしょう。季節性 とは、夏場のアイスクリームの売上増のように、季節による変動を指します。そしてノイズとは、分析目的に対して不要な情報のことです。

これらは回帰分析の結果を歪ませるおそれがあるため、変数の設定時には注意する必要があります。

まとめ

回帰分析とは、特定の結果に対する要因の因果関係を関数で表す、分析手法の一つです。回帰分析によって「売上が上がった要因に関する因果関係の把握」「特定の要因による将来の結果の予測」などができます。

回帰分析では、おもに単回帰分析・重回帰分析・ロジスティック回帰分析が用いられます。実際に分析を行なう際には、説明変数を正確に見定めることと、トレンドを除去することに注意しましょう。

回帰分析は自身で行なうことも可能ですが、正確な分析には専門的な知識が欠かせません。正確な分析を行ないたい場合には、専門性の高いプロにお任せすることを検討してみてはいかがでしょうか。

東北大学と日立ハイテクによる脳科学ベンチャーである株式会社NeUでは、アカデミアや企業研究所出身の専門家による、高度な解析技術を用いたマーケティングリサーチを提供しています。
脳計測をはじめとしたニューロマーケティング調査はもちろん、それらと売上情報などの行動データとの掛け合わせや、オンラインアンケートと組み合わせた複合的な調査など、お客様の知りたい・検証したい情報に合わせた、カスタムメイドのリサーチプロトコル作成、多面的な解析が可能です。

お問い合わせはこちら

 

  • share
  • share
  • share