クラスター分析とは?データ分析における効果的なグループ化のやり方についてわかりやすく解説

2023.06.20
983
  • share
  • share
  • share


マーケティングの分析手法にはさまざまなものが存在します。なかでも「消費者の傾向」を見つけるために使用されるものが「クラスター分析」です。クラスター分析を用いることで、消費者行動や消費者心理の理解を深められます。

この記事では、クラスター分析の概要から2種類の分析方法の違いや応用方法、簡単な手順まで解説します。

クラスター分析とは


クラスター分析とは、集団のなかから似ているものを集めてグループ(クラスター)を作り、分類する統計的な分析手法の総称です。

さまざまな傾向が混ざり合う集団のなかから類似性を見出すものであり、性別や年齢層などのはじめから分類基準がわかっている集団に分けることはクラスター分析とは呼びません。
基準が明確ではないデータを分類する際に、多く用いられる手法です。

基準が明確ではないデータを分類することで、傾向・動向を調査したり、マーケティングではターゲット分析(※)やペルソナ分析(※)で利用されたりします。

※ターゲット分析:狙うべき市場やユーザーをターゲッティングするための分析手法
※ペルソナ分析:顧客の視点から商品やサービスの開発、改良、販促などにアプローチするため、ペルソナ(自社のサービスや商品を利用している典型的な顧客像)を詳細に設定していくマーケティング手法

データ分析におけるクラスター分析の重要性

クラスター分析は、顧客アンケートや市場調査などの膨大なデータの分析に用いられます。これらのデータに対してクラスター分析を実施することで、例えば商圏(集客できる範囲)の特性分析やブランドのポジショニング分析などが行なえます。

年齢や性別などとは異なる分類による分析が行なえるため、よりマーケティングの効果を高めるための施策を立案・実施しやすくなるでしょう。

メーカーやブランド側の視点ではなく、消費者・ユーザーの視点でのデータ分類の分析や新たな発見、マーケティング施策が実現できるようになります。

クラスター分析には2種類存在する


クラスター分析には、大きく2種類の分析手法が存在します。それぞれの特徴や違い、使い分け方法について見ていきましょう。

階層クラスター分析

階層クラスター分析は、似たデータ同士をまとめることでクラスターを形成する手法です。途中のプロセスが階層のようになり、樹形図(デンドログラム)ができあがる点が特徴です。

デンドログラムはトーナメント図のようなものであり、クラスターが結合する過程を確認できます。

分類対象が多すぎる場合は計算量が多くなることで実行できなくなったり、分析結果がわかりにくくなったりするといった欠点があります。そのため、階層クラスター分析は、一般的に分類する対象が少ない場合に利用される手法です。

非階層クラスター分析

非階層クラスター分析は、はじめにクラスターの数を決めておきグルーピングする手法です。似たデータ同士を同じクラスターになるように全体を分割することで、関連性の強いクラスターと関連性の弱いクラスターを明らかにできます。

階層クラスター分析と異なり、全体的な計算量が少なくなることから、ビッグデータなどの大量のデータ分析に向いています。

ただし、利用する際にはいくつのクラスターに分類するのかを事前に決める必要があり、同じデータで分析を行なっても分析ごとに結果が変わる点に注意が必要です。

2つのクラスター分析の使い分け方法

それぞれのクラスター分析は、おもにクラスター数によって使い分けることが一般的です。目安としては、クラスター数が約30以下の場合は階層クラスター分析、約30以上の場合は非階層クラスター分析を用います。

前述のとおり、階層クラスター分析はデンドログラムによってクラスター同士の関係性を直感的に確認できる反面、クラスター数が多くなるほどデンドログラムが複雑になり、理解が難しくなります。

同様に、非階層クラスター分析は大量のデータの分析に用いることができますが、効果的な分析のためには具体的な仮説を立てる必要がある点がデメリットです。
双方の特徴を理解したうえで使い分ける必要があります。

クラスター分析はどのように応用できるのか


クラスター分析を応用すれば、顧客セグメンテーションの実施や商品推薦(レコメンド)システムの実装などが実現できます。
この2つはクラスター分析の代表的な応用例です。クラスター分析が、それぞれにどのように作用するのかを解説します。

顧客セグメンテーションへの応用

セグメンテーションとは顧客市場を細分化するプロセスであり、セグメンテーションによって細分化された顧客グループをセグメントと呼びます。このセグメンテーションを実施するためにクラスター分析が用いられることが多く、代表的なセグメントの例としては次のようなものが挙げられます。

・ジオグラフィック:国、地域、人口密度、気候など
・デモグラフィック:年齢、性別、職業、宗教、民族、収入など
・サイコグラフィック:社会階級、ライフスタイル、性格
・ビヘイビアル:利用シーン、利用頻度、ユーザーステータスなど

従来は、顧客属性としてジオグラフィックとデモグラフィックが頻繁に利用されていました。

しかし、近年のビッグデータをはじめとする技術の進歩により、サイコグラフィックやビヘイビアルに注目したセグメンテーションも実現できるようになりました。

その結果、顧客に対する理解が深まり、より効果的なマーケティング施策を実施できるようになっています。

商品推薦(レコメンド)システムへの応用

商品推薦(レコメンド)は、ECサイトや通販サイトでは欠かせない仕組み・機能となっています。その名のとおり、顧客に対して商品を自動的におすすめするシステムですが、このシステムにもクラスター分析が応用されています。

レコメンドシステムの代表的な例としては、「この商品を購入した方は、こちらの商品も購入しています」のような文言とともに別の商品をおすすめするものです。

これは、特定の商品を購入した顧客グループ(クラスター)に属する別の顧客にも、同様の商品をおすすめすることで売上の向上を期待しています。

特定の属性を持つ顧客に購入された商品であれば、似た属性の顧客も同じように欲しいと感じる可能性は高く、購入される確率が高いため非常に効果的です。

より詳細に分析を実施すれば、異なる商品を併せて購入してもらうクロスセルだけでなく、検討中の商品よりも単価の高い商品を購入してもらうアップセルも実現できます。

クラスター分析の簡単な手順


ここでは、クラスター分析の手順を簡単にまとめて解説します。クラスター分析を行なう際の大まかな流れをつかむための参考としてください。実際にクラスター分析を行ないたい場合は専門的な知識も必要になるため、最終的には専門家に依頼することをおすすめします。

データ収集

分析にあたりはじめに行なうことは、データの収集です。分析の目的を明確にし、適したデータを収集しましょう。分析の目的としては顧客属性や購買傾向、市場調査などが挙げられます。

これらの目的に合わせて、顧客アンケートやアクセス履歴、市場動向データなどを収集します。併せて、今後のデータの収集方法についても検討を進めます。

クラスタリング手法の選択

分析の目的や収集したデータをもとに、階層クラスター分析・非階層クラスター分析のどちらの手法を利用するか検討します。2つのクラスター分析を選択する際は、前述のとおりクラスター数に応じて選択するとよいでしょう。

加えて、対象の類似度を数値的に定義する必要があります。代表的な測定方法としては次のようなものが挙げられます。

・ユークリッド距離(直線距離):変数同士に相関がある場合に用いる方法
・マンハッタン距離(市街地距離):碁盤の目上の道路を通る方法で、どこを通っても最短距離が等しくなる
・チェビシェフ距離:同じ次元の変数を別次元の変数と考えたいときに用いる方法で、斜めも同じ距離と考える
・ミンコフスキー距離:ユークリッド距離とマンハッタン距離を含めた指標を用いる方法

これらの距離の測定方法は、データの特徴に応じて選択することが重要です。

クラスタリング実行

クラスタリングを実行する際には、2種類のクラスター分析のなかからクラスターを形成する方法を定義する必要があります。

形成方法によってバランスが変わるため、適した方法の選択が重要です。それぞれの形成方法としては、次のようなものが挙げられます。

階層クラスター分析

ウォード法:クラスターの併合で失われる情報を最小にする

最短距離法(最近隣法):各集団の最も近い個体の組み合わせにする方法で、分類感度が低くクラスターが帯状になる

再長距離砲(最遠隣法):各クラスターの最も遠い距離の組み合わせにする方法で、分類感度が高くクラスター同士の拡散現象が起こりやすい

重心法:重心の組み合わせにする方法で、クラスターの大きさによって計算が行なわれる

群平均法:個体間すべての対となる距離の平均値とする方法

メディアン法:特定の2つのクラスター重心間の中央値と街のクラスターの重心とする方法

非階層クラスター分析

k平均法(k-means法):あらかじめ定めたクラスター数を「k」に分類し、それぞれの距離が最大になるまで再配置する方法

前述のクラスタリング手法と併せて実行することで、クラスターを形成していきます。

結果の解釈

クラスタリングの結果が出てからが本番です。結果を分析してデータの構造やパターンを理解し、ビジネスや研究の目的に沿った意味付けを行ないます。

クラスター分析は、あくまでもビジネスなどにおける目的を達成するための手段です。

クラスタリングの結果をもとに顧客セグメンテーションを実施したり、レコメンドシステムに応用したりと、目的の達成に向けて活用します。

クラスター分析は一度の分析で最適な結果が出るものではありません。

分析者が試行錯誤をしながら分析を進めるため、その都度異なる結果が出ることでしょう。加えて、分析者の主観が入る余地もあるため、その点も考慮しながら活用する必要があります。

まとめ

クラスター分析は、集団のなかから似ているものを集めてグループ(クラスター)を作り、分類する統計的な分析手法の総称です。クラスター分析は大きく「階層クラスター分析」と「非階層クラスター分析」に分かれ、一般的にはクラスター数によって使い分けます。

クラスター分析を活用すると、マーケティングの効果を高めることが可能です。応用例としては、顧客セグメンテーションやレコメンドシステムなどが挙げられます。

実際に分析を行なうには専門的な知識が必要になるため、この記事を参考に概要をつかんだうえで、専門家に依頼することを検討してみてはいかがでしょうか。

東北大学と日立ハイテクによる脳科学ベンチャーである株式会社NeUでは、アカデミアや企業研究所出身の専門家による、高度な解析技術を用いたマーケティングリサーチを提供しています。
脳計測をはじめとしたニューロマーケティング調査では、脳活動のデータからクラスタリングすることも可能です。加えて、脳活動と売上情報などの行動データとの掛け合わせや、オンラインアンケートと組み合わせた複合的な調査など、お客様の知りたい・検証したい情報に合わせた、カスタムメイドのリサーチプロトコル作成、多面的な解析が可能です。

お問い合わせはこちら

 

  • share
  • share
  • share