散布図は、営業、製造などさまざまなビジネスシーンで利用されているデータ分析手法です。この記事では、散布図の概要をはじめ、図のパターンや読み方、作成方法まで詳しく解説していますので、自社で散布図を作成・分析する際の参考にしてください。
散布図とは
散布図とは、2種類の項目を縦軸と横軸に設定し、数値を持つ複数のデータの位置を打点(プロット)したグラフのことです。「QC(品質管理)7つ道具」にも含まれており、データ分析手法のひとつとしてビジネスの現場でも活用されています。縦軸と横軸の値から割り出した交点を打点して、データを図に表し可視化するため、2種類の項目間にどれくらい関係しているのか(相関関係)が分かります。
各データを示す点のグラフ上に配置された様子から、2種類の項目が強く関係しあっているのか、または一方の項目がもう一方の項目の影響を受けているのか、といった内容を検証することが可能です。そのため、「製品の強度と比重」、「消費電力と気温」など、関連性が予測される2種類の項目の関連性を確認したいケースでの活用に適しています。
マーケティング施策を検討する際にも、売上やコストといったデータに対して、顧客単価、顧客のリピート数などのデータを使用して手法を活用することで、互いに関わりがあるかどうかを確認できます。散布図を活用してさまざまな要素の関係性をチェックすることにより、これまでは気づかなかった売上などの改善したい項目に関係する要素を発見し、効率的に改善策や計画が立案できるメリットがあります。
ただし、散布図はあくまで要素同士の相関関係を明確にできる図であるため、因果関係があるかどうかまでは調べられない点に注意が必要です。
※表 散布図とは
散布図で見られる3つのパターン
散布図に現れるパターンは、大きく分けて「正の相関」「負の相関」「相関がない」の3種類があります。完成した散布図のパターンによって、調べたいデータに何らかの相関があるのかなどの判断が可能です。
正の相関
散布図を作成した際に、2種類の項目のうち一方の値が増加するほどもう一方の値も増加しているケースが正の相関です。打点と打点の距離が近く、狭い範囲にまとまっているほど互いに強く関係しており、打点が広範囲に位置しているケースでは弱い相関状態であることが分かります。
正の相関が強いケースは、縦軸と横軸の項目が因果関係にある可能性が高いことが推測できます。相関が弱い状態は、2種類の項目が因果関係にあるのではなく、他に影響を与えている要因が存在するケースなどが予測されるため、他の要素との関連性も調べることが重要です。
正の相関が見られる事例としては、気温が上昇するほど冷たい飲料の売上が増加する「気温の変化と冷たい飲料の売上」や、身長が高い人ほど体重も重い傾向にある「身長と体重」といったケースが挙げられます。
※図 正の相関
負の相関
負の相関とは、2種類の項目のうち一方の値が増加するほどもう一方の値が減少しているケースのことです。正の相関と同様に、打点と打点の距離が近く、点在している範囲が狭いほど負の相関が強い状態であり、2つの項目がお互いに強い影響を受けていることが読み取れます。
負の相関が見られるケースとしては、気温が上昇するほど温かい飲料の売上が下がる「気温と温かい飲料の売上」や、残業が多くなるほど効率が落ちる傾向が見られる「残業時間の長さと生産性」などが挙げられます。
※図 負の相関
相関がない
相関がないケースは、2つの値の増減に規則性がなく、打点がグラフ上にランダムに点在している状態です。この場合、一方の項目の数値が増加しても、もう一方の数値が増えたり減ったりすることはありません。
例えば2種類の項目の一方を「売上」に設定して、売上と結びつく要素を探すケースにおいては、相関関係がない項目は経営や業務改善などには活用できません。活用できる要素を見つけるためには、項目を変更して改めて関連性のある要素を探す必要があります。
※図 相関関係なし
散布図の書き方を4ステップで紹介
ステップ1:データを準備する
散布図を作成する際は、相関関係が予測される2種類のデータを収集して準備する必要があります。データは、数値で表せる定量データを使います。「よい・どちらでもない・悪い」といった選択肢を設定した顧客アンケートの結果や、数値では表せない情報は散布図の分析に活用できません。
代表的な定量データには、利益・コスト・売上などがあります。対して関連する要素には、顧客の年齢・客単価・来店回数・店舗規模・気温など、さまざまな項目が考えられます。例えば、品質管理における分析では不良品数や完成品に生じる誤差などを設定し、加工時間や加工速度といった相関関係が見込まれる情報を用意します。
データ量が少ない場合、たとえ図を作成したとしても打点が少なく相関関係が見つけられないケースもあるため、データは十分な量を収集・準備することが重要です。「身長と年齢」のつながりを確認するにあたって、20歳以下のデータのみを使用するなどデータの一部のみを抜き出して調査してしまうと、全体の傾向が把握できない恐れもあります。
軸の数量を決定する
調べたい2種類の定量データを準備したら、次に縦軸と横軸に各項目を設定して打点するための枠を作成します。縦軸にコストや売上、不良品数などの項目を設定する場合、横軸には縦軸との関連性をチェックしたい項目(顧客の年齢・来店回数・作業時間など)を設定します。縦軸と横軸の項目を逆に設定しても問題はありません。
グラフは、準備したデータを漏れなく反映したものを作成します。収集したデータの全てを活用するため、数値の最大値・最小値を把握してからグラフの範囲を定めなければなりません。目盛りを設定する際には、各データの数値が確認できる間隔を空けることも重要です。縦軸・横軸の範囲や単位・目盛りまで決定し、作成したら次のステップに移ります。
打点する
軸に数量を設定したあとは、座標上に点を配置(打点)していきます。グラフの目盛りから位置を割り出して座標上に打点していくと、2種類の項目の数値に相関関係があるかどうかが可視化されます。
データ数が多いと、点の配置に時間がかかります。手作業で散布図を作成するのが難しいケースでは、Excelの機能を利用して作成することも可能です。セルに2種類のデータの数値を入力した表を作成してから、グラフを挿入する機能を使うことで、自動的にグラフが完成します。
作成の目的を記入する
散布図が作成できたら、最後に図の説明を書き加えます。作成の目的を記入し、グラフから何が分かるのかを明確にしておくことで、さらに情報が伝わりやすくなります。図のタイトル部分に直接目的を入れて説明する方法も効果的です。
また、作成した担当者名、データの出典、測定期間といった付属情報も記載します。
層別散布図なら詳細に相関関係がわかる
層別とは、使用するデータを関連性のあるカテゴリーごとに分類して複数の層に分けることです。大量のデータを扱うケースなどでは、散布図を作成しても相関関係が現れないこともあります。層別散布図では、座標上の点を色分けなどでカテゴリー別に表示することで、隠れていた相関関係の発見につなげられます。
例えば、不良品数と作業時間の2種類のデータを用いて層別散布図を作成する場合、製品ごとに打点を色分けすることでそれぞれの相関関係が可視化できます。全製品のデータを色分けせずに表示する通常の散布図ではカテゴリーごとの傾向が分かりにくかったケースでも、層別散布図を用いることで製品ごとの不良品発生数と作業時間の相関関係が明確になります。
※表 層別散布図
まとめ
散布図とは、2項目の定量データを用いて相関関係があるかどうかを可視化できるグラフのことです。点の配置された状況から要素同士のつながりが読み取れるため、傾向の把握や影響を与えている要素の発見などにつなげられます。大量のデータを使用して散布図を作成する際は、カテゴリーごとに打点を区別する層別散布図を作成することで、カテゴリー別に相関関係を把握できるメリットがあります。
ほかプロジェクト管理全般に関する資料もご用意していますので、そちらもぜひご活用ください。
- カテゴリ:
- キーワード: