55
卒業研究論文 コーヒーショップにおける売り上げデータの分析と最適な仕入れ戦略の構築 12D8101024E 佐々木菜摘 中央大学理工学部情報工学科 田口研究室 2016 年 3 月

コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

卒業研究論文

コーヒーショップにおける売り上げデータの分析と最適な仕入れ戦略の構築

12D8101024E 佐々木菜摘

中央大学理工学部情報工学科 田口研究室

2016年 3月

Page 2: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

あらまし

アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

と食材などのロスが増えてしまい、赤字に繋がることがある。さらに、売れる商品・売れ

ない商品の変動も大きいため、どのような条件がそろったときにどの商品の売れ行きが伸

びるかを推定することができれば、ロスの金額を減らすことができる。その結果同じ売り

上げでもロスを減らして、高い利益を出すことが可能になるはずである。実際、現在の廃

棄食材は全体の %程度もある。本研究では、気象データを用いて日々の売り上げを予測

し、買い合わせの分析をすることによってある商品が売れるときに共に売れやすい商品を

予測し、向上を図る。また、ロスを最低限に抑え品切れを起こさない最適な製造個数を予

測する。まずメニューをカテゴリー分けし、各カテゴリーと気象条件の相関関係を回帰分

析によって求める。次にアソシエーション分析を用いてレシートデータから買い合わせの

傾向を求める。これらによって得られた、各カテゴリーと気象条件の相関関係・買い合わ

せの傾向を用いてカテゴリーごとの販売個数を予測し、最適な仕入れ戦略を構築する。

キーワード:コーヒーショップ、回帰分析、アソシエーション分析、売り上げ

Page 3: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

i

目次

第 1 章 はじめに .............................................................................................................................. 1

第 2 章 使用データ .......................................................................................................................... 2

2.1 コーヒーショップの概要 ...................................................................................................... 2

2.2 売り上げデータの概要 .......................................................................................................... 2

2.3 気象データの概要.................................................................................................................. 4

第 3 章 回帰分析 .............................................................................................................................. 6

3.1 回帰分析とは ......................................................................................................................... 6

3.2 Excel を用いた回帰分析 ....................................................................................................... 7

第 4 章 データマイニング ............................................................................................................ 12

4.1 データマイニングとは ........................................................................................................ 12

4.2 アソシエーション分析 ........................................................................................................ 12

4.3 相関ルール ........................................................................................................................... 13

第 5 章 気象データに注目した購買行動分析 ............................................................................ 14

5.1 メニューの各カテゴリーと平均気温の関係 .................................................................... 14

5.2 様々な気象条件と売り上げの関係 .................................................................................... 27

第 6 章 購買データの分析 ............................................................................................................ 39

6.1 買い合わせデータの集計 .................................................................................................... 39

6.2 ドリンクメニューとフードメニューの買い合わせの傾向 ............................................ 41

第 7 章 最適な仕入れ戦略の構築 ................................................................................................ 44

7.1 各カテゴリーの販売個数予測 ............................................................................................ 44

7.2 仕入れ戦略の構築................................................................................................................ 47

第 8 章 おわりに ............................................................................................................................ 50

8.1 まとめ ................................................................................................................................... 50

8.2 今後の課題 ........................................................................................................................... 50

謝辞 .................................................................................................................................................... 51

参考文献 ............................................................................................................................................ 52

Page 4: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

1

第 1 章

はじめに

アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

と食材などのロスが増えてしまい、赤字に繋がることがある。さらに、売れる商品・売れ

ない商品の変動も大きいため、どのような条件がそろったときにどの商品の売れ行きが伸

びるかを推定することができれば、ロスの金額を減らすことができる。その結果同じ売り

上げでもロスを減らして、高い利益を出すことが可能になるはずである。本研究では、気

象データを用いて日々の売り上げを予測し、買い合わせの分析をすることによってある商

品が売れるときに共に売れやすい商品を予測し、向上を図る。また、ロスを最低限に抑え

品切れを起こさない最適な製造個数を予測する。

Page 5: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

2

第 2 章

使用データ

2.1 コーヒーショップの概要

本研究では、東京都内の丸ノ内線本郷三丁目駅の改札口に隣接する某コーヒーショップ

から提供していただいた売り上げデータを用いる。

1. 場所 丸ノ内線本郷三丁目駅 改札横

2. 営業時間 平日 7 時~22 時

土日祝日 8 時~21 時

3. 席数 89 席(1F…禁煙 18 席、2F…禁煙 62 席 喫煙 9 席)

4. レジ 1 つ(決済方法は現金・交通系電子マネー)

このコーヒーショップは全国約 350 店舗を有するチェーン店である。過去 1 年内に新し

くオープンした店舗ではパスタも導入しているが、本研究で対象とする本郷三丁目の店舗

では、ドリンク・パン・サンドイッチ・デザート・お菓子のみの販売であり、デザート以

外の全商品がテイクアウト可能である。

2.2 売り上げデータの概要

某コーヒーショップの売り上げデータは以下の通りである。

1. 対象期間 2015 年 9 月 1 日(火)から 2015 年 9 月 30 日(水)の

30 日間

2. 一日平均来客数 平日 660.26 人

休日 357 人

3. 一日平均売上金額 平日 233,172.95 円

休日 145,584.18 円

4. 客単価 平日 353 円、休日 407.8 円

5. データの内容

・購入日時

・購入商品

・合計金額

・決済方法

本研究では、購入日時、購入商品のデータを使用する。また、ドリンク商品の

サイズ(S、M、L)、ドリンク・パン・デザート・サンドイッチ・お菓子の種類は考

慮しない。メニューを表 2.1 に示す。

Page 6: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

3

表 2.1 提供メニュー

ドリンク

ホット

ホットコーヒー(ブレンド、アメリカン)、カフェラテ、

紅茶(ミルク、レモン、ストレート)、ロイヤルミルクティー、

ゆず茶、抹茶ラテ、プレミアムココア、ベトナムコーヒー、

イタリアンカプチーノ

コールド

アイスコーヒー、アイスカフェラテ、アイスティー

(ミルク、レモン、ストレート)、アイスプレミアムココア、

アイスロイヤルミルクティー、アイスゆず茶、

ミックスジュース、スムージー(いちごバナナ、

ベルギーチョコ、みかん、もも、ぶどう)、

アイスベトナムコーヒー、野菜ジュース、

アイス抹茶ラテ、オレンジジュース

フード

パン

菓子パン

終日 チョコクロワッサン 3 種、

バターデニッシュ

モーニング フレンチトースト

ランチ なし

ランチ後 アーモンドシュガーパイ

惣菜パン

終日 じゃがバターデニッシュ

モーニング

ホットサンドハムチーズ、

ウインナーコロネ、

たまごサラダ&ハム(バンズ)

ランチ

ホットサンドハムチーズ、

やみつきドック、カレーパン 2 種、

メンチカツバーガー

ランチ後 やみつきドック、カレーパン 2 種

サンドイッチ 2種サンド A・B・C・D・E

3種サンド A

デザート 和風パフェ 3 種、デニブラン 5 種、

ミルクフラッペ 4 種、パフェ 5 種

お菓子 ビスケット 4 種

Page 7: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

4

・各セット内容

モーニングセット…全てのパンとサンドイッチが対象

+140 円でコーヒー、

+210 円で紅茶・カフェラテ・ジュース

の S サイズがつけられる

ランチセット…表 2.1 惣菜パンのランチに含まれるパン 5 種

または各種サンドイッチといずれかのチョコクロワッサン

にコーヒー・紅茶・カフェラテ・野菜ジュース・

オレンジジュースの S サイズをつけるとセット価格になる

ランチセットの例)

ホットサンド+チョコクロワッサン+対象ドリンク=500 円

カレーパン+チョコクロワッサン+対象ドリンク=500 円

やみつきドック+チョコクロワッサン+対象ドリンク=550 円

2 種サンドイッチ+チョコクロワッサン+対象ドリンク=550 円

メンチカツバーガー+チョコクロワッサン+対象ドリンク=621 円

3 種サンドイッチ+チョコクロワッサン+対象ドリンク=621 円

モーニングセット、ランチセットいずれも+54 円ごとにドリンクを

サイズアップできる

2.3 気象データの概要

本研究では、気象庁ホームページに掲載されている過去の気象データから 2015 年 9 月東

京の日ごとの気温、降水量、湿度の値を使用する。

使用したデータを表 2.2 にまとめる。

表 2.2 2015 年 9 月の平均気温

日付 1 2 3 4 5 6 7 8 9 10 11 12 13 14

曜日 火 水 木 金 土 日 月 火 水 木 金 土 日 月

平均気温 23.7 26.9 25.7 24.7 25.4 23.8 23 20 22.4 21.8 23.9 24.7 24.4 22.9

前日比 1.6 3.2 -1.2 -1 0.7 -1.6 -0.8 -3 2.4 -0.6 2.1 0.8 -0.3 -1.5

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水

22.3 21.1 17.9 20.6 24.1 23.3 22.7 23 22.4 20.4 17.7 20.5 21.4 23.3 22.7 20.9

-0.6 -1.2 -3.2 2.7 3.5 -0.8 -0.6 0.3 -0.6 -2 -2.7 2.8 0.9 1.9 -0.6 -1.8

Page 8: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

5

前日比の値は前日と当日の気温の差であり、マイナスがついている値は気温が下がって

いることを示し、符号がついていないものは気温が上がっていることを示す。

9/1 の前日比の値には、同じ気象庁のデータから 8/31 の気温が 22.1℃であったことを用いて

いる。

Page 9: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

6

第 3 章

回帰分析

3.1 回帰分析とは

回帰分析とは、ある変数 y をほかの n 個の変数 x1,x2,…,xnによって説明する関係式

y = f ( x1 , x2 ,…, xn )

あるいはこれだけでは説明できない項ε(残差項)を含めた

y = f ( x1 , x2 ,…, xn ) +ε

を特定する方法論で、特に f ( x1 , x2 ,…, xn ) = b + a1x1 + … + anxn で表される場合に限定した

ものを線形回帰という。

説明される変数 y を説明する変数が x1つだけの場合に単回帰と呼ばれ、複数の場合、重回

帰と呼ばれる。ここでは簡単のために単回帰の場合について説明するが、重回帰への拡張

は容易である。

線形回帰の単回帰は y = b + ax という関係式を仮定して、すでに得られている l組の x と

y のデータ ( x1 , y1 ) , ( x2 , y2 ) ,…, ( xl, yl ) から切片 b と傾き a を特定するというものである。

y = b + ax という関係はあくまでも仮定であり、この関係が正しい場合でも得られている

データが l個の有限な手がかりしかないことから、特定された b , a が真の値( b* , a* )からず

れてしまうことはほとんど確実である。その意味で、パラメーターをできるだけ誤差を少

なくして特定する試みを推定といい、特定された値( b* , a* )は推定値と呼ばれる。

パラメーターの推定は、適当な目的関数を設定したうえで最適化によって決定される。

最もよく使われる基準が最小二乗法(OLS)である。単回帰モデルに対する OLS は

min𝑏,𝑎

{∑(𝑏 + 𝑎𝑥𝑖 − 𝑦𝑖)2

l

𝑖=1

: 𝑎, 𝑏 ∈ 𝑅} (5.1)

という制約なしの最小化問題の解( b* , a* )を用いて、線形関数 y = 𝑏∗ + 𝑎∗𝑥 を推定する。

(5.1)の目的関数は、各データ𝑥𝑖に対する関数値 b + a𝑥𝑖と実際の値𝑦𝑖の差(残差)

𝜀𝑖 ∶= 𝑦𝑖 − (𝑏 + 𝑎𝑥) を 2 乗したもの(つまり、𝜀𝑖2)を、すべてのデータについて和をとったも

の、つまり ∑ 𝜀𝑖2l

𝑖=1 である。これは 1 つの直線に対して、データと縦方向(y 方向)の差を一

辺とする正方形の面積であるため、(5.1)はこのような面積の合計値が一番小さくなるような

直線を見つける問題である。

なお推定する線形関数 y = b + ax としては x が変数で b , a はパラメーターであるが、回

帰分析では関数形を特定するのが目的であるため、最小化問題(5.1)ではパラメーターb , a

が決定変数となり(𝑥𝑖 , 𝑦𝑖)はデータとして与えられている。

Page 10: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

7

3.2 Excel を用いた回帰分析

最小化問題は凸な 2 次関数の制約なし最小化問題となるため、Excel ソルバーでも非線形

計画(NLP)用の「GRG」アルゴリズムを用いて停留点を見つけることができれば最適解にな

る。しかし、この問題は解析的に解けることが知られていて、ソルバーを用いるまでもな

い。Excel では「データ分析」アドインの「回帰分析」を用いることで簡単に計算できるばかり

ではなく、推定値に関する様々な統計的な情報をまとめて得ることができる。

データが表 3.1のようにセル範囲A1:B26 に与えられているとする。列A には最高気温(℃)、

列 B にはアイスコーヒーの注文数(個)、行 1 にはデータ X と Y の名前である「最高気温(℃)」

「アイスコーヒー注文数(個)」が入っている。

表 3.1 回帰分析データ例

「回帰分析」ダイアログボックスに以下のようにデータ範囲を入力し、必要に応じてチェッ

クを入れる。

Page 11: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

8

・「入力 Y 範囲」としてセル範囲 B1:B26 を指定

・「入力 X 範囲」としてセル範囲 A1:A26 を指定

・指定した範囲にデータの名前を含むため、「ラベル」にチェックを入れる。

⇒指定した範囲の一番上の行をデータの名前を表すラベルとし、分析対象のデータに含

まない。

・「出力オプション」では分析結果を出力する場所を選択することができる。

ここではセル E2 を出力先の先頭に指定する。

・「残差」の 4 項目および「正規確率」の 1 項目をチェックしておくと、追加的な情報が

得られる。

図 3.2 回帰分析ダイアログボックス

OK をクリックすると分析結果が出力される。(図 3.3)

Page 12: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

9

表 3.3 分析結果例

セル F18:F19 をみると、切片の係数 b が 30.21020179、最高気温xの係数 a が 11.7657084

と出力されているため、y = b + ax に代入して y = 30.21020179 + 11.7657084 という関係

式が推定されたことになる。

セル F6 重決定係数は 𝑦𝑖 , 𝑖 = 1 , … , 𝑙 のバラツキ(分散)のうちモデルの部分

𝑏∗ + 𝑎∗𝑥𝑖 , i = 1 , … , l のバラツキでどれくらい説明できているかを0以上1以下の数値で示

していて、1 に近いほど回帰直線の当てはまりがよいことを表す。数学的な性質として推定

に使用するパラメーター(b や a)の数が多いほど、この値は大きくなってしまうことから、

パラメーターの数が増えるほど小さい値になるよう補正をかけたものがセル F7「補正𝑅2」

(自由度調整済み決定係数)である。今回は 0.85 を超えているので、かなり当てはまりのいい

結果といえる。

セル I18:I19「P-値」は(モデルが正規性の過程を満たしていることを前提として)、推定パラ

メーター(b や a)が 0 である場合に、推定された値(𝑏∗や𝑎∗)をとる確率を表している。したが

って、P-値がものすごく低い場合には、該当の推定値が 0 でないとみなす。(逆に P-値が大

きい場合には、0 でない推定値が得られても 0 の可能性も十分あるということになり、該当

の変数 x が y を説明しているといえないことになる。)

P-値が 0.05 以下であればおおよそ合格であるが、図 3.3 の例でセル I18:I19 を見ると切片項

bのP-値が約 0.24と、推定値𝑏∗が 0であることを 95%以上の確率で棄却できないことから、

Page 13: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

10

有意な結果とはいえないことがわかる。

「回帰分析」ダイアログボックスで「観測値グラフの作成」をチェックしておくと、図 3.4 の

ように、x と y のデータの散布図と、最小二乗法によって得られた回帰直線上の点が描画さ

れる。

図 3.4 観測値グラフ

また、「回帰分析」ダイアボックスで「残差グラフの作成」や「正規確率グラフの作成」にチェ

ックを入れておくと、x データに対する残差(図 3.5)や y データの分布と正規分布との分位点

比較(図 3.6)が出力される。

Page 14: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

11

図 3.5 残差グラフ

図 3.6 正規確率グラフ

Page 15: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

12

第 4 章

データマイニング

4.1 データマイニングとは

データマイニングとは、統計的手法を用いて企業に蓄積される顧客データや従業員デー

タの中から各情報の相関や法則性といった情報を探し出すための分析手法である。

例えば顧客データを利用すれば購買履歴から商品の併売傾向を探しだすことができる。過

去の購買履歴から「おむつを買ったお客さんはビールも良く買う」といったような情報が

発見されると、これによりおむつとビールをならべておけば売り上げ増加が見込めるとい

った行動を起こすことが可能となる。従業員データを利用すれば研修等の育成履歴から退

職者を再雇用する際に求める人材のみを見つけることができる。得られるデータの精度は

データマイニングを行う者のスキルに依存する。しかし、良い情報を探し出すことができ

れば、施策に無駄な情報を省いたり、潜在的なニーズを掘り起こすことが可能になる。

・データマイニングの手順

① データを解析可能な形に整える

データマイニングで使用するデータの多くは、解析することを目的に集められたもので

はないため、解析を始める前にデータを整理する必要がある。ここでいう「整理」とは、

値の入っていないデータの補完、例外的なケースの除外、 単位が揃っていないデータ

の単位揃える、などの作業を指す。

② 解析を行ってルールやパターンを見つける

③ 得られたルールやパターンを有効に活用する

4.2 アソシエーション分析

アソシエーション分析とは

アソシエーション分析とは、アソシエーションルールと呼ばれる事象間のつながりの強

さに関する規則を知識として発見する分析である。ある事象が発生した時に、別な事象が

発生する事後確率が高いような事象の組み合わせを求める。

例えばスーパーマーケットのデータなどに対しては、どの商品が同時に購入されている

か、どの商品の組み合わせが頻繁に現れるか、というルール(前提と結論)を抽出することが

できる。この分析の結果、乳製品とパンが同時購入される頻度が高いことがわかれば、こ

のスーパーのパン売り場に乳製品を置くことや、パンの購入者に対して乳製品を割り引く

ようなキャンペーンを実行すれば、パンと乳製品の売り上げが上昇することが期待できる。

Page 16: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

13

アソシエーション分析の中で、POS や購買データの分析を行う手法をマーケットバスケ

ット分析とよぶ。マーケットバスケット分析で使うデータは買い物かごの中のデータ、つ

まりレシートのデータが基本であり、図 4.1 のように Excel の表にまとめることができる。

表 4.1 レシートデータ

4.3 相関ルール

相関ルールとは、商品の組み合わせに頻出する何らかの関連、あるいは規則のことを指す。

相関ルールの評価指標

データベースの中から相関ルールを検出する際、評価指標が必要となる。多く用いら

れている指標として支持度(support)、信頼度(confidence)、リフト(lift)がある。

信頼度…仮にルールの前提が起きたと仮定したときに、結論が起きる確率

この数値が高いほど、ルールの前提と結論の結びつきが高い

サポート…ルールの前提と結論が同時に起きる確率、つまり「ルールそのものが起きる

確率」。重要なルールは、信頼度だけでなくサポートもそれなりに大きいこ

とが求められる。

リフト…前提または結論のどちらかのデータの中での出現回数が非常に多い場合に前

提と結論の間の結びつきの強さを見ることができる。

𝐿𝑖𝑓𝑡(𝐴 → 𝐵) =𝑃(𝐵|𝐴)

𝑃(𝐵)

例) Lift(アイスコーヒー → 惣菜パン)

=アイスコーヒーを買ったときに惣菜パンを購入する確率

惣菜パンを購入する確率

リフトは、前提が存在することで結論が起こる確率がどれだけ大きくなるのかの

比を表しており、リフトが 1 の場合は、全く前提の存在が効いていないことにな

る。リフトが 1 より大きければ大きいほど、その効果は大きくなる。一方、リフ

ト値が 1より小さい場合には、前提が結論を疎外していることがわかる。

トマト

なす

ゅうり

ャベツ

レタス

ゃがいも

人参

ごぼう

ネギ

カボチ

トマト

なす

ゅうり

ャベツ

レタス

ゃがいも

人参

ごぼう

ネギ

カボチ

1 ○ ○ ○ ○ ○ 1 1 1 2 1 12 ○ ○ ○ ○ ○ 2 1 2 1 4 23 ○ ○ ○ ○ 3 3 1 3 24 ○ ○ ○ ○ ○ 4 2 2 1 2 15 ○ ○ ○ ○ ○ ○ ○ 5 1 2 1 2 2 1 2

Page 17: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

14

第 5 章

気象データに注目した購買行動分析

5.1 メニューの各カテゴリーと平均気温の関係

表 2.1に示したメニューを、次のように分類する。

・コールドドリンク

・ホットドリンク

・パン

・サンドイッチ

・デザート

各カテゴリーについて、対象期間の 2015 年 9 月 1 日から 30 日までの平均気温との関係を

調べる。ただし、対象の店舗が所在する本郷三丁目駅周辺には会社や学校が多く平日と休

日の売り上げに大きな差があることから、ここでは平日に限定して分析を行う。

表 5.1 カテゴリー別販売個数と平均気温

表 5.1 では、1 段目に日付、2 段目に曜日、3 段目に平均気温、4 段目から最下段に各カテ

ゴリーの一日ごとの販売個数の集計を示している。

この表をグラフに表したものが図 5.2である。

日付 1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

曜日 火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

平均気温 23.7 26.9 25.7 24.7 23 20 22.4 21.8 23.9 22.9 22.3 21.1 17.9 20.6 20.4 17.7 23.3 22.7 20.9

コールドドリンク 537 586 607 607 420 403 470 433 594 485 495 416 344 466 437 378 536 446 495

ホットドリンク 369 297 284 238 399 564 508 470 283 387 319 404 618 409 394 539 338 345 367

パン 425 447 416 405 475 513 560 518 450 480 462 452 516 484 429 479 437 424 412

サンドイッチ 36 46 57 43 58 63 60 57 56 68 49 56 66 52 56 64 55 50 52

デザート 60 50 53 61 37 40 48 69 61 56 63 56 40 49 73 37 57 55 48

Page 18: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

15

図 5.2 販売個数と平均気温の関係

図 5.2 で、左縦軸には販売個数の目盛りをとってあり、各カテゴリーの販売個数は色別に

棒グラフで示している。右縦軸には気温の目盛りをとってあり、平均気温の推移を折れ線

グラフで示している。横軸には対象期間のなかで平日に絞った日付をとっている。

次に、表 5.1 からホットドリンクとコールドドリンクの合計を出し、ドリンク全体の販売

個数の中でのホットドリンクの割合と平均気温の関係を表 5.3、図 5.4に示す。

表 5.3 ホットドリンクの割合

0

5

10

15

20

25

30

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

0

100

200

300

400

500

600

700販売個数

(個)

日付

気温

(℃)

コールドドリンク ホットドリンク パン

サンドイッチ デザート 平均気温

日付 1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

曜日 火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

平均気温 23.7 26.9 25.7 24.7 23 20 22.4 21.8 23.9 22.9 22.3 21.1 17.9 20.6 20.4 17.7 23.3 22.7 20.9

ホットドリンク 369 297 284 238 399 564 508 470 283 387 319 404 618 409 394 539 338 345 367

ドリンク総計 906 883 891 845 819 967 978 903 877 872 814 820 962 875 831 917 874 791 862

ホット/総計 0.41 0.34 0.32 0.28 0.49 0.58 0.52 0.52 0.32 0.44 0.39 0.49 0.64 0.47 0.47 0.59 0.39 0.44 0.43

Page 19: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

16

図 5.4 ホットドリンクの割合と平均気温の関係

図 5.4で、縦軸はドリンク販売個数の中でのホットドリンクの割合、横軸は平均気温を表

しており、それぞれの気温におけるホットドリンクの割合を点で表している。これらを見

ると、気温が低い方がホットドリンクの割合が高くなることがわかる。また、ドリンク全

体の販売個数の中でのホットドリンクの割合と平均気温の関係は y = −0.0356x + 1.2402

という一次方程式に近似できる。

次に、各カテゴリーについて、説明される変数を販売個数、説明する変数を平均気温とし

て単回帰分析を行う。

表 5.5に、コールドドリンクと平均気温で回帰分析を行った結果を示す。

y = -0.0356x + 1.2402

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

17 18 19 20 21 22 23 24 25 26 27 28

ホット

/総計

平均気温

ホット/総計 線形 (予測値: ホット/総計)

Page 20: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

17

表 5.5 コールドドリンクと平均気温の単回帰分析

概要

回帰統計重相関 R 0.8721372重決定 R2 0.7606233補正 R2 0.7465423標準誤差 39.591698観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 84673 84673 54.017763 1.1E-06残差 17 26647.5 1567.5合計 18 111321

係数 標準誤差 t P-値 下限 95% 上限 95%下限 95.0%上限 95.0%切片 -161.7011 88.0306 -1.8369 0.0837761 -347.43 24.0272 -347.43 24.0272平均気温 28.98156 3.94324 7.34968 1.135E-06 20.662 37.3011 20.662 37.3011

残差出力

観測値予測値:

コールドドリンク 残差

1 525.16191 11.83812 617.9029 -31.9033 583.12503 23.8754 554.14347 52.85655 504.87482 -84.8756 417.93014 -14.937 487.48588 -17.4868 470.09695 -37.0979 530.95822 63.0418

10 501.97666 -16.97711 484.58773 10.412312 449.80985 -33.8113 357.06886 -13.06914 435.31908 30.680915 429.52276 7.4772416 351.27255 26.727417 513.56929 22.430718 496.18035 -50.1819 444.01354 50.9865

Page 21: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

18

表 5.5で決定係数𝑅2が 0.76となっていることから、コールドドリンクの販売個数と平均気

温には相関関係があるといえる。

観測値のグラフは図 5.6 のようになり、縦軸はコールドドリンクの販売個数、横軸は平均気

温を示している。それぞれの気温におけるコールドドリンクの販売個数は

y = 28.982x − 161.7 という式に近似できる。

図 5.6 観測値グラフ(コールドドリンク)

次にホットドリンクについて回帰分析を行うと、表 5.7のようになる。

y = 28.982x - 161.7

0

100

200

300

400

500

600

700

17 18 19 20 21 22 23 24 25 26 27 28

コールドドリンク

平均気温

コールドドリンク 線形 (予測値: コールドドリンク)

Page 22: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

19

表 5.7 ホットドリンクと平均気温の回帰分析

概要

回帰統計重相関 R 0.81127重決定 R2 0.65815補正 R2 0.63804標準誤差 61.7857観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 124945.6 124946 32.729926 2.5E-05残差 17 64897.03 3817.47合計 18 189842.6

係数 標準誤差 t P-値 下限 95% 上限 95%下限 95.0%上限 95.0%切片 1178.17 137.3781 8.57609 1.398E-07 888.325 1468.01 888.325 1468.01平均気温 -35.205 6.153714 -5.721 2.498E-05 -48.189 -22.222 -48.189 -22.222

残差出力

観測値予測値:

ホットドリンク 残差

1 343.798 25.201822 231.141 65.859233 273.387 10.61274 308.593 -70.59275 368.442 30.558016 474.058 89.941687 389.565 118.43478 410.689 59.311489 336.757 -53.7571

10 371.963 15.0374711 393.086 -74.085812 435.332 -31.332313 547.99 70.0102514 452.935 -43.935115 459.976 -65.976116 555.031 -16.030817 357.88 -19.880418 379.004 -34.003619 442.373 -75.3734

Page 23: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

20

表 5.7を見ると、決定係数𝑅2は 0.66と 1に近い数値がでているため、ホットドリンクの販

売個数と平均気温にも大きな相関関係があるといえる。

また、観測値グラフは図 5.8のようになり、表 5.7の係数を使って y = −35.205x + 1178.2

という近似直線に近似できることがわかる。

図 5.8 観測値グラフ(ホットドリンク)

図 5.8で、縦軸はホットドリンクの販売個数、横軸は平均気温を表す。

ここで、コールドドリンク・ホットドリンクの販売個数が、平均気温を説明変数xとして、

それぞれ y = 28.982x − 161.7、 y = −35.205x + 1178.2 と表すことができ、またドリンク

全体の販売数の中でのホットドリンクの割合が平均気温を説明変数xとして

y = −0.0356x + 1.2402 と表されることについてこれらの結果がどの程度正確なものであ

るかを確かめる。

ドリンク全体の中でのホットドリンクの割合が、平均気温を説明変数 xとして

−0.0356x + 1.2402 と表されるとき、コールドドリンクの割合は全体の割合 1からホットド

リンクの割合を引いたものであるため、 1 − (−0.0356x + 1.2402) であり、これを整理して

0.0356x − 0.2402 となる。

表 5.1から 8日のデータを見ると、平均気温 20℃、コールドドリンクの販売個数は 403個、

ホットドリンクの販売個数は 564個である。

コールドドリンクについての近似式に x = 20 を代入すると

28.982 ∗ 20 − 161.7 = 417.94 であり、ホットドリンクについての近似式に x = 20 を代入

y = -35.205x + 1178.2

0

100

200

300

400

500

600

700

17 18 19 20 21 22 23 24 25 26 27 28

ホットドリンク

平均気温

ホットドリンク 線形 (予測値: ホットドリンク)

Page 24: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

21

すると −35.205 ∗ 20 + 1178.2 = 474.1 となる。また、ホットドリンクの割合を表す近似式

に x = 20 を代入すると、 −0.0356 ∗ 20 + 1.2402 = 0.5282 となる。

コールドドリンク及びホットドリンクの計算結果からドリンク全体の中でのホットドリン

クの割合を計算すると 0.58となり、これはホットドリンクの割合を表す近似式を利用して

計算した結果 0.5282に近い値になっている。

次に、パンの販売数を平均気温で説明する回帰分析を行う。

Page 25: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

22

表 5.9 パンと平均気温の回帰分析

概要

回帰統計重相関 R 0.4411重決定 R2 0.1946補正 R2 0.1472標準誤差 39.169観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 6300 6300 4.1062657 0.05871残差 17 26082.1 1534.24合計 18 32382.1

係数 標準誤差 t P-値 下限 95% 上限 95%下限 95.0%上限 95.0%切片 637.86 87.0916 7.32396 1.188E-06 454.108 821.603 454.108 821.603平均気温 -7.905 3.90118 -2.0264 0.0587097 -16.136 0.32545 -16.136 0.32545

残差出力

観測値予測値:

パン残差

1 450.5 -25.4992 425.2 21.79763 434.69 -18.6894 442.59 -37.5945 456.03 18.96696 479.75 33.25097 460.78 99.22378 465.52 52.48059 448.92 1.08165

10 456.82 23.176311 461.57 0.4331412 471.05 -19.05313 496.35 19.649714 475.01 8.9940815 476.59 -47.58716 497.93 -18.93117 453.66 -16.66218 458.4 -34.40519 472.63 -60.634

Page 26: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

23

表 5.9では決定係数𝑅2は 0.1946とかなり 0に近い数値がでているため、パンの販売個数と

平均気温はほとんど相関関係がないといえる。

これは、観測値グラフを見ると近似直線がほぼ横ばいであることからもわかる。また、1日

平均 450個という数が比較的安定していることがわかる。(図 5.10)

図 5.10 観測値グラフ(パン)

図 5.10で、縦軸はパンの販売個数、横軸は平均気温を表す。

続いて、サンドイッチとデザートついても平均気温を説明変数とし回帰分析を行う。

y = -7.9053x + 637.86

0

100

200

300

400

500

600

17 18 19 20 21 22 23 24 25 26 27 28

パン

平均気温

パン 線形 (予測値: パン)

Page 27: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

24

表 5.11 サンドイッチと平均気温の回帰分析

概要

回帰統計重相関 R 0.53893重決定 R2 0.290446補正 R2 0.248707標準誤差 6.912914観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 332.545 332.545 6.9586997 0.01727残差 17 812.402 47.7884合計 18 1144.95

係数 標準誤差 t P-値 下限 95%上限 95%下限 95.0%上限 95.0%切片 95.27757 15.3706 6.19869 9.719E-06 62.8485 127.707 62.8485 127.707平均気温 -1.81625 0.68851 -2.6379 0.017268 -3.2689 -0.3636 -3.2689 -0.3636

残差出力

観測値予測値:

サンドイッチ残差

1 52.23256 -16.2332 46.42057 -0.42063 48.60007 8.399934 50.41631 -7.41635 53.50393 4.496076 58.95267 4.047337 54.59368 5.406328 55.68343 1.316579 51.86931 4.13069

10 53.68556 14.314411 54.7753 -5.775312 56.9548 -0.954813 62.76678 3.2332214 57.86292 -5.862915 58.22617 -2.226216 63.13003 0.8699717 52.95906 2.0409418 54.0488 -4.048819 57.31805 -5.318

Page 28: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

25

表 5.12 デザートと平均気温の回帰分析

概要

回帰統計重相関 R 0.33954重決定 R2 0.11529補正 R2 0.06324標準誤差 9.92839観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 218.364 218.364 2.2152545 0.15497残差 17 1675.74 98.573合計 18 1894.11

係数 標準誤差 t P-値 下限 95%上限 95%下限 95.0%上限 95.0%切片 20.6347 22.0754 0.93474 0.3630112 -25.94 67.2097 -25.94 67.2097平均気温 1.47177 0.98885 1.48837 0.1549681 -0.6145 3.55805 -0.6145 3.55805

残差出力

観測値予測値:デザート

残差

1 55.5157 4.48432 60.2254 -10.2253 58.4592 -5.45924 56.9875 4.012535 54.4855 -17.4856 50.0701 -10.077 53.6024 -5.60248 52.7193 16.28079 55.8101 5.18995

10 54.3383 1.6617211 53.4552 9.5447812 51.6891 4.310913 46.9794 -6.979414 50.9532 -1.953215 50.6589 22.341116 46.6851 -9.685117 54.927 2.0730118 54.0439 0.9560719 51.3947 -3.3947

Page 29: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

26

表 5.11、表 5.12を見ると、それぞれ決定係数𝑅2が 0.290446および 0.11529であることか

ら、サンドイッチとデザートに関しても平均気温との相関関係はほとんどないといえる。

それぞれの結果の観測値グラフは以下の通りである。

図 5.13 観測値グラフ(サンドイッチ)

図 5.14 観測値グラフ(デザート)

y = -1.8162x + 95.278

0

10

20

30

40

50

60

70

80

17 18 19 20 21 22 23 24 25 26 27 28

サンドイッチ

平均気温

サンドイッチ 線形 (予測値: サンドイッチ)

y = 1.4718x + 20.635

0

10

20

30

40

50

60

70

80

17 18 19 20 21 22 23 24 25 26 27 28

デザート

平均気温

デザート 線形 (予測値: デザート)

Page 30: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

27

以上の結果から、それぞれのカテゴリーごとの販売個数について説明変数に平均気温を

とると、パン・サンドイッチ・デザートは平均気温との相関関係がないために説明するこ

とができず、コールドドリンクおよびホットドリンクに関しては平均気温との相関関係が

かなり強いため、近似式で各温度における販売個数を推定することができた。

コールドドリンクおよびホットドリンクの販売個数を平均気温で説明する近似式は以下の

通りである。

・コードドリンク y = 28.982x − 161.7

・ホットドリンク y = −35.205x + 1178.2

5.2 様々な気象条件と売り上げの関係

5.1メニューの各カテゴリーと平均気温の関係の結果、パン・サンドイッチ・デザートに

関しては平均気温とは特に相関関係がないことが分かったため、他の気象条件についても

相関関係がないか検証する。

表 5.15 各カテゴリー別販売個数と気象条件

表 5.15は、表 5.1に気象庁のホームページから最高気温・平均湿度・降水量の値を引用し

追加したものである。

5.1では説明変数を平均気温として回帰分析を行い、コールドドリンクとホットドリンクに

ついての近似式を導いたが、説明変数を最高気温として再度回帰分析を行った。(表 16、表

18)

日付 1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

曜日 火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

天気 曇 晴 曇 雨 晴 雨 雨 曇 晴 晴 晴 曇 雨 曇 曇 雨 晴 曇 晴

平均気温 23.7 26.9 25.7 24.7 23 20 22.4 21.8 23.9 22.9 22.3 21.1 17.9 20.6 20.4 17.7 23.3 22.7 20.9

気温前日比 1.6 3.2 -1.2 -1 -0.8 -3 2.4 -0.6 2.1 -1.5 -0.6 -1.2 -3.2 2.7 -2 -2.7 1.9 -0.6 -1.8

最高気温 26.5 31.5 30.4 30.1 26.1 21 25.3 23.5 29.3 27.3 27.5 25.2 18.9 23.9 23 19.5 27.8 26.6 25.8

平均湿度 96 82 78 88 98 100 99 99 79 69 66 74 98 96 83 98 73 43 43

降水量 12 5.5 1.5 14 19 65.5 156.5 50 0 0 0 4 74.5 5.5 1 43 0 0 0

コールドドリンク 537 586 607 607 420 403 470 433 594 485 495 416 344 466 437 378 536 446 495

ホットドリンク 369 297 284 238 399 564 508 470 283 387 319 404 618 409 394 539 338 345 367

パン 425 447 416 405 475 513 560 518 450 480 462 452 516 484 429 479 437 424 412

サンドイッチ 36 46 57 43 58 63 60 57 56 68 49 56 66 52 56 64 55 50 52

デザート 60 50 53 61 37 40 48 69 61 56 63 56 40 49 73 37 57 55 48

Page 31: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

28

表 5.16 コールドドリンクと最高気温の回帰分析

表 5.16で、決定係数𝑅2を見ると 0.8267と、平均気温で回帰分析を行ったときに比べより 1

に近い値になっているため、より当てはまりのいい結果であるといえる。

観測値グラフは図 5.17となり、近似式は y = 20.344x − 41.95 である。

図 5.17 観測値グラフ(コールドドリンク②)

概要

回帰統計重相関 R 0.909271重決定 R2 0.826775補正 R2 0.816585標準誤差 33.67976観測数 19

分散分析表自由度 変動 分散観測された分散比有意 F

回帰 1 92036.98 92036.98 81.13801 7E-08残差 17 19283.55 1134.326合計 18 111320.5

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0%上限 95.0%切片 -41.95 58.6607 -0.71513 0.484235 -165.713 81.81324 -165.713 81.81324最高気温 20.34352 2.258468 9.007664 7E-08 15.57857 25.10847 15.57857 25.10847

y = 20.344x - 41.95

0

100

200

300

400

500

600

700

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

コールドドリンク

最高気温

コールドドリンク 線形 (予測値: コールドドリンク)

Page 32: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

29

表 5.18 ホットドリンクと最高気温の回帰分析

表 5.18 で決定係数𝑅2を見ると、0.842 とホットドリンクに関しても平均気温で回帰分析を

行ったときに比べより 1 に近い値となっている。したがってホットドリンクに関してもよ

り当てはまりのいい結果といえる。

観測値グラフは図 5.19となり、近似式は y = −26.811x + 1086.7 である。

図 5.19 観測値グラフ(ホットドリンク②)

概要

回帰統計重相関 R 0.91763重決定 R2 0.842045補正 R2 0.832754標準誤差 41.99902観測数 19

分散分析表自由度 変動 分散観測された分散比有意 F

回帰 1 159856 159856 90.62557 3.17E-08残差 17 29986.6 1763.918合計 18 189842.6

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0%上限 95.0%切片 1086.728 73.15052 14.85605 3.61E-11 932.394 1241.062 932.394 1241.062最高気温 -26.8108 2.816333 -9.51975 3.17E-08 -32.7527 -20.8688 -32.7527 -20.8688

y = -26.811x + 1086.7

0

100

200

300

400

500

600

700

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

ホットドリンク

最高気温

ホットドリンク 線形 (予測値: ホットドリンク)

Page 33: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

30

また、パン・サンドイッチ・デザートに関しては、平均気温との相関関係が見られなかっ

たことから、最高気温との相関関係もないとしてここでは省略するが、実際に回帰分析を

行うと決定係数𝑅2はそれぞれ 0.314520307、0.29303206、0.142752143といずれも 0に近い

値であったため、最高気温とも相関関係がないことは証明できている。

次に、説明変数を平均湿度として回帰分析を行った。各カテゴリーにおける決定係数𝑅2の

値は以下の通りである。

・コールドドリンク 0.060508045

・ホットドリンク 0.254322043

・パン 0.346054735

・サンドイッチ 0.033957869

・デザート 0.062543515

これらを見ると、どれも 0に近い値となっている。したがって、平均湿度は販売個数に相

関関係がないということがわかった。

続いて説明変数を降水量として回帰分析を行った。各カテゴリーにおける決定係数𝑅2の値

は以下の通りである。

・コールドドリンク 0.159666949

・ホットドリンク 0.489266401

・パン 0.671751371

・サンドイッチ 0.152616278

・デザート 0.138841132

これらを見ると、コールドドリンク、ホットドリンク、サンドイッチ、デザートに関して

は特に降水量との相関関係は見られなかったが、パンに関しては 0.67と相関関係が見られ

ることがわかる。パンについての回帰分析から得られた観測値グラフは図 5.20の通りであ

り、近似式は y = 0.8704x + 441.61 である。

Page 34: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

31

図 5.20 観測値グラフ(パンと降水量)

以上の結果、最高気温はコールドドリンクとホットドリンクの販売個数に大きな影響があ

ることがわかった。これは、単位時間における来客数が最も多い昼の時間帯が最高気温と

なるため、平均気温よりも最高気温の方が相関が大きかったということだと考えられる

それぞれの近似式はコールドドリンクのとき y = 20.344x − 41.95、ホットドリンクのとき

y = −26.811x + 1086.7である。しかしどのカテゴリーに関しても平均湿度との相関はなく、

降水量との相関はパンに関してのみ見られた。

ここで、何を購入したかには着目せず一日の総客数と各気象条件の相関を確かめる。ただ

し、ここで言う客数はレシート数であり複数客の支払いをまとめてひとりが行う場合がし

ばしばある。後の販売予測の際にレシート数、実客数、販売個数の換算値が必要となる。

ここでは、レシート数に対するドリンク数の割合を用いることにする。この値は 1.32と安

定している。

表 5.21は被説明変数を客数、説明変数を最高気温として回帰分析を行った結果であり、図

5.22はその結果から得られた観測値グラフである。

y = 0.8704x + 441.61

0

100

200

300

400

500

600

700

0 50 100 150 200

パン

降水量

パン 線形 (予測値: パン)

Page 35: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

32

表 5.21 客数と最高気温の回帰分析

概要

回帰統計重相関 R 0.3626重決定 R2 0.1315補正 R2 0.0804標準誤差 30.611観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 2411.635 2411.635 2.5736143 0.12707残差 17 15930.05 937.0617合計 18 18341.68

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95% 上限 95%切片 745.05 53.31659 13.97409 9.477E-11 632.563 857.539 632.563 857.539最高気温 -3.293 2.052717 -1.60425 0.1270747 -7.6239 1.03779 -7.6239 1.03779

残差出力

観測値予測値:客数

残差

1 657.78 14.215312 641.32 33.680653 644.94 11.058284 645.93 -2.929645 659.1 -38.10196 675.9 30.103437 661.74 64.263638 667.66 20.33619 648.56 14.4359

10 655.15 11.8497611 654.49 -23.491612 662.07 -36.065713 682.81 28.1879914 666.35 -11.346715 669.31 -42.310416 680.84 -8.8361717 653.5 -8.503718 657.46 -49.455419 660.09 -7.08984

Page 36: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

33

図 5.22 観測値グラフ(客数と最高気温)

表 5.21 を見ると、決定係数𝑅2が 0.1315 であることから最高気温と客数には特に相関関係

はないことがわかる。

次に、表 5.15 から降水量が 0 ではない日を 1、0 であった日を 0 として 0 と 1 を使って客

数について散布図を作成する。(図 5.23)

図 5.23 雨の有無と客数

600

620

640

660

680

700

720

740

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

客数

最高気温

客数

600

620

640

660

680

700

720

740

0 1

客数

0⇒雨以外、1⇒雨

Page 37: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

34

図 5.23を見ると、雨が降っていない日・降った日共に客数に特徴は見られなかったが、そ

れぞれ平均来客数を計算すると、雨が降った日は降らなかった日より平均 30人ほど多かっ

たことがわかる。次に、気象庁のホームページから 1 日ごとのデータを参照し、雨が降っ

ていた時間を 1時間ごとに合計した。表 5.24は雨の有無・雨が降った時間・降水量・客数

をまとめたものである。

表 5.24 雨と客数の関係

表 5.24から被説明変数を客数、雨が降った時間を説明変数として回帰分析を行う。

雨雨が降った

時間降水量 客数

1 4 12 6721 3 5.5 6751 1 1.5 6561 1 14 6431 7 19 6211 15 65.5 7061 14 156.5 7261 11 50 6880 0 0 6630 0 0 6670 0 0 6310 0 4 6261 15 74.5 7111 5 5.5 6551 2 1 6271 15 43 6720 0 0 6450 0 0 6080 0 0 653

Page 38: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

35

表 5.25 客数と雨が降った時間の回帰分析

概要

回帰統計重相関 R 0.743385重決定 R2 0.552622補正 R2 0.526305標準誤差 21.97013観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 10136.01 10136.01 20.999148 0.000265残差 17 8205.674 482.6867合計 18 18341.68

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0%上限 95.0%切片 640.8111 6.589658 97.24496 8.692E-25 626.9081 654.714 626.9081 654.714雨が降った時間3.974086 0.867234 4.582483 0.0002648 2.144381 5.80379 2.144381 5.80379

残差出力

観測値予測値:客数

残差

1 656.7074 15.29262 652.7333 22.266693 644.7851 11.214864 644.7851 -1.785145 668.6297 -47.62976 700.4223 5.5776617 696.4483 29.551758 684.526 3.4740049 640.8111 22.18895

10 640.8111 26.1889511 640.8111 -9.8110512 640.8111 -14.811113 700.4223 10.5776614 660.6815 -5.6814815 648.7592 -21.759216 700.4223 -28.422317 640.8111 4.18894518 640.8111 -32.811119 640.8111 12.18895

Page 39: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

36

表 5.25で決定係数𝑅2を見ると 0.55であり、0.5を超えているためこれは相関があると言え

る。この結果から得られた観測値グラフが図 5.26である。

図 5.26 観測値グラフ(客数と雨が降った時間)

次に表 5.24から説明変数を降水量に変えて客数について回帰分析を行う。

y = 3.9741x + 640.81

600

620

640

660

680

700

720

740

0 2 4 6 8 10 12 14 16

客数

雨が降った時間

客数 予測値: 客数

Page 40: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

37

表 5.27 客数と降水量の回帰分析

概要

回帰統計重相関 R 0.78369重決定 R2 0.61416補正 R2 0.59147標準誤差 20.4031観測数 19

分散分析表

自由度 変動 分散観測された

分散比有意 F

回帰 1 11264.8 11264.79 27.060073 7.2E-05残差 17 7076.9 416.2881合計 18 18341.7

係数 標準誤差 t P-値 下限 95%上限 95%下限 95%上限 95%切片 645.362 5.4878 117.5993 3.451E-26 633.783 656.94 633.783 656.94降水量 0.62639 0.12042 5.20193 7.198E-05 0.37234 0.88045 0.37234 0.88045

残差出力

観測値予測値:客数

残差

1 652.878 19.12172 648.807 26.19333 646.301 9.698834 654.131 -11.1315 657.263 -36.2636 686.39 19.60967 743.392 -17.3928 676.681 11.31879 645.362 17.6384

10 645.362 21.638411 645.362 -14.36212 647.867 -21.86713 692.028 18.972114 648.807 6.1932615 645.988 -18.98816 672.297 -0.296517 645.362 -0.361618 645.362 -37.36219 645.362 7.63842

Page 41: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

38

表 5.27で決定係数𝑅2を見ると、0.61とこれまでの客数での回帰分析の中で最も高い数値が

出た。下の図 5.28はこの結果から得られた観測値グラフである。決定係数の値と図 5.28

から、客数と降水量には相関関係があることがわかる。このときの近似式は、

y = 0.6264x + 645.36 である。

図 5.28 観測値グラフ(客数と降水量)

以上の結果から、一日の中でこのコーヒーショップを利用する客数は最高気温とは特に相

関関係はないが、雨が降った時間と一日の降水量には相関関係があり、雨が降っている時

間が長く降水量が多い方が客数は多くなることがわかった。

ここまでの分析で、雨が降ると総来客数は増えるがドリンクの販売個数は増減がなく、パ

ンの販売個数は増加することがわかった。これにより、対象の店舗が駅の改札横にあり改

札を出て傘をささずに入店できるため、雨が降っているときは帰り道の途中で買い物をす

るのを避け、改札横のこのコーヒーショップでパンのみを買って帰る顧客が多いというこ

とが考えられる。また、1日のドリンクの販売個数は合計 900個ほどであるが、1日の総来

客数は通常 650人程度であり雨の日は 700人程度に増えていることから、雨の日は一人で

来店する顧客が多いことも考えられる。

y = 0.6264x + 645.36

600

620

640

660

680

700

720

740

0 20 40 60 80 100 120 140 160

客数

降水量

客数 予測値: 客数

Page 42: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

39

第 6 章

購買データの分析

6.1 買い合わせデータの集計

前章でコールドドリンクとホットドリンクの販売個数は最高気温を使って推定でき、パ

ンの販売個数は降水量を使って推定できることが分かった。ここでは実際のレシートから

買い合わせのデータを分析し、気象条件を使って説明することの難しいパン、サンドイッ

チ、デザートの販売個数をドリンクの販売個数から推定することを試みる。ただし、パン

に関しては降水量から推定できるが雨が降らない日が多い場合すべて同じ数値になってし

まい、信用のできる結果とは言えないためここで買い合わせのデータからも分析すること

とする。

採集できるデータには限りがあるため、9月の 30日間の中で平均的な売り上げであった 17

日の朝 7時からの 150件およびランチタイムの 12時から 14時の 139件、同じ曜日で 17日

よりも気温の高い 24日の 12時から 14時の 120件のデータを使用する。

また、ドリンクやパンの販売個数に比べサンドイッチ・デザートの販売個数はわずかであ

るため、この分析ではパン・サンドイッチ・デザートを食事としてまとめて扱うこととす

る。

表 6.1 17日朝の販売データ

アイスコーヒー

アイスカフ

ェラテ

アイステ

ィー

アイスココア

アイスロイヤル

アイスゆず茶

ックスジ

ュース

スムージー

アイスベトナム

野菜ジ

ュース

アイス抹茶ラテ

オレンジジ

ュース

ットコーヒー

カフ

ェラテ

紅茶

ロイヤル

ゆず茶

ココア

ベトナム珈琲

カプチーノ

抹茶ラテ

クロワ

ッサン

菓子パン

惣菜パン

サンドイ

ッチ

デザート

コールドドリンク

ットドリンク

ドリンク

食事

1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 02 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 13 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 14 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 05 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 06 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 07 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 18 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 19 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 010 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 111 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 112 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 213 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 114 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 115 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 116 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 117 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 018 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 019 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 020 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 121 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 122 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 023 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 024 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 025 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 1 126 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 127 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 028 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 129 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0

コールドドリンク ホットドリンク 合計食事

Page 43: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

40

表 6.1は実際のレシートを 1件ずつ表にまとめたものの一部である。1列目の数字は取引順

を表しており、各取引で何がいくつ買われたかを、コールドドリンクから食事の列に数字

で示してある。また、右の合計の各列は、コールドドリンク・ホットドリンク・ドリンク

全体・食事それぞれのカテゴリーの合計である。

各データについて表 6.1のようにまとめ、合計の欄を使ってそれぞれの取引でどのカテゴ

リーから売れたかを次のようにまとめ直す。

1 ホットドリンク

2 ホットドリンク

2 食事

3 コールドドリンク

3 食事

4 コールドドリンク

5 ホットドリンク

6 コールドドリンク

7 ホットドリンク

7 食事

8 ホットドリンク

9 ホットドリンク

10 コールドドリンク

10 食事

11 ホットドリンク

11 食事

12 コールドドリンク

12 食事

12 食事

13 食事

14 食事

15 コールドドリンク

15 食事

16 ホットドリンク

16 食事

17 ホットドリンク

18 コールドドリンク

19 ホットドリンク

20 コールドドリンク

Page 44: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

41

20 食事

21 ホットドリンク

21 食事

22 ホットドリンク

23 ホットドリンク

24 コールドドリンク

25 コールドドリンク

25 食事

26 コールドドリンク

26 食事

27 ホットドリンク

28 ホットドリンク

28 食事

29 コールドドリンク

先頭の数字は取引順を表しており、1回の取引で複数の商品が売れた場合には各商品につい

て取引番号が記してある。

このデータをテキストファイルとして保存し、NTTデータ数理システムの Visual Mining

Studio(VMS)というソフトを使ってアソシエーション分析を行う。

6.2 ドリンクメニューとフードメニューの買い合わせの傾

6.1で整理したデータを用いて、はじめに 17日朝の 150件のデータでアソシエーション分

析を行う。(表 6.2)

表 6.2 アソシエーション分析結果(17日朝)

表 6.2で、「前提」が起こるときに同時に「結論」が起こるという一連の流れを「ルール」とい

い、ルール.数はそのルールが起こった回数、前提.数はそのルールで前提となっている項

前提 結論 信頼度 サポート Lift Convictionルール.数 前提.数 結論.数 キー.数A2-食事 A2-ホットドリンク 47.69 20.67 0.87 0.87 31 65 82 150A2-ホットドリンク A2-食事 37.80 20.67 0.87 0.91 31 82 65 150A2-コールドドリンクA2-食事 37.50 14.00 0.87 0.91 21 56 65 150A2-食事 A2-コールドドリンク 32.31 14.00 0.87 0.93 21 65 56 150A2-コールドドリンクA2-ホットドリンク 1.79 0.67 0.03 0.46 1 56 82 150A2-ホットドリンク A2-コールドドリンク 1.22 0.67 0.03 0.63 1 82 56 150

Page 45: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

42

目がデータの中で現れた回数、結論.数は結論となっている項目が現れた回数を表している。

キー.数はデータの数であり、表 6.2では 150件のデータを使用しているため 150となって

いる。

Convictionは A→Bというルールが間違った予測をしていないかどうかの指標になり、

Convictionが大きい値であれば、前提 Aであるときに結論 Bである確率が高くなる。前提

と結論を入れ替えるとこの値は変わる。

信頼度・サポート・Liftについては第 4章ですでに説明しているため、ここでは省略する。

表 6.2で、前提が食事のときを見ると、47.69%の確率でホットドリンクを同時に購入し

ており、32.31%の確率でコールドドリンクを同時に購入している。残りの 20パーセント

は、食事のみの購入である。食事を購入する顧客のうち 2割が食事のみ、残りの 8割がド

リンクを同時に購入している。また、ドリンクを同時に購入している顧客のうち約 6割が、

ホットドリンクを購入していることがわかる。

前提がホットドリンクのときを見ると、37.8%の確率で食事をしている。ホットドリンクと

コールドドリンクを同時に購入しているパターンもあるが、これは複数人で来店してそれ

ぞれがドリンクのみの注文であるためドリンク単品と考え、ホットドリンク単品の確率を

出すと 62.2%である。

前提がコールドドリンクのときを見ると、37.50%の確率で食事をしており、62.5%が単品で

の購入である。この結果から、最高気温が 18.9℃の 17日の朝ではホットドリンクとコール

ドドリンク共に 4割の顧客がドリンクと食事を同時に購入していることがわかる。また、

ホットドリンクを購入したときに食事をするというルールが出現する確率とコールドドリ

ンクを購入したときに食事をするというルールが出現する確率はそれぞれ 20.67%と 14.00%

であり、食事とドリンクを同時に購入するときホットドリンクである確率はコールドドリ

ンクの約 1.5倍である。

次に Liftの値を見ると、どのルールに関しても 1より低い値になっており、これはどのカ

テゴリーも前提の条件がない方が売れやすいということを表している。

次に、昼の 12時から 14時の買い合わせのデータについて、2 パターンの気温で比較する。

表 6.3 アソシエーション分析結果(17日昼(最高気温 18.9℃))

表 6.4 アソシエーション分析結果(24日昼(最高気温 23℃))

前提 結論 信頼度 サポート Lift Convictionルール.数 前提.数 結論.数 キー.数A2-食事 A2-ホットドリンク 60 32.37 0.92 0.86 45 75 91 139A2-コールドドリンクA2-食事 50 13.67 0.93 0.92 19 38 75 139A2-ホットドリンク A2-食事 49.45 32.37 0.92 0.91 45 91 75 139A2-食事 A2-コールドドリンク 25.33 13.67 0.93 0.97 19 75 38 139A2-コールドドリンクA2-ホットドリンク 2.63 0.72 0.04 0.35 1 38 91 139A2-ホットドリンク A2-コールドドリンク 1.10 0.72 0.04 0.73 1 91 38 139

Page 46: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

43

表 6.3 を見ると、前提が食事のときにホットドリンクを購入する確率は 60%でコールドド

リンクを購入する確率は 25.33%と、食事との同時購入の際のコールドドリンクの販売個数

はホットドリンクの半分以下である。同様のことについて表 6.4 を見ると、前提が食事の

ときにホットドリンクを購入する確率は 47.46%でコールドドリンクを購入する確率は

44.07%と、食事との同時購入の際のコールドドリンクとホットドリンクの販売個数はほぼ

同数である。

次に前提がホットドリンクのときで比較する。表 6.3 でホットドリンクと共に食事をする

確率は 49.45%、表 6.4で食事をする確率は 50.91%と、気温が変わってもホットドリンク

を注文する顧客の約半数が食事をしていることがわかる。同様にコールドドリンクのとき

で比較すると、表 6.3 でコールドドリンクと共に食事をする確率は 50%、表 6.4 で食事を

する確率は 41.94%と、気温が上がりコールドドリンク全体での割合が増えても食事との同

時購入の割合は減少している。

5章で気温が下がるとホットドリンクの割合が増えることがわかったが、以上の結果からホ

ットドリンクに関しては全体の割合が増えてもその中で食事と同時購入する割合は常に 5

割ほどであることがわかった。しかしコールドドリンクに関しては、5章で気温が上がると

コールドドリンク全体の割合が増えることはわかったが、その中で食事との同時購入の割

合は減少することが分かった。これはコールドドリンク単品の注文が増えることを表して

いる。

また、表 6.2 と表 6.3 で同じ日の朝の時間帯と昼の時間帯で比較すると、朝はホットドリ

ンク・コールドドリンク共に約 37%が食事と共に購入されているが、昼はホットドリンク・

コールドドリンク共に約 50%が食事と共に購入されているため、朝に比べ昼の時間帯の方

が食事と共に購入される確率が高いことがわかる。

以上の結果をまとめると、アソシエーション分析の結果、ホットドリンクが売れる割合は

気温が高い日は少なく低い日は多いのに対して、そのどちらの場合でもホットドリンクの

販売個数の約半数が食事と同時に購入されていると言える。また、コールドドリンクの場

合では、販売個数の割合が低くなる気温の高い日にはその中の約半数が食事と共に購入さ

れているが、気温が高くなり販売個数が増加してもそれに応じて食事の販売個数も同時に

増加することはあまり望めず、気温が高い日には食事との同時購入の割合は低くなってし

まう。また、一日の中で昼の時間帯にドリンクが食事と同時購入される割合は、ホットド

リンクとコールドドリンク共に朝の約 1.35倍であることがわかった。

前提 結論 信頼度 サポート Lift Convictionルール.数 前提.数 結論.数 キー.数A2-ホットドリンク A2-食事 50.91 23.33 1.04 1.04 28 55 59 120A2-食事 A2-ホットドリンク 47.46 23.33 1.04 1.03 28 59 55 120A2-食事 A2-コールドドリンク 44.07 21.67 0.85 0.86 26 59 62 120A2-コールドドリンク A2-食事 41.94 21.67 0.85 0.88 26 62 59 120A2-ホットドリンク A2-コールドドリンク 5.45 2.50 0.11 0.51 3 55 62 120A2-コールドドリンク A2-ホットドリンク 4.84 2.50 0.11 0.57 3 62 55 120

Page 47: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

44

第 7 章

最適な仕入れ戦略の構築

7.1 各カテゴリーの販売個数予測

これまで分析を行った結果から、仕入れ戦略の構築に必要な項目をまとめると以下の通

りである。

・ドリンクの販売個数の割合は気温が高い日にはコールドドリンクが多く、気温が低い日

にはホットドリンクが多い。

このとき、コールドドリンクの販売個数は説明変数 x を最高気温として

y = 20.344x − 41.95という式に近似することができ、同様にホットドリンクは

y = −26.811x + 1086.7という式に近似することができる。

・パンの販売個数は 1日平均 450個という数が比較的安定している

・朝の時間帯は、ドリンクを購入した顧客の約 4割が食事と一緒に購入している。

・昼の時間帯は、気温が低い日はホットドリンク・コールドドリンク関わらずドリンクを

購入した顧客の約半分が食事と共に購入している。ホットドリンクに関しては気温が高

い日も約半分が食事と同時に購入されているが、コールドドリンクは気温が高い日には

単品での購入が多く、食事と同時購入される確率は約 4 割程度に下がる。

・1 日の総来客数は、説明変数 x を用いて y = 0.6264x + 645.36 と表せる。

まず、サンドイッチとデザートに関しては特に気象条件との相関や買い合わせの傾向が見

られなかったため、サンドイッチ・デザート共に各日の平均個数を出すと、サンドイッチ

は平均 55 個、デザートは平均 53 個であった。この数をそれぞれの 1 日の予測販売個数と

する。

次に、パンの販売個数は 1 日平均 450 個であるといえるが、一度に 450 個作ることは不可

能であり各時間帯に合わせて作り足すことが必要なため、時間を朝・昼・夜の 3 つに分割

し、7 時~11 時を朝、11~16 時を昼、16 時~22 時を夜とする。朝はドリンクの販売個数の

約 4 割、昼は気温が低い日にはドリンクの販売個数の約半数、気温が高い日にはホットド

リンクの販売個数の約半数とコールドドリンクの販売個数の約 4 割が食事と一緒に購入さ

れている。夜については買い合わせのデータが得られなかったため、ここではドリンクの

販売個数の約 4 割が食事と一緒に購入されていると仮定する。ここで、食事にはサンドイ

ッチとデザートも含まれているが、それぞれの販売個数はパンの販売個数に比べて非常に

少ないため、ここでは食事の販売個数をパンの販売個数とする。次に、17 日朝のレシート

Page 48: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

45

データは 150 件であったが、これはオープンから約 2 時間のデータであり、また 9 時以降

は会社員が出勤後であり来客数は少ないことが予測できるため、11 時までの 4 時間で約 250

人の来客があったと仮定する。17 日の来客数は 711 人であったため、1 日の来客数の約 3.5

割が朝の時間帯に来店しているといえる。

17 日の昼の 2 時間での来客数は 139 件であったが、これは 12 時から 14 時のデータであり、

昼食をとりに訪れる会社員が多い 12 時台が含まれているため、14 時から 17 時の来客数は

これより少ないと予測できる。1 時間に 50 人来店すると仮定すると、14 時から 17 時の 3

時間で約 150 人が来店することとなり、昼の時間帯での来客数は 300 人程度であるといえ

る。これは 17 日の実際の来客数の約 4.2 割であるため、昼の時間帯には 1 日の約 4.2 割が

来店すると仮定できる。これらの仮定から、夜の時間帯には 1 日の来客数の約 2.3 割が来店

していると仮定できる。これらの仮定と分析の結果から、9 月の平日における各カテゴリー

の販売個数を最高気温と降水量を用いて予測する。9 月の平日の最高気温と降水量は以下の

通りである。

表 7.1 9 月の最高気温・降水量

まず説明変数 x を降水量として y = 0.6264x + 645.36 より 1 日の総来客数を予測し実際

の来客数との差異を求めると以下の表の通りとなる。差異の行で符号のついていない数値

は実際の来客数より予測が多いことを表し、マイナスの符号がついているものは実際の来

客数より予測が少ないことを表す。

表 7.2 予測来客数

表 7.2 より、25 日と 28 日の予測が実際の来客数に等しいことがわかるため、この 2 日間で

各カテゴリーの販売個数を予測し、実際の販売個数と比較する。

ここで、最高気温が 23℃未満の日を気温が低い日、最高気温が 23℃以上の日を気温が高い

日とする。よって、25 日は気温が低い日、28 日は気温が高い日となる。

まずこの 2 日間をそれぞれ朝・昼・夜の 3 つの時間帯に分けそれぞれの時間帯の来客数を

計算すると、表 7.3 の通りになる。

日付 1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

曜日 火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

最高気温 26.5 31.5 30.4 30.1 26.1 21 25.3 23.5 29.3 27.3 27.5 25.2 18.9 23.9 23 19.5 27.8 26.6 25.8

降水量 12 5.5 1.5 14 19 65.5 156.5 50 0 0 0 4 74.5 5.5 1 43 0 0 0

日付 1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

曜日 火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

最高気温 26.5 31.5 30.4 30.1 26.1 21 25.3 23.5 29.3 27.3 27.5 25.2 18.9 23.9 23 19.5 27.8 26.6 25.8

降水量 12 5.5 1.5 14 19 65.5 156.5 50 0 0 0 4 74.5 5.5 1 43 0 0 0

予測来客数 653 649 646 654 657 686 743 677 645 645 645 648 692 649 646 672 645 645 645

来客数 672 675 656 643 621 706 726 688 663 667 631 626 711 655 627 672 645 608 653

差異 -19 -26 -10 11 36 -20 17 -11 -18 -22 14 22 -19 -6 19 0 0 37 -8

Page 49: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

46

表 7.3 時間帯別予測来客数

ここで、各日のドリンクの販売個数は説明変数 x を最高気温としてコールドドリンクの販

売個数の近似式がy = 20.344x − 41.95、ホットドリンクの販売個数の近似式が

y = −26.811x + 1086.7と表されることを用いて以下の通り予測できる。

表 7.4 ドリンク予測販売個数

ここで、表 7.2 からこの 2 日間の予測来客数はそれぞれ 672 人、645 人であるがドリンクの

予測販売個数は両日ともにこれらを大きく上回っていることから、複数人で来店し 1 回の

取引で全員分のドリンクを購入する顧客が多いことが考えられる。そこで各日総客数の何

倍のドリンクが売れるかを計算すると、約 1.32 倍となるので、朝・昼・晩それぞれ客数の

1.32 倍ずつドリンクが売れるとする。また、それぞれの日でコールドドリンクとホットド

リンクの予測販売個数の日を出すと、25 日は「コールドドリンク:ホットドリンク」の比

が約 5:6、28 日は約 16:5 であるため、この比を全時間帯に適用する。得られた結果が以

下の表 7.5 である。

表 7.5 時間帯別ドリンク予測販売個数

以上の結果からそれぞれの時間帯でのパンの販売個数を予測すると、6 章で行った分析から

得られた結果を用いて、25 日最高気温が 19.5℃のため気温の低い日、28 日は 27.8℃のため

気温の高い日としそれぞれ計算し、以下の予測が立てられる。

25日 28日

朝 235.3 225.9

昼 282.4 271.1

夜 154.6 148.4

25日 28日

コールドドリンク 354.8 523.6

ホットドリンク 563.9 341.4

合計 918.6 865.0

25日 26日

コールドドリンク 120.9 181.9

ホットドリンク 192.1 118.6

コールドドリンク 145.0 218.2

ホットドリンク 230.5 142.3

コールドドリンク 79.4 119.5

ホットドリンク 126.2 77.9

Page 50: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

47

表 7.6 時間帯別パン予測販売個数

表 7.4~表 7.5 から、25 日はコールドドリンクが 355 個、ホットドリンクが 564 個売れ、パ

ンは朝 106 個、昼 188 個、夜 93 個、合計 387 個売れると予測できる。同様に 28 日は、コ

ールドドリンクが 524 個、ホットドリンクが 341 個売れ、パンは朝 102 個、昼 180 個、夜

89 個、合計 371 個売れると予測できる。

7.2 仕入れ戦略の構築

7.1 で気象条件を用いて各カテゴリーの販売個数を予測することができたので、ここでは

この予測から最適な仕入れ・製造の方法を考える。

7.1 で予測したそれぞれの販売個数を表にまとめると以下の通りになる。

表 7.7 予測販売個数

ここで、すべての食材が発注を行った日の 2 日後に納品されると仮定する。予想気温と予

想降水量がわかれば表 7.7 のように販売個数の予測を立てることができるため、発注数を決

める際に 1 日後、2 日後の予想最高気温と予想降水量を調べ、2 日分の予測使用量からその

日残っている在庫の数を引けば、発注すれきものと個数を決定できる。

また、パンを製造するには 1 次発酵→生地の分割→ベンチタイム→成形→2 次発酵→トッピ

ング→焼成→仕上げという工程が必要であり、パンの種類によってかかる時間は変わって

くるが、ここではパンの種類に関わらず 1 次発酵から仕上げまでで 2 時間かかると仮定す

る。この仮定から、朝の時間帯(7 時~11 時)に販売する予定のパンはオープンの 2 時間前に

製造を開始し、9 時までに予測販売個数分の製造を終わらせる必要があることがわかる。同

様に昼の時間帯(11 時~17 時)に販売する予定のパンは、9 時までに朝の分のパンを作り終え

ているため 9 時から製造を開始すると 11 時に販売することができ、15 時までに予測販売個

25日 28日

朝 106.4 102.1

昼 187.8 180.2

夜 92.5 88.8

25日 28日

355 524

564 341

朝 106 102

昼 188 180

夜 93 89

55 55

53 53

パン

サンドイッチ

コールドドリンク

ホットドリンク

デザート

Page 51: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

48

数分の製造を終わらせることとなる。夜についても、15 時には昼の分の製造を終えている

ので 15 時から夜の時間帯(17 時~22 時)に販売する予定のパンを製造することができ、20

時には 1 日分すべてのパンの製造を終えることになる。

ここまで 25 日と 28 日の 2 日間について予測を立ててきたが、同様の方法で 9 月 1 日から

30 日までの平日の 19 日間についても予測を立てると、以下の表の通りになる。

表 7.8 9 月販売個数予測

表 7 で、青く塗られた部分が予測販売数である。

ここまでで販売個数の予測と仕入れ戦略の構築はできたので、それぞれのカテゴリーにつ

いて実際の販売個数と比較すると、表 7.9~表 7.13 のようになる。

表 7.9 予測と結果の差異(コールドドリンク)

表 7.10 予測と結果の差異(ホットドリンク)

表 7.11 予測と結果の差異(パン)

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

火 水 木 金 月 火 水 木 金 月 火 水 木 金 木 金 月 火 水

26.5 31.5 30.4 30.1 26.1 21 25.3 23.5 29.3 27.3 27.5 25.2 18.9 23.9 23 19.5 27.8 26.6 25.8

12 5.5 1.5 14 19 65.5 156.5 50 0 0 0 4 74.5 5.5 1 43 0 0 0

653 649 646 654 657 686 743 677 645 645 645 648 692 649 646 672 645 645 645

672 675 656 643 621 706 726 688 663 667 631 626 711 655 627 672 645 608 653

-19 -26 -10 11 36 -20 17 -11 -18 -22 14 22 -19 -6 19 0 0 37 -8

497 599 577 570 489 385 473 436 554 513 518 471 343 444 426 355 524 499 483

376 242 272 280 387 524 408 457 301 355 349 411 580 446 470 564 341 374 395

朝 103 103 102 104 104 109 118 107 102 102 102 103 110 103 102 106 102 102 102

昼 182 181 181 183 184 192 208 189 180 180 180 181 193 181 180 188 180 180 180

夜 90 89 89 90 90 94 102 93 89 89 89 89 95 89 89 93 89 89 89

合計 376 373 372 376 378 395 428 389 371 371 371 373 398 373 372 387 371 371 371

55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55

53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53

ホットドリンク

サンドイッチ

デザート

パン

日付

曜日

最高気温

降水量

予測来客数

来客数

差異

コールドドリンク

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

予測 497 599 577 570 489 385 473 436 554 513 518 471 343 444 426 355 524 499 483

結果 537 586 607 607 420 403 470 433 594 485 495 416 344 466 437 378 536 446 495

差異 -40 13 -30 -37 69 -18 3 3 -40 28 23 55 -1 -22 -11 -23 -12 53 -12

日付

コールドドリンク

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

予測 376 242 272 280 387 524 408 457 301 355 349 411 580 446 470 564 341 374 395

結果 369 297 284 238 399 564 508 470 283 387 319 404 618 409 394 539 338 345 367

差異 7 -55 -12 42 -12 -40 -100 -13 18 -32 30 7 -38 37 76 25 3 29 28

日付

ホットドリンク

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

予測 376 373 372 376 378 395 428 389 371 371 371 373 398 373 372 387 371 371 371

結果 425 447 416 405 475 513 560 518 450 480 462 452 516 484 429 479 437 424 412

差異 -49 -74 -44 -29 -97 -118 -132 -129 -79 -109 -91 -79 -118 -111 -57 -92 -66 -53 -41

日付

パン

Page 52: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

49

表 7.12 予測と結果の差異(サンドイッチ)

表 7.13 予測と結果の差異(デザート)

表 7.9~表 7.13 で、予測の行は表 7.8 で出したそれぞれの予測販売個数、結果の行は実際の

販売個数、差異の行は予測から結果を引いたものであり、差異の数値に符号がついていな

いとき、予測の方がその数値分多く、マイナスの符号がついているとき予測の方がその数

値の絶対値分少ないことを表す。

ドリンクについては、コールドドリンク・ホットドリンク共に回帰分析によって得られた

近似式を用いて予測を立てているため誤差が 100 以内に収まっている。

パンについては最高気温に関係なく平均 450 個ほど売れるという結果が出ていたが、この

予測では平均 370 個程度となってしまったため、全日実際の販売個数より少ない予測とな

っている。

サンドイッチとデザートについては、予測が困難であり実際の販売個数の平均を予測とし

たため、予測の個数が実際より多い人少ない日が両方存在する結果となった。

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

予測 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55 55

結果 36 46 57 43 58 63 60 57 56 68 49 56 66 52 56 64 55 50 52

差異 19 9 -2 12 -3 -8 -5 -2 -1 -13 6 -1 -11 3 -1 -9 0 5 3

日付

サンドイッチ

1 2 3 4 7 8 9 10 11 14 15 16 17 18 24 25 28 29 30

予測 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53 53

結果 60 50 53 61 37 40 48 69 61 56 63 56 40 49 73 37 57 55 48

差異 -7 3 0 -8 16 13 5 -16 -8 -3 -10 -3 13 4 -20 16 -4 -2 5

日付

デザート

Page 53: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

50

第 8 章

おわりに

8.1 まとめ

本研究では、駅改札横にある某コーヒーショップの売り上げデータを用いて、回帰分析

とアソシエーション分析によるデータの分析、分析から得られた結果を用いた仕入れ戦略

の構築を行った。第 5 章では、回帰分析を用いてメニューの各カテゴリーの販売個数と気

象条件の相関関係を調べた。コールドドリンク及びホットドリンクは最高気温との間に大

きな相関が見られ、パンと降水量の間にはわずかに相関関係が見られた。また、1 日の総来

店客数は降水量によって説明することができ、降水量が増加すると来店客数も増加するこ

とがわかった。降水量が増えると客数も増えるのに対しドリンクの販売個数が増えること

はないが、パンの販売個数は増加した。これは、雨が降るとパンのみを買って帰宅する顧

客が多いからであると考えられる。第 6 章では、アソシエーション分析を用いて購買デー

タからカテゴリーごとの買い合わせの傾向を求めた。朝はドリンクの販売個数の約 4 割、

昼は気温が高い日はドリンクの販売個数の約 5 割、気温が高い日はホットドリンクの販売

個数の約 5 割とコールドドリンクの販売個数の約 4 割が食事と一緒に購入されていること

がわかった。気温が上がるとコールドドリンクの販売個数は増加するが食事との同時購入

の割合は減少している。これは、気温が上がるとコールドドリンク単品での注文が増加す

ることによると考えられる。第 7 章では、第 5 章と第 6 章で得られた結果を用いて気温と

降水量からカテゴリーごとの販売個数を予測し仕入れ戦略の構築を試みたが、あまりいい

結果は得られなかった。これは採集したデータの量が少なく、信頼度の高い傾向があまり

見られなかったことが原因と考えられる。

8.2 今後の課題

本研究では、採集できるデータにかなり限りがあり、特に買い合わせの傾向についてあ

まりいい結果が見られなかった。また、それにより販売個数の予測に関して、仕入れ戦略

の構築を行うにあたり十分な結果は得られなかった。分析するデータの量を増やし様々の

パターンで分析することができれば、気象条件を元にして全てのカテゴリーの販売個数を

予測し、最適な仕入れ戦略を構築できると考えられる。さらに、本研究ではメニューをカ

テゴリーに分けカテゴリーごとに分析・考察を行ったが、ここからさらにメニューひとつ

ひとつに広げていければ実用性のある結果が得られるはずである。

Page 54: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

51

謝辞

本研究を進めるにあたり、多くのご指導、ご助言を頂いた中央大学理工学部情報工学科

田口東教授に深く感謝いたします。また、多くのご助言、ご協力を頂いた山形浩一氏をは

じめとする、田口研究室の皆様に深く感謝いたします。

Page 55: コーヒーショップにおける売り上げデータの分析と最適な ......あらまし アルバイト先の駅併設コーヒーショップでは日々売り上げが変動しており、来客が少ない

52

参考文献

[1] 藤澤克樹・後藤順哉・安井雄一郎、“Excel で学ぶ OR”、オーム社、2011.

[2] 株式会社数理システム、“Visual Mining Studio チュートリアル”、2012.

[3] 気象庁、“過去の気象データ検索”、(オンライン)入手先

<www.data.jma.go.jp/obd/stats/etrn/index.php>