19
Knygų paklausos prognozavimo elektroniniame knygyne galimybės 2015-09-19 Aurimas Rapečka, dr. Virginijus Marcinkevičius

Aurimas RAPEČKA, Virginijus MARCINKEVIČIUS. Knygų paklausos prognozavimo elektroniniame knygyne galimybės

Embed Size (px)

Citation preview

Knygų paklausos prognozavimo elektroniniame knygyne galimybės

2015-09-19

Aurimas Rapečka, dr. Virginijus Marcinkevičius

Reikia žinoti kiek knygos egzempliorių turėti◦ Pristatymo laikas◦ Grąžinimo kaštai

Ypač aktualu naujoms knygoms

Prognozavimo poreikis

Tyrimui pateiktoje pirkimo istorijoje užfiksuota 84140 knygų pardavimų, kurių metu parduota 15020 skirtingų knygų

Laikotarpis: nuo 2008-05-09 iki 2014-12-01

Formatas:

Tiriami duomenys

Laikas Pirkimo ID Knygos ID Kategorijos ID

Autoriaus ID

Leidėjo ID Kaina

Duomenų pjūviai (1)

2 137 272 407 542 677 812 947 108212171352148716281791198422710

50

100

150

200

250

Diena prekyboje

Pard

avim

ų sk

aiči

us

Per pirmas 7 dienas įvykdyta 1482 iš 47205 pirkimų, arba 3,14%, per pirmas 30 dienų – 4923, arba 10,43% visų pirkimų, o per pirmas 100 dienų – 11521, arba 24,41%.

Duomenų pjūviai (2)

1 2 3 4 5 6 7 8 9 10 11 120

1000

2000

3000

4000

5000

6000

Mėnuo

Pard

avim

ų sk

aiči

us

Pardavimai pagal mėnesį

Duomenų pjūviai (3)

1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930310

200400600800

100012001400160018002000

Mėnesio diena

Pard

avim

ų sk

aiči

usPardavimai pagal mėnesio dieną

Duomenų pjūviai (4)

050

100150200250300350400450

Knyga

Pard

avim

ų sk

aiči

usIndividualių knygų pardavimai

Duomenų pjūviai (5)

0

1000

2000

3000

4000

5000

6000

Leidykla

Pard

avim

ų sk

aiči

usLeidyklų knygų pardavimai

Trumpo laikotarpio prognozavimo kliūtys

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 250

200400600800

10001200140016001800

Knygos pardavimų skaičius

Knyg

ų sk

aiči

us

30 dienų laikotarpis – dauguma knygų parduota tik 1 arba 2 kartus

Prognozavimo kliūtys

Rinkinyje saugoma informacija yra labai fragmentiška, o prognozavimui tinkamų duomenų dalis yra maža.

Prekybos sezoniškumas tiek metų, tiek mėnesio dienų bėgyje jaučiamas labai silpnai.

Rinkinyje yra daug nepalankių prognozavimui knygų, kurių parduodama mažiau nei 1 per savaitę ar per mėnesį.

Naujų knygų sąsajos su jau esančiomis

Prognozavimo metodų pasirinkimasARIMA – autoregresinis integruotas slankiųjų vidurkių metodas

– autoregresijos komponentė, – diferencijavimo eilė, – slenkamojo vidurkio narių skaičius, – sezoniškumo autoregresijos komponentė, – sezoninio diferencijavimo eilė ir – sezoninė slenkančio vidurkio komponentė

Programinė įranga

Paketas Programinė įrangaApribojimai

komerciniam naudojimui

Tiesioginis ryšys su serveriu

XLSTAT Microsoft Excel Mokama NėraVidinis MatLab Mokama Įmanomas per SQL

forecast R NėraTiesioginis, per SQL, per

R.NET

Arima ForecastingWessa (per interneto

naršyklę)Nėra Nėra

Vidinis NCSS Mokama NėraVidinis Cronos Nėra Nėra

strategico R NėraTiesioginis, per SQL, per

R.NET

PEERForecaster Microsoft Excel Mokama Nėra

ARIMA parametrų parinkimas 1,0,0 1,1,0 5,1,0 5,1,1 12,1,0 12,1,1 16,1,1 16,3,0 16,0,0

RMSE 74,59 73,81 72,39 70,80 70,09 70,09 69,75 69,74 69,69 AICC 3904 3899 3894 3865 3887 3873 3878 3898 3893

* Skaičiai antraštinėse celėse atitinka 𝑝, 𝑞, 𝑑 parametrus 𝐴𝑅𝐼𝑀𝐴(𝑝,𝑞,𝑑) metode

0 50 100 150 200 250 300 3500

200

400

600

800

1000

1200

Periodas

Pard

avim

ai

ARIMA(16,1,1) savaičių prognozės palyginimas su realiais duomenimis

ARIMA parametrų parinkimas3 lentelė. Geriausiai ir blogiausiai knygų pardavimus prognozuojantys modeliai 𝒑 𝒒 𝒅 AICC vidurkis Sąlyginis efektyvumas

4 3 1 195 100% 1 4 1 200 98% 4 2 1 200 98% 1 6 1 201 97% 2 2 0 203 96%

<...> 2 3 0 222 86% 0 3 0 223 85,5% 0 4 0 223 85,5% 0 2 0 227 83,5% 0 1 0 241 76,5%

00.10.20.30.40.50.60.70.80.9

1

Elektroniniams knygynams labai svarbu laiku patenkinti atsiradusią paklausą, tam reikia pakankamai tiksliai ją prognozuoti, siekiant užtikrinti greitą pristatymą.

Vienas iš geriausiai vertinamų laiko eilučių analizės metodų – autoregresinis integruotas slenkamųjų vidurkių (ARIMA) metodas. Šio meto esmė – autoregresijos, diferencijavimo ir slenkančiojo vidurkio komponenčių sujungimas.

Išvados

◦ Iš tyrimams pateikto duomenų rinkinio su knygų prekybos istorija pastebėta, kad prekybos pikas jaučiamas pirmosiomis dienomis po pirmojo knygos pardavimo ir vėliau palaipsniui mažėja. Reikia pažymėti, kad gana didelė knygų paklausa pastebima net dvejus metus po knygos išleidimo. Tai – šiek tiek netikėtas analizės rezultatas. Pardavimų sezoniškumas juntamas, tačiau nėra stipriai išreikštas. Mėnesio dienų sezoniškumų nepastebėta.

Išvados

Nustatyta, kad geriausius viso asortimento paklausos prognozavimo rezultatus demonstruoja šie ARIMA(p,q,d) modeliai:

Ketvirčiuose: ARIMA(5,4,1).Mėnesiuose: ARIMA(17,0,1).Savaitėse: ARIMA(16,1,0), ARIMA(16,3,0), ARIMA(16,1,1).

Geriausius individualių komponenčių paklausos prognozavimo savaitės laikotarpiu rezultatus demonstruoja šie ARIMA(p,q,d) modeliai:

Individualioms knygoms: ARIMA(4,3,1).Autoriams: ARIMA(4,2,1); ARIMA(0,4,0)

(nerekomenduojama naudoti). Kategorijoms: ARIMA(6,2,1), ARIMA(4,2,1), ARIMA(3,2,1). Leidykloms: ARIMA(5,2,1), ARIMA(3,2,1).

Išvados

Ačiū už dėmesį