12

Click here to load reader

Time Series Decomposition

Embed Size (px)

DESCRIPTION

Time series

Citation preview

Page 1: Time Series Decomposition

2/20/2011

1

Phân rã chuỗi thời gian

Lời giới thiệu

� Bất kì chuỗi thời gian nào cũng đều có thể được

phân rã theo các thành phần:

- Xu hướng (Trend)

- Chu kỳ (Cycle)

- Mùa vụ (Seasonal)

- Sai số (Error)

Việc phân rã này có thể giúp cho việc dự báo biến

động của chuỗi trong tương lai.

Page 2: Time Series Decomposition

2/20/2011

2

Lời giới thiệu

� Thành phần xu hướng đại điện cho sự thay đổitrong dài hạn của chuỗi

� Thành phần chu kì phản ánh những thay đổi do một sự kiện/chính sách nào đó gây ra.

� Thành phần mùa vụ là những biến động được lặpđi lặp lại sau một khoảng thời gian nhất định. Nóthường gây ra bởi các yếu tố như mùa mưa, kìnghỉ lễ tết,…

� Thành phần sai số là không dự đoán được.

Phương pháp phân rã

� Một chuỗi thời gian bất kì có thể được biểu diễn dưới

dạng toán sau:

� Yt là giá trị thực tế của chuỗi thời gian tại thời điểm t.

� St là chỉ số mùa vụ tại thời điểm t.

� Tt là thành phần xu hướng tại thời điểm t.

� Ct là thành phần chu kì tại thời điểm t.

� et là thành phần ngẫu nhiên (phần còn lại) tại thời điểm t.

( , , , )t t t t t

Y f S T C e=

Page 3: Time Series Decomposition

2/20/2011

3

Phương pháp phân rã

� Dạng hàm chính xác của f phụ thuộc vàophương pháp phân rã. Thông thường có hai cách sau:

� Mô hình dạng tổng

� Mô hình dạng tích

t t t t tY S T C e= + + +

t t t t tY S T C e= × × ×

Phương pháp phân rã

� Mô hình dạng tổng thường

được sử dụng nếu độ lớn

của các biến động mang

tính mùa vụ không thay

đổi theo giá trị của chuỗi.

� Hình vẽ bên biểu diễn

doanh số bán lẻ của các

cửa hàng ở Mĩ từ 1/1992

đến 5/2002.

Page 4: Time Series Decomposition

2/20/2011

4

Phương pháp phân rã

� Mô hình dạng tích thườngthích hợp với các chuỗi sốcó biến động mang tínhmùa vụ tăng theo giá trịcủa chuỗi.

� Hình vẽ bên biểu diễn sốmáy chơi nhạc DVD đượcbán mỗi tháng từ 4/1997 đến 6/2002.

Phương pháp phân rã

� Mô hình dạng tích có thể được chuyển đổi về môhình dạng tổng bằng cách lấy logarithm chuỗi thờigian.

� Ví dụ

t t t t tY S T C e= × × ×

t t t t tLogY LogS LogT LogC Loge= + + +

Page 5: Time Series Decomposition

2/20/2011

5

Điều chỉnh mùa vụ

� Việc phân ra giúp cho chúng ta dễ dàng có

được số liệu được điều chỉnh theo mùa vụ.

� Với mô hình dạng tổng, số liệu điều chỉnh

theo mùa vụ được tính bằng cách loại trừ đi

thành phần mùa vụ.

t t t t tY S T C e− = + +

Điều chỉnh mùa vụ

� Đối với mô hình dạng tích, số liệu điềuchỉnh theo mùa vụ có thể được tính bằngcách chia số liệu gốc ban đầu cho chỉ sốmùa vụ.

� Hầu hết các số liệu công bố của cơ quanthống kê trên thế giới (trừ Việt Nam) là sốliệu đã được điều chỉnh theo mùa vụ.

tt t t

t

YT C e

S= + +

Page 6: Time Series Decomposition

2/20/2011

6

Điều chỉnh mùa vụ

� Quá trình loại bỏ yếu tố mùa vụ khỏi chuỗisố liệu rất hữu ích bởi vì:

� Nó cho phép chúng ta nhìn rõ hơn những thànhphần cơ bản của chuỗi số liệu.

� Đo lường được mức độ mùa vụ thông qua việctính toán các chỉ số mùa vụ.

� Tăng tính chính xác của việc dự báo.

Phương pháp phân rã

� Mô hình dạng tích

� Giả sử chuỗi thời gian tuân theo mô hình dạng

tích (Xem hình vẽ để xác định)

Page 7: Time Series Decomposition

2/20/2011

7

Loại bỏ yếu tố mùa vụ

� Thành phần Tt, Ct có thể được tính toán sử dụng

phương pháp trung bình trượt trọng tâm (CMA

centered moving average). Cách tính này giúp

loại bỏ những dao động ngắn hạn khỏi số liệu.

� Những biến động ngắn hạn này bao gồm cả biến

động mùa vụ và biến động ngẫu nhiên.

Loại bỏ yếu tố mùa vụ

� Trung bình trượt được định nghĩa là giá trịtrung bình của các thời kì tạo nên tính mùavụ của chuỗi số.

� Số thời kì để tính trung bình trượt của số liệutháng sẽ là 12 - MA(12)

� Số thời kì để tính trung bình trượt của số liệuquý sẽ là 4 - MA(4).

� Trung bình trượt trọng tâm (CMA) sẽ cho tagiá trị “điển hình” của Y trong khoảng mộtnăm xoay quanh thời điểm t.

Page 8: Time Series Decomposition

2/20/2011

8

Loại bỏ yếu tố mùa vụ

� Ví dụ:

Year Quarter Time indexY MA CMA

1 1 1 10

2 2 18

3 3 20

4 4 12

2 1 5 12

2 6 20

3 7 24

4 8 13

3 1 9 14

2 10 22

3 11 28

4 12 16

Loại bỏ yếu tố mùa vụ

� Trung bình trượt trọng tâm phản ánh số liệu

đã được loại bỏ yếu tố mùa vụ.

� Mức độ mùa vụ, được gọi là chỉ số mùa vụ(SF), là tỉ số giữa giá trị thực với giá trịđược loại bỏ yếu tố mùa vụ. Tức là

t

tt

CMA

YSF =

Page 9: Time Series Decomposition

2/20/2011

9

Loại bỏ yếu tố mùa vụ

� Chỉ số mùa vụ lớn hơn 1 cho biết thời kì đó

giá trị của Y lớn hơn giá trị trung bình,

ngược lại nếu chỉ số mùa vụ nhỏ hơn 1 sẽcho biết giá trị của Y nhỏ hơn giá trị trung

bình.

Phân rã thành phần xu hướng và

chu kì

� Thành phần xu hướng có thể được mô tả qua mộtđường thẳng hoặc đường cong chạy xuyên qua cácđiểm số liệu.

� Thành phần xu hướng được ước lượng từ số liệuđã loại trừ yếu tố mùa vụ.

Page 10: Time Series Decomposition

2/20/2011

10

Phân rã thành phần xu hướng và

chu kì

� Thông thường có hai cách xác định thành phần xuhướng:

� (1) Chúng ta có thể ước lượng phương trình hồiquy đơn giản sau:

� Trong đó time =1 với thời kì đầu tiên trong chuỗi sốliệu và tăng dần sau đó.

� Phương pháp OLS có thể được sử dụng để ước lượng a và b. Sau đó a và b được sử dụng để ước lượng xuhướng và chu kì của chuỗi số.

CMA a b time= + ×

Phân rã thành phần xu hướng và

chu kì

� (2) Sử dụng phương pháp lọc HP (hodrick prescottfilter).

� Phương pháp này xác định thành phần xu hướng τbằng cách tối thiểu hóa đại lượng sau:

� λ = 100 với số liệu năm, 1600 với số liệu quý và14.400 với số liệu tháng.

12 2

1 1

1 2

( ) ( ( ) ( ) )T T

t t t t t t

t t

y τ λ τ τ τ τ

+ −

= =

− + − − −∑ ∑

Page 11: Time Series Decomposition

2/20/2011

11

Xác định thành phần chu kì

� Thành phần chu kì có

thể được tính như sau:Year QuarterTime index Y CMA CMAT CF

1 1 1 10 14

2 2 18 14.6

3 3 20 15.3 15.2 1.003

4 4 12 15.8 15.8 0.997

2 1 5 12 16.5 16.4 1.006

2 6 20 17.1 17 1.007

3 7 24 17.5 17.6 0.994

4 8 13 18 18.2 0.989

3 1 9 14 18.8 18.8 0.997

2 10 22 19.6 19.4 1.012

3 11 28

4 12 16

003.115.2

15.3

CMAT

CMACF

CMAT

CMACF

3

33

t

tt

===

=

Phương pháp phân rã

� Mô hình dạng tổng

� Giả sử rằng chuỗi thời gian tuân theo mô hình

dạng tổng.

� Bước 1: Xác định thành phần xu hướng và chu kì sửdụng CMA bậc k.

� Bước 2: Xác định thành phần mùa vụ và sai số bằng

cách trừ đi CMA

t t t t tY T C S E− − = +

Page 12: Time Series Decomposition

2/20/2011

12

Phương pháp phân rã

� Mô hình dạng tổng

� Bước 3: Trong mô hình này chúng ta giả định thành

phần chu kì cố định từ năm này qua năm khác nên

chỉ số mùa vụ sẽ là trung bình cộng của các giá trịđã loại bỏ thành phần xu hướng và chu kì ở các thời

kì tương ứng.