14
TP SAN TIN HC QUẢN LÝ Tp 04, s1&2, 2015, 55-68. DỰ BÁO THỜI ĐIỂM MUA BÁN CHỨNG KHOÁN KẾT HỢP PHƯƠNG PHÁP PHÂN ĐOẠN DỮ LIỆU VÀ VECTƠ HỖ TRỢ HỒI QUY Đặng Công Tâm 1 Trn Hng Trang 1 Dương Minh Đức 1 Tóm tắt: Trong bài báo này, chúng tôi sử dụng phương pháp hồi quy vectơ hỗ tr(SVR) và phân đoạn dliệu (TBSM) để xây dựng mô hình dự báo thời điểm mua bán chứng khoán tại thtrường Mtrên sàn NASDAQ. TBSM được dùng để phân đoạn chui dliu thời gian thành các xu hướng phản ánh đồ thgiá tạo nên những tín hiệu giao dch, những tín hiệu này kết hp với các chỉ skthuật được đưa vào SVR huấn luyện để tìm ra các điểm mua bán. Hướng tiếp cn tập trung nghiên cứu vào việc thay đổi các giá trị ngưỡng và tham số cũng như các tín hiệu tạo điểm giao dịch đem lại li nhuận cao hơn so với các nghiên cứu trước. Tkhóa: TBS Method, Support Vector Regression, Stepwise Regression Analysis. 1 GII THIU Dbáo thời điểm mua bán chứng khoán trong tương lai là một đề tài nghiên cứu rộng rãi trong nhiều lĩnh vực như thương mại, tài chính, thống kê, khoa học máy tính, v.v.. nhằm tìm ra các thời điểm mua bán cổ phiếu đem lại li nhuận cho các nhà đầu tư. Các chuyên gia giao dịch thường sdụng phân tích cơ bản và phân tích kthuật để phân tích cổ phiếu và ra quyết định đầu tư. Phân tích cơ bản là một phương pháp truyền thống liên quan đến các nghiên cứu vnguyên tắc cơ bản ca một công ty như doanh thu, phí tổn, vtrí thị trường, tốc độ tăng trưởng hàng năm (Murphy,1999) [14]. Ngược lại, phân tích kỹ thut chnghiên cứu vbiến động giá trên thị trường, các nhà phân tích chỉ tập trung nghiên cứu mô hình giá và sử dng nhng dliệu giá khác nhau để tính toán dự báo biến động giá trong tương lai (Turner, 2007) [15]. Phân tích kỹ thuật được xây dựng vi mt nim tin rằng giá chin tại đại din cho tt cthông tin về tài sản đó cũng như giá cả phản ánh mọi thtrên thị trường. Theo lý thuyết Dow, nghiên cứu vgiá là yêu cầu cn thiết và đầy đủ nht. Tuy nhiên, gần đầy cộng đồng nghiên cứu tp trung nhiều vào các kỹ thuật tính toán mềm như ANN [1][2][3] hay SVR [4][5]… Hơn nữa, nhằm nâng cao độ chính xác dự đoán, các nghiên cứu sdng lai ANN hay SVR với các kỹ thuật trí tunhân tạo khác. Davoud và Taheri [3] kết hp chn lc chskthut bng PCA/SRA và ANN. Hay Yanru Xu [6] áp dụng 2 phương pháp kết hp SVM-RFE và RF-RFE để chọn ra các đặc tính của thtrường chứng khoán có ảnh hưởng đến sbiến động giá để dbáo xu hướng giá. Ngoài ra còn có Huang và Wu [7] sử 1 Khoa Hthống Thông tin, Trường Đại học Công nghệ Thông tin – Đại Hc Quc gia TP.HCM.

Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Embed Size (px)

DESCRIPTION

Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Citation preview

Page 1: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

TẬP SAN TIN HỌC QUẢN LÝ

Tập 04, số 1&2, 2015, 55-68.

DỰ BÁO THỜI ĐIỂM MUA BÁN CHỨNG KHOÁN

KẾT HỢP PHƯƠNG PHÁP PHÂN ĐOẠN DỮ LIỆU VÀ

VECTƠ HỖ TRỢ HỒI QUY

Đặng Công Tâm1

Trần Hồng Trang1

Dương Minh Đức 1

Tóm tắt: Trong bài báo này, chúng tôi sử dụng phương pháp hồi quy vectơ hỗ trợ (SVR)

và phân đoạn dữ liệu (TBSM) để xây dựng mô hình dự báo thời điểm mua bán chứng

khoán tại thị trường Mỹ trên sàn NASDAQ. TBSM được dùng để phân đoạn chuỗi dữ liệu

thời gian thành các xu hướng phản ánh đồ thị giá tạo nên những tín hiệu giao dịch,

những tín hiệu này kết hợp với các chỉ số kỹ thuật được đưa vào SVR huấn luyện để tìm

ra các điểm mua bán. Hướng tiếp cận tập trung nghiên cứu vào việc thay đổi các giá trị

ngưỡng và tham số cũng như các tín hiệu tạo điểm giao dịch đem lại lợi nhuận cao hơn

so với các nghiên cứu trước.

Từ khóa: TBS Method, Support Vector Regression, Stepwise Regression Analysis.

1 GIỚI THIỆU

Dự báo thời điểm mua bán chứng khoán trong tương lai là một đề tài nghiên cứu

rộng rãi trong nhiều lĩnh vực như thương mại, tài chính, thống kê, khoa học máy

tính, v.v.. nhằm tìm ra các thời điểm mua bán cổ phiếu đem lại lợi nhuận cho các

nhà đầu tư. Các chuyên gia giao dịch thường sử dụng phân tích cơ bản và phân tích

kỹ thuật để phân tích cổ phiếu và ra quyết định đầu tư. Phân tích cơ bản là một

phương pháp truyền thống liên quan đến các nghiên cứu về nguyên tắc cơ bản của

một công ty như doanh thu, phí tổn, vị trí thị trường, tốc độ tăng trưởng hàng năm

(Murphy,1999) [14]. Ngược lại, phân tích kỹ thuật chỉ nghiên cứu về biến động giá

trên thị trường, các nhà phân tích chỉ tập trung nghiên cứu mô hình giá và sử dụng

những dữ liệu giá khác nhau để tính toán dự báo biến động giá trong tương lai

(Turner, 2007) [15]. Phân tích kỹ thuật được xây dựng với một niềm tin rằng giá

cả hiện tại đại diện cho tất cả thông tin về tài sản đó cũng như giá cả phản ánh mọi

thứ trên thị trường. Theo lý thuyết Dow, nghiên cứu về giá là yêu cầu cần thiết và

đầy đủ nhất.

Tuy nhiên, gần đầy cộng đồng nghiên cứu tập trung nhiều vào các kỹ thuật tính

toán mềm như ANN [1][2][3] hay SVR [4][5]… Hơn nữa, nhằm nâng cao độ

chính xác dự đoán, các nghiên cứu sử dụng lai ANN hay SVR với các kỹ thuật trí

tuệ nhân tạo khác. Davoud và Taheri [3] kết hợp chọn lọc chỉ số kỹ thuật bằng

PCA/SRA và ANN. Hay Yanru Xu [6] áp dụng 2 phương pháp kết hợp SVM-RFE

và RF-RFE để chọn ra các đặc tính của thị trường chứng khoán có ảnh hưởng đến

sự biến động giá để dự báo xu hướng giá. Ngoài ra còn có Huang và Wu [7] sử

1 Khoa Hệ thống Thông tin, Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM.

Page 2: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

56

dụng GA để chọn các đặc trưng đầu vào kết hợp với SVM, Huang và Tsai [8] dùng

hệ số quyết định r2

kết hợp SVR. Bên cạnh việc lựa chọn các đặc trưng đầu vào thì

việc phân chia dữ liệu thành các cụm rồi xây dựng mô hình dự đoán cho mỗi cụm

cũng là đề xuất khá là hay cho bài toán dự đoán chứng khoán. Cụ thể, như Afolabi

và Olude [9] kết hợp thuật toán gom cụm SOM với ANN, Huang và Tsai [8] kết

hợp SOM với SVR.

Trong bài báo này, chúng tôi đề xuất phương pháp lai TBSM-SVR để dự đoán giá

cổ phiếu ở thị trường chứng khoán Mỹ. Trong phương pháp lai này, TBSM thực

hiện nhiệm vụ làm mượt đường giá ban đầu của chuỗi thời gian thành các đoạn xu

hướng phản ánh gần đúng với biến động của chuỗi giá với mục tiêu giảm nhiễu và

giảm thời gian dự báo đồng thời SRA lựa chọn các chỉ số kỹ thuật quan trọng nhất

để thiết lập đầu vào. Sau đó, các xu hướng được số hóa và các chỉ số kỹ thuật được

chọn sẽ được dùng để huấn luyện SVR và cho ra mô hình dự đoán. Việc cần thiết

trong mô hình này là điều chỉnh tham số sao cho lợi nhuận thu được là cao hơn có

thể. Chúng tôi đã nghiên cứu và chỉnh sửa ngưỡng tham số của TBSM và SVR với

hiệu suất tốt hơn mô hình trước [10].

2 MÔ HÌNH ĐỀ XUẤT

Trong việc xác định thời điểm mua bán chứng khoán. Ta cần phải quan tâm các

yếu tố:

Dữ liệu đầu vào: Phương pháp tiếp cận của bài báo là dựa trên lịch sử giá

chứng khoán bao gồm: Giá đóng cửa, giá mở cửa, giá cao nhất, giá thấp nhất.

Mục tiêu: Xác định các thời điểm mua hoặc bán chứng khoán sao cho tổng lợi

nhuận đạt được là cao nhất.

Khoảng thời gian xem xét: Nghiên cứu trong bài báo tập trung ra quyết định

thời điểm mua bán trong ngắn hạn và trung hạn với các chỉ số kỹ thuật có các

thời gian tương ứng.

2.1 Các bước chính trong mô hình dự báo

Bài toán dự báo thời điểm mua bán chứng khoán sử dụng bộ dữ liệu giá bao gồm

Giá đóng cửa, Giá mở cửa, Giá cao nhất, Giá thấp nhất, Khối lượng giao dịch.

Mục tiêu cuối cùng của hệ thống là đưa ra được mô hình dự báo với các ngưỡng

mua và bán để xác định điểm mua / bán thích hợp dựa trên lịch sử giá.

Hệ thống chúng tôi được chia làm 2 bước chính: bước huấn luyện và bước kiểm

tra. Trong bước huấn luyện, chúng tôi sẽ chuẩn bị một tập dữ liệu huấn luyện bao

gồm 5 loại giá trong ngày. Tập dữ liệu này sẽ được chia thành 2 phần: Phần 1 gồm

giá đóng cửa qua TBSM được số hóa thành 3 phân đoạn phản ánh 3 xu hướng của

giá chứng khoán có giá trị nằm trong khoảng [0,1]; Phần 2 gồm tất cả các loại giá

còn lại để tính toán các chỉ số kỹ thuật. Kết quả của 2 phần trên là đầu vào cho

phương pháp huấn luyện máy học để xây dựng ra một mô hình được sử dụng trong

bước kiểm tra để tìm độ lợi nhuận của mô hình dự đoán. Mô hình dự đoán được

mô tả như hình 1 gồm:

Page 3: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

57

Hình 1. Mô hình hệ thống

Huấn luyện dữ liệu:

(1) Lấy dữ liệu giá đóng cửa của cổ phiếu

(2) Tạo các điểm ngoặt theo xu hướng bằng phương pháp TBSM

(3) Số hóa các đoạn xu hướng trong miền [0,1]; gọi là các tín hiệu giao dịch

(4) Tính toán các chỉ số kỹ thuật dựa trên giá (đóng cửa, mở cửa, cao nhất, thấp

nhất) và khối lượng

(5) Chọn lọc các biến tương quan bằng phương pháp SRA; chuẩn hóa dữ liệu trong

miền [0,1]

(6) Dùng các tín hiệu giao dịch và các chỉ số kỹ thuật làm đầu vào cho huấn luyện

máy học

(7) Chọn bộ tham số tối ưu cho mô hình

(8) Tạo ra được mô hình dự báo cùng với các ngưỡng mua/bán

Chi tiết mô hình hệ thống như sau:

(1) Lấy bộ dữ liệu giá chứng khoán

Trong bài báo này, chúng tôi chọn dữ liệu chứng khoán của các mã AAPL, XOM,

BA, JNJ, CAT trong khoảng thời gian từ tháng 01/2007 đến tháng 06/2009.

(2) Tạo các điểm ngoặt theo xu hướng bằng phương pháp TBSM

Trong bài toán chuỗi thời gian có nhiều phương pháp tiếp cận như Fourier

transform, Wavelets, và PLR để tìm các điểm ngoặt trong dữ liệu chuỗi thời gian.

Dựa theo yêu cầu của đề tài chúng tôi thì phương pháp PLR là cần thiết. PLR được

sử dụng trong các nghiên cứu [11][12][13] cho kết quả với độ chính xác khá cao.

Thêm nữa, PLR là một hướng tiếp cận để phân đoạn khá tốt trong việc tìm ra các

xu hướng giá tuy nhiên với những chuỗi giá phức tạp và nhiều biến động hay cụ

thể hơn là nhiều xu hướng thì PLR lại không phát huy được lợi thế của nó. Vì thế,

trong nghiên cứu này, chúng tôi sẽ sử dụng phương pháp phân đoạn đa xu hướng

Page 4: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

58

là TBSM để phân chia chuỗi dữ liệu giá chứng khoán thực thành 3 xu hướng phản

ánh đúng với xu hướng thực của giá chứng khoán. Từ đó, chúng ta sẽ có được

những tín hiệu giao dịch tốt đem lại lợi nhuận cao trên thị trường chứng khoán.

Chuỗi dữ liệu giá chứng khoán được phân thành 3 xu hướng: Tăng, giảm và không

đổi. Tại những điểm chuyển tiếp của các xu hướng gọi là điểm ngoặt. Nhiệm vụ

của phần này là tìm ra được các điểm ngoặt trên chuỗi dữ liệu. Tuy nhiên, vì giá

chứng khoán của mỗi phân đoạn là khác nhau, do đó chúng ta cần phải chuyển các

phân đoạn đó thành các giá trị có giới hạn miền thuộc [0,1] gọi là các tín hiệu giao

dịch.

Hình 2. Mô phỏng thuật toán TBSM [10]

(3) Số hóa các đoạn xu hướng trong miền [0,1]: gọi là các tín hiệu giao dịch

Trong bước này, nhiệm vụ là tính toán các tín hiệu giao dịch trong chuỗi thời gian.

Trong phần trước, chúng ta chia chuỗi dữ liệu thành một số phân đoạn xu hướng.

Chúng ta đề xuất một phân đoạn Sk là Tăng thì giá trị Tín hiệu giao dịch Sk’ có

miền giá trị là <0, 0.1,…,1>, nếu Sk là Không đổi thì Sk’ =<0.5,..,0.5>, nếu Sk là

Giảm thì Sk’=<1,0.9,…, 0>. Chúng tôi sử dụng cách thức chuyển đổi này như [10]

đã đề cập.

Hình 3. Số hóa các đoạn thành tín hiệu giao dịch

Page 5: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

59

(4) & (5): Tính toán và Chọn lọc các chỉ số kỹ thuật

Mỗi loại chỉ số kỹ thuật có những tham số cần phải điều chỉnh; vì thế, trước khi sử

dụng các chỉ số kỹ thuật để xác định tín hiệu giao dịch của mã chứng khoán nào

đó, chúng ta phải kiểm tra khả năng tương thích của cổ phiếu đối với chỉ số đó.

Ứng với mỗi mã chứng khoán thì sẽ bị ảnh hưởng bới các chỉ số kỹ thuật khác

nhau.

Đầu vào của hệ thống ngoài các tín hiệu giao dịch còn có các chỉ số kỹ thuật kèm

theo bao gồm các chỉ số kỹ thuật như bảng 1:

Loại chỉ số Chỉ số kỹ thuật

Đường trung bình 5MA, 6MA, 10MA, 20MA

BIAS 5BIAS, 10BIAS

Chỉ số sức mạnh tương đối 6RSI, 12 RSI

Stochatics 9K, 9D

Trung bình phân kỳ hội tụ 9MACD

Williams %R 12W%R

Độ chênh lệch của các chỉ số kỹ

thuật ngày t và t+1 (t là ngày hiện

tại)

Δ5MA, Δ6MA, Δ10MA, Δ5BIAS, Δ10BIAS,

Δ6RSI, Δ12RSI, Δ9K, Δ9D, Δ9MACD,

Δ12W%R

Bảng 1:

Nghiên cứu dùng SVM để quản lý vấn đề về trọng số của các chỉ số kỹ thuật từ tập

dữ liệu huấn luyện. Tuy nhiên, việc chọn tất cả các chỉ số kỹ thuật với nhiều cách

điều chỉnh tham số có thể giảm hiệu suất học. Do đó, sử dụng thuật toán SRA để

chọn những số kỹ thuật tốt với những tham số tốt làm input cho SVM.

Tất cả các chỉ số kỹ thuật trên tạo nên 1 véc–tơ có 23 đặc trưng. Tuy nhiên ứng với

mỗi mã chứng khoán thì sẽ bị ảnh hưởng bới các chỉ số kỹ thuật khác nhau. Do đó,

những chỉ số kỹ thuật này sẽ được chọn lọc bằng giải thuật SRA nhằm chọn lọc

những chỉ số kỹ thuật nào có ảnh hưởng nhều nhất đến giá chứng khoán và tránh

loãng thông tin khi vào huấn luyện.

Chuyển đổi giá trị các chỉ số kỹ thuật đã được chọn trong khoảng [0,1] làm đầu

vào cho máy học, theo công thức:

𝑁𝑜𝑟𝑚𝑎𝑙(𝑥𝑖𝑗) =𝑥𝑖𝑗 − 𝑀𝑖𝑛(𝑥𝑖)

𝑀𝑎𝑥(𝑥𝑖) − 𝑀𝑖𝑛(𝑥𝑖) 𝑖 = 1, … , 𝑛; 𝑗 = 1, … , 𝑚; 𝑛, 𝑚 ∈ 𝑅

Trong đó:

Normal(xij): Giá trị của chỉ số kỹ thuật i tại thời điểm thứ j

Min (xi) : Giá trị thấp nhất của chỉ số kỹ thuật i

Max (xi) : Giá trị cao nhất của chỉ số kỹ thuật i

(6) & (7) Thực hiện huấn luyện dữ liệu bằng phương pháp hồi quy vectơ

SVR

Page 6: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

60

Phương pháp vectơ hồi quy hỗ trợ là một phương pháp máy học có thể trích xuất

thông tin hữu ích từ dữ liệu lịch sử giá chứng khoán. Với giá trị đầu ra là các tín

hiệu giao dịch từ giải thuật TBSM, còn các giá trị đầu vào là các chỉ số kỹ thuật đã

được chọn lọc từ thuật toán SRA. Ý tưởng của SVR là ánh xạ không gian đầu vào

(nếu xác định hồi quy tuyến tính thì không hiệu quả) sang một không gian mới cao

chiều hơn. Ở đó ta có thể áp dụng được hồi quy tuyến tính. Hàm nhân được sử

dụng trong nghiên cứu là RBF (Radial Basis Function) để ánh xạ dữ liệu.

Chúng tôi sẽ sử dụng hàm lỗi RMSE để đo độ sai lệch giữa giá trị học và đầu ra

của SVR, mô hình có RMSE nhỏ nhất tức mô hình có bộ tham số tối ưu nhất sẽ

được chọn để kiểm tra.

Công thức RMSE như sau:

Trong đó:

yi: Tín hiệu giao dịch ngày thứ i được tính bởi TBSM

𝑦�� : Tín hiệu giao dịch ngày thứ i được ước tính từ mô hình SVR

𝑛 : Tổng số dữ liệu huấn luyện

(8) Tạo mô hình dự báo cùng với các ngưỡng mua/bán

Từ dữ liệu đầu ra của SVR, ta sẽ xác định các thời điểm nào nên mua hoặc nên bán

cổ phiếu dựa vào các ngưỡng mua và ngưỡng bán đã được thiết lập. Ở đây chúng

tôi đã thay đổi tín hiệu giao dịch so với nghiên cứu trước [10]. Cụ thể nếu đường

tín hiệu giao dịch vượt quá ngưỡng bán thì sẽ là tín hiệu của việc bán vào còn nếu

đường tín hiệu giao dịch cắt xuống dưới ngưỡng mua thì đó là tín hiệu của việc

mua ra.

Hình 4. Xác định điểm mua/bán từ mô hình SVR

Các ngưỡng mua và bán được thiết lập theo công thức [10]:

𝐵𝑢𝑦𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 = µ + σ

𝑆𝑒𝑙𝑙𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 = 1 − (µ + σ)

Page 7: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

61

µ =1

𝑁∑ 𝑥′1

𝑁

𝑖=1

σ = √1

𝑁∑(𝑥 ′

𝑖 − µ)2

𝑁

𝑖=1

Trong đó:

µ : giá trị trung bình của tín hiệu giao dịch trong chuỗi dữ liệu huấn

luyện

σ : độ lệch chuẩn của tín hiệu giao dịch trong chuỗi dữ liệu huấn luyện

N : số lượng ngày trong chuỗi dữ liệu huấn luyện

xi' : Giá trị tín hiệu giao dịch

2.2 Cài đặt hệ thống

Trong quá trình tiền xử lý dữ liệu, hệ thống tiến hành tính các chỉ số kỹ thuật như:

giá đóng cửa, khối lượng giao dịch, 5MA, 6MA, 10MA, 20MA, 5BIAS, 10BIAS,

6RSI, 12RSI, 9KD, 12W%R. Sự khác nhau của các chỉ số kỹ thuật giữa ngày t và

ngày t + 1: ∆5MA, ∆6MA, ∆10MA, ∆5BIAS, ∆10BIAS, ∆6RSI, ∆12RSI,

∆12W%R, ∆9KD, ∆9MACD, lựa chọn các giá trị đặc trưng đầu vào bằng thuật

toán SRA, phân đoạn dữ liệu bằng thuật toán TBSM. Chúng tôi thu thập dữ liệu

giá chứng khoán của các mã tại thị trường Mỹ, chi tiết như trong bảng sau:

Mã cổ phiếu Tên công ty Thời gian

APPL Apple 2/1/2008 - 6/30/2009

BA BOEING CO. 2/1/2008 - 6/30/2009

JNJ Johnson and Johnson 2/1/2008 - 6/30/2009

XOM Exxon Mobil Corp 2/1/2008 - 6/30/2009

CAT Caterpillar Inc. 2/1/2008 - 6/30/2009

VZ Verizon Communication Inc. 2/1/2008 - 6/30/2009

Bảng 2. Dữ liệu chứng khoán sử dụng trong mô hình

3 CÀI ĐẶT THỰC NGHIỆM

3.1 Kết quả thực nghiệm

Trong nghiên cứu này, chúng tôi thực nghiệm mô hình trên 6 mã cổ phiếu của thị

trường chứng khoán Mỹ là Apple (AAPL), BOEING CO. (BA), Caterpillar Inc.

(CAT), Johnson and Johnson (JNJ), Exxon Mobil Corp (XOM), Verizon

Communication Inc. (VZ). Lý do chúng tôi dùng bộ mã này là để so sánh kết quả

với tác giả có cùng hướng nghiên cứu. Bộ dữ liệu huấn luyện và kiểm tra được thể

hiện trong bảng 3. Mỗi tập dữ liệu chứa 1 tập con: Tập huấn luyện và tập kiểm tra.

Tập huấn luyện bao gồm dữ liệu trong 1 năm từ 1/2/2008 đến 12/31/2008 với 253

Page 8: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

62

điểm dữ liệu. Tập kiểm tra bao gồm dữ liệu trong 6 tháng từ 1/2/2009 đến

6/30/2009 với 124 điểm dữ liệu.

Mã cổ phiếu Tập huấn luyện Tập kiểm tra

APPL 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

BA 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

JNJ 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

XOM 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

CAT 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

VZ 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009

Bảng 3. Tập dữ liệu huấn luyện và kiểm tra trong SVR

Quá trình huấn luyện của SVR xảy ra với bộ dữ liệu trong một năm. Ví dụ, để dự

báo cho ngày tiếp theo (11/24/2015), chúng tôi sử dụng dữ liệu huấn luyện trong

vòng một năm tới ngày hiện tại tức từ 11/23/2014 – 11/23/2015.

Mô phỏng thực hiện giao dịch:

- Chúng tôi thực hiện giao dịch cổ phiếu với $1000.

- Mua khi giá trị dự báo vượt quá ngưỡng mua với tất cả số tiền hiện có

- Bán khi giá trị dự báo vượt quá ngưỡng bán với tất cả số cổ phiếu hiện đang

giữ

Dưới đây là các mô hình khuyến nghị thời điểm mua bán theo hướng tiếp cận

của chúng tôi:

Hình 5. Tín hiệu giao dịch dự báo cho CAT (xu hướng tăng)

và output máy học tương ứng

Page 9: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

63

Mỗi mô hình khuyến nghị cho nhà đầu tư các thời điểm giao dịch của từng dựa

trên các điểm mua/bán trên mô hình. Các điểm tròn màu xanh tương ứng với

khuyến nghị bán còn các chấm tròn đỏ tương ứng với khuyến nghị mua. Nếu gặp

hai khuyến nghị giống nhau liên tiếp thì ta thực hiện hiện khuyến nghị xuất hiện

trước. Sự xuất hiện liên tiếp này nhằm hỗ trợ các nhà đầu tư bị trễ trong việc nắm

bắt xu hướng kiếm thêm lợi nhuận, nhưng rõ ràng là sẽ mang nhiều rủi ro hơn so

với những khuyến nghị đầu tiên.

Hình 6. Tín hiệu giao dịch dự báo cho AAPL (xu hướng tăng)

và output máy học tương ứng

Hình 7. Tín hiệu giao dịch dự báo cho XOM (xu hướng giảm)

Page 10: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

64

Hình 8. Tín hiệu giao dịch dự báo cho BA (xu hướng ngang)

Hình 9. Tín hiệu giao dịch dự báo cho JNJ (xu hướng giảm)

Hình 10. Tín hiệu giao dịch dự báo cho VZ (xu hướng đi ngang)

Lợi nhuận thu được từ việc mua bán theo các khuyến nghị được mô tả trong Bảng

5. Việc giảm các ngưỡng cho thuận toán TBSM, cũng như thay đổi thời điểm ra

quyết định mua bán đối với mô hình theo hướng tiếp cận của chúng tôi, giúp cải

thiện lợi nhuận cho các mã có xu hướng giảm (XOM, JNJ, CAT) so với [10]

nhưng thua kém so với các mã có xu hướng tăng và đi ngang (AAPL, VZ, BA).

Còn lại, cách tiếp cận này đa số vượt trội so với IPLR-BPN [11] và chiến thuật

Mua-Giữ.

3.2 Đánh giá

Lợi nhuận thu được trong các chu kỳ thời gian bằng mô hình của chúng tôi như

Bảng 4.

Page 11: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

65

STT Mã cổ

phiếu

1 tháng 3 tháng 6 tháng

Mô hình Mua-giữ Mô hình Mua-giữ Mô hình Mua-giữ

1 JNJ 0% -3.58% 9.77% -12.08% 16.97% -4.80%

2 XOM 2.96% -3.93% 0.89% -14.69% 32.74% -9.06%

3 BA 0% -4.38% -2.41% -16.62% 51.92% 8.42%

4 VZ 0% -9.76% 0% -10.91% 19.16% -7.49%

5 CAT 0% -32.19% 16.32% -37.41% 49.55% -17.44%

6 AAPL 7.24% 7.22% 35.18% 23.16% 79.47% 66.87%

Bảng 4. Lợi nhuận thu được theo giai đoạn

Khác với các nghiên cứu về dự báo xu hướng hay giá bằng phương pháp phân lớp

dự đoán cho ngày hôm sau [16], điều này sẽ khiến các nhà đầu tư phải thường

xuyên giao dịch, dẫn đến tốn nhiều chi phí cho các nhà môi giới chứng khoán. Mô

hình của chúng tôi tập trung vào các đầu tư dài hạn hơn, nên có ít giao dịch hơn

nhằm giảm thiểu các chi phí môi giới. Đơn cử như mã VZ, sau 3 tháng vẫn chưa

có tín hiệu mua nào mà chỉ có 1 tín hiệu bán ở cuối tháng thứ 1, mặc dù ở giai

đoạn giữa tháng thứ 2 đến đầu tháng thứ 3 vẫn có những đợt sóng ở mức trung

bình.

Để đánh giá tính hiệu quả của mô hình, chúng tôi sử dụng phần trăm lợi nhuận thu

được khi thực hiện giao dịch.

STT Mã cổ phiếu Mô hình đề xuất TBSM-SVR

[10]

IPLR-BPN [11] Mua – giữ

JNJ 16.97% 13.95% 16.88% -4.80%

2 XOM 32.74% 22.40% −1.99% -9.06%

3 BA 51.91% 59.49% 17.50% 8.42%

4 VZ 19.16% 28.60% 27.72% -7.49%

5 CAT 49.55% 43.79% 9.36% -17.44%

6 AAPL 79.47% 92.35% 12.97% 66.87%

Bảng 5. Kết quả so sánh lợi nhuận đối với các nghiên cứu trước

Page 12: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

66

Hình 11. Biểu đồ so sánh lợi nhuận đạt được so với các nghiên cứu liên

quan

4 KẾT LUẬN

Trong nghiên cứu này chúng tôi kết hợp hai kỹ thuật TBSM và SVR của Jheng-

Long Wu và các cộng sự [10]. Cải tiến mô hình bằng việc thay đổi tín hiệu tạo ra

khuyến nghị giao dịch, cũng như thay đổi các khoảng để quét tham số đối với kỹ

thuật TBSM và phương pháp hồi quy. Theo đó, việc có được ngưỡng phù hợp cho

kỹ thuật TBSM sẽ tạo được những phân đoạn giống với mô hình giá, kèm với việc

sử dụng phương pháp vét cạn đối với SVR để tìm tham số (Cost, gamma) cho mô

hình có độ lỗi thấp nhất. Mô hình này sau đó được dùng cho tập test đạt kết quả rất

khả quan: lợi nhuận thu được vượt trội so với chiến thuật Mua-Giữ, giá trị trung

bình 41.63% so với 6.08% và ngang ngửa với nghiên cứu liên quan [10] 43.43%

nhưng trội hơn ở các mã có xu hướng giảm.

Ngoài việc áp dụng cho sàn chứng khoán NASDAQ của Mỹ, mô hình của chúng

tôi cũng có thể áp dụng vào các sàn chứng khoán khác ở thị trường Việt Nam, vì

có điểm chung là đều sử dụng các chỉ số kỹ thuật. Điểm khác biệt lớn nhất của hai

thị trường là sàn Mỹ là sàn quốc tế nên có lượng giao dịch lớn (tính thanh khoản

cao), ngược với Việt Nam là sàn mới mới thành lập nên còn nhỏ, khối lượng giao

dịch thấp, dễ bị các cá nhân hoặc tổ chức chi phối. Ngoài ra, có thể áp dụng cho

các thị trường giao dịch khác như vàng hay ngoại tệ. Điểm chung của các thị

trường này là giá cả phụ thuộc vào cung cầu, còn quan hệ cung cầu thì được phản

ảnh qua các chỉ số kỹ thuật.

Trong tương lai, mô hình cần bổ sung các chỉ số kỹ thuật nhằm đánh giá độ mạnh,

yếu của xu hướng để cho kết quả đạt tốt hơn đối với một số mô hình có xu hướng

mạnh làm ảnh hưởng đến các chỉ số kỹ thuật. Ngoài ra, còn có thể kết hợp với các

kỹ thuật phân tích khác như phân tích cơ bản, phân tích kỹ thuật để tăng độ chắn

chắn và an toàn, hay áp dụng thêm các chiến thuật giao dịch như cắt lỗ (stop-loss),

16

,97

49

,55

32

,74

51

,91

19

,16

79

,47

13

,95

43

,79

22

,4

59

,49

28

,6

92

,35

16

,88

9,3

6

-1,9

9

17

,5

27

,72

12

,97

-4,8

-17

,44

-9,0

6

8,4

2

-7,4

9

66

,87

J N J C A T XO M B A V Z A A P L Lợi n

hu

ận t

hu

đư

ợc

(%)

Mã cổ phiếu

S O S Á N H M Ô H Ì N H V Ớ I C Á C N G H I Ê N C Ứ U L I Ê N Q U A N T H E O L Ợ I N H U Ậ N

Mô hình đề xuất TBSM-SVR [11] IPLR-BPN [10] Mua - Giữ

Page 13: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.

67

chốt lời (stop-gain) để hạn chế rủi ro (đối với các tín hiệu nhiễu gây khuyến nghị

sai) cũng như đảm bảo số lợi nhuận đã thu được.

Tài Liệu Tham Khảo

[1] Pei-Chann Chang, Chen-Hao Liu, Jun-Lin Lin, Chin-Yuan Fan, Celeste S.P. Ng, A neural

network with a case based dynamic window for stock trading prediction, Expert Systems

with Applications 36, 2009, 6889–6898.

[2] Yunus Y, Halid K và Mo J, Stock Market Prediction by Using Artificial Neural Network,

2014.

[3] Kumar A, Anshul K, Tej P, Surya P, A Stock Market Prediction Model using Artificial

Neural Network, IEEE-20180, 2012.

[4] Chi-Yuan Yeh, Chi-Wei Huang, Shie-Jue Lee, A multiple-kernel support vector regression

approach for stock market price forecasting, Expert Systems with Applications 38 (2011)

2177–2186.

[5] Kwon Y. K., Moon B. R., A Hybrid Neurogenetic Approach for Stock Forecasting, IEEE,

Vol. 18, No. 3 (2007).

[6] Yanru Xu, Zhengui L. L, A Study on Feature Selection for the Trend Prediction of Stock

Trading Price, 2013.

[7] Huang S-C., Wu T-K., Integrating GA-based time-scale feature extractions with SVMs for

stock index forecasting, Expert Systems with Applications 35, 2008, pp. 2080–2088.

[8] Huang C-L., Tsai C-Y., A hybrid SOFM-SVR with a filter-based feature selection for stock

market forecasting, Expert Systems with Applications 36, 2009, pp. 1529–1539.

[9] Afolabi M. O., Olude O., Predicting Stock Prices Using a Hybrid Kohonen Self Organizing

Map, IEEE, 2007.

[10] Jheng-Long Wu, Pei-Chann Chang, and Yi-Fang Pan, A Trend-Based Segmentation

Method and the Support Vector Regression for Financial Time Series Forecasting,

Mathematical Problems in Engineering Volume 2012.

[11] Pei-Chann Chang, Chin-Yuan Fan, Chen-Hao Liu, Integrating a Piecewise Linear

Representation Method and a Neural Network Model for Stock Trading Points Prediction,

2009.

[12] Pei-Chann Chang, Chen-Hao Liu, Jun-Lin Lin, Chin-Yuan Fan, Celeste S.P. Ng, A neural

network with a case based dynamic window for stock trading prediction, Expert Systems

with Applications 36, 2009, 6889–6898.

[13] H. Wu, B. Salzberg, D. Zhang, Online event-driven subsequence matching over financial

data streams, in Proc. SIGMOD, Stream Manag, Jun. 2004, pp. 23–34.

[14] J. Murphy, Technical Analysis of Financial Markets, New York Institute of Finance, USA,

1999

[15] T. Turner, A Beginner’s Guide to Day Trading Online, Adams Media, 2nd

Ed., 2007

[16] Pittipol Kantavat, Boonserm Kijsirikul, Combining technical analysis and support vector

machine for stock trading, IEEE, 2008.

Page 14: Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy

Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.

68

Thông tin tác giả

Đặng Công Tâm,

Khoa Hệ thống Thông tin,

Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,

Email: [email protected];

Trần Hồng Trang,

Khoa Hệ thống Thông tin,

Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,

Email: [email protected];

Dương Minh Đức,

Khoa Hệ thống Thông tin,

Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,

Email: [email protected].