Upload
thelemontree10
View
23
Download
7
Embed Size (px)
DESCRIPTION
Dự Báo Thời Điểm Mua Bán Chứng Khoán Kết Hợp Phương Pháp Phân Đoạn Dữ Liệu Và Vectơ Hỗ Trợ Hồi Quy
Citation preview
TẬP SAN TIN HỌC QUẢN LÝ
Tập 04, số 1&2, 2015, 55-68.
DỰ BÁO THỜI ĐIỂM MUA BÁN CHỨNG KHOÁN
KẾT HỢP PHƯƠNG PHÁP PHÂN ĐOẠN DỮ LIỆU VÀ
VECTƠ HỖ TRỢ HỒI QUY
Đặng Công Tâm1
Trần Hồng Trang1
Dương Minh Đức 1
Tóm tắt: Trong bài báo này, chúng tôi sử dụng phương pháp hồi quy vectơ hỗ trợ (SVR)
và phân đoạn dữ liệu (TBSM) để xây dựng mô hình dự báo thời điểm mua bán chứng
khoán tại thị trường Mỹ trên sàn NASDAQ. TBSM được dùng để phân đoạn chuỗi dữ liệu
thời gian thành các xu hướng phản ánh đồ thị giá tạo nên những tín hiệu giao dịch,
những tín hiệu này kết hợp với các chỉ số kỹ thuật được đưa vào SVR huấn luyện để tìm
ra các điểm mua bán. Hướng tiếp cận tập trung nghiên cứu vào việc thay đổi các giá trị
ngưỡng và tham số cũng như các tín hiệu tạo điểm giao dịch đem lại lợi nhuận cao hơn
so với các nghiên cứu trước.
Từ khóa: TBS Method, Support Vector Regression, Stepwise Regression Analysis.
1 GIỚI THIỆU
Dự báo thời điểm mua bán chứng khoán trong tương lai là một đề tài nghiên cứu
rộng rãi trong nhiều lĩnh vực như thương mại, tài chính, thống kê, khoa học máy
tính, v.v.. nhằm tìm ra các thời điểm mua bán cổ phiếu đem lại lợi nhuận cho các
nhà đầu tư. Các chuyên gia giao dịch thường sử dụng phân tích cơ bản và phân tích
kỹ thuật để phân tích cổ phiếu và ra quyết định đầu tư. Phân tích cơ bản là một
phương pháp truyền thống liên quan đến các nghiên cứu về nguyên tắc cơ bản của
một công ty như doanh thu, phí tổn, vị trí thị trường, tốc độ tăng trưởng hàng năm
(Murphy,1999) [14]. Ngược lại, phân tích kỹ thuật chỉ nghiên cứu về biến động giá
trên thị trường, các nhà phân tích chỉ tập trung nghiên cứu mô hình giá và sử dụng
những dữ liệu giá khác nhau để tính toán dự báo biến động giá trong tương lai
(Turner, 2007) [15]. Phân tích kỹ thuật được xây dựng với một niềm tin rằng giá
cả hiện tại đại diện cho tất cả thông tin về tài sản đó cũng như giá cả phản ánh mọi
thứ trên thị trường. Theo lý thuyết Dow, nghiên cứu về giá là yêu cầu cần thiết và
đầy đủ nhất.
Tuy nhiên, gần đầy cộng đồng nghiên cứu tập trung nhiều vào các kỹ thuật tính
toán mềm như ANN [1][2][3] hay SVR [4][5]… Hơn nữa, nhằm nâng cao độ
chính xác dự đoán, các nghiên cứu sử dụng lai ANN hay SVR với các kỹ thuật trí
tuệ nhân tạo khác. Davoud và Taheri [3] kết hợp chọn lọc chỉ số kỹ thuật bằng
PCA/SRA và ANN. Hay Yanru Xu [6] áp dụng 2 phương pháp kết hợp SVM-RFE
và RF-RFE để chọn ra các đặc tính của thị trường chứng khoán có ảnh hưởng đến
sự biến động giá để dự báo xu hướng giá. Ngoài ra còn có Huang và Wu [7] sử
1 Khoa Hệ thống Thông tin, Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM.
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
56
dụng GA để chọn các đặc trưng đầu vào kết hợp với SVM, Huang và Tsai [8] dùng
hệ số quyết định r2
kết hợp SVR. Bên cạnh việc lựa chọn các đặc trưng đầu vào thì
việc phân chia dữ liệu thành các cụm rồi xây dựng mô hình dự đoán cho mỗi cụm
cũng là đề xuất khá là hay cho bài toán dự đoán chứng khoán. Cụ thể, như Afolabi
và Olude [9] kết hợp thuật toán gom cụm SOM với ANN, Huang và Tsai [8] kết
hợp SOM với SVR.
Trong bài báo này, chúng tôi đề xuất phương pháp lai TBSM-SVR để dự đoán giá
cổ phiếu ở thị trường chứng khoán Mỹ. Trong phương pháp lai này, TBSM thực
hiện nhiệm vụ làm mượt đường giá ban đầu của chuỗi thời gian thành các đoạn xu
hướng phản ánh gần đúng với biến động của chuỗi giá với mục tiêu giảm nhiễu và
giảm thời gian dự báo đồng thời SRA lựa chọn các chỉ số kỹ thuật quan trọng nhất
để thiết lập đầu vào. Sau đó, các xu hướng được số hóa và các chỉ số kỹ thuật được
chọn sẽ được dùng để huấn luyện SVR và cho ra mô hình dự đoán. Việc cần thiết
trong mô hình này là điều chỉnh tham số sao cho lợi nhuận thu được là cao hơn có
thể. Chúng tôi đã nghiên cứu và chỉnh sửa ngưỡng tham số của TBSM và SVR với
hiệu suất tốt hơn mô hình trước [10].
2 MÔ HÌNH ĐỀ XUẤT
Trong việc xác định thời điểm mua bán chứng khoán. Ta cần phải quan tâm các
yếu tố:
Dữ liệu đầu vào: Phương pháp tiếp cận của bài báo là dựa trên lịch sử giá
chứng khoán bao gồm: Giá đóng cửa, giá mở cửa, giá cao nhất, giá thấp nhất.
Mục tiêu: Xác định các thời điểm mua hoặc bán chứng khoán sao cho tổng lợi
nhuận đạt được là cao nhất.
Khoảng thời gian xem xét: Nghiên cứu trong bài báo tập trung ra quyết định
thời điểm mua bán trong ngắn hạn và trung hạn với các chỉ số kỹ thuật có các
thời gian tương ứng.
2.1 Các bước chính trong mô hình dự báo
Bài toán dự báo thời điểm mua bán chứng khoán sử dụng bộ dữ liệu giá bao gồm
Giá đóng cửa, Giá mở cửa, Giá cao nhất, Giá thấp nhất, Khối lượng giao dịch.
Mục tiêu cuối cùng của hệ thống là đưa ra được mô hình dự báo với các ngưỡng
mua và bán để xác định điểm mua / bán thích hợp dựa trên lịch sử giá.
Hệ thống chúng tôi được chia làm 2 bước chính: bước huấn luyện và bước kiểm
tra. Trong bước huấn luyện, chúng tôi sẽ chuẩn bị một tập dữ liệu huấn luyện bao
gồm 5 loại giá trong ngày. Tập dữ liệu này sẽ được chia thành 2 phần: Phần 1 gồm
giá đóng cửa qua TBSM được số hóa thành 3 phân đoạn phản ánh 3 xu hướng của
giá chứng khoán có giá trị nằm trong khoảng [0,1]; Phần 2 gồm tất cả các loại giá
còn lại để tính toán các chỉ số kỹ thuật. Kết quả của 2 phần trên là đầu vào cho
phương pháp huấn luyện máy học để xây dựng ra một mô hình được sử dụng trong
bước kiểm tra để tìm độ lợi nhuận của mô hình dự đoán. Mô hình dự đoán được
mô tả như hình 1 gồm:
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
57
Hình 1. Mô hình hệ thống
Huấn luyện dữ liệu:
(1) Lấy dữ liệu giá đóng cửa của cổ phiếu
(2) Tạo các điểm ngoặt theo xu hướng bằng phương pháp TBSM
(3) Số hóa các đoạn xu hướng trong miền [0,1]; gọi là các tín hiệu giao dịch
(4) Tính toán các chỉ số kỹ thuật dựa trên giá (đóng cửa, mở cửa, cao nhất, thấp
nhất) và khối lượng
(5) Chọn lọc các biến tương quan bằng phương pháp SRA; chuẩn hóa dữ liệu trong
miền [0,1]
(6) Dùng các tín hiệu giao dịch và các chỉ số kỹ thuật làm đầu vào cho huấn luyện
máy học
(7) Chọn bộ tham số tối ưu cho mô hình
(8) Tạo ra được mô hình dự báo cùng với các ngưỡng mua/bán
Chi tiết mô hình hệ thống như sau:
(1) Lấy bộ dữ liệu giá chứng khoán
Trong bài báo này, chúng tôi chọn dữ liệu chứng khoán của các mã AAPL, XOM,
BA, JNJ, CAT trong khoảng thời gian từ tháng 01/2007 đến tháng 06/2009.
(2) Tạo các điểm ngoặt theo xu hướng bằng phương pháp TBSM
Trong bài toán chuỗi thời gian có nhiều phương pháp tiếp cận như Fourier
transform, Wavelets, và PLR để tìm các điểm ngoặt trong dữ liệu chuỗi thời gian.
Dựa theo yêu cầu của đề tài chúng tôi thì phương pháp PLR là cần thiết. PLR được
sử dụng trong các nghiên cứu [11][12][13] cho kết quả với độ chính xác khá cao.
Thêm nữa, PLR là một hướng tiếp cận để phân đoạn khá tốt trong việc tìm ra các
xu hướng giá tuy nhiên với những chuỗi giá phức tạp và nhiều biến động hay cụ
thể hơn là nhiều xu hướng thì PLR lại không phát huy được lợi thế của nó. Vì thế,
trong nghiên cứu này, chúng tôi sẽ sử dụng phương pháp phân đoạn đa xu hướng
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
58
là TBSM để phân chia chuỗi dữ liệu giá chứng khoán thực thành 3 xu hướng phản
ánh đúng với xu hướng thực của giá chứng khoán. Từ đó, chúng ta sẽ có được
những tín hiệu giao dịch tốt đem lại lợi nhuận cao trên thị trường chứng khoán.
Chuỗi dữ liệu giá chứng khoán được phân thành 3 xu hướng: Tăng, giảm và không
đổi. Tại những điểm chuyển tiếp của các xu hướng gọi là điểm ngoặt. Nhiệm vụ
của phần này là tìm ra được các điểm ngoặt trên chuỗi dữ liệu. Tuy nhiên, vì giá
chứng khoán của mỗi phân đoạn là khác nhau, do đó chúng ta cần phải chuyển các
phân đoạn đó thành các giá trị có giới hạn miền thuộc [0,1] gọi là các tín hiệu giao
dịch.
Hình 2. Mô phỏng thuật toán TBSM [10]
(3) Số hóa các đoạn xu hướng trong miền [0,1]: gọi là các tín hiệu giao dịch
Trong bước này, nhiệm vụ là tính toán các tín hiệu giao dịch trong chuỗi thời gian.
Trong phần trước, chúng ta chia chuỗi dữ liệu thành một số phân đoạn xu hướng.
Chúng ta đề xuất một phân đoạn Sk là Tăng thì giá trị Tín hiệu giao dịch Sk’ có
miền giá trị là <0, 0.1,…,1>, nếu Sk là Không đổi thì Sk’ =<0.5,..,0.5>, nếu Sk là
Giảm thì Sk’=<1,0.9,…, 0>. Chúng tôi sử dụng cách thức chuyển đổi này như [10]
đã đề cập.
Hình 3. Số hóa các đoạn thành tín hiệu giao dịch
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
59
(4) & (5): Tính toán và Chọn lọc các chỉ số kỹ thuật
Mỗi loại chỉ số kỹ thuật có những tham số cần phải điều chỉnh; vì thế, trước khi sử
dụng các chỉ số kỹ thuật để xác định tín hiệu giao dịch của mã chứng khoán nào
đó, chúng ta phải kiểm tra khả năng tương thích của cổ phiếu đối với chỉ số đó.
Ứng với mỗi mã chứng khoán thì sẽ bị ảnh hưởng bới các chỉ số kỹ thuật khác
nhau.
Đầu vào của hệ thống ngoài các tín hiệu giao dịch còn có các chỉ số kỹ thuật kèm
theo bao gồm các chỉ số kỹ thuật như bảng 1:
Loại chỉ số Chỉ số kỹ thuật
Đường trung bình 5MA, 6MA, 10MA, 20MA
BIAS 5BIAS, 10BIAS
Chỉ số sức mạnh tương đối 6RSI, 12 RSI
Stochatics 9K, 9D
Trung bình phân kỳ hội tụ 9MACD
Williams %R 12W%R
Độ chênh lệch của các chỉ số kỹ
thuật ngày t và t+1 (t là ngày hiện
tại)
Δ5MA, Δ6MA, Δ10MA, Δ5BIAS, Δ10BIAS,
Δ6RSI, Δ12RSI, Δ9K, Δ9D, Δ9MACD,
Δ12W%R
Bảng 1:
Nghiên cứu dùng SVM để quản lý vấn đề về trọng số của các chỉ số kỹ thuật từ tập
dữ liệu huấn luyện. Tuy nhiên, việc chọn tất cả các chỉ số kỹ thuật với nhiều cách
điều chỉnh tham số có thể giảm hiệu suất học. Do đó, sử dụng thuật toán SRA để
chọn những số kỹ thuật tốt với những tham số tốt làm input cho SVM.
Tất cả các chỉ số kỹ thuật trên tạo nên 1 véc–tơ có 23 đặc trưng. Tuy nhiên ứng với
mỗi mã chứng khoán thì sẽ bị ảnh hưởng bới các chỉ số kỹ thuật khác nhau. Do đó,
những chỉ số kỹ thuật này sẽ được chọn lọc bằng giải thuật SRA nhằm chọn lọc
những chỉ số kỹ thuật nào có ảnh hưởng nhều nhất đến giá chứng khoán và tránh
loãng thông tin khi vào huấn luyện.
Chuyển đổi giá trị các chỉ số kỹ thuật đã được chọn trong khoảng [0,1] làm đầu
vào cho máy học, theo công thức:
𝑁𝑜𝑟𝑚𝑎𝑙(𝑥𝑖𝑗) =𝑥𝑖𝑗 − 𝑀𝑖𝑛(𝑥𝑖)
𝑀𝑎𝑥(𝑥𝑖) − 𝑀𝑖𝑛(𝑥𝑖) 𝑖 = 1, … , 𝑛; 𝑗 = 1, … , 𝑚; 𝑛, 𝑚 ∈ 𝑅
Trong đó:
Normal(xij): Giá trị của chỉ số kỹ thuật i tại thời điểm thứ j
Min (xi) : Giá trị thấp nhất của chỉ số kỹ thuật i
Max (xi) : Giá trị cao nhất của chỉ số kỹ thuật i
(6) & (7) Thực hiện huấn luyện dữ liệu bằng phương pháp hồi quy vectơ
SVR
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
60
Phương pháp vectơ hồi quy hỗ trợ là một phương pháp máy học có thể trích xuất
thông tin hữu ích từ dữ liệu lịch sử giá chứng khoán. Với giá trị đầu ra là các tín
hiệu giao dịch từ giải thuật TBSM, còn các giá trị đầu vào là các chỉ số kỹ thuật đã
được chọn lọc từ thuật toán SRA. Ý tưởng của SVR là ánh xạ không gian đầu vào
(nếu xác định hồi quy tuyến tính thì không hiệu quả) sang một không gian mới cao
chiều hơn. Ở đó ta có thể áp dụng được hồi quy tuyến tính. Hàm nhân được sử
dụng trong nghiên cứu là RBF (Radial Basis Function) để ánh xạ dữ liệu.
Chúng tôi sẽ sử dụng hàm lỗi RMSE để đo độ sai lệch giữa giá trị học và đầu ra
của SVR, mô hình có RMSE nhỏ nhất tức mô hình có bộ tham số tối ưu nhất sẽ
được chọn để kiểm tra.
Công thức RMSE như sau:
Trong đó:
yi: Tín hiệu giao dịch ngày thứ i được tính bởi TBSM
𝑦�� : Tín hiệu giao dịch ngày thứ i được ước tính từ mô hình SVR
𝑛 : Tổng số dữ liệu huấn luyện
(8) Tạo mô hình dự báo cùng với các ngưỡng mua/bán
Từ dữ liệu đầu ra của SVR, ta sẽ xác định các thời điểm nào nên mua hoặc nên bán
cổ phiếu dựa vào các ngưỡng mua và ngưỡng bán đã được thiết lập. Ở đây chúng
tôi đã thay đổi tín hiệu giao dịch so với nghiên cứu trước [10]. Cụ thể nếu đường
tín hiệu giao dịch vượt quá ngưỡng bán thì sẽ là tín hiệu của việc bán vào còn nếu
đường tín hiệu giao dịch cắt xuống dưới ngưỡng mua thì đó là tín hiệu của việc
mua ra.
Hình 4. Xác định điểm mua/bán từ mô hình SVR
Các ngưỡng mua và bán được thiết lập theo công thức [10]:
𝐵𝑢𝑦𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 = µ + σ
𝑆𝑒𝑙𝑙𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 = 1 − (µ + σ)
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
61
µ =1
𝑁∑ 𝑥′1
𝑁
𝑖=1
σ = √1
𝑁∑(𝑥 ′
𝑖 − µ)2
𝑁
𝑖=1
Trong đó:
µ : giá trị trung bình của tín hiệu giao dịch trong chuỗi dữ liệu huấn
luyện
σ : độ lệch chuẩn của tín hiệu giao dịch trong chuỗi dữ liệu huấn luyện
N : số lượng ngày trong chuỗi dữ liệu huấn luyện
xi' : Giá trị tín hiệu giao dịch
2.2 Cài đặt hệ thống
Trong quá trình tiền xử lý dữ liệu, hệ thống tiến hành tính các chỉ số kỹ thuật như:
giá đóng cửa, khối lượng giao dịch, 5MA, 6MA, 10MA, 20MA, 5BIAS, 10BIAS,
6RSI, 12RSI, 9KD, 12W%R. Sự khác nhau của các chỉ số kỹ thuật giữa ngày t và
ngày t + 1: ∆5MA, ∆6MA, ∆10MA, ∆5BIAS, ∆10BIAS, ∆6RSI, ∆12RSI,
∆12W%R, ∆9KD, ∆9MACD, lựa chọn các giá trị đặc trưng đầu vào bằng thuật
toán SRA, phân đoạn dữ liệu bằng thuật toán TBSM. Chúng tôi thu thập dữ liệu
giá chứng khoán của các mã tại thị trường Mỹ, chi tiết như trong bảng sau:
Mã cổ phiếu Tên công ty Thời gian
APPL Apple 2/1/2008 - 6/30/2009
BA BOEING CO. 2/1/2008 - 6/30/2009
JNJ Johnson and Johnson 2/1/2008 - 6/30/2009
XOM Exxon Mobil Corp 2/1/2008 - 6/30/2009
CAT Caterpillar Inc. 2/1/2008 - 6/30/2009
VZ Verizon Communication Inc. 2/1/2008 - 6/30/2009
Bảng 2. Dữ liệu chứng khoán sử dụng trong mô hình
3 CÀI ĐẶT THỰC NGHIỆM
3.1 Kết quả thực nghiệm
Trong nghiên cứu này, chúng tôi thực nghiệm mô hình trên 6 mã cổ phiếu của thị
trường chứng khoán Mỹ là Apple (AAPL), BOEING CO. (BA), Caterpillar Inc.
(CAT), Johnson and Johnson (JNJ), Exxon Mobil Corp (XOM), Verizon
Communication Inc. (VZ). Lý do chúng tôi dùng bộ mã này là để so sánh kết quả
với tác giả có cùng hướng nghiên cứu. Bộ dữ liệu huấn luyện và kiểm tra được thể
hiện trong bảng 3. Mỗi tập dữ liệu chứa 1 tập con: Tập huấn luyện và tập kiểm tra.
Tập huấn luyện bao gồm dữ liệu trong 1 năm từ 1/2/2008 đến 12/31/2008 với 253
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
62
điểm dữ liệu. Tập kiểm tra bao gồm dữ liệu trong 6 tháng từ 1/2/2009 đến
6/30/2009 với 124 điểm dữ liệu.
Mã cổ phiếu Tập huấn luyện Tập kiểm tra
APPL 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
BA 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
JNJ 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
XOM 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
CAT 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
VZ 1/2/2008 - 12/31/2008 1/2/2009 - 6/30/2009
Bảng 3. Tập dữ liệu huấn luyện và kiểm tra trong SVR
Quá trình huấn luyện của SVR xảy ra với bộ dữ liệu trong một năm. Ví dụ, để dự
báo cho ngày tiếp theo (11/24/2015), chúng tôi sử dụng dữ liệu huấn luyện trong
vòng một năm tới ngày hiện tại tức từ 11/23/2014 – 11/23/2015.
Mô phỏng thực hiện giao dịch:
- Chúng tôi thực hiện giao dịch cổ phiếu với $1000.
- Mua khi giá trị dự báo vượt quá ngưỡng mua với tất cả số tiền hiện có
- Bán khi giá trị dự báo vượt quá ngưỡng bán với tất cả số cổ phiếu hiện đang
giữ
Dưới đây là các mô hình khuyến nghị thời điểm mua bán theo hướng tiếp cận
của chúng tôi:
Hình 5. Tín hiệu giao dịch dự báo cho CAT (xu hướng tăng)
và output máy học tương ứng
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
63
Mỗi mô hình khuyến nghị cho nhà đầu tư các thời điểm giao dịch của từng dựa
trên các điểm mua/bán trên mô hình. Các điểm tròn màu xanh tương ứng với
khuyến nghị bán còn các chấm tròn đỏ tương ứng với khuyến nghị mua. Nếu gặp
hai khuyến nghị giống nhau liên tiếp thì ta thực hiện hiện khuyến nghị xuất hiện
trước. Sự xuất hiện liên tiếp này nhằm hỗ trợ các nhà đầu tư bị trễ trong việc nắm
bắt xu hướng kiếm thêm lợi nhuận, nhưng rõ ràng là sẽ mang nhiều rủi ro hơn so
với những khuyến nghị đầu tiên.
Hình 6. Tín hiệu giao dịch dự báo cho AAPL (xu hướng tăng)
và output máy học tương ứng
Hình 7. Tín hiệu giao dịch dự báo cho XOM (xu hướng giảm)
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
64
Hình 8. Tín hiệu giao dịch dự báo cho BA (xu hướng ngang)
Hình 9. Tín hiệu giao dịch dự báo cho JNJ (xu hướng giảm)
Hình 10. Tín hiệu giao dịch dự báo cho VZ (xu hướng đi ngang)
Lợi nhuận thu được từ việc mua bán theo các khuyến nghị được mô tả trong Bảng
5. Việc giảm các ngưỡng cho thuận toán TBSM, cũng như thay đổi thời điểm ra
quyết định mua bán đối với mô hình theo hướng tiếp cận của chúng tôi, giúp cải
thiện lợi nhuận cho các mã có xu hướng giảm (XOM, JNJ, CAT) so với [10]
nhưng thua kém so với các mã có xu hướng tăng và đi ngang (AAPL, VZ, BA).
Còn lại, cách tiếp cận này đa số vượt trội so với IPLR-BPN [11] và chiến thuật
Mua-Giữ.
3.2 Đánh giá
Lợi nhuận thu được trong các chu kỳ thời gian bằng mô hình của chúng tôi như
Bảng 4.
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
65
STT Mã cổ
phiếu
1 tháng 3 tháng 6 tháng
Mô hình Mua-giữ Mô hình Mua-giữ Mô hình Mua-giữ
1 JNJ 0% -3.58% 9.77% -12.08% 16.97% -4.80%
2 XOM 2.96% -3.93% 0.89% -14.69% 32.74% -9.06%
3 BA 0% -4.38% -2.41% -16.62% 51.92% 8.42%
4 VZ 0% -9.76% 0% -10.91% 19.16% -7.49%
5 CAT 0% -32.19% 16.32% -37.41% 49.55% -17.44%
6 AAPL 7.24% 7.22% 35.18% 23.16% 79.47% 66.87%
Bảng 4. Lợi nhuận thu được theo giai đoạn
Khác với các nghiên cứu về dự báo xu hướng hay giá bằng phương pháp phân lớp
dự đoán cho ngày hôm sau [16], điều này sẽ khiến các nhà đầu tư phải thường
xuyên giao dịch, dẫn đến tốn nhiều chi phí cho các nhà môi giới chứng khoán. Mô
hình của chúng tôi tập trung vào các đầu tư dài hạn hơn, nên có ít giao dịch hơn
nhằm giảm thiểu các chi phí môi giới. Đơn cử như mã VZ, sau 3 tháng vẫn chưa
có tín hiệu mua nào mà chỉ có 1 tín hiệu bán ở cuối tháng thứ 1, mặc dù ở giai
đoạn giữa tháng thứ 2 đến đầu tháng thứ 3 vẫn có những đợt sóng ở mức trung
bình.
Để đánh giá tính hiệu quả của mô hình, chúng tôi sử dụng phần trăm lợi nhuận thu
được khi thực hiện giao dịch.
STT Mã cổ phiếu Mô hình đề xuất TBSM-SVR
[10]
IPLR-BPN [11] Mua – giữ
JNJ 16.97% 13.95% 16.88% -4.80%
2 XOM 32.74% 22.40% −1.99% -9.06%
3 BA 51.91% 59.49% 17.50% 8.42%
4 VZ 19.16% 28.60% 27.72% -7.49%
5 CAT 49.55% 43.79% 9.36% -17.44%
6 AAPL 79.47% 92.35% 12.97% 66.87%
Bảng 5. Kết quả so sánh lợi nhuận đối với các nghiên cứu trước
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
66
Hình 11. Biểu đồ so sánh lợi nhuận đạt được so với các nghiên cứu liên
quan
4 KẾT LUẬN
Trong nghiên cứu này chúng tôi kết hợp hai kỹ thuật TBSM và SVR của Jheng-
Long Wu và các cộng sự [10]. Cải tiến mô hình bằng việc thay đổi tín hiệu tạo ra
khuyến nghị giao dịch, cũng như thay đổi các khoảng để quét tham số đối với kỹ
thuật TBSM và phương pháp hồi quy. Theo đó, việc có được ngưỡng phù hợp cho
kỹ thuật TBSM sẽ tạo được những phân đoạn giống với mô hình giá, kèm với việc
sử dụng phương pháp vét cạn đối với SVR để tìm tham số (Cost, gamma) cho mô
hình có độ lỗi thấp nhất. Mô hình này sau đó được dùng cho tập test đạt kết quả rất
khả quan: lợi nhuận thu được vượt trội so với chiến thuật Mua-Giữ, giá trị trung
bình 41.63% so với 6.08% và ngang ngửa với nghiên cứu liên quan [10] 43.43%
nhưng trội hơn ở các mã có xu hướng giảm.
Ngoài việc áp dụng cho sàn chứng khoán NASDAQ của Mỹ, mô hình của chúng
tôi cũng có thể áp dụng vào các sàn chứng khoán khác ở thị trường Việt Nam, vì
có điểm chung là đều sử dụng các chỉ số kỹ thuật. Điểm khác biệt lớn nhất của hai
thị trường là sàn Mỹ là sàn quốc tế nên có lượng giao dịch lớn (tính thanh khoản
cao), ngược với Việt Nam là sàn mới mới thành lập nên còn nhỏ, khối lượng giao
dịch thấp, dễ bị các cá nhân hoặc tổ chức chi phối. Ngoài ra, có thể áp dụng cho
các thị trường giao dịch khác như vàng hay ngoại tệ. Điểm chung của các thị
trường này là giá cả phụ thuộc vào cung cầu, còn quan hệ cung cầu thì được phản
ảnh qua các chỉ số kỹ thuật.
Trong tương lai, mô hình cần bổ sung các chỉ số kỹ thuật nhằm đánh giá độ mạnh,
yếu của xu hướng để cho kết quả đạt tốt hơn đối với một số mô hình có xu hướng
mạnh làm ảnh hưởng đến các chỉ số kỹ thuật. Ngoài ra, còn có thể kết hợp với các
kỹ thuật phân tích khác như phân tích cơ bản, phân tích kỹ thuật để tăng độ chắn
chắn và an toàn, hay áp dụng thêm các chiến thuật giao dịch như cắt lỗ (stop-loss),
16
,97
49
,55
32
,74
51
,91
19
,16
79
,47
13
,95
43
,79
22
,4
59
,49
28
,6
92
,35
16
,88
9,3
6
-1,9
9
17
,5
27
,72
12
,97
-4,8
-17
,44
-9,0
6
8,4
2
-7,4
9
66
,87
J N J C A T XO M B A V Z A A P L Lợi n
hu
ận t
hu
đư
ợc
(%)
Mã cổ phiếu
S O S Á N H M Ô H Ì N H V Ớ I C Á C N G H I Ê N C Ứ U L I Ê N Q U A N T H E O L Ợ I N H U Ậ N
Mô hình đề xuất TBSM-SVR [11] IPLR-BPN [10] Mua - Giữ
Tập san Tin hoc quản ly, tập 04, số 1&2, 2015.
67
chốt lời (stop-gain) để hạn chế rủi ro (đối với các tín hiệu nhiễu gây khuyến nghị
sai) cũng như đảm bảo số lợi nhuận đã thu được.
Tài Liệu Tham Khảo
[1] Pei-Chann Chang, Chen-Hao Liu, Jun-Lin Lin, Chin-Yuan Fan, Celeste S.P. Ng, A neural
network with a case based dynamic window for stock trading prediction, Expert Systems
with Applications 36, 2009, 6889–6898.
[2] Yunus Y, Halid K và Mo J, Stock Market Prediction by Using Artificial Neural Network,
2014.
[3] Kumar A, Anshul K, Tej P, Surya P, A Stock Market Prediction Model using Artificial
Neural Network, IEEE-20180, 2012.
[4] Chi-Yuan Yeh, Chi-Wei Huang, Shie-Jue Lee, A multiple-kernel support vector regression
approach for stock market price forecasting, Expert Systems with Applications 38 (2011)
2177–2186.
[5] Kwon Y. K., Moon B. R., A Hybrid Neurogenetic Approach for Stock Forecasting, IEEE,
Vol. 18, No. 3 (2007).
[6] Yanru Xu, Zhengui L. L, A Study on Feature Selection for the Trend Prediction of Stock
Trading Price, 2013.
[7] Huang S-C., Wu T-K., Integrating GA-based time-scale feature extractions with SVMs for
stock index forecasting, Expert Systems with Applications 35, 2008, pp. 2080–2088.
[8] Huang C-L., Tsai C-Y., A hybrid SOFM-SVR with a filter-based feature selection for stock
market forecasting, Expert Systems with Applications 36, 2009, pp. 1529–1539.
[9] Afolabi M. O., Olude O., Predicting Stock Prices Using a Hybrid Kohonen Self Organizing
Map, IEEE, 2007.
[10] Jheng-Long Wu, Pei-Chann Chang, and Yi-Fang Pan, A Trend-Based Segmentation
Method and the Support Vector Regression for Financial Time Series Forecasting,
Mathematical Problems in Engineering Volume 2012.
[11] Pei-Chann Chang, Chin-Yuan Fan, Chen-Hao Liu, Integrating a Piecewise Linear
Representation Method and a Neural Network Model for Stock Trading Points Prediction,
2009.
[12] Pei-Chann Chang, Chen-Hao Liu, Jun-Lin Lin, Chin-Yuan Fan, Celeste S.P. Ng, A neural
network with a case based dynamic window for stock trading prediction, Expert Systems
with Applications 36, 2009, 6889–6898.
[13] H. Wu, B. Salzberg, D. Zhang, Online event-driven subsequence matching over financial
data streams, in Proc. SIGMOD, Stream Manag, Jun. 2004, pp. 23–34.
[14] J. Murphy, Technical Analysis of Financial Markets, New York Institute of Finance, USA,
1999
[15] T. Turner, A Beginner’s Guide to Day Trading Online, Adams Media, 2nd
Ed., 2007
[16] Pittipol Kantavat, Boonserm Kijsirikul, Combining technical analysis and support vector
machine for stock trading, IEEE, 2008.
Dự Báo Thời Điểm Mua Bán Chứng Khoáng Kết Hợp TBSM và SVR.
68
Thông tin tác giả
Đặng Công Tâm,
Khoa Hệ thống Thông tin,
Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,
Email: [email protected];
Trần Hồng Trang,
Khoa Hệ thống Thông tin,
Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,
Email: [email protected];
Dương Minh Đức,
Khoa Hệ thống Thông tin,
Trường Đại học Công nghệ Thông tin – Đại Học Quốc gia TP.HCM,
Email: [email protected].