Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA-2011
Tối ưu hệ số học của mạng hàm bán kính cơ sở trong bộ điều
khiển robot theo phương pháp tính momen
Optimization of the radial basis function network in the robot
controller by computed torque method Nguyễn Trần Hiệp
1; Phạm Thượng Cát
2
1 Khoa kỹ thuật điều khiển, Học viện kỹ thuật Quân sự
2Viện công nghệ Thông tin, Viện Khoa học và công nghệ Việt nam
[email protected]; [email protected]
Abstract: Recently, radial basis function network
(RBFN) is used quite widely when using neural
networks as controllers for subjects with multiple
uncertain parameters such as the robot. The most
important thing when using online learning neural
network system is the choice of coefficient for
networks with fast convergence speed. So far this
coefficient has been chosen by experience and
sometimes it takes quite a long time to find a
coefficient that satisfies the requirement of the
controlling task. Another problem is, when finding
coefficients satisfying the required study of the
problem and control, we can not conclude that the
optimal coefficients. This article refers to the use of
genetic algorithms (GA) to find optimal learning
coefficient for RBF network is used as a controller for
objects whose parameters are uncertain.
Tóm tắt: Gần đây, mạng hàm bán kính cơ sở
(RBFN) được sử dụng khá rộng rãi khi sử dụng mạng
nơron để điều khiển các đối tượng với nhiều tham số
bất định như robot. Hệ số học của mạng nơron có ảnh
hưởng rất lớn đến tốc độ hội tụ và chất lượng của quá
trình điều khiển. Trước đây, hệ số này đã được chọn
bằng kinh nghiệm và đôi khi phải mất một thời gian
khá dài mới tìm được một hệ số đáp ứng các yêu cầu
của bài toán điều khiển. Trong trường hợp đó, chúng
ta cũng không thể khẳng định được hệ số học vừa tìm
được tìm được là tốt nhất. Bài viết này đề cập đến
việc sử dụng thuật di truyền (GA) thực hiện tối ưu hóa
hệ số học cho mạng hàm bán kính cơ sở là thành phần
của bộ điều khiển robot theo phương pháp tính
momen.
Từ khóa: Robot, Mạng RBF, Giải thuật di truyền.
1. Xây dựng mô hình bộ điều khiển robot
sử dụng mạng RBFN 1.1 . Bài toán điều khiển robot với nhiều thành
phần phi tuyến bất định
Phương trình động lực học của một hệ robot n khớp
cứng có thể được mô tả bằng phương trình vi phân phi
tuyến dạng vector như sau:
τ)qd(q,(q)gq)q(q,Bq(q)M ˆˆˆ (1)
Trong đó: Tnqqq ],......,[ 21q ,
Tnqqq ],......,[ 21 q , T
nqqq ,....., 21q là các vector
nx1 biểu diễn vị trí, vận tốc và gia tốc góc của các
khớp tương ứng. Tn ,....., 21τ là vector nx1 biểu
diễn momen tác động lên các khớp. nxnR(q)M là
ma trận quán tính, đối xứng và xác định dương
nxnR )q(q,B ˆ là ma trận hệ số Coriolis và lực hướng
tâm. 1ˆ nxR(q)g là thành phần gia tốc trọng trường.
1nxR)qd(q, là thành phần lực ma sát và nhiễu tác
động lên các khớp của robot.
Trong phương trình (1) có các thành phần không được
biết chính xác do tính bất định của mô hình robot .
Các tham số (q),M )q(q,B ˆ , (q)g có thể được mô tả
như sau:
M(q) M(q)(q)M ˆ (2a)
)qB(q,)qB(q, )q(q,B ˆ (2b)
g(q)g(q) (q)g ˆ (2c)
M(q), )qB(q, , g(q) là các thành phần được xác
định chính xác Δg(q)),qΔB(q,ΔM(q), biểu diễn sai
lệch do tính bất định của mô hình robot. Giả thiết
000 gbm Δg(q),)qΔB(q,, ΔM(q) ,
( 000 g,b,m là các giá trị được biết). Khi đó, phương
trình (1) có thể được biểu diễn dưới dạng:
)qf(q,g(q)q)qB(q,qM(q)τ (3a)
)qf(q, ττ 0 (3b)
g(q)q)qB(q,qM(q)τ0 (3c)
)qd(q, Δg(q))qΔB(q,M(q))qf(q, (3d)
1nxR)qf(q, trong (3d) là tổng hợp các thành phần
không xác định của hệ động lực gồm ma sát, nhiễu
loạn tác động lên robot và bị chặn bởi 0f f với
0f có thể xác định được .
189
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA - 2011
Mục đích của điều khiển là xác định tín hiệu điều
khiển sao cho robot bám được quỹ đạo dq mong
muốn, nghĩa là sai lệch 0 dqqe ;
0d
e q q và 0d
e q q . Ở đây e,
e ,e là các giá trị sai số về vị trí, vận tốc và gia tốc
góc.
1.2. Xác định thuật điều khiển robot theo phương
pháp tính momen sử dụng mạng hàm bán kính cơ
sở (RBFN).
Phương pháp tính momen là một phương pháp điều
khiển được dùng phổ biến trong lĩnh vực điều khiển
robot. Bộ điều khiển được thực hiện trên cơ sở tách
riêng mô hình động lực học của robot thành hai phần
tuyến tính và phi tuyến, để các thành phần như tác
động của trọng lực, lực ma sát, momen hướng tâm,
lực Coriolis .v.v. sẽ được bù đủ. Với mô hình động
lực học hệ robot được biểu diễn như phương trình (1),
khi đó bộ điều khiển bộ điều khiển PD hay PID được
sử dụng để điều khiển vị trí của robot tiệm cận với
quỹ đạo mong muốn. Phương pháp tính momen
được mô tả như phương trình sau:
ˆ ˆτ M(q)u h(q,q) (4)
d P Du q K e + K e (5)
ˆ ˆ ˆ)h(q,q) = B(q,q)q+d(q,q g(q) (6)
K P, KD
là các ma trận đường chéo xác định dương.
Vì ma trận M (q) là xác định dương và khả đảo nên
vòng điều khiển kín của toàn bộ hệ thống có dạng:
q u (7)
Khi ma trận M (q) và vector h (q,q) giả thiết được
xác định chính xác, nếu chọn đúng các hệ số KDi , KPi
hệ thống sẽ là ổn định tiệm cận và thậm chí không
còn xuất hiện dao động và độ quá điều chỉnh trong
quá trình quá độ. Tuy nhiên phương pháp tính momen
chỉ đơn giản khi các thành phần M(q), B(q,q) ,
g(q) được xác định chính xác. Trong thực tế do tính
bất định của mô hình của robot, các tham số
M(q), B(q,q) , g(q) có thể được mô tả như phương
trình (2).
Do ma trận M (q) và vector h (q,q) không thể biết
chính xác mà chúng ta chỉ nhận được một giá trị ước
lượng của M(q) và h(q,q) : M(q) M(q) và
h(q,q) h(q,q) . Thay thế các giá trị ước lượng M(q)
và h(q,q) vào phương trình động lực học của robot
(4) ta nhận được:
1 ˆ ˆ1q M (q) M(q) u M (q) h(q,q) h(q,(q)
Rõ ràng phương trình trên khác với phương trình (7)
do đó luật điều khiển theo phương pháp tính momen
như trên sẽ gây ra sai số.
Để bù các hành phần bất định của hệ robot, tác giả
đề xuất sử dụng RBFN được học online để xác định
chính xác các thành phần bất định của hệ robot khi
điều khiển bằng phương pháp tính momen [1], [3].
Khi đó, hệ có thể được xem như một hệ điều khiển
PD, các hệ số KP, KD được chọn đảm bảo cho hệ ổn
định và có tốc độ hội tụ nhanh.
Từ phương trình (3b) và (5), suy ra:
0 d D Pτ =M(q) q -K e-K e B(q,q)q+g(q) (8)
Ta có: 0 1τ τ τ (9)
Với τ1 là thành phần momen điều khiển bù sẽ được
xác định sau.
Ta chọn biến phụ s dưới dạng: s = e+Ce (10)
qua đó ta thấy sự đồng nhất giữa s và e.
Với ma trận C là đối xứng và xác định dương T
C = C > 0
Việc chọn ma trận hệ số C đối xứng xác định dương
bảo đảm khi s = 0 hệ tự trị e+ Ce = 0 sẽ tiến về gốc
tọa độ của mặt phẳng pha: e 0,e 0 .
Ta có thể biểu diễn 1f (q,q)=f (s)
nxR . Theo định
lý Stone-Weierstrass, thành phần không xác định
1f (s)
nxR có thể được xấp xỉ bằng một mạng nơron
hữu hạn có cấu trúc như sau:
ˆf (s)= Wσ+ε=f(s)+ε (10)
f(s) = Wσ (11)
Trong đó:
W : Ma trận trọng số của mạng nơron được cập
nhật on-line,
:ε Sai số xấp xỉ và bị chặn 0ε .
Mạng nơron xấp xỉ f (s) là mạng hàm bán kính cơ sở
(RBFN) 3 lớp thoả mãn các điều kiện của định lý
Stone-Weierstrass, với lớp ẩn có n nút với hàm tác
động là hàm có phân bố Gauss :
2
2exp
i i
i
i
s c
lớp đầu vào, lớp ra có hàm tác động dạng tuyến tính
gồm n nơron. Với ,j jc là kỳ vọng và phương sai
của hàm phân bố Gauss có thể tự chọn. Nếu chọn
được các tham số ,j jc phủ hết dải thay đổi cả về
biên độ và dải tần của hàm bất định f (s) thì tốc độ
hội tụ sẽ nhanh hơn.
1s
2s
ns
1s
2s
ns
1 1
1
ˆn
j j
j
f w
2 2
1
ˆn
j j
j
f w
1
ˆn
n jn j
j
f w
H. 1 Mạng RBFN xấp xỉ hàm f (s)
190
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA-2011
Cấu trúc của mạng RBFN có thể mô tả theo sơ đồ trên
Hình 1.
Định lý: Hệ động lực robot n bậc tự do (1) với mạng
nơron (11) sẽ bám theo quỹ đạo mong muốn d
q với
sai số e 0 nếu ta chọn thuật điều khiển τ và thuật
học w icủa mạng nơron như sau:
d D P
1
( ) e
(1 )
τ = M q q K K e B(q,q)
g(q) M(q) Wσ s s
(12)
w si j , (13)
với i = 1, 2, …. n
Trong đó các tham số tự chọn D P,K I K C là
ma trận đối xứng xác định dương, I là ma trận đơn vị,
các hệ số , , 0 .
Cấu trúc của hệ điều khiển có thể mô tả theo sơ đồ
trên Hình 2
Momen τ gồm hai thành phần chính:
0 d D P( ) eτ = M q q K K e B(q,q) g(q) là thành
phần phản hồi và bù các thành phần phi tuyến, 1
1 (1 )τ =M(q) Wσ s s
là đầu ra của RBFN
được học on-line để xấp xỉ các thành phần phi tuyến
bất định của robot.
Định lý này được chứng minh bằng phương pháp
ổn định Lyapunov đảm bảo tính ổn định tiệm cận
toàn cục của cả hệ thống như sau:
Chứng minh:
Chọn hàm V xác định dương:
1
1
2s s w w
nT T
i i
i
V
(14)
Ta có V > 0 khi 0s,wi ; V = 0 khi và chỉ khi
s,w = 0i , i=1,2,..n
Lấy đạo hàm V theo thời gian:
1
s s w wn
T T
i i
i
V
(15)
Sau một vài biến đổi ta nhận được:
1
s s s τ - f (s) w wn
T T T
i i
i
V
(16)
Với thuật học on-line:
w si i , i= 1,2 ….n
ta có thể xác định được:
1 1 1
w w w s s w s Wσn n n
T T T T
i i i i i i
i i i
(17)
Cuối cùng ta nhận được: 2 1 2
2
0
- ( ) - .
-
s s s s ε s s s ε
s s s
TV
(18)
Với s là khả vi (10), xét thành phần 1
s s
để
làm rõ tính hữu hạn của τ và V khi s→0 Ta có:
2 2 2 20 0 0
1 2
lim lim lim 1...s s ss
i i i
n i
s s s
s s s s
2 2 2 20 0 0
1 2
lim lim lim 1...s s ss
i i i
n i
s s s
s s s s
1,2,... .i n hoặc 0
1 lim 1s s
is
.
Với giá trị hữu hạn của 1
s sta sẽ có ,τ V trong
là tồn tại và hữu hạn khi s→0.
Nếu chọn: 0 ; 0 ta có
0- + ε -s s s (19)
Cuối cùng thay (19) vào (18) ta nhận được:
2
0s sV (20)
Ta thấy 0V khi s ≠ 0 và 0V khi và chỉ khi
s = 0. Theo nguyên lý ổn định Lyapunov [11],[8],
s 0 và sai số e 0 . Và hàm (14) đươc chọn ban
đầu được gọi là hàm Lyapunov. Như vậy hệ (1) là ổn
định tiệm cận dq q hay nói cách khác quỹ đạo của
robot bám theo quỹ đạo mong muốn với sai số bằng 0.
Tốc độ hội tụ của mạng nơron phụ thuộc vào thuật
học (13). Để cho quá trình học hội tụ nhanh, đảm bảo
các chỉ tiêu chất lượng điều chỉnh như độ quá chỉnh,
số lần dao động.v.v. chúng ta có thể lựa chọn một hệ
số học tối ưu bằng cách sử dụng thuật di truyền.
2. Sử dụng thuật di truyền để tối ưu hệ số
học của RBFN. Thuật di truyền (Genetic Algorithm - GA) là thuật tự
điều chỉnh dựa trên sự tiến hóa chọn lọc và phát triển
tự nhiên. Chọn lọc tự nhiên là sự liên kết giữa các
nhiễm sắc thể - Chromosome và biểu diễn cấu trúc mã
hoá của chúng để chọn ra được cá thể có đặc tính tốt
nhất qua các thế hệ. Giống như trong tự nhiên, bằng
quá trình chọn lọc, thuật di truyền sẽ tìm ra được
những nhiễm sắc thể tốt nhất nhờ hiệu chỉnh thông tin
của chúng thích nghi với sự thay đổi của môi trường.
Những thông tin này cho phép ước lượng được giá trị
của mỗi nhiễm sắc thể theo một hàm thích ứng chọn
Nếu không đạt
chỉ tiêu của quá
trình quá độ
Nếu đạt chỉ tiêu
của quá trình
quá độ
B(q,q)q g(q)
H. 2 Điều khiển robot theo phương pháp
tính momen với RBFN
d
d
q
q
e
-
1τ
d D Pq K e K e M(q)
+
11
s = e + Ce
sτ = M(q) Wσ
s
W sσT
q
q
Robot
+
+
τ
+
0τ
191
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA - 2011
trước để chọn ra những nhiễm sắc thể có giá trị thích
ứng tốt nhất và loại bỏ những nhiễm sắc thể có giá trị
thích ứng kém. Để tiến hoá từ thế hệ này sang thế hệ
khác, GA sử dụng ba phép biến đổi cơ bản là tái tạo
lại, liên kết chéo và biến đổi. Ở bài toán mà ta đang
xét, thông tin về hệ thống đã khá rõ ràng, về bản chất
là hệ sẽ tiến đến trạng thái ổn định, chỉ cần thêm một
thông tin bổ sung là giá trị nào của hệ số học (η) sẽ
đem lại chất lượng điều khiển tốt nhất. Do đó, trong
trường hợp này, sử dụng GA để xác định hệ số học
(η) tối ưu sẽ là phương án đơn giản và phù hợp
nhất.Tìm hàm thích ứng trong GA là rất quan trọng
đối với từng trường hợp cụ thể. Ta cần tìm hệ số học
( j ) của RBFN trong (12) để sao cho thời gian thiết
lập (Tc), độ quá điều chỉnh (Oc), số lần dao động (N)
đạt các chỉ tiêu về chất lượng điều khiển, đồng thời
tại thời điểm Tc giá trị ước lượng theo hàm thích ứng
đạt được các yêu cầu đặt ra của bài toán. Do đó, lựa
chọn hàm thích ứng trong trường hợp này ngoài tiêu
chuẩn về sai số, sẽ được bổ xung thêm các chỉ tiêu về
chất lượng của quá trình điều khiển như vừa trình bày
ở trên. Giá trị ước lượng theo hàm thích ứng của cá
thể j (j = 1 r) trong tập hợp mẫu của GA được xác
định như sau:
0
( , ( ), , )
( ( ))
e
e
j c c
j c
F T O N
F T
(21)
Tc là thời gian thiết lập của quá trình quá độ, Oc là độ
quá chỉnh, N là số lần dao động trong thời gian thiết
lập.
( , ( ))ej cF T : giá trị ước lượng theo hàm thích ứng
của cá thể thứ j ( j ) tại thời điểm Tc.
2
( )
1 0
1( ( ))e
e
j cn k
m
i
i m
F T
(22)
Với: i là thứ tự các khớp của robot, m là bậc đạo hàm
của sai lệch e.
Quá trình tiến hóa sẽ dừng lại khi ít nhất có một cá thể
j có quá trình quá độ đạt được các điều kiện (21) và
giá trị ước lượng theo hàm thích ứng
0( , ( ))ej cF T F , với F0 được cho trước tùy theo yêu
cầu về độ chính xác của từng trường hợp cụ thể, khi
đó j sẽ là giá trị tốt nhất tìm được. Khi hệ thống tiến
đến giá trị xác lập, tất cả các sai số tiến đến không do
đó về mặt lý thuyết, hàm thích ứng sẽ tiến đến vô
cùng. Do hệ thống điều khiển của chúng ta là hệ điều
khiển theo sai lệch do đó luôn tồn tại sai số, vì vậy giá
trị của hàm thích ứng trong trường hợp này sẽ tiến
đến một giá trị giới hạn. Như vậy, nếu một cá thể
j tìm được trong quá trình tiến hóa, đảm bảo thỏa
mãn điều kiện (21), đồng thời có giá trị
0( , ( ))ej cF T F sẽ là hệ số học tối ưu. Tập hợp ban
đầu của các hệ số học j được lựa chọn một cách
ngẫu nhiên và là số nguyên dương.
Mỗi một giá trị j được chọn là một cá thể và để tiện
khi thực hiện các phép biến đổi và liên kết chéo ta có
thể sử dụng mã nhị phân để biểu diễn giá trị của hệ số
học (trong trường hợp này sử dụng mã nhị phân 8
bits). Bằng mã nhị phân 8 bits ta có thể tạo ngẫu
nhiên được 256 giá trị nằm trong dải từ 0 đến 255. Để
đảm bảo các cho trường hợp: ηj <1, ηj > 255, giá trị
thực của ηj sau các phép biến đổi của GA được nhân
với một hệ số thang đo cho phép bao hết miền giá trị
của ηj.
Đầu tiên ta có thể chọn hệ số thang đo lớn để đảm bảo
bao hết miền giá trị của ηj. Sau lần tối ưu đầu tiên cho
phép xác định được khu vực tối ưu của hệ số học. Ta
sẽ thay đổi hệ số thang đo để thực hiện tìm giá trị tối
ưu trong khu vực đó. Trường hợp sau mỗi lần tối ưu
ta tìm được cùng một lúc nhiều giá trị cực đại, khi đó
có thể thực hiện tìm giá trị tối ưu của hệ số học đồng
thời trên nhiều máy tính. Như vậy sẽ t ng tốc độ tìm
kiếm tối ưu cho GA.
3. Mô phỏng điều khiển robot PUMA 560
theo phương pháp tính momen. 3.1. Mô hình robot PUMA560.
Robot PUMA 560 là robot 6 bậc tự do có tham số như
sau:
Khớp m (kg) rx (m) ry (m) rz (m)
1 0 0 0 0
2 17.4 -0.3638 0.006 0.2275
3 4.8 -0.0203 -0.0141 0.070
4 0.82 0 0.019 0
5 0.34 0 0 0
6 0.09 0 0 0.032
Khớp Ixx
kg.m2
Iyy
kg.m2
Izz
kg.m2
Ixy=Iyz=Iz
x
(kg.m2)
1 0 0.35 0 0
2 0.13 0.524 0.539 0
3 0.066 0.086 0.0125 0
4 0.0018 0.0013 0.0018 0
5 0.0003 0.0004 0.0003 0
6 0.0001
5
0.00015 0.00004 0
Khớp ia [
o]
ia [m] id [m] Biến
khớp
1 -90o 0 0 1
2 0 0.4318 0.15005 2
3 -90o
0.0203 0 3
4 90 0 0.4318 4
5 -90 0 0 5
6 0 0 0.05625 6
3.2 Bài toán điều khiển robot.
192
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA-2011
Giả sử ta chỉ biết các tham số mô hình robot có độ
chính xác 90%.
Ta sẽ điều khiển tay nắm robot đi theo mặt cong dạng 26 3z x x (Hình 4,5) từ vị trí y = (0,25m 0,2m -
0,375m 0 0 0)T tới vị trí y = (0,5 m 0,2 m 0m 0 1,406
0)T. Trong quá trình dịch chuyển, hướng của tay nắm
phải luôn trùng với tia pháp tuyến của mặt cong.
H. 3 Mô hình robot PUMA 560 và các hệ toạ độ khớp
0 2 4 6 8 10-2
-1.5
-1
-0.5
0
0.5
qd1
qd2
qd3
H. 4 Các giá trị đặt của các khớp 1,2,3
0 2 4 6 8 10
-2
-1
0
1
2
3
4
qd4
qd5
qd6
H. 5 Các giá trị đặt của các khớp 4,5,6.
Ta chọn các tham số của robot và điều kiện mô phỏng
như khi chưa sử dụng mạng nơron.
Chọn các tham số điều khiển cho moment τ và thuật
chỉnh trọng mạng nơron w i cho robot như (12) và
(13):
Với 2; 3; 10
Với các tham số hàm Gauss của mạng nơron được
chọn theo kinh nghiệm như sau:
1 2 1 210; 0.1 ; 0.3c c .
Ta có kết quả mô phỏng như sau:
0 1 2 3 4 5 6 7 8 9 10-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
e1
e2
e3
H. 6 Sai lệch tại các khớp 1,2,3
0 1 2 3 4 5 6 7 8 9 10-0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
e4
e5
e6
H. 7 Sai lệch tại các khớp 4,5,6
0 1 2 3 4 5 6 7 8 9 10-50
0
50
100
150
200
torque1
torque2
torque3
H. 8 Biểu diễn momen tại các khớp 1,2,3
0 1 2 3 4 5 6 7 8 9 10-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
torque4
torque5
torque6
H. 9 Biểu diễn momen tại các khớp 4,5,6
Trong quá trình mô phỏng, khi lựa chọn hệ số học η
cho RBFN theo (12) và (13), tác giả nhận thấy: Với
các giá trị η lựa chọn khác nhau sẽ nhận được các kết
quả có chất lượng điều khiển khác nhau. Khi chọn giá
trị η lớn, sai số của hệ thống khi đạt đến trạng thái xác
lập sẽ sẽ rất bé, gần như bằng “không” nhưng độ quá
chỉnh lớn và số lần dao động trong quá trình quá độ
t ng lên không đạt được các chỉ tiêu của quá trình quá
độ. Khi chọn giá trị η nhỏ sẽ khắc phục được hai
nhược điểm trên là độ quá chỉnh và số lần dao động
giảm nhưng sai số khi hệ đạt đến trạng thái xác lập là
khá lớn, thậm chí khi t ng biên độ của nhiễu, hệ còn
bị mất ổn định. Như vậy với một cấu trúc RBFN được
lựa chọn dùng kết hợp với bộ điều khiển tính momen
sẽ tồn tại một hệ số học η tối ưu đảm bảo tìm được
chất lượng điều chỉnh của hệ là tốt nhất. Xuất phát từ
nhận xét trên, tác giả đề xuất bài toán toán tìm hệ số
học η tối ưu cho RBFN được lựa chọn dùng kết hợp
với bộ điều khiển tính momen. Vì η là một số vô
hướng và cấu trúc của bộ điều khiển đã đảm bảo ổn
định, tác giả lựa chọn phương pháp tìm giá trị η tối ưu
sử dụng thuật di truyền (GA) tiến hành học off-line.
193
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA - 2011
Đồng thời trong quá trình tìm giá trị η tối ưu các chỉ
tiêu về chất lượng của điều khiển cũng sẽ được đánh
giá thông qua quá trình xác định giá trị của các mẫu
học theo hàm thích ứng – fitnes function của GA.
Với mô hình bài toán điều khiển như đã trình bày ở
trên, ta sử dụng GA để tìm hệ số học tối ưu của RBFN
theo thuật học được biểu diễn trong (13. Các chỉ tiêu
của quá trình quá độ được cho như Bảng 1:
Các chỉ tiêu của quá
trình quá độ
Giá trị giới
hạn
Đơn
vị
Thời gian điều chỉnh (T) 10 sec
Thời gian thiết lập (TC) ≤ 3 sec
Độ quá điều chỉnh (OC) ≤ 20% giá trị
thiết lập (Qc)
Số lần dao động (N) ≤ 4
Hàm thích ứng trong trường hợp này được xác định
theo (14), cụ thể như sau:
0 3
( , ( ))
( ( )) khác
e
e
j c
j c
F T
F T
c
c c
nÕu T
0 nÕu O 20% Q
0 nÕu N 4
nÕu
Đây là thành phần cho phép đánh giá chỉ tiêu chất
lượng của quá trình quá độ, giá trị ηj tìm được đảm
bảo quá trình điều khiển robot thỏa mãn được tất cả
các yêu cầu của quá trình quá độ.
2 2 2 2 2 2.....1 2 1 2 6 6
1( ( )) 50ej CF T
e e e e e e
Đây là thành phần đảm bảo cho sai lệch của điều
khiển robot nằm trong phạm vi cho phép.
Các tham số của GA được chọn như sau:
Tỷ lệ liên kết chéo (Pc): 0.5, 0.5
Tỷ lệ biến đổi (Pm) : 0.05, 0.05
Kích thước của tập hợp (Psize): r = 100, 100
Giá trị chặn dưới của hàm thích ứng (F0) = 50. 50
Thực hiện tối ưu bằng GA với hệ số thang đo là 1 và
sau 200 thế hệ ta tìm được 1 giá trị tối ưu là 20 đảm
bảo được tất cả các yêu cầu về chất lượng điều khiển
được đặt ra trên Bảng 1. Như vậy thông qua quá trình
tiến hóa để xác định hệ số học η tối ưu bằng GA, ta
đã đánh giá được cả chất lượng của quá trình quá độ
bằng việc xác định giá trị theo hàm thích ứng của
từng mẫu học trong khoảng thời gian mong muốn (ở
đây, ta khảo sát trong khoảng thời gian từ 0 – Tc) nếu
sử dụng các phương pháp tối ưu khác sẽ khó thực
hiện được đánh giá này. Đó là lý do vì sao tác giả lại
sử dụng GA để làm công cụ xác định hệ số học tối ưu
của RBFN.
Kết quả mô phỏng với hệ số học η =20.
0 1 2 3 4 5 6 7 8 9 10-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
e1
e2
e3
H. 10 Sai lệch tại các khớp 1,2,3
0 1 2 3 4 5 6 7 8 9 10-0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
e4
e5
e6
H. 11 Sai lệch tại các khớp 4,5,6
0 1 2 3 4 5 6 7 8 9 10-50
0
50
100
150
200
torque1
torque2
torque3
H. 12 Biểu diễn momen tại các khớp 1,2,3
0 1 2 3 4 5 6 7 8 9 10-0.14
-0.12
-0.1
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
toruqe4
torque5
torque6
H. 13 Biểu diễn momen tại các khớp 4,5,6
Nhận xét: So sánh kết quả thu được trên hình 10 – 13
và kết quả mô phỏng nhận được trên các hình 6 – 9, ta
thấy với hệ số học tối ưu tìm được, so với trường hợp
chọn hệ số học η =10, sai lệch về vị trí và vận tốc góc
giảm đi nhiều khi hệ đạt trạng thái xác lập. Như vậy
sử dụng GA để xác định hệ số học tối ưu cho phép
đánh giá được chất lượng của quá trình quá độ, ngoài
các chỉ tiêu về sai số (e), số lần dao động (N), độ quá
chỉnh (Qc) và thời gian thiết lập (Tc) còn cho phép
đánh giá được giá trị cực đại và tốc độ biến thiên của
momen tác động lên khớp của robot. Giá trị η tối ưu
tìm được đảm bảo được tất cả các chỉ tiêu của quá
trình quá độ và các điều kiện vật lý đảm bảo cho động
cơ hoạt động.
194
Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011
VCCA-2011
Kết luận Với mô hình điều khiển robot theo phương pháp tính momen sử dụng mạng RBF đảm bảo quá trình học online và cho phép tối ưu trên toàn bộ không gian trạng thái. Kết quả cho thấy hệ thống đảm bảo hội tụ và sai lệch tiến đến không. Việc sử dụng GA để tìm ra hệ số học tối ưu cho phép nâng khảo sát, đánh giá được ảnh hưởng của hệ số học đến quá trình hội tụ của thuật học đồng thời làm nâng cao hơn nữa chất lượng của quá trình điều khiển. Đây là một bước tiến trong quá trình nghiên cứu ứng dụng mạng nơron để xây dựng các bộ điều khiển robot vừa đảm bảo tính hội tụ và ổn định đồng thời nâng cao hơn nữa chất lượng của điều khiển.
Tài liệu tham khảo
[1] Nguyễn Trần Hiệp, Phạm Thượng Cát, Điều
khiển robot n bậc tự do theo phương pháp tính
momen sử dụng mạng nơron xấp xỉ các đại
lượng bất định. Hội thảo Tự động hóa và
Robotic trong Quốc phòng và kinh tế, tháng 3
n m 2009. Tạp chỉ nghiên cứu KH và Công
nghệ Quân sự số đặc biệt tháng 3 n m 2009
trang 73-81.
[2] Nguyễn Trần Hiệp, Phạm Thượng Cát, Điều
khiển robot n bậc tự do với mặt trượt tích phân
và mạng nơron xấp xỉ các đại lượng phi tuyến
bất định. Tạp chí KHKT số 127 n m 2009, Học
viện kỹ thuật Quân sự, Tr 36 – 45
[3] Nguyễn Trần Hiệp, Phạm Thượng Cát, Điều
khiển robot với mạng nơron RBF có hệ số học
được tối ưu bằng giải thuật di truyền, Tạp chí
Tự động hóa ngày nay số 126 tháng 5 n m 2011,
Hội nghị Cơ điện tử toàn quốc lần thứ 5 tổ chức
từ ngày 22 – 23/10/2010 tại Thành phố Hồ chí
Minh.
[4] Nguyen Tran Hiep, Pham Thuong Cat, Robust
Neural Sliding Mode Control of Robot
Manipulators, Proceeding of 2nd
Mediterrannean Conference on Intelligent
Systems and Automation, March 23-25 2009,
Zarzis, Tunisia. Page 210 -215 (API Conference
Proceedings 1107).
[5] Nguyen Tran Hiep, Pham Thuong Cat, Robot
control nDOF by integrated sliding surface and
approximating neural networks, Proceeding of
European Control Conreference 2009, 23 - 26
August 2009 Budapest Hungary. Page 2187-
2192.
[6] Nguyễn Thanh Thuỷ, Trần Ngọc Hà., (1999)
Tích hợp kỹ thuật mạng nơron và giải thuật di
truyền trong phân tích dữ liệu. Tạp chí tin học
và điều khiển học T15, S.2.
[7] Bach H. Dinh, Matthew W. Dunnigan, Donald
S. Reay (2008), “A Practical Approach for
Position Control of Robotic Manipulator Using a
Radial Basis Function Network and a Simple
Vision Systems”, Wseas Transaction on
Systems and Control. Issue 4, Volume 3, April
2008, Page 289 – 298.
[8] Gongcai Xin, Zhengzai Qian, Weilun Chen, Kun
Qian and Li Li (2010), “Neural Network and
Sliding Mode Control Combining Based
Reconfigurable Control”, Communications in
Computer and Information Science, 2010,
Volume 98, Part 5, Pages 238-243.
[9] Jakub Możaryn and Jerzy E. Kurek (2010),
“Sliding Mode Control of Robot Based on
Neural Network Model with Positive Definite
Inertia Matrix”, Artificial Neural Networks –
ICANN 2010. Lecture Notes in Computer
Science, 2010, Volume 6353/2010, Pages 266-
275.
[10] J.Somlo - B.Lantos - P.T.Cat (1997), Advanced
Robot Control. Akademiai Kiado. Budapest.
[11] L. Bossi, L. Magni, C. Rottenbacher and G.
Mimmi (2009), “ Modeling and Validation of a
Planar Flexible Manipulator”, Proceeding of the
European Control Conference 2009, August 23-
26, 2009, Budapest, Hungary, pp 2809 – 22814.
[12] Min-Jung Lee, Gi Hyun Hwang, Tae-Seok Jin
(2008), “Design and Implementation of
Manipulator Tracking Control based on
Intelligent Method”, Reseachs was supported by
the Program for the Training of Graduate
Students in Regional Innovation with was
conducted by the Ministry of Commerce Industry
and Energy of the Korean government.
[13] Wen-Bin Lin; Chien-An Chen; Huann-Keng
Chiang (2011), “Design and Implementation of a
Sliding Mode Controller Using a Gaussian
Radial Basis Function Neural Network Estimator
for a Synchronous Reluctance Motor Speed
Drive”, Int Electric Power Components and
Systems. Volume 39, Issue 6, 2011, Pages 548 –
562.
[14] Weimin Ge and Duofang Ye (2011), “Sliding
mode variable structure control of mobile
manipulators”, International Journal of
Modelling, Identification and Control. Volume
12, Number 1-2 / 2011, Pages 166 – 172.
195