10
M"T PHNG PHÁP I SÁNH NH TH$I GIAN TH&C Trn Th Thanh Hi * , Eric Marchand ** & a ch%: * Trung tâm MICA, Tr,ng i h'c Bách Khoa Hà N*i ** IRISA Rennes, Campus Beaulieu, Rennes, France Emails: [email protected]; [email protected] Tóm tt: )i sánh nh là m*t bài toán c bn có mt trong nhi "u 0ng d.ng khác nhau c/a l nh v3c th& giác máy tính nh nhn dng nh, theo dõi )i t -ng, tìm ki !m, vv. Trong m*t s) bài toán òi h(i tính toán th,i gian th3c nh theo dõi giám sát (tracking), i "u khi #n t 3 *ng bng hình nh (visual servoing), vi $c )i sánh nh phi -c th3c hi $n nhanh và phi t -c * chính xác mong mu)n. Trong bài báo này, chúng tôi " xut m*t phng pháp cho phép )i sánh nh th,i gian th3c. Phng pháp )i sánh nh mà chúng tôi " xut d3a trên các k4 thut trích ch'n nhanh các i #m c trng trong nh, ánh x các i #m này vào không gian c trng có s) chi "u thp và tìm ki !m nhanh i #m lân cn gn nht trong không gian c trng # )i sánh các i #m c trng, t 1 ó a ra k!t lun v" các v& trí gi )ng nhau trên hai nh. Phng pháp ã -c th2 nghi $m v+i m*t t p các nh khác bi $t nhau v" v& trí, ánh sáng, góc thu nhn nh t 1 camera. Ngoài ra chúng tôi cng ã th2 nghi $m thut toán trong m*t 0ng d.ng i "u khi #n t 3 *ng bng hình nh # ki #m tra * chính xác và th,i gian tính toán c/a thut toán. Gi i thut hot *ng v+i t )c * 10-14Hz trên máy tính Pentium IV 2.6Ghz, ch0ng minh kh nng tích h-p c/a nó vào trong các 0ng d.ng th,i gian th3c . Abstract: Image matching is a primitive problem for many computer vision applications like image recognition, tracking, indexation, image retrieval, ect. In some applications as tracking, visual servoing, image matching needs to be as correct and fast as possible. In this paper, we propose a real-time image matching method. Our main contributions are to propose: i) a fast method for keypoint detection; ii) a compact representation of keypoint in a low-dimentional feature space based on PCA technique and iii) a reliable method for matching feature points in that feature space. Experiements have been conducted with natural real images to measure the performance of the proposed method. The image matching algorithm works at 10-14Hz, shows its capability to be applied to realtime applications. I. GI#I THIU BÀI TOÁN I SÁNH NH (i sánh nh là m,t bài toán ã và ang thu hút /c s5 quan tâm c1a các nhà nghiên c2u và phát tri "n. M+i khi bài toán này /c gi i quyt, nó m. ra rt nhi !u các 2ng d0ng h4u ích nh: tìm ki m nh, nhn dng, theo dõi và phát hi $n (i t /ng, vv. (i sánh hai nh là tìm ra nh4ng vùng gi (ng nhau trên hai nh. Thông th-ng, " so sánh hai nh, ng-i ta so sánh các phn t 3 c bn cu thành nên nó. n gi n nht là so sánh các i "m nh (pixel). Tuy nhiên phép so sánh này òi h'i nhi !u th-i gian tính toán và th-ng không t /c , chính xác mong mu(n. Các phng pháp sau này ! xut trích ch&n các c trng " bi "u di #n nh. Khi ó bài toán (i sánh nh s quy v! bài toán so sánh các c trng trích ch&n [ 25, 24, 23, 3, 19, 27, 20, 22, 13, 28]. Các c trng cho phép bi "u di #n nh ã /c nghiên c2u bao g)m -ng biên, vùng nh, i"m c trng, histogram, vv. Bài toán (i sánh nh ã /c ! cp vào nh4ng nm 50. Hai thp k6 gn ây, s( l /ng các công trình nghiên c2u và phát tri "n các gi i thut (i sánh nh t ng m,t các áng k". Dù vy, (i sánh nh vn còn là m,t bài toán m.. Có hai vn ! c bn th-ng /c t ra trong bài toán (i sánh nh: i) làm sao có th" bi "u di #n thông tin m,t cách hi $u qu nhm th5c hi $n vi $c (i sánh hai nh m,t cách chính xác và nhanh nht có th"; ii) làm th nào " gi i pháp (i sánh vn hot ,ng hi $u qu khi có s5 thay *i c1a môi tr-ng: nhi#u trong quá trình thu nhn nh, s5 thay *i v! ánh sáng, s5 che khut, vv. Các phng pháp (i sánh nh d5a trên vi $c (i sánh các i "m c trng /c ! xut rt nhi !u và ã gt hái /c nh4ng thành công áng k" [26, 14, 20]. Tuy nhiên " t /c m,t , chính xác nht % nh, các phng pháp này !u òi h'i rt nhi !u th-i gian tính toán. Trong nh4ng 2ng d0ng th- i gian th5c nh theo dõi (i t /ng trong nh (tracking), i !u khi "n t 5 ,ng bng hình nh (visual servoing), vi $c a ra m,t phng pháp !i sánh nh th'c hi n trong th%i gian th'c là m,t công vi $c cn thi t [2, 4, 5, 6, 7, 8, 10, 15, 16, 17, 18].

MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

Embed Size (px)

Citation preview

Page 1: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

M T PH NG PHÁP I SÁNH NH TH I GIAN TH C

Tr n Th Thanh H i *, Eric Marchand**

a ch : * Trung tâm MICA, Tr ng i h c Bách Khoa Hà N i

** IRISA Rennes, Campus Beaulieu, Rennes, France

Emails: [email protected]; [email protected]

Tóm t t: i sánh nh là m t bài toán c b n có m t trong nhi u ng d ng khác nhau c a l nh v c th

giác máy tính nh nh n d ng nh, theo dõi i t ng, tìm ki m, vv. Trong m t s bài toán òi h i tính

toán th i gian th c nh theo dõi giám sát (tracking), i u khi n t ng b ng hình nh (visual servoing),

vi c i sánh nh ph i c th c hi n nhanh và ph i t c chính xác mong mu n. Trong bài báo

này, chúng tôi xu t m t ph ng pháp cho phép i sánh nh th i gian th c. Ph ng pháp i sánh

nh mà chúng tôi xu t d a trên các k thu t trích ch n nhanh các i m c tr ng trong nh, ánh x

các i m này vào không gian c tr ng có s chi u th p và tìm ki m nhanh i m lân c n g n nh t trong

không gian c tr ng i sánh các i m c tr ng, t ó a ra k t lu n v các v trí gi ng nhau trên

hai nh. Ph ng pháp ã c th nghi m v i m t t p các nh khác bi t nhau v v trí, ánh sáng, góc thu

nh n nh t camera. Ngoài ra chúng tôi c ng ã th nghi m thu t toán trong m t ng d ng i u khi n t

ng b ng hình nh ki m tra chính xác và th i gian tính toán c a thu t toán. Gi i thu t ho t ng

v i t c 10-14Hz trên máy tính Pentium IV 2.6Ghz, ch ng minh kh n ng tích h p c a nó vào trong các

ng d ng th i gian th c.

Abstract: Image matching is a primitive problem for many computer vision applications like image

recognition, tracking, indexation, image retrieval, ect. In some applications as tracking, visual servoing,

image matching needs to be as correct and fast as possible. In this paper, we propose a real-time image

matching method. Our main contributions are to propose: i) a fast method for keypoint detection; ii) a

compact representation of keypoint in a low-dimentional feature space based on PCA technique and iii) a

reliable method for matching feature points in that feature space. Experiements have been conducted with

natural real images to measure the performance of the proposed method. The image matching algorithm

works at 10-14Hz, shows its capability to be applied to realtime applications.

I. GI I THI U BÀI TOÁN I SÁNH NH

i sánh nh là m t bài toán ã và ang thu hút c s quan tâm c a các nhà nghiên c u và phát tri n. M i khi bài toán này c gi i quy t, nó m ra r t nhi u các ng d ng h u ích nh : tìm ki m nh, nh n d ng, theo dõi và phát hi n i t ng, vv. i sánh hai nh là tìm ra nh ng vùng gi ng nhau trên hai nh. Thông th ng, so sánh hai nh, ng i ta so sánh các ph n t c b n c u thành nên nó. n gi n nh t là so sánh các i m nh (pixel). Tuy nhiên phép so sánh này òi h i nhi u th i gian tính toán và th ng không t c chính xác mong mu n. Các ph ng pháp sau này xu t trích ch n các c tr ng bi u di n nh. Khi ó bài toán i sánh nh s quy v bài toán so sánh các c tr ng trích ch n [25, 24, 23, 3, 19, 27, 20, 22, 13, 28]. Các c tr ng cho phép bi u di n nh ã c nghiên c u bao g m ng biên, vùng nh, i m c tr ng, histogram, vv.

Bài toán i sánh nh ã c c p vào nh ng n m 50. Hai th p k g n ây, s l ng các công trình nghiên c u và phát tri n các gi i thu t i sánh nh t ng m t các áng k . Dù v y, i sánh nh v n còn là m t bài toán m . Có hai v n c b n th ng c t ra trong bài toán i sánh nh: i) làm sao có th bi u di n thông tin m t cách hi u qu nh m th c hi n vi c i sánh hai nh m t cách chính xác và nhanh nh t có th ; ii) làm th nào gi i pháp i sánh v n ho t ng hi u qu khi có s thay i c a môi tr ng: nhi u trong quá trình thu nh n nh, s thay i v ánh sáng, s che khu t, vv.

Các ph ng pháp i sánh nh d a trên vi c i sánh các i m c tr ng c xu t r t nhi u và ã g t hái c nh ng thành công áng k [26, 14, 20]. Tuy nhiên t c m t chính xác nh t nh, các ph ng pháp này u òi h i r t nhi u th i gian tính toán. Trong nh ng ng d ng th i gian th c nh theo dõi i t ng trong nh (tracking), i u khi n t ng b ng hình nh (visual servoing), vi c a ra m t ph ng pháp i sánh nh th c hi n trong th i gian th c là m t công vi c c n thi t [2, 4, 5, 6, 7, 8, 10, 15, 16, 17, 18].

Page 2: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

óng góp c b n trong bài báo này là xu t m t ph ng pháp so sánh nh có kh n ng dung hòa c hai yêu c u: chính xác và th i gian tính toán nh m t i các ng d ng th i gian th c. làm c i u ó, ph ng pháp d a trên ba mô un sau:

Mô un 1: Phát hi n nhanh các i m c tr ng trong nh: Vi c phát hi n này ph i c th c hi n nhanh, các i m phát hi n ph i bi u di n các c tr ng phân bi t cho phép i sánh nh hi u qu .

Mô un 2: c t các vùng c tr ng b ng các vector mô t : M i i m c tr ng s c mô t b i m t vector. Vector này ph i có dài h u h n gi m th i gian tìm ki m trong không gian c tr ng, xong c ng không c quá t i gi n v n ch a các thông tin phân bi t c a m i vùng nh.

Mô un 3: i sánh các vector mô t so sánh các vùng c tr ng trong hai nh t ó cho phép so sánh hai nh.

Trong các ph n ti p theo c a bài bài báo này, chúng tôi trình bày c th t ng mô un. Ph n II trình bày m t ph ng pháp phát hi n (mô un 1) và bi u di n các i m c tr ng trong không gian c tr ng (mô un 2). Trong ph n III, chúng tôi trình bày m t ph ng pháp i sánh các i m trong không gian c

tr ng (mô un 3). K t qu th nghi m ph ng pháp i sánh nh thông qua vi c i sánh các vector c tr ng c trình bày trong ph n IV. Ph n V a ra m t s k t lun và h ng phát tri n.

II. PHÁT HI N VÀ BI U DI N CÁC C TR NG

II.1 i m c tr ng: nh ngh a và ph ng pháp trích ch n

II.1.1 nh ngh a i m c tr ng

nh ngh a: Chúng tôi nh ngh a i m c tr ng trong nh là m t i m nh có ch a nhi u thông tin

h n các i m nh lân c n. Bi u di n nh thông qua các i m c tr ng s cô ng (compact) h n, vì th

gi m kích th c trong không gian tìm ki m kéo theo gi m th i gian i sánh nh.

II.1.2 Phát hi n i m c tr ng trong nh

nh ngh a trên ây cho phép hi u m t cách nôm na v i m c tr ng. phát hi n các i m c tr ng trong nh, c n ph i nh ngh a i m c tr ng m t cách toán h c. Có nhi u ph ng pháp phát hi n i m

c tr ng t n t i. Harris a ra nh ngh a i m c tr ng d a trên sai khác v l n c a các vector riêng c a ma tr n o hàm h ng tính t i i m ó [24]. Lowe phát hi n các i m c c i ho c c c ti u trong không gian 3 chi u (x, y, scale) c a Laplacian và g i các i m c tr ng là các blob [14]. Vi c phát hi n i m c tr ng theo các ph ng pháp này t ng i ph c t p và t n nhi u th i gian tính toán. Rosten

xu t m t ph ng pháp cho phép phát hi n nhanh i m c tr ng [22]. Rosten ki m tra xem li u giá tr m c xám c a n i m liên ti p trên ng tròn 16 (xem nh ngh a d i ây) có l n hay nh h n giá tr m c xám c a i m xem xét. Khi n l n, vi c ki m tra này c ng m t th i gian và i u ki n này ôi khi không lo i b c các i m c tr ng n m g n nhau.

Chúng tôi n gi n hóa ph ng pháp c a Rosten và xu t thêm m t s c i ti n, nh t là trong ph n lo i b i m c tr ng k nhau. Chúng tôi a ra nh ngh a mt i m không c tr ng trong nh nh sau:

nh ngh a i m không c tr ng: Gi thi t có nh I mà ta mu n trích ch n các c tr ng. x s không là

i m c tr ng n u tn t i hai i m p, q sao cho:

(1)

trong ó là m t ng ng có giá tr nh . p, q là hai i m n m trên ng tròn c u thành t 16 pixels bao

quanh i m x nh trong hình v 1.

Page 3: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

Hình 1: ng tròn 16 pixels.

i u ki n (1) s cho phép lo i b m t cách nhanh chóng các i m ng biên và các i m thu c vùng có m c xám ng u. tránh phát hi n các i m n m trên các ng biên cong (skewed edge), chúng tôi th c hi n vi c ki m tra c trên các i m lân c n c a p và q, c th là q+1 và q-1. Vi c ki m tra b t u t m t i m n m trên ng tròn - 16 và k t thúc ngay sau khi i u ki n (1) th a mãn. Nh th trong r t nhi u tr ng h p, i u ki n (1) ã c th a mãn ngay t l n ki m tra u tiên, vì th gi i thu t lo i b các i m không c tr ng c ti n hành m t cách r t nhanh chóng.

M i khi các i m trên ng biên và các i m thu c vùng sáng ng u c lo i b , các i m c tr ng n m sát g n nhau (do nhi u) s c lo i b ch gi l i nh ng i m c tr ng nh t. i m c tr ng nh t là i m có áp ng Laplacian l n nh t so v i các i m c tr ng lân c n.

Laplacian c tính d a trên o hàm b c hai c a nh. gi m nh khâu tính toán, chúng tôi s d ng m t công th c tính nhanh Laplacian x p x nh sau:

(2)

trong ó p, q là hai i m i x ng qua x trên ng tròn - 16.

Nh ng i m v t qua c hai vòng ki m tra là nh ng i m c tr ng. M t cách tr c quan, vi c phát hi n các i m c tr ng nh xu t trên là r t nhanh, nhanh h n các ph ng pháp c xu t trong [14] (phát hi n các i m c c tr trong không gian ba chi u x, y, scale). Tuy nhiên do ch làm v i nh g c ( nh có phân gi i y ), các i m c tr ng phát hi n c s bi n i khi kích th c i t ng nh thay i. Trong các bài toán nh theo dõi phát hi n i t ng, kích th c i t ng nh th ng bi n i không nhi u, vì th các i m c tr ng phát hi n nh ph ng pháp xu t v n có giá tr cho bài toán i sánh nh.

Hình 2 minh h a k t qu thu nh n c t ph ng pháp phát hi n i m c tr ng t m t nh. i u ki n lo i b i m không c tr ng c a chúng tôi n gi n h n nhi u so v i i u ki n xu t b i Rosten et al. [22], tuy nhiên k t qu phát hi n i m c tr ng ph n l n là gi ng nhau (xem hình 2a và 2b). Ngoài ra, do áp d ng thêm i u ki n v Laplacian, m t s l ng l n các i m c tr ng n m g n nhau c lo i b , ch gi l i các i m c tr ng nh t (hình 2c)

Hình 2: a) i m c tr ng phát hi n theo ph ng pháp c a [22]. b) i m c tr ng phát hi n theo

ph ng pháp xu t. c) Các i m c tr ng còn l i sau khi ã lo i b các i m lân c n.

II.1.3 H ng c a i m c tr ng

Trong ph n II.1.2, chúng tôi ã trình bày m t ph ng pháp cho phép phát hi n và nh v nhanh các i m c tr ng trên nh. Trong ph n này, chúng tôi xu t gán cho m i i m c tr ng m t h ng, g i là

Page 4: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

h ng c tr ng c a i m. Vi c gán h ng c tr ng cho i m nh s cho phép mô t c tr ng c l p v i h ng c a i t ng nh (do có s thay i v góc ch p).

xác nh h ng c tr ng cho m t i m nh (x, y), [14] xu t tính histogram h ng các gradient tính trong mi n lân c n c a i m xem xét. Thông th ng, t t c các i m n m trong ng tròn bán kính r,

tâm (x, y) s c coi là lân c n-r c a i m (x, y), ta g i là C(x, y, r). V i m i i m (xi, yi) trong ng

tròn C(x, y, r), ta tính h ng vector gradient t i i m này. l n c a vector gradient c coi nh tr ng

s tính histogram. Trong bài báo này, chúng tôi th nghi m v i r = 7 (pixels). Histogram có 36 bin ph không gian 360 . Hình 3 bên ph i minh h a histogram c tính trong lân c n c a m t i m nh. Tr c hoành c a histogram bi u di n s bin, tr c tung là s i m nh có ánh tr ng s theo biên c a gradient có cùng h ng t ng ng. i m c c i trên histogram cho phép xác nh m t h ng chính (canonical orientation), ta gán nó nh là h ng c tr ng ca i m xem xét.

Ph ng pháp tính h ng c tr ng mà chúng tôi xu t ph c t p h n m t chút so v i m t ph ng pháp xu t b i [13] do vi c ánh tr ng s c a h ng theo l n c a vector gradient và vi c tính histogram

h ng. Tuy nhiên v i cách tính này, h ng xác nh c s ít b tác ng b i nhi u h n. Hình 3 minh h a các h ng c tr ng tính c trên m i i m c tr ng. Ta có th th y nh ng i m c tr ng bi u di n các góc c a c a s c a tòa nhà s c phân bi t b i các h ng c tr ng.

a

b

Hình 3: a) Các i m c tr ng phát hi n v i các h ng c tr ng (vector màu ). b) Histogram h ng

gradient tính t i m t i m nh. Tr c hoành bi u di n s l ng bins c a histogram. Tr c tung bi u di n s

i m nh ánh tr ng s theo biên c a vector gradient c a các i m nh.

II.2 Bi u di n các i m c tr ng - Không gian c tr ng

II.2.1 Xây d ng không gian c tr ng

Chúng ta có m t t p các i m c tr ng cho phép bi u di n nh, m i i m c tr ng c gán m t h ng c tr ng. so sánh hai i m c tr ng trong nh, m i i m ph i c mô t b i m t vector c tr ng.

Các mô t nên c l p v i các bi n i v h ng, ánh sáng và v trí ch p nh. Có nhi u ph ng pháp mô t các c tr ng. Cách n gi n nh t là s d ng chính m c xám c a vùng nh bao xung quanh i m

c tr ng và vi c so sánh hai i m c tr ng quy v tính s t ng quan (correlation measure) gi a hai vùng m c xám. N u vùng m c xám xem xét có kích th c NxN, không gian c tr ng s có kích th c N2 chi u và vi c tính toán và tìm ki m trong không gian có s chi u l n s r t t n kém v th i gian và b nh [1, 11].

gi m s chi u c a không gian c tr ng, chúng tôi xu t s d ng ph ng pháp phân tích thành các thành ph n chính (PCA - Principal Component Analysis). Ph ng pháp này cho phép chuy n không gian

Page 5: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

N2 chi u v không gian có s chi u nh h n nâng cao hi u su t i sánh nh. Ngoài ra, do m c xám r t d b nhi u và ph thu c nhi u vào c ng ánh sáng, chúng tôi ngh thay m c xám b ng biên c a vector gradient chu n hóa (normalized gradient of the image). Trong [12], Y. Ke c ng ã ch ra r ng vi c s d ng PCA cho phép t ng t c gi i thu t i sánh các i m c tr ng trong nh m t cách áng k.

Không gian c tr ng c xây d ng thông qua các b c sau:

1) L y ra m t t p nh h c. T p này ph i l n và các nh nên phân bi t có th h c c nhi u m u khác nhau.

2) Trên m i nh, phát hi n các i m c tr ng, tính h ng c tr ng cho các i m c tr ng, xác nh vùng ph t ng ng v i i m c tr ng (theo h ng c tr ng). Vùng ph là m t vùng hình vuông có kích th c NxN và có h ng là h ng c tr ng (xem m t ví d hình 3a). G i s l ng vùng c tr ng thu c t t p nh h c là M.

3) V i m i vùng ph Pi, tính gradient c a các pixel trong vùng ph : G(x, y) = Ix2(x, y) + Ix

2(x, y) trong ó Ix

2, Iy2 là gradient c a nh theo các h ng x, y. M i i m c tr ng c bi u di n b i m t vector i

có (N-2)2 thành ph n (do không tính các i m n m trên c nh c a hình vuông kích th c NxN).

4) Chu n hóa vector gradient i:

4a) Tính vector gradient trung bình:

4b) Chu n hóa vector c tr ng:

5) Tính ma tr n hi p ph ng sai:

C là m t ma tr n có kích th c (N-2)2 x (N-2)2.

6) Tính các giá tr riêng và vector riêng c a ma tr n C b ng ph ng pháp phân tích thành các giá tr riêng (Singular Value Decomposition - SVD). G i e1, e2, ..., eK là các K giá tr riêng l n nh t tìm c trong t p các giá tr riêng.

7) Gi l i K vector riêng làm h c s cho không gian c tr ng. K thông th ng nh h n r t nhi u so v i N2. G i các vector c tr ng là (v1, v2, ..., vK).

L u r ng giai o n h c xây d ng h c s c a không gian c tr ng c làm offline, c l p v i lúc ch y ch ng trình.

II.2.2 Bi u di n trong không gian c tr ng

Sau khi không gian c tr ng ã c xây d ng, m i i m c tr ng có th c ánh x sang không gian c tr ng thông qua các b c sau:

1) Chu n hóa vector biên gradient = -

2) Ánh x vector sang không gian c tr ng:

3) Bi u di n nh m t vector K ph n t : = (w1, w2, ..., wK)

M i i m c tr ng, tr c ó c bi u di n b i m t vector - (N-2)2 chi u (khi N = 41, s chi u là 39 x 39 = 1521 chi u), gi ch còn c bi u di n b i vector - K chi u, v i K = 20 trong tr ng h p th nghi m c a chúng tôi. S chi u c a không gian c tr ng gi m m t cách áng k , cho phép gi m l ng th i gian tính toán và tìm ki m trong không gian này.

III. i sánh các vector c tr ng

Page 6: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

so sánh hai nh, ta so sánh các i m c tr ng phát hi n c t hai nh. V i m i nh t p các i m c tr ng c phát hi n b i ph ng pháp c trình bày trong ph n II.1.2. M i i m sau ó c gán m t h ng c tr ng (ph n II.1.2) và c mô t b i m t vector c tr ng (ph n II.2.2). Vi c i sánh các hai t p h p i m c tr ng quy v bài toán tìm i m lân c n g n nh t (nearest neigbour) c a m i i m c tr ng (xem hình 4).

Hình 4 : i sánh hai nh quy v i sánh hai t p h p i m c tr ng trong không gian c tr ng

Có hai v n c n c quan tâm: i) t ch c t p h p i m cho phép vi c tìm ki m lân c n m t cách hi u qu ; ii) vi c so sánh ph i t c m t chính xác nh t nh.

M t ph ng pháp xu t b i D. Mount cho phép tìm ki m nhanh các i m lân c n c s d ng [21]. ANN là vi t t t c a Approximative Nearest Neigbour. Nó cho phép t ch c d li u d i d ng kd-tree. Vi c tìm ki m lân c n g n nh t mang tính x p x trên kd-tree. Vì th th i gian tìm ki m gi m áng k . Tuy nhiên vi c tìm ki m lân c n x p x ôi khi a ra m t lân c n không h n là g n nh t. tránh các l i có th x y ra, chúng tôi xu t s d ng thêm m t tiêu chí liên quan n vi c tính lân c n g n th hai (second nearest neighbour) nh xu t trong [14]. C th là hai i m trong không gian c tr ng c coi là gi ng nhau n u nh kho ng cách Euclide gi a hai i m là nh nh t và t s gi a kho ng cách g n nh t và kho ng cách g n nhì ph i nh h n m t ng ng cho tr c. Kho ng cách gi a hai i m trong không gian

c tr ng là kho ng cách Euclide c tính nh sau:

trong ó ei là các giá tr riêng c a ma tr n hi p t ng quan C tính trên.

Ngoài ra, gi i thu t RANSAC c ng c áp d ng lo i b các l i i sánh. Chi ti t v RANSAC c trình bày trong [9].

IV. M T S K T QU TH C NGHI M

Các b c th c hi n i sánh hai nh I1, I2:

1) Phát hi n các i m c tr ng trên m i nh I1, I2

2) V i m i nh Ii, t p các i m c tr ng s c ánh x sang không gian c tr ng. G i Si là t p các i m c tr ng c a nh Ii trong không gian c tr ng.

3) S d ng ph ng pháp ANN và ph ng pháp RANSAC tìm các c p i m gi ng nhau gi a hai t p S1 và S2

D li u s d ng th nghi m thu t toán: B d li u nh có c b ng cách ch p nh các v t trong phòng thí nghi m, các nh trong khuôn viên i h c. S nh s d ng cho vi c h c là 30 nh. Gi i thu t

c th nghi m trong hai tr ng h p nh m ki m tra:

1) chính xác c a gi i thu t i v i s thay i c a môi tr ng: Th nghi m v i các c p nh khi có s d ch chuy n c a camera, s thay i c a ánh sáng, s che khu t.

2) Th i gian tính toán c a gi i thu t: Th nghi m xác nh xem thu t toán có nhanh ng d ng vào các bài toán c n i sánh nh th i gian th c (nh là i u khi n t ng b ng hình nh, theo dõi i t ng).

M t s tham s s d ng khi th nghi m thu t toán: S chi u c a không gian c tr ng: K = 20. Kích th c c a vùng bao ph N = 17. ây là các tham s c l a ch n m t cách th c nghi m. Th c t , thu t

Lân c n g n nh t

I1

I2

Page 7: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

toán c th nghi m v i các giá tr khác nhau c a N, K, b N = 17, K= 20 là b tham s cho chính xác/th i gian tính toán t t nh t trên b th nghi m c a chúng tôi.

Hình 5, 6, 7 cung c p m t s k t qu i sánh nh. Trên hình, các i m c tr ng c ánh d u b ng các d u +, hai i m gi ng nhau trên hai nh c n i b ng m t ng th ng. Ta có th th y r ng, gi i thu t v n cho k t qu t t khi ánh sáng thay i (hình 5b), khi camera di chuy n (hình 5c), khi có s che khu t (hình 5a) hay trong tr ng hai nh khác nhau v góc quay camera (hình 6).

Hình 5: i sánh các i m c tr ng gi a hai nh khác nhau v góc nghiêng và v trí thu nh n nh.

Hình 6 : M t s k t qu i sánh hai nh c a thu nh n c t nh ng v trí khác nhau, trong i u ki n

ánh sáng khác nhau.

Hình 7 c trích ra t vi c th nghi m gi i thu t trong m t ng d ng s d ng hình nh i u khi n robot (robot có g n camera). ng d ng có th tóm t t nh sau: Ng i ta mu n i u khi n robot (có g n camera) di chuy n t m t v trí A sang m t v trí B b ng hình nh. làm c vi c này, nh quan sát

c IA t v trí A s c i sánh v i nh IB v trí B. S sai khác gi a hai nh cho phép i u khi n robot chuy n t v trí A n m t v trí T g n v trí B h n v trí A. T i v trí T, ta l i so sánh nh quan sát

c It v i IB và d ch chuy n robot t v trí T n m t v trí g n B h n v trí T. C làm nh v y cho n khi It trùng v i IB có ngh a là robot ã di chuy n n v trí mong mu n B. L thuy t v vi c i u khi n di chuy n robot d a trên s sai khác hình nh c trình bày c th trong các bài báo [5, 6, 8].

Page 8: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

Th nghi m cho th y s l ng c p i m nh gi ng nhau tìm th y trên hai nh It và IB luôn cho phép thu t toán xác nh phép bi n i gi a hai nh (transformation) ho t ng t t (t i thi u là 4 hay 8 c p i m, tùy thu c vào scene quan sát là 2D hay 3D). L i i sánh th ng g p ph i khi các i m c tr ng

phát hi n c các v trí khác nhau trên nh bi u th nh ng i t ng gi ng nhau (ví d các góc c a c a các toà nhà hình 7c). tránh các l i này, gi i thu t tìm ki m i m lân c n g n nh t nên tính n quan h không gian gi a các i m nh.

a b c

Hình 7: Th nghi m gi i thu t i sánh các trong ng d ng i u khi n t ng b ng hình nh. Trong m i

hình, phía bên trên là m t nh It trong lúc ch y ch ng trình, bên d i là nh tham chi u (IB). c) Minh

h a m t ví d v l i i sánh do các i m c tr ng bi u di n các i t ng trên th c t khá gi ng nhau.

B ng I cung c p m t s thông tin v th i gian tính toán trong m i giai o n c a gi i thu t xu t. Gi i thu t ho t ng v i t c 10Hz trên máy Pentium IV, 2.6GHz khi các nh t ng i khác nhau v v trí thu nh n nh c ng nh i u ki n ánh sáng. Trong tr ng h p i sánh nh trong ng d ng i u khi n robot b ng hình nh, gi i thu t có lúc t n t c 14Hz.

Các công o n trong bài toán i sánh (ms)

Phát hi n i m c tr ng 10

Mô t i m c tr ng (PCA) 30

i sánh các i m c tr ng (gi i thu t ANN) 20

Lo i b các áp án sai (gi i thu t RANSAC) 30

B ng 1: Th i gian tính toán c a m i b c trong gi i thu t i sánh nh

V. K T LU N VÀ H NG PHÁT TRI N

Trong bài báo này, chúng tôi xu t m t ph ng pháp i sánh nh nhanh, có kh n ng ng d ng vào các bài toán òi h i vi c i sánh ph i c th c hi n trong th i gian th c. óng góp chính c a chúng tôi là ã a ra: 1) m t ph ng pháp phát hi n nhanh các i m c tr ng trong nh; 2) m t cách th c xác nh

h ng c tr ng cho nh và vi c bi u di n i m c tr ng trong không gian c tr ng s d ng k thu t PCA; 3) m t xu t s d ng gi i thu t ANN th c hi n tìm ki m nhanh các lân c n g n nh t.

Ph ng pháp ã c th nghi m v i các nh t nhiên và trong bài toán i u khi n t ng b ng hình nh. Gi i thu t ho t ng v i t c 10-14Hz trên máy tính Pentium IV, 2.6GHz phù h p v i các ng

d ng th i gian th c (gi i thu t xu t b i D. Lowe ch y v i t c 3Hz trên máy Pentium IV, 2GHz). chính xác c a gi i thu t ã c ki m nghi m thông qua vi c h i t c a các ng d ng i u khi n t ng b ng hình nh. H ng phát tri n ti p theo c a chúng tôi là lo i b m t s l i i sánh b ng cách xem xét

Page 9: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

và a vào các ràng bu c v quan h không gian gi a các i m c tr ng. Sau ó chúng tôi s th nghi m gi i thu t i sánh nh trong m t h th ng theo dõi giám sát (video surveillance).

TÀI LI U THAM KH O

[1] S. Arya, D. M. Mount, N. S. Netanyahu, R. Silverman, and A. Y. Wu. An optimal algorithm for approximate nearest neighbor searching. Journal of ACM, (45): 891.923, 1998. [2] S. Benhimane and E. Malis. Homography-based 2d visual tracking and servoing. Int. Journal of Computer

Vision, 2007. Special IJCV/IJRR issue on vision for robots. [3] S. Boukir, P. Bouthemy, F. Chaumette, and D. Juvin. A local method for contour matching and its parallel implementation. Machine Vision and Application, 10(5/6):321.330, April 1998. [4] A.I. Comport, E. Marchand, and F. Chaumette. Robust model-based tracking for robot vision. In IEEE/RSJ Int.

Conf. on Intelligent Robots and Systems, IROS'04, volume 1, pages 692.697, Sendai, Japan, September 2004. (extended version version published in Advanced Robotics, 16(10):1097.1013, december 2005 (special issue on Selected paper from IROS'04). [5] A.I. Comport, E. Marchand, and F. Chaumette. Statistically robust 2d visual servoing. IEEE Trans. on Robotics, 22(2):415.421, apr 2006. [6] A.I. Comport, E. Marchand, M. Pressigout, and F. Chaumette. Realtime markerless tracking for augmented reality: the virtual visual servoing framework. IEEE Trans. on Visualization and Computer Graphics, 12(4):615.628, July 2006. [7] T. Drummond and R. Cipolla. Real-time visual tracking of complex structures. IEEE Trans. on Pattern Analysis

and Machine Intelligence, 24(7):932.946, July 2002. [8] B. Espiau, F. Chaumette, and P. Rives. A new approach to visual servoing in robotics. IEEE Trans. on Robotics

and Automation, 8(3):313.326, June 1992. [9] N. Fischler and R.C. Bolles. Random sample consensus: A paradigm for model _tting with application to image analysis and automated cartography. Communication of the ACM, 24(6):381.395, June 1981. [10] S. Hutchinson, G. Hager, and P. Corke. A tutorial on visual servo control. IEEE Trans. on Robotics and

Automation, 12(5):651.670, October 1996. [11] P. Indyk. Nearest Neighbors in high dimensional spaces. Handbook of Discrete and Computational Geometry, CRC Press, 2004. [12] Y. Ke and R. Sukthankar. Pca-sift: A more distinctive representation for local image descriptor. In IEEE Int.

Conf. on Computer Vision and Pattern Recognition, 2004. [13] V. Lepetit and P. Fua. Keypoint recognition using randomized trees. IEEE Trans. on Pattern Analysis and

Machine Intelligence, 28(9):1465.1479, September 2006. [14] D. Lowe. Distinctive image features from scale-invariant keypoints. Int. Journal of Computer Vision, 60(2):91.110, 2004. [15] E. Malis, F. Chaumette, and S. Boudet. 2 1/2 D visual servoing with respect to unknown objects through a new estimation scheme of camera displacement. Int. Journal of Computer Vision, 37(1):79. 97, June 2000. [16] E. Marchand. Visp: A software environment for eye-in-hand visual servoing. In IEEE Int. Conf. on Robotics

and Automation, ICRA'99, volume 4, pages 3224.3229, Detroit, Michigan, Mai 1999. [17] E. Marchand and F. Chaumette. Feature tracking for visual servoing purposes. Robotics and Autonomous

Systems, 52(1):53.70, June 2005. special issue on .Advances in Robot Vision., D. Kragic, H. Christensen (Eds.). [18] E. Marchand, F. Spindler, and F. Chaumette. ViSP for visual servoing: a generic software platform with a wide class of robot control skills. IEEE Robotics and Automation Magazine, 12(4):40.52, December 2005. Special Issue on "Software Packages for Vision-Based Control of Motion", P. Oh, D. Burschka (Eds.). [19] K. Mikolajczyck and C. Schmid. Indexing based on scale invariant interest point. In IEEE, Int. Conf. on

Computer Vision, ICCV'01, pages 525.531, Seattle, 2001. [20] K. Mikolajczyk, T. Tuytelaars, C. Schmid, A. Zisserman, J. Matas, F. Schaffalitzky, T. Kadir, and L. Van Gool. A comparison of affine region detectors. Int. Journal of Computer Vision, 65:43.72, 2005. [21] D.M. Mount. ANN programming Manual. Dpt. of Computer Science and Inst. of Advanced Computer Studies, Univ. of Maryland, College Park, Maryland, 2005. [22] E. Rosten and T. Drummond. Fusing points and lines for high performance tracking. In IEEE Int. Conf. on

Computer Vision, pages 1508.1515, Beijing, China, 2005.

Page 10: MỘT PHƯƠNG PHÁP ÐỐI SÁNH ẢNH THỜI GIAN THỰC Trần Thị

[23] J. Shi and C. Tomasi. Good features to track. In IEEE Int. Conf. on Computer Vision and Pattern Recognition,

CVPR'94, pages 593.600, Seattle, Washington, June 1994. [24] C. Harris and M.J. Stephens. A combined corner and edge detector. In Alvey Vision Conference, pages 147.152, 1988. [25] H. Moravec. Obstacle avoidance and navigation in the real world by a seeing robot rover. Technical Report

CMU-RI-TR-3, Carnegie-Mellon University, Robotics Institute, 1980. [26] C. Schmid, R. Mohr, and C. Bauckhage. Evaluation of interest point detectors. International Journal of

Computer Vision, 37(2):151–172, June 2000. [27], H. Tran, Etude des lignes d'intérêt naturelles pour la représentation d'objets en vision par ordinateur, Ph.D

dissertation (in french), INPG, France, Mars 2006 [28], H. Tran, A. Lux, A method for ridge extraction, In Proc. of Asean Conference on computer vision ACCV05, Volume 1, Pages 96-111, Jeju, Korea, 2004