Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẶNG TUẤN ANH
NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG
KHUÔN MẶT TRÊN CÁC MÔ HÌNH
KHUÔN MẶT 3D KHÁC NHAU
Ngành: Công nghệ Thông tin
Chuyên ngành: Công nghệ Phần mềm
Mã số: 60 48 10
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. Bùi Thế Duy
Hà Nội - 2008
MỤC LỤC
MỞ ĐẦU ......................................................................................................................... 5
CHƢƠNG 1. TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN
MẶT 3D .......................................................................................................................... 7
1.1 Giới thiệu .......................................................................................................... 7
1.2 Các kỹ thuật hiện có đƣợc sử dụng để tạo mô hình và làm hoạt ảnh khuôn
mặt 3D .......................................................................................................................... 8
1.2.1 Tạo mô hình khuôn mặt .............................................................................. 9
1.2.2 Tạo mô hình hoạt ảnh của khuôn mặt ...... Error! Bookmark not defined.
1.2.3 Môi .......................................................... Error! Bookmark not defined.
1.3 Một mô hình khuôn mặt 3D cho ứng dụng thời gian thực .. Error! Bookmark
not defined.
1.3.1 Lƣới mặt ................................................... Error! Bookmark not defined.
1.3.2 Mô hình môi ............................................. Error! Bookmark not defined.
1.4 Các cơ làm khuôn mặt hoạt ảnh...................... Error! Bookmark not defined.
1.4.1 Các cơ vectơ ............................................. Error! Bookmark not defined.
1.4.2 Cơ vòng miệng ......................................... Error! Bookmark not defined.
1.4.3 Cơ vòng mắt ............................................. Error! Bookmark not defined.
1.4.4 Xoay quai hàm .......................................... Error! Bookmark not defined.
1.4.5 Xoay tròng mắt ......................................... Error! Bookmark not defined.
1.5 Kết quả thực nghiệm ....................................... Error! Bookmark not defined.
1.6 Kết luận chƣơng .............................................. Error! Bookmark not defined.
CHƢƠNG 2. CƠ SỞ LÝ THUYẾT NỀN TẢNG ........ Error! Bookmark not defined.
2.1 Giới thiệu ........................................................ Error! Bookmark not defined.
2.2 Các nghiên cứu trƣớc đây về việc chuyển hoạt ảnh khuôn mặt ............. Error!
Bookmark not defined.
2.2.1 Nhân bản biểu hiện ................................... Error! Bookmark not defined.
2.2.2 Dịch chuyển các bảng hoạt ảnh khuôn mặt MPEG-4 ... Error! Bookmark
not defined.
2.2.3 Chuyển một cấu trúc khuôn mặt nhiều lớp ............ Error! Bookmark not
defined.
2.3 Mạng RBF và các thuật toán di truyền học .... Error! Bookmark not defined.
2.3.1 Mạng RBF ................................................ Error! Bookmark not defined.
2.3.2 Các thuật toán di truyền học ..................... Error! Bookmark not defined.
CHƢƠNG 3. XÂY DỰNG MÔ HÌNH KHUÔN MẶT 3D TỪ MỘT KHUÔN MẶT
GỐC ............................................................................... Error! Bookmark not defined.
3.1 Giới thiệu ........................................................ Error! Bookmark not defined.
3.2 Mô tả phƣơng pháp biến đổi khuôn mặt 3D ... Error! Bookmark not defined.
3.3 Các mạng RBF ................................................ Error! Bookmark not defined.
3.4 Hàm sai số ....................................................... Error! Bookmark not defined.
3.5 Sử dụng GA điều chỉnh các điểm đánh dấu ... Error! Bookmark not defined.
3.5.1 Nhiễm sắc thể ........................................... Error! Bookmark not defined.
3.5.2 Hàm thích nghi (Fitness function) ............ Error! Bookmark not defined.
3.5.3 Phép lai ghép (Crossover) ........................ Error! Bookmark not defined.
3.5.4 Đột biến (Mutation) .................................. Error! Bookmark not defined.
3.5.5 Phép toán bổ sung (Additional Operation) ............. Error! Bookmark not
defined.
3.6 Quy trình biến đổi khuôn mặt 3D ................... Error! Bookmark not defined.
3.7 Một công cụ biến đổi khuôn mặt 3D .............. Error! Bookmark not defined.
3.7.1 Tạo mô hình khuôn mặt 3D bằng Poser 5 Error! Bookmark not defined.
3.7.2 Công cụ biến đổi ....................................... Error! Bookmark not defined.
KẾT LUẬN ................................................................... Error! Bookmark not defined.
TÀI LIỆU THAM KHẢO ............................................................................................. 12
PHỤ LỤC ...................................................................... Error! Bookmark not defined.
DANH MỤC VIẾT TẮT
Ký hiệu Tiếng Anh Ý nghĩa
AMA Abstract Muscle Action Hành động cơ trừu tƣợng
FAP Facial Animation Parameter Tham số hoạt ảnh mặt
FAT Face Animation Table Bảng hoạt ảnh khuôn mặt
FFD Free Form Deformation Biến đổi dạng tự do
GA Genetic Algorithms Các thuật toán di truyền học
RBF Radial Basis Function Hàm cơ sở bán kính
RFFD Rational Free Form Deformation Biến đổi dạng tự do hợp lý
DANH MỤC CÁC BẢNG
Bảng 1.1: Các cơ trên mô hình khuôn mặt (ở phần khuôn mặt bên phải). ............ Error!
Bookmark not defined.
Bảng 1.2: Kết quả của việc áp dụng các kỹ thuật tăng tốc độ hoạt ảnh (trên một máy
tính Pentium III, 800 Mhz, 256MB RAM, Nvidia GeForce3 video card) ............ Error!
Bookmark not defined.
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải) ........................... 10
Hình 1.2: Một bề mặt B-spline ...................................................................................... 12
Hình 1.3: Mô hình cơ vòng của Waters......................... Error! Bookmark not defined.
Hình 1.4: Mô hình cơ phiến của Waters ........................ Error! Bookmark not defined.
Hình 1.5: Mô hình cơ vectơ của Waters ........................ Error! Bookmark not defined.
Hình 1.6: Hành động của cơ vòng miệng thực: (a) chìa môi và (b) mím môi. ..... Error!
Bookmark not defined.
Hình 1.7: (a) Khuôn mặt khung lƣới cùng các cơ; (b) khuôn mặt bình thƣờng; và (c)
hiệu ứng của cơ gò má lớn bên trái. .............................. Error! Bookmark not defined.
Hình 1.8: Chia vùng trên phần khuôn mặt bên phải. ..... Error! Bookmark not defined.
Hình 1.9: Đôi môi (bên trái) và các điểm điều khiển của môi (bên phải). ............ Error!
Bookmark not defined.
Hình 1.10: (a) Lƣới mặt không có môi; và (b) môi kết hợp với toàn bộ lƣới mặt Error!
Bookmark not defined.
Hình 1.11: Giản đồ các cơ mặt ...................................... Error! Bookmark not defined.
Hình 1.12: Tác động của cơ đơn lên lƣới (a và b); Tác động của hai cơ lên lƣới (biểu
diễn theo từng bƣớc) bằng cách mô phỏng tính chất song song (c,d,e,f) và bằng cách
thêm sự biến đổi (g,h,i,j)................................................ Error! Bookmark not defined.
Hình 1.13: Tác động của ba cơ lên lƣới mặt: bằng cách mô phỏng các đƣờng song
song (a) và bằng cách thêm sự biến đổi (b) ................... Error! Bookmark not defined.
Hình 1.14: Khi có biểu hiện buồn, xử lý sự co cơ đối với cặp lông mày: bằng cách mô
phỏng các đƣờng song song (a) và bằng cách thêm sự biến đổi (b) .. Error! Bookmark
not defined.
Hình 1.15: Miền chứa các nếp nhăn đƣợc tạo bởi sự co rút của một cơ vectơ ..... Error!
Bookmark not defined.
Hình 1.16: Hàm nếp nhăn .............................................. Error! Bookmark not defined.
Hình 1.17: Bài toán “pháp tuyến đỉnh không biểu diễn” và cách giải. ................. Error!
Bookmark not defined.
Hình 1.18: Các nếp nhăn do sự co cơ tạo nên. .............. Error! Bookmark not defined.
Hình 1.19: Mô tả hành động của cơ vòng miệng: đẩy môi ra (a); mím môi lại (b).
....................................................................................... Error! Bookmark not defined.
Hình 1.20: Sự biến đổi của môi dƣới tác động của sự co cơ vòng miệng: dạng bình
thƣờng (a); đẩy môi ra (b) và mím môi lại (c)............... Error! Bookmark not defined.
Hình 1.21: Chỉ nhắm một mắt (a); Nhắm cả hai mắt (b). ............ Error! Bookmark not
defined.
Hình 1.22: Các góc định hƣớng mắt. ............................. Error! Bookmark not defined.
Hình 1.23: Vùng nhìn đƣợc của mắt. ............................ Error! Bookmark not defined.
Hình 1.24: Khuôn mặt buồn khi có (a) và khi không có (b) các nếp nhăn và việc xử lý
hành động co đa cơ. ....................................................... Error! Bookmark not defined.
Hình 1.25: Gƣơng mặt ngạc nhiên. ............................... Error! Bookmark not defined.
Hình 1.26: Gƣơng mặt hạnh phúc. ................................ Error! Bookmark not defined.
Hình 1.27: Gƣơng mặt buồn. ......................................... Error! Bookmark not defined.
Hình 2.1: Mạng RBF trong xây dựng mô hình chuỗi thời gian .. Error! Bookmark not
defined.
Hình 2.2: Mạng RBF trong phân loại mẫu .................... Error! Bookmark not defined.
Hình 2.3: Sơ đồ thuật toán di truyền học ....................... Error! Bookmark not defined.
Hình 3.1: Tổng quan hệ thống khai thác khuôn mặt. .... Error! Bookmark not defined.
Hình 3.2: Mô hình khuôn mặt nguồn (4650 đa giác). ... Error! Bookmark not defined.
Hình 3.3: Giao phần giữa một bề mặt của mô hình khuôn mặt với mặt phẳng mẫu.
....................................................................................... Error! Bookmark not defined.
Hình 3.4: Cách đặt vị trí các điểm mẫu trên giao phần giữa mặt phẳng mẫu và bề mặt
của mô hình khuôn mặt mục tiêu và mô hình khuôn mặt biến đổi. ... Error! Bookmark
not defined.
Hình 3.5: Một điểm đánh dấu ban đầu và biến thể của nó .......... Error! Bookmark not
defined.
Hình 3.6: Phép lai ghép đa điểm. .................................. Error! Bookmark not defined.
Hình 3.7: Cách thức hội tụ của quá trình GA: đƣờng nét đứt – các nghiệm đƣợc thay
thế bởi phép chiếu của chúng lên mô hình khuôn mặt mục tiêu trong suốt quá trình
GA; đƣờng liên tục: phép chiếu đƣợc sử dụng chỉ để tính hàm sai số và để tạo ra
nghiệm cuối cùng........................................................... Error! Bookmark not defined.
Hình 3.8: Quy trình biến đổi khuôn mặt 3D .................. Error! Bookmark not defined.
Hình 3.9: Giao diện công cụ Face của Poser 5 .............. Error! Bookmark not defined.
Hình 3.10: Hai hình ảnh của khuôn mặt: chụp thẳng và chụp bên..... Error! Bookmark
not defined.
Hình 3.11: Nạp ảnh và xác định một số vị trí trên gƣơng mặt .... Error! Bookmark not
defined.
Hình 3.12: Kết quả thu đƣợc sau bƣớc 1 ....................... Error! Bookmark not defined.
Hình 3.13: Texture Variation và công cụ Face ShapingError! Bookmark not defined.
Hình 3.14: Biểu đồ lớp thiết kế của hệ thống ................ Error! Bookmark not defined.
Hình 3.15: Giao diện công cụ biến đổi khuôn mặt 3D .. Error! Bookmark not defined.
Hình 3.16: Đƣa vào khuôn mặt mục tiêu ...................... Error! Bookmark not defined.
Hình 3.17: Chọn các điểm đánh dấu trên khuôn mặt mục tiêu ... Error! Bookmark not
defined.
Hình 3.18: Kết quả thực nghiệm khi sử dụng công cụ biến đổi khuôn mặt 3D .... Error!
Bookmark not defined.
MỞ ĐẦU
Hiện nay, phần lớn tƣơng tác giữa con ngƣời và máy tính đƣợc thực hiện thông qua
chuột và bàn phím. Cùng với sự phát triển nhanh chóng của đồ họa máy tính và công nghệ
ngôn ngữ, các nhà nghiên cứu ngày càng chú ý tới việc đƣa sự tƣơng tác này trở nên linh hoạt,
thích ứng và hƣớng tới con ngƣời hơn. Một cách thực hiện điều này là qua việc tạo ra các
agent hiện thân (embodied agent). Các agent hiện thân đã từng đƣợc sử dụng làm giao diện
cho tƣơng tác con ngƣời – máy tính [11]. Ngƣời ta cho rằng những agent hội thoại hiện thân
(embodied conversational agents) cho phép ngƣời sử dụng tƣơng tác tự nhiên hơn với máy
tính.
Với xu thế phát triển của thế giới ảo, công nghệ agent hiện thân cho phép tạo dựng
những nhân vật ảo với nhiều mục đích khác nhau nhƣ giải trí, giáo dục. Khả năng nói chuyện,
biểu hiện gƣơng mặt và các cử chỉ của agent hiện thân khiến chúng rất phù hợp với các ứng
dụng giải trí. Ngƣời kể chuyện ảo tại Đại học Twente là một ví dụ về agent hiện thân [38]. Đây
là một agent nói chuyện hiện thân, kể lại những câu chuyện đƣợc sáng tác ra, với những ngôn
điệu và cử chỉ thích hợp. Agent này đƣợc đặt trong một mô hình - bản sao nhà hát địa phƣơng:
Virtual Music Center. Bên cạnh dạng kể chuyện truyền thống này, ngƣời ta cũng dự định phát
triển các vở kịch ảo, trong đó các nhân vật hiện thân diễn trên sân khấu ảo, dựa trên cốt truyện
đã sáng tác. Còn có nhiều ví dụ khác về các agent hiện thân phục vụ lĩnh vực giải trí, nhƣ các
nhân vật nhân tạo ở phòng thí nghiệm truyền thông MIT [4], các nhà bình luận bóng đá robot
[2].
Các agent hiện thân có thể làm ngƣời hƣớng dẫn các thủ tục, trả lời câu hỏi thắc mắc,
và kiểm soát hành động của sinh viên. Agent hiện thân cũng có thể trở thành đồng đội trong
những nhiệm vụ đòi hỏi sự tham gia của nhiều ngƣời. Một ví dụ về những agent nhƣ vậy là
Steve - chuyên gia luyện bay trong môi trƣờng ảo tại Đại học Nam California [35]. Steve
đƣợc xây dựng nhằm hỗ trợ việc tập luyện của đội trong một mô hình môi trƣờng làm việc ảo
tƣơng tác ba chiều của một sinh viên, khi mà việc luyện tập dựa trên các thiết bị thật không có
trên thực tế.
Các agent hiện thân cũng đƣợc dùng để phát triển các trò chơi trên máy tính. Các trò
chơi máy tính truyền thống thƣờng có những nhân vật thụ động, cứng nhắc, máy móc. So với
trò chơi một ngƣời chơi (một ngƣời chơi với các nhân vật máy tính), thì các trò chơi nhiều
ngƣời chơi vẫn đƣợc ƣa chuộng hơn. Chơi với ngƣời thật thú vị hơn vì cách phản ứng của con
ngƣời luôn đƣa đến những diễn biến mới mẻ, ngay cả khi chơi nhiều lần với cùng một ngƣời.
Còn trò chơi chỉ chơi với nhân vật máy tính sẽ không có đƣợc điều đó. Các agent hiện thân
(hay các nhân vật ảo có thể cử động) có mục tiêu, kiến thức và khả năng riêng của chúng, đây
có thể là lời giải đáp cho vấn đề này [23], đặc biệt là đối với những loại trò chơi sử dụng máy
tính để tạo nên thế giới và các nhân vật ảo có thể tƣơng tác động với ngƣời chơi, ví dụ nhƣ
Quake, Half-Life 2, Diablo 3,... Do đó, các nhân vật ảo có thể cử động đang đƣợc phát triển
và đƣa vào nhiều loại trò chơi máy tính. Chúng cũng có tiềm năng dẫn đến việc ra đời những
loại trò chơi hoàn toàn mới [23].
Một agent hiện thân điển hình gồm các thành phần sau:
- Một cái đầu nói chuyện có khả năng nói, thể hiện các cử động môi trong khi nói, có
các biểu cảm trên gƣơng mặt và thể hiện đƣợc các tín hiệu hội thoại.
- Một cơ thể có khả năng thể hiện các cử chỉ.
- Một mô hình trí não có thể bao gồm lòng tin, cảm xúc, kế hoạch hành vi, động thái và
tính cách…
Đối tƣợng nghiên cứu của luận văn này là các agent hiện thân đƣợc thể hiện dƣới dạng
một khuôn mặt 3D. Trong bài toán xây dựng một mô hình khuôn mặt 3D, thông thƣờng ta
phải trải qua các bƣớc sau:
- Bƣớc 1: Sử dụng đồ hoạ máy tính để tạo dựng một mô hình khuôn mặt 3D.
- Bƣớc 2: Tạo dựng mô hình cơ mặt có thể đạt đƣợc những biểu hiện khuôn mặt chân
thực trong thời gian thực trên một máy tính thông thƣờng.
Các nghiên cứu trƣớc đây đã cho thấy bƣớc 2 đòi hỏi rất nhiều công sức và thời gian. Và
việc này lặp lại mỗi khi chúng ta xây dựng một mô hình khuôn mặt 3D mới. Đây là lý do để luận
văn nghiên cứu một phƣơng pháp tạo dựng mô hình cơ mặt cho một khuôn mặt 3D mới bằng
cách biến đổi mô hình khuôn mặt nguồn đã có mô hình cơ mặt. Trên cơ sở nghiên cứu và thử
nghiệm phƣơng pháp nhân bản của Bùi Thế Duy và cộng sự [9], tôi đƣa ra một quy trình và xây
dựng một công cụ tạo ra hoạt ảnh trên các khuôn mặt 3D. Công cụ này đƣợc xây dựng để kết nối
với phần mềm tạo khuôn mặt Poser.
Có một số ƣu điểm khi sử dụng mô hình khuôn mặt biến đổi để thể hiện một mô hình
khuôn mặt mới thay cho việc sử dụng chính bản thân mô hình mới. Thứ nhất, khi tạo hoạt ảnh
với những mô hình khuôn mặt khác nhau, chúng ta có thể giữ đƣợc một mô hình khuôn mặt cố
định với số đỉnh và số đa giác đƣợc xác định trƣớc. Thứ hai, ta có thể tái sử dụng các thông số
trên mô hình khuôn mặt cố định trƣớc, ví dụ nhƣ các thông số xoay quai hàm và đảo mắt. Thứ
ba, ta có thể sử dụng lại những thông tin về các vùng trên mô hình khuôn mặt để nâng cao hiệu
quả của cơ vectơ và điều khiển hoạt ảnh.
Luận văn đƣợc cấu trúc nhƣ sau. Chƣơng 1 giới thiệu một mô hình khuôn mặt 3D dựa
trên hệ thống cơ đơn giản, có thể đáp ứng các mục tiêu sau: nó vừa có thể tạo nên những biểu
hiện khuôn mặt chân thực, đồng thời lại đạt đƣợc hoạt ảnh thời gian thực trên những máy tính
cá nhân thông thƣờng. Chƣơng 2 trình bày cơ sở lý thuyết để xây dựng một phƣơng pháp
truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc
tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng 3 trình bày một phƣơng pháp
truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc
tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng này mô tả quy trình và một công
cụ do tác giả phát triển để thử nghiệm phƣơng pháp đƣợc đƣa ra trong luận văn.
CHƯƠNG 1. TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN MẶT 3D
1.1 Giới thiệu
Khuôn mặt của con ngƣời rất đặc biệt. Đó là bộ phận cơ thể quan trọng để giúp nhận
diện một ngƣời bằng mắt thƣờng. Trong hàng trăm khuôn mặt quen thuộc, chúng ta vẫn có
thể nhận ra một khuôn mặt cụ thể. Ta cũng có khả năng phát hiện ra từng cử động tinh tế của
khuôn mặt. Khả năng này phát triển từ thời thơ ấu của chúng ta và nhờ nó ta có đƣợc công cụ
giao tiếp cơ bản nhất của con ngƣời. Theo một số nghiên cứu, trẻ em 9 tháng tuổi bắt đầu hiểu
đƣợc những phản ứng của khuôn mặt ngƣời khác. Ngay khi 1 tuổi, trẻ em phát triển bình
thƣờng có thể phân biệt các biểu hiện cảm xúc và chúng tiếp tục hoàn thiện khả năng này
trong quá trình trƣởng thành.
Hoạt ảnh của khuôn mặt con ngƣời giữ vai trò quan trọng trong giao tiếp mặt đối mặt.
Cử động môi trong khi nói chuyện giúp đoán biết đƣợc bằng mắt ngƣời đó đang nói gì. Cohen
and Massaro [13] đã chứng minh rằng tỷ lệ nhận biết âm vị từ những đoạn video vừa có hình
ảnh ngƣời nói vừa có âm thanh cao hơn hẳn so với từ những đoạn băng chỉ có âm thanh. Đối
với ngƣời điếc, cử động môi là điều thiết yếu để họ hiểu đƣợc các hội thoại. Trong giao tiếp
bằng cử chỉ, biểu hiện của khuôn mặt thƣờng ngụ ý sự biến đổi của khuôn mặt theo thời gian.
Tuy nhiên, ngay cả một bức tranh chân dung cũng thể hiện cảm xúc, nghĩa là biểu hiện của
khuôn mặt có thể ở chế độ tĩnh, mặc dù những biểu hiện đó không rõ ràng nếu không đƣợc
đặt trong hoàn cảnh cụ thể. Biểu hiện của khuôn mặt diễn ra liên tục trong suốt quá trình nói
chuyện. Chúng là sự minh họa và bổ sung cho những thông tin từ lời nói. Chúng có thể diễn
đạt cảm xúc, tâm trạng, và truyền đạt các thông tin về tính cách của ngƣời nói. Những thông
tin này có thể làm lộ ra phần ẩn giấu bên trong một con ngƣời, mà lời nói không toát lên
đƣợc.
Bài toán tạo mô hình khuôn mặt con ngƣời và tạo ra các hoạt ảnh mặt bằng máy tính
là một thách thức lớn trong cộng đồng khoa học nghiên cứu về đồ họa vi tính. Một nhu cầu
mới nảy sinh là thể hiện đƣợc khuôn mặt chân thực, chất lƣợng cao và đồng thời đạt đƣợc
hoạt ảnh thời gian thực của khuôn mặt. Nhìn chung, trƣớc nghiên cứu của Bùi Thế Duy và
cộng sự [7, 8], các cách tiếp cận đều chƣa thể đạt đƣợc cả hai mục tiêu này. Hoạt ảnh khung
cơ sở (key-frame animation) [29], hoạt ảnh đƣợc tham số hoá (parameterized animation) [30]
và hoạt ảnh dựa trên hệ thống cơ giả (pseudo-muscle-based animation) [21] là các cách thức
đơn giản để đạt đƣợc hoạt ảnh thời gian thực, tuy nhiên chúng không thể tạo ra các biểu hiện
khuôn mặt chân thực, do không tạo đƣợc các chỗ phình và nếp nhăn trên da, cũng nhƣ không
xử lý đƣợc các tƣơng tác đa tham số (đa cơ). Mặt khác, hoạt ảnh dựa trên hệ thống cơ đa lớp
với nhiều lớp thuộc cấu trúc khuôn mặt có thể tạo đƣợc sự biểu đạt chân thực, nhƣng việc xử
lý hoạt ảnh thời gian thực bằng phƣơng pháp này đòi hỏi dung lƣợng tính toán khổng lồ, mà
các máy tính cá nhân thông thƣờng không đáp ứng đƣợc.
Trong chƣơng này, tôi sẽ xem xét một mô hình khuôn mặt 3D dựa trên hệ thống cơ
giản đơn, mà có thể tạo ra nét mặt chân thực cũng nhƣ các hoạt ảnh thời gian thực trên máy
tính cá nhân thông thƣờng. Để thực hiện đƣợc điều này, tôi sẽ tìm hiểu:
- Một mô hình có biểu hiện khuôn mặt chân thực và chất lƣợng cao, đủ đơn giản để giữ
đƣợc các hoạt ảnh thời gian thực và có thể hỗ trợ mô hình cơ điều khiển sự biến đổi
trên gƣơng mặt.
- Một mô hình cơ tạo ra sự biến đổi chân thực trên bề mặt của khuôn mặt, xử lý đƣợc
các tƣơng tác đa cơ một cách chính xác, và tạo ra đƣợc các chỗ phình và nếp nhăn
trong thời gian thực.
Phần 1.2 bàn cụ thể về các kỹ thuật hiện có đƣợc sử dụng để tạo mô hình và làm hoạt ảnh
khuôn mặt. Trƣớc tiên, tôi nghiên cứu về hai kỹ thuật chính để tạo mô hình khuôn mặt, đó là:
tạo mô hình khuôn mặt bằng các lớp hình đa giác và tạo mô hình khuôn mặt bằng các lớp bề
mặt đƣợc tham số hoá. Phần này cũng chỉ ra những ƣu và nhƣợc điểm của từng kỹ thuật trong
quá trình biểu hiện và hoạt ảnh gƣơng mặt. Sau đó tôi nghiên cứu tiếp các kỹ thuật làm hoạt
ảnh khuôn mặt. Bốn kỹ thuật chính đƣợc đề cập tới là: hoạt ảnh khung cơ sở [29], hoạt ảnh
đƣợc tham số hoá [30], hoạt ảnh dựa trên hệ thống cơ giả [21] và hoạt ảnh dựa trên hệ thống
cơ (muscle-based animation) [43]. Phần 1.3 giới thiệu cấu trúc mô hình khuôn mặt của Bùi
Thế Duy và cộng sự [7]. Tôi mô tả cách thức xây dựng mạng lƣới khuôn mặt để tạo ra các
biểu hiện chân thực trong khi vẫn giữ đƣợc hoạt ảnh trong thời gian thực. Mạng lƣới khuôn
mặt cũng đƣợc thiết kế để nâng cao hiệu quả của mô hình cơ. Phần 1.4 thảo luận về hệ thống
cơ điều khiển hoạt ảnh của khuôn mặt [7, 8]. Trong phần này, tôi mô tả cách thức mở rộng mô
hình cơ của Waters [43] để xử lý việc kết hợp giữa các hành động đa cơ, và để tạo ra các chỗ
phình và các nếp nhăn trên gƣơng mặt. Phần này cũng bàn về các kỹ thuật để nâng cao hiệu
quả của mô hình cơ. Tiếp theo, tôi tìm hiểu cách cử động cơ vòng miệng, cơ vòng mắt và sự
chuyển động của hàm. Cuối cùng, những kết quả thực nghiệm của Bùi Thế Duy và cộng sự
[8] sẽ đƣợc đƣa ra ở Phần 1.5, trong đó khuôn mặt đƣợc tạo ra mang các sắc thái ngạc nhiên,
hạnh phúc và buồn rầu, nhằm minh họa cho cách thức xây dựng các biểu hiện khuôn mặt chân
thực.
1.2 Các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh
khuôn mặt 3D
Mục đích của hoạt ảnh khuôn mặt 3D là điều khiển mạng lƣới bề mặt 3D của mô hình
khuôn mặt theo thời gian, sao cho tại một thời điểm bất kỳ, mô hình khuôn mặt có biểu hiện
nhƣ ta mong muốn. Có nhiều phƣơng pháp tạo nên hoạt ảnh khuôn mặt 3D, từ phƣơng pháp
đơn giản nhằm tạo ra hoạt ảnh thời gian thực nhƣ mô hình khuôn mặt CANDIDE [36], đến
những phƣơng pháp phức tạp hơn nhằm đạt đƣợc sự biểu hiện khuôn mặt có chất lƣợng nhƣ
ảnh chụp, ví dụ nhƣ mô hình khuôn mặt dựa trên hệ thống cơ đa lớp của Lee và cộng sự [24].
Theo mô tả của Rydfalk [36], CANDIDE là một mô hình khuôn mặt đƣợc tham số hoá
(parameterized face model), chỉ bao gồm 75 đỉnh và 100 tam giác. Mô hình này đƣợc xây
dựng dành riêng cho việc mã hoá khuôn mặt con ngƣời, qua đó khuôn mặt ngƣời đƣợc mã
hóa với tỷ lệ bít đƣợc giảm đáng kể, trong các ứng dụng nhƣ điện thoại truyền hình. Số lƣợng
ít các đa giác của mô hình này cho phép tái xây dựng và đạt đƣợc hiệu ứng hoạt ảnh nhanh
chóng ngay cả với các máy tính thông thƣờng (dung lƣợng thấp). CANDIDE do các đơn vị
hành động (Action Units) toàn cục và cục bộ điều khiển [15]. Các đơn vị toàn cục tƣơng ứng
với các chuyển động xoay quanh ba trục. Các đơn vị hành động cục bộ tạo ra các biểu hiện
khác nhau của khuôn mặt.
Mô hình khuôn mặt của Lee và cộng sự [24] là một ví dụ trong các phƣơng pháp nhằm
đạt đƣợc các biểu hiện chất lƣợng cao. Nó bao gồm nhiều lớp: một lớp mô sinh học, một lớp
cơ và một cấu trúc sọ đặc. Để tạo mô hình khuôn mặt của một cá nhân, các dữ liệu từ một
máy quét laze sẽ đƣợc nhập tự động vào mô hình khuôn mặt chung. Hình ảnh từ máy quét
cũng đƣợc xử lý để tạo nên kết cấu bề mặt của mô hình khuôn mặt. Bằng một hệ thống cơ xây
dựng dựa trên vật lý học, các biểu hiện khuôn mặt chân thực sẽ đƣợc tạo ra trên bề mặt đƣợc
cấu thành của mô hình khuôn mặt.
Có hai vấn đề cần lƣu tâm khi xử lý hoạt ảnh khuôn mặt 3D. Vấn đề đầu tiên là việc
tạo mô hình khuôn mặt, trong đó xử lý cách biểu hiện của chính mô hình khuôn mặt đó. Vấn
đề thứ hai là việc tạo mô hình chuyển động của khuôn mặt. Bây giờ tôi sẽ xem xét lại các kỹ
thuật để xử lý hai vấn đề này một cách chi tiết. Ngoài ra, tôi cũng sẽ thảo luận về các phƣơng
pháp để tạo mô hình và làm môi cử động. Trong số các bộ phận của khuôn mặt, môi đóng vai
trò quan trọng trong giao tiếp mặt đối mặt. Nó cũng là một thành phần quan trọng trong các
biểu hiện cảm xúc và tham gia vào việc giải nghĩa lời nói. Bởi vậy, môi luôn là một thành
phần đƣợc chú ý đặc biệt trong việc tạo mô hình hoạt ảnh khuôn mặt.
1.2.1 Tạo mô hình khuôn mặt
Khuôn mặt con ngƣời là một bề mặt ba chiều linh hoạt và phức tạp. Khuôn mặt
thƣờng mang một số nếp nhăn cố định, còn những chỗ phình và nếp nhăn tạm thời đƣợc tạo ra
trong quá trình biểu đạt của khuôn mặt. Thách thức đặt ra là làm sao có thể tạo nên một bề
mặt cho phép biểu hiện chân thực, đồng thời đạt đƣợc hiệu ứng chuyển động thời gian thực.
Tạo mô hình khuôn mặt bằng lớp da gồm nhiều đa giác
Một phƣơng pháp là sử dụng nhiều lớp đa giác để mô phỏng trực tiếp bề mặt khuôn
mặt. Sau đó, mô hình khuôn mặt đƣợc tạo hoạt ảnh bằng cách trực tiếp điều khiển các đỉnh đa
giác trên bề mặt. Phƣơng pháp này lần đầu đƣợc giới thiệu bởi Gouraud [17]. Ông xây dựng
một mẫu bề mặt của khuôn mặt bằng nhiều điểm và nối các điểm này để tạo thành một lớp da
gồm các hình đa giác. Ứng dụng phƣơng pháp này, Parke [29] đã tạo ra một mô hình khuôn
mặt, một trong những công trình đầu tiên trong lĩnh vực nghiên cứu hoạt ảnh khuôn mặt con
ngƣời. Mô hình này bao gồm khoảng 250 hình đa giác đƣợc tạo thành từ 400 đỉnh. Do khuôn
mặt con ngƣời gần nhƣ đối xứng, nên chỉ cần tạo ra một nửa mô hình khuôn mặt, còn nửa kia
là sự lặp lại đối xứng. Parke tập trung vào tốc độ và chất lƣợng của quá trình kết xuất đồ họa
(render) khi tạo ra mô hình khuôn mặt. Ông giảm đến mức tối thiểu số lƣợng hình đa giác
(nhƣng vẫn đảm bảo chất lƣợng tốt) để có thể đạt đƣợc kết xuất đồ họa nhanh hơn. Để thu
đƣợc độ tô bóng mịn (smooth shading), ông sử dụng thêm nhiều đa giác ở các vùng có độ
cong lớn (mũi, miệng, quanh mắt và đỉnh cằm) và giảm bớt ở các vùng có độ cong nhỏ (trán,
má và cổ). Các đa giác ở vùng dƣới mắt, cánh mũi, bờ môi, khóe miệng, những nơi xuất hiện
nếp nhăn trên khuôn mặt, đƣợc thiết kế sao cho cạnh của chúng trùng với các nếp gấp. Các đa
giác nằm trong vùng xuất hiện các đƣờng biên màu sắc, nhƣ môi và lông mày, đƣợc thiết kế
sao cho cạnh của chúng trùng với các đƣờng biên này.
Nhiều hệ thống hoạt ảnh khuôn mặt khác sử dụng lƣới đa giác để mô phỏng lớp da của
khuôn mặt. Ví dụ nhƣ mô hình khuôn mặt CANDIDE [36] và mô hình khuôn mặt Greta [32].
CANDIDE ban đầu là một mô hình khuôn mặt tham số hóa do Rydfalk tạo nên tại Linkoping
Image Coding Group, đƣợc xây dựng riêng nhằm mã hóa khuôn mặt con ngƣời. Nó bao gồm
75 đỉnh và 100 tam giác, cho phép tái xây dựng khuôn mặt một cách nhanh chóng ngay ở các
máy tính dung lƣợng thấp. Những phiên bản nâng cao của mô hình khuôn mặt này đã ra đời
sau đó. Nhiều đỉnh đa giác đƣợc thêm vào để che phủ toàn bộ phần đầu (gồm cả tóc và răng)
và phần vai (Candide-2 [45]), và để đơn giản hóa hoạt ảnh bằng các tham số hoạt ảnh mặt
MPEG-4 (Candide-3 [1]). Greta là một mô hình khuôn mặt phù hợp với các đặc điểm kỹ thuật
MPEG-4 và chứa khoảng 15000 đa giác. Mô hình này là nỗ lực lớn nhằm nâng cao mức độ
chi tiết trên các vùng biểu hiện của mô hình khuôn mặt trong giao tiếp trao đổi thông tin và
thể hiện cảm xúc. Đó là những vùng gồm miệng, mắt, trán và nếp nhăn kéo từ cánh mũi qua
khóe miệng. Nhiều đa giác đƣợc thiết kế và đặt tại các vùng này. Ngoài ra, trán và nếp nhăn
qua khóe miệng đƣợc đặc biệt chú ý. Các đa giác ở vùng trán đƣợc tổ chức thành một lƣới các
đƣờng ngang cách đều, để tạo nên những nếp nhăn ngang xuất hiện khi nhƣớn lông mày bằng
các kỹ thuật tạo bề mặt sần (bump mapping techniques) [27]. Các đa giác nằm ở nếp nhăn qua
khóe miệng đƣợc sắp xếp sao cho sự phân tách giữa vùng da bị kéo căng gần miệng và vùng
da ở má có thể tạo nên nếp nhăn rõ nét khi khuôn mặt cƣời.
Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải)
Khi tạo mô hình bề mặt của khuôn mặt, bên dƣới lớp da gồm các đa giác, ngƣời ta sử
dụng thêm các lớp nhƣ lớp mỡ dƣới da, lớp cơ và bề mặt sọ để hình thành nên mô hình cơ dựa
trên vật lý học [19, 24].
Để tạo mô hình một cá nhân cụ thể, ta sử dụng ba kỹ thuật. Kỹ thuật thứ nhất là xây
dựng thủ công mô hình khuôn mặt cho một cá nhân bằng các kỹ thuật tạo mô hình 3D nhƣ
AutoCAD và 3DMax. Đây là một công việc rất tốn thời gian và đòi hỏi sự kiên trì. Kỹ thuật
thứ hai, đƣợc gọi là phƣơng pháp quang trắc (photogrammetric measurement), xây dựng mô
hình khuôn mặt từ nhiều tấm ảnh chụp đầu của cá nhân từ những góc độ khác nhau. Để tìm
đƣợc mối quan hệ giữa các bức ảnh với mô hình 3D, ta cần xác định đƣợc những điểm đặc
trƣng trên các bức ảnh. Kỹ thuật thứ ba là sử dụng máy quét laze để quét hình các khuôn mặt
thật, rồi sử dụng hình ảnh đó làm chất liệu cho mô hình khuôn mặt. Các máy quét laze cho
phép thu đƣợc dữ liệu 3D rất chi tiết nhƣ màu sắc hay mức xám của các điểm đƣợc quét. Việc
kết hợp những dữ liệu này có thể tạo nên những mô hình tĩnh chân thực đến bất ngờ.
Việc mô phỏng khuôn mặt con ngƣời bằng các đa giác có nhiều ƣu điểm. Nhờ phƣơng
pháp xây dựng các bề mặt đa giác, nhiều vấn đề đƣợc giải quyết thông qua các thuật toán, ví
dụ nhƣ việc xác định một phần hay toàn bộ đối tƣợng nằm bên trong không gian quan sát,
phát hiện các bề mặt ẩn, xác định độ tô bóng của các bề mặt hiển thị… Những thuật toán này
xử lý nhanh và đỡ tốn kém hơn so với thuật toán dành cho các bề mặt cấp độ cao hơn, chúng
cũng đƣợc bổ sung vào phần cứng của máy tính. Ngoài ra, việc phát triển các thuật toán tô
bóng Grouraud [17] và tô bóng Phong [10] cho phép tạo đƣờng cong liên tục trên một bề mặt
xây dựng từ các đa giác. Tuy nhiên, nếu chỉ sử dụng một lƣợng nhỏ đa giác nhƣ trong mô
hình Parke [29] và mô hình khuôn mặt CANDIDE [36], thì những thuật toán này không thể
che dấu hoàn toàn độ phẳng của bề mặt khuôn mặt.
Tạo mô hình khuôn mặt bằng các bề mặt tham số
Có thể tạo mô hình khuôn con ngƣời bằng một bề mặt tham số. Mục đích là tìm kiếm
một phƣơng trình toán học để biểu diễn bề mặt khuôn mặt. Tuy nhiên, rất khó tìm ra một
phƣơng trình cho phép biểu diễn khuôn mặt một cách chi tiết. Cách tiếp cận đƣợc ƣa chuộng
hơn là tạo ra một bề mặt bằng cách kết nối một tập hợp các mảng tham số. Những mảng này
phải liên kết với các mảng kế tiếp tại đƣờng biên. Đây thƣờng đƣợc gọi là tính chất liên tục
C0. Độ mịn của toàn bộ bề mặt đƣợc đánh giá thông qua tính chất liên tục ở các bậc cao hơn.
Bề mặt đạt đƣợc liên tục C1 khi các mảng (đƣợc biểu diễn bằng đạo hàm bậc nhất của các
mảng ban đầu) đạt liên tục tại các đƣờng biên, liên tục C2 là liên tục đối với đạo hàm bậc
hai… Bề mặt liên tục ở bậc càng cao thì càng mịn. Bề mặt đƣợc tạo nên bởi các mảng này
thƣờng đƣợc xác định bởi một tập hợp các điểm đƣợc gọi là “điểm điều khiển” (control
points). Ta có thể làm mô hình khuôn mặt hoạt ảnh bằng việc điều chỉnh các điểm điều khiển
này. Các điểm điều khiển thƣờng đƣợc sắp xếp thành một lƣới kích thƣớc :)1()1( mn
mjniW ji 0,0,, . Các điểm nằm trên bề mặt, ),( vuw , đƣợc xác định là tổng trọng
số của các điểm điều khiển jiW , :
m
i
n
jjiji WvNuNvuw
0 0,)()(),(
trong đó )(uNi và )(vN j là các hàm cơ bản. Một hàm cơ bản biểu diễn một đƣờng cong
trên mặt phẳng hai chiều. Nhƣ vậy, về mặt trực giác, bề mặt đƣợc tạo nên bằng cách kết hợp
nhiều đƣờng cong. Những đƣờng cong này đƣợc lựa chọn một cách cẩn thận sao cho bề mặt
đƣợc tạo nên đạt độ mịn cần thiết. Ngƣời ta thƣờng chọn các đƣờng cong spline do sự đơn
giản và tính chất liên tục bậc cao của chúng. Hình 1.2 là một ví dụ về bề mặt đƣợc tạo bởi các
mảng tham số nhƣ thế này.
Hình 1.2: Một bề mặt B-spline
TÀI LIỆU THAM KHẢO
1. Ahlberg, J. (2001), “Candide-3 – an updated parameterized face”, Technical Report
Report No. LiTH-ISY-R-2326, Dept. of Electrical Engineering, Linkping, University,
Sweden.
2. André, E., Herzog, G., and Rist, T. (1997), “Generating multimedia presentations for
robocup soccer trò chơis”, In Kitano, H., editor, RoboCup ’97: Robot Soccer World Cup I,
pages 200–215. Springer-Verlag, New York.
3. Bishop, C. M. (1995), Neural Networks for Pattern Recognition. Oxford University Press,
Oxford.
4. Blumberg, B., Downie, M., Ivanov, Y. A., Berlin, M., Johnson, M. P., and Tomlinson, B.
(2002), “Integrated learning for interactive synthetic characters”, In SIGGRAPH 2002,
pages 417–426.
5. Bors, A. G., Gabbouj, G. (1994), “Minimal topology for a radial basis function neural
network for pattern classification”, Digital Signal Processing: a review jounal, vol. 4, no.
3, pp. 172-188.
6. Broomhead, D. S. and Lowe, D. (1988), “Multivariable functional interpolation and
adaptive networks”, Complex Systems, vol. 2, pages 321-355.
7. Bui The Duy, Heylen, D., and Nijholt, A. (2003a), “Improvements on a simple muscle-based
3d face for realistic facial expressions”, In 16th International Conference on Computer
Animation and Social Agents (CASA-2003), pages 33–40, Los Alamos, CA. IEEE Computer
Society.
8. Bui The Duy, Heylen, D., Poel, M., and Nijholt, A. (2003b), “Exporting vector muscles for
facial animation”. In Butz, A., Krger, A., and Olivier, P., editors, Proceedings International
Symposium on Smart Graphics 2003, Berlin, Lecture Notes in Computer Science, Springer.
9. Bui The Duy, Poel, M., Heylen, D., and Nijholt, A. (2003c), “Automatic face morphing for
transferring facial animation”, In Proceedings 6th IASTED International Conference on
Computers, Graphics, and Imaging (CGIM 2003), Anaheim/Calgary/Zurich, ACTA Press.
10. Bui Tuong Phong (1975), “Illumination for computer generated pictures”,
Communications of the ACM, 18(6).
11. Cassell, J., Sullivan, J., Prevost, S., and Churchill, E., editors (2000), Embodied
Conversational Agents, The MIT Press.
12. Chen, S., Cowan, C. F. N., Grant, P. M. (1991), “Orthogonal least squares learning
algorithm for radial basis function networks”, IEEE Trans. On Neural Networks, vol. 2,
no. 2, pp. 302-309.
13. Cohen, M. M. and Massaro, D. W. (1993), “Modeling coarticulation in synthetic visual
speech”, In Magnenat Thalmann, N. and Thalmann, D., editors, Models and Techniques in
Computer Animation, pages 139–156, Springer, Tokyo.
14. Eck, M. (1991), “Interpolation methods for reconstruction of 3d surfaces from sequences
of planar slices”, CAD und Computergraphik, 13(5).
15. Ekman, P. and Friesen, W. V. (1978), “Facial Action Coding System”, Consulting
Psychologists Press, Palo Alto, CA.
16. Goldberg, D. E. (1989), Genetic Algorithms in Search, Optimization, and Machine
Learning, Addison-Wesley, Reading, MA.
17. Gouraud, H. (1971), Computer display of curved surfaces. PhD thesis, Dept. of Electrical
Engineering, University of Utah.
18. Hoch, M., Fleischmann, G., and Girod, B. (1994), “Modeling and animation of facial
expressions based on b-splines”, Visual Computer, 11.
19. Kahler, K., Haber, J., and Seidel, H. P. (2001), “Geometry-based muscle modeling for
facial animation”. In Watson, B. and Buchanan, J. W., editors, Proceedings of Graphics
Interface 2001, pages 37–46.
20. Kahler, K., Haber, J., Yamauchi, H., and Seidel, H. P. (2002), “Head shop: Generating
animated head models with anatomical structure”, In Spencer, S. N., editor, Proceedings
of the 2002 ACM SIGGRAPH Symposium on Computer Animation (SCA-02), pages 55–
64, New York, ACM Press.
21. Kalra, P., Mangili, A., Magnenat-Thalmann, N., and Thalmann, D. (1992), “Simulation of
facial muscle actions based on rational free form deformations”, In Kilgour, A. and
Kjelldahl, L., editors, Computer Graphics Forum (EURO-GRAPHICS ’92 Proceedings),
volume 11 (3), pages 59–69.
22. King, S. A., Parent, R. E., and Olsafsky, B. (2000), “An anatomically-based 3d parametric
lip model to support facial animation and synchronized speech”, In Proceedings of
Deform 2000, pages 7–19.
23. Laird, J. E. and van Lent, M. (2000), “Human-level ai’s killer application: Interactive
computer trò chơis”, In Proceedings of the Seventeenth National Conference on Artificial
Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence,
AAAI Press / The MIT Press.
24. Lee, Y., Terzopoulos, D., and Waters, K. (1995), “Realistic face modeling for animation”,
In Cook, R., editor, SIGGRAPH 95 Conference Proceedings, Annual Conference Series,
pages 55–62. ACM SIGGRAPH, Addison Wesley.
25. Magnenat-Thalmann, N., Primeau, E., and Thalmann, D. (1988), “Abstract muscle action
procedures for human face animation”, The Visual Computer, 3(5):290–297.
26. Mani, M. V. and Ostermann, J. (2001), “Cloning of MPEG-4 face models”, In
International Workshop on Very Low Bit rate Video Coding (VLBV01).
27. Moubaraki,L., Ohya, J., and Kishino, F. (1995), “Realistic 3D facial animation in virtual
space teleconferencing”, In 4th IEEE International workshop on Robot and Human
Communication.
28. Noh, J. and Neumann, U. (2001), “Expression cloning”, In Fiume, E., editor, SIGGRAPH
2001, Computer Graphics Proceedings, Annual Conference Series, pages 277–288. ACM
Press / ACM SIGGRAPH.
29. Parke, F. I. (1972), Computer generated animation of faces, Master’s thesis, Dept. of
Electrical Engineering, Division of Computer Science, University of Utah.
30. Parke, F. I. (1974), A parametric model for human faces, PhD thesis, University of Utah.
31. Parke, F. I. and Waters, K. (1996), Computer Facial Animation, A K Peters. ISBN 1-
56881-014-8.
32. Pasquariello, S. and Pelachaud, C. (2001), “Greta: A simple facial animation engine”, In
6th Online World Conference on Soft Computing in Industrial Appications, Session on
Soft Computing for Intelligent 3D Agents.
33. Platt, S. M. and Badler, N. I. (1981), “Animating facial expression”, Computer Graphics,
13(3):245–252.
34. Poggio, T., Girosi, F. (1990), “Network for approximation and learning”, Proc. IEEE, vol. 78,
no. 9, pp. 1481-1497.
35. Rickel, J. and Johnson, W. L. (1998), “Steve: A pedagogical agent for virtual reality”, In
Proceedings of the Second International Conference on Autonomous Agents.
36. Rydfalk, M. (1987), “Candide, a parameterized face”, Technical Report, Report No. LiTH-
ISY-I-866, Dept. of Electrical Engineering, Linkping University, Sweden.
37. Terzopoulos, D. and Waters, K. (1990), “Physically-based facial modelling, analysis, and
animation”, The Journal of Visualization and Computer Animation, 1(2): 73–80.
38. Theune, M., Faas, S., Heylen, D., andNijholt, A. (2003), “Thevirtualstoryteller: Story
creation by intelligent agents”, In Proceedings TIDSE 03: Technologies for Interactive
Digital Storytelling and Entertainment, pages 204–215, Fraunhofer IRB Verlag.
39. Tou, J. T., Gonzalez, R. C. (1974), Pattern Recognition, Reading, MA: Addison –
Wesley.
40. Ulgen, F. (1997), “A step toward universal facial animation via volume morphing”, In 6th
IEEE International Workshop on Robot and Human communication, pages 358–363.
41. Waite, C. (1989), The facial action control editor, face: A parametric facial expression
editor for computer generated animation, Master’s thesis, MIT, Media Arts and Sciences.
42. Wang, C. L. (1993), Langwidere: A hierarchical spline based facial animation system
with simulated muscles. Master’s thesis, University of Calgary.
43. Waters, K. (1987), “A muscle model for animating three-dimensional facial expression”.
In Stone, M. C., editor, Computer Graphics (SIGGRAPH ’87 Proceedings), pages 17–24.
44. Waters, K. (1996),
http://crl.research.compaq.com/publications/books/waters/Appendix1/appendix1.html.
45. Welsh, B. (1991), Model-based coding of images, PhD thesis, Essex University.
46. Wikipedia (2008), Ellipsoid, [http://en.wikipedia.org/wiki/Ellipsoid]
47. Wikipedia (2008), Genetic Algorithm, [http://en.wikipedia.org/wiki/Genetic_algorithm]
48. Wikipedia (2008), Mahalanobis Distance,
[http://en.wikipedia.org/wiki/Mahalanobis_distance]
49. Wikipedia (2008), Radial Basis Function,
[http://en.wikipedia.org/wiki/Radial_basis_function]
50. Wu, Y., Magnenat-Thalmann, N., and Thalmann, D. (1994), “A plastic-visco-elastic
model for wrinkles in facial animation and skin”, In Proc. 2nd Pacific Conference on
Computer Graphics and Applications.