Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
i
LỜI CAM ĐOAN
Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá nhân dưới sự
hướng dẫn của PGS.TS. Phạm Văn Tất, trường Đại học Hoa Sen và PGS. TS. Trần
Dương, trường Đại học Sư Phạm – Đại học Huế.
Luận án được thực hiện tại trường Đại học Khoa Học – Đại học Huế. Chưa từng
có kết quả nghiên cứu tương tự được công bố dưới bất cứ hình thức nào trước khi
thực hiện luận án. Một phần kết quả của công trình này đã được công bố trên: Tạp
chí Hóa học và Ứng dụng, Tạp chí Hóa học, Tạp Chí Khoa học và Công nghệ -
trường Đại học Khoa học – Đại học Huế, Tạp chí Đại học Huế, Tạp chí
Computational Chemistry, Cogent Chemistry, Taylor Francis, Tạp chí Organic &
Medicinal Chemistry International Journal (OMCIJ), Tạp chí Natural products
research.
Ký tên
Bùi Thị Phương Thúy
ii
LỜI CẢM ƠN
Để hoàn thành luận án trước hết em xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS.
Phạm Văn Tất, Trường Đại học Hoa Sen; PGS. TS. Trần Dương, Trường Đại học
Sư Phạm Huế đã giao đề tài, hướng dẫn trực tiếp và truyền đạt những kinh nghiệm
và kiến thức quý báu, tận tình chỉ dẫn, động viên và tạo mọi điều kiện thuận lợi giúp
đỡ em hoàn thành luận án này.
Em xin gửi lời cảm ơn chân thành đến GS.TS. Trần Thái Hòa, TS. Trần Xuân
Mậu, TS. Nguyễn Thị Ái Nhung - Khoa Hóa, Trường Đại học Khoa Học Huế. Các
thầy cô đã giúp đỡ, động viên và chỉ dạy nhiều kiến thức quý báu trong quá trình
em học tập tại trường.
Em xin gửi lời cảm ơn các Thầy Cô trong Khoa Hóa, các Thầy Cô trong Khoa
Sau đại học và toàn thể Ban Giám hiệu Trường Đại học Khoa Học Huế đã cho phép
và tạo mọi thuận lợi cho em hoàn thành luận án này.
Em xin gửi lời cảm ơn đến TS. Phùng Văn Trung, TS. Hoàng Thị Kim Dung
Viện Hoá học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam TP. Hồ Chí Minh
đã giúp đỡ em trong quá trình làm luận án.
Em xin gửi lời cảm ơn đến PGS.TS. Nguyễn Hùng Huy, Khoa Hoá, Trường Đại
học Khoa học Tự Nhiên – ĐHQGHN đã giúp đỡ, tận tình chỉ dẫn em trong quá
trình làm luận án.
Tôi xin gửi lời cảm ơn chân thành gia đình, bạn bè đã động viên, giúp đỡ cho tôi
hoàn thành luận án này.
Ký tên
Bùi Thị Phương Thúy
iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
ANOVA Phân tích phương sai
ARE, % Giá trị tuyệt đối của sai số tương đối
Bond Liên kết
Cal Tính toán (Calculation)
SKC Sắc kí cột
COSY 1H-1H (Correlation Spectroscopy)
d Đỉnh đôi (doublet)
dd Mũi đôi của mũi đôi (duplet of duplet)
DEPT Phô DEPT (Distortionless Enhancement by Polarisation Transfer)
DMSO Dimethyl sulfoxide (CH3)2S=O
Exp Thực nghiệm (Experiment)
EtOAc Ethyl acetate (CH3COOC2H5)
EtOH Ethanol (C2H5OH)
E-State Trạng thái điện tử (electrotopological state)
GI50 Nồng độ thuốc ức chế 50% sự phát triển của tế bào gây ung thư
(50% Growth Inhibition)
pGI50 pGI50= -log(GI50)
pGI50,exp Giá trị pGI50 thực nghiệm
pGI50,pr Giá trị pGI50 dự đoán
HMBC Phô tương tác đa liên kết hai chiều dị hạt nhân (Heteronuclear
Multiple Bond Vorrelation)
HSQC Phô tương tác hai chiều trực tiếp dị hạt nhân (heteronuclear single
quantum coherence)
HPV Vi rút u nhú ở người (Human Papillomavirus)
IR Phô hồng ngoại (Infrared Spectroscopy)
iv
LV Biến ẩn (Latent Variables)
LogP Giá trị logarit hệ số phân tán
Linear Tuyến tính
m Mũi đa (multiplet)
MM+ Phương pháp cơ học phân tử MM
MARE, % Giá trị trung bình của ARE, %
MSE Sai số trung bình bình phương (Mean Squared Error)
MS Phô khối (mass spectrometry)
MetOH methanol (CH3OH)
Nonlinear Phi tuyến tính
NMR Phô cộng hưởng từ hạt nhân
OD Phương pháp đo mật độ quang (Optical Density)
PCA Phân tích thành phần chính (Principal Components Analysis)
PCR Hồi qui thành phần chính (Principal Components Regression)
PLS Bình phương cực tiểu riêng phần (Partial Least Squares)
QSPR Quan hệ định lượng cấu trúc - tính chất
(Quantitative Structure - Property Relationship)
QSAR Quan hệ định lượng cấu trúc - hoạt tính
(Quantitative Structure - Activity Relationship)
QESAR Quan hệ định lượng giữa cấu trúc điện tử và hoạt tính sinh học
(Quantitative Electronic Structure - Activity Relationship)
QSDAR Quan hệ định lượng giữa cấu trúc phô NMR và hoạt tính sinh học
(Quantitative Spectrum Data - Activity Relationship)
QSSR Quan hệ định lượng cấu trúc - cấu trúc
(Quantitative Structure - Structure Relationship)
Q2 Hệ số tương quan đánh giá chéo (Cross-validation correlation
coefficient)
R2tr Hệ số tương quan R2 luyện
R2pr Hệ số tương quan R2 dự đoán
v
R2ad R2
hiệu chỉnh
Rf Hệ số lưu giữ (Retention Factor)
SAR Quan hệ cấu trúc hoạt tính (Structure - Activity Relationship)
s Đỉnh đơn (singlet)
SRB Sulforhodamine B
SK Sắc ký
SKLM Sắc ký lớp mỏng
t Mũi ba (triplet)
TCA Trichloroacetic acid
UV Phô UV (Ultraviolet Spectroscopy)
J (Hz) Hằng số ghép (Hz) (Coupling constant Hz)
1H-NMR Phô cộng hưởng từ hạt nhân proton (Hydrogen Nuclear Magnetic
Resonance)
13C-NMR Phô cộng hưởng từ hạt nhân cacbon 13 (Carbon Nuclear Magnetic
Resonance)
(ppm) Độ dịch chuyển hóa học (chemical shift) tính bằng ppm
QSARMLR
(3.16)QSARMLR phương trình 3.16
QSARMLR
(3.17) QSARMLR phương trình 3.17
QSARMLR
(3.19) QSARMLR phương trình 3.19
vi
DANH MỤC CÁC BẢNG
Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30) ................................................. 63
Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone ................................................... 65
Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2tr ............................................................................... 67
Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2tr, R2
pr, SE ................................................................... 67
Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2tr ..................................................................................... 68
Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2tr và R2
pr ....................................................................... 68
Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2tr và R2
pr ........................................................................... 69
Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2tr .............................................................................. 69
Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê ................................................ 71
Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7) ........................................................... 72
Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các mô hình QESARMLR (với
k = 5 – 7) .......................................................................................................................................................... 73
Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN ........................................ 75
Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê ........................................................................... 76
Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch chuyển hóa học i trong các mô
hình QSDARMLR .............................................................................................................................................. 77
Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các mô hình QSDARMLR (với
k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1) ....................................................................................... 79
Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử............................................ 81
Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất nghiên cứu bằng mô hình
QSSRMLR và các chất dùng để dự đoán ........................................................................................................... 82
Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE ...................................... 86
Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và GMPmxi,% đối với các tham số mô
tả phân tử 2D và 3D trong các mô hình QSARMLR (với k là 8, 9 và 10) .......................................................... 87
Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.16) và QSARANN(1) ..... 90
Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE ...................................... 91
Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các tham số mô tả phân tử
2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7) ............................................................................... 92
Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN ................................................................................................................................................... 95
Bảng 3.24 Các mô hình QSARMLR với các giá trị R2tr
, SE và R2pr tương ứng .................................................. 97
Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của điện tích nguyên tử trong
các mô hình QSARMLR ..................................................................................................................................... 99
Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và
QSARANN(2) .................................................................................................................................................... 100
Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế bào Hela ở các nồng độ
khác nhau ....................................................................................................................................................... 112
vii
Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro ................ 113
Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và
QESARANN..................................................................................................................................................... 114
Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán từ mô hình QSDARMLR
(M1) và QSDARANN (M2) ............................................................................................................................. 116
Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn xuất flavone và isoflavone
tương tự được nghiên cứu từ mô hình QSSRMLR ........................................................................................... 118
Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR ............................................ 119
Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của các dẫn xuất flavonoid chiết
xuất. ............................................................................................................................................................... 120
Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các mô hình QSARMLR (3.16)
và QSARANN(1) .............................................................................................................................................. 121
Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình QSARANN(1 ............................. 122
Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập luteolin và daidzin từ các mô
hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN ....................................................................................... 123
Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô hình QSARPCA-ANN ) .... 124
Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và
QSARANN (2) .................................................................................................................................................. 125
Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn nhóm thế vào vị trí C6,
C3’ của quercetin, dự đoán từ mô hình QSARANN(2) ....................................................................................... 125
viii
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính ................................................ 7
Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93] .................................................... 7
Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66] .............................................................................. 15
Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66] ............................................................................ 18
Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66] ................................................................................................... 19
Hình 1.6 Giải thích F-test [51, 66] .................................................................................................................. 20
Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107] ...................................................................... 24
Hình 1.8 Thành phần chính với p = 2 [51, 106] .............................................................................................. 27
Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106] ........................................................................................... 30
Hình 1.10 Sơ đồ giải thuật di truyền [10] ........................................................................................................ 34
Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76] .................................................. 36
Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76] ..................................... 36
Hình 1.13 Toán tử chéo đơn điểm [76] ........................................................................................................... 37
Hình 1.14 Toán tử chéo hai điểm [76] ............................................................................................................ 37
Hình 1.15 Hệ thống thần kinh sinh học tự nhiên ............................................................................................. 40
Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50] ....................................................................................... 41
Hình 1.17 Cấu trúc mạng nơ ron [101] ........................................................................................................... 42
Hình 1.18 Quá trình học của mạng nơ ron [16] ............................................................................................... 43
Hình 1.19 Mô hình tính toán một nơ ron [69, 77] ............................................................................................ 44
Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74] ............................................................................... 47
Hình 1.21 Một số dẫn xuất flavonoid [20, 74] ................................................................................................. 47
Hình 2.1 Sơ đồ nghiên cứu tông quát .............................................................................................................. 51
Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2] ................................................................................... 54
Hình 2.3 Xây dựng các mô hình hồi quy đa biến ............................................................................................. 56
Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59] ........................................................................... 57
Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient ............................................................................... 64
Hình 3.2 Ảnh hưởng của k đến R2 và SE.......................................................................................................... 67
Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi .................................................................................. 72
Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính chất hóa lý ..................... 81
Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm ........................................................ 85
Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid trong nhóm kiểm tra ... 88
Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50 ............................................. 94
Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11 ................................................................................................. 102
Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7 ................................................................................................... 103
Hình 3.10 Cấu trúc POL1, C15H10O6 ............................................................................................................. 104
Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9 ......................................................................................... 106
Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% .............................................. 107
ix
Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6 .......................................................................................... 108
Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% ................................................ 109
Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) ....................................................................................... 110
Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các flavone, isoflavone mới và
chất mẫu ......................................................................................................................................................... 113
Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2] ................................................. 117
Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2] ......................................... 117
Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2 ..................................... 122
Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) POL1; b) GML1 ............ 123
Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) AIL1; b) CSL1 .............. 126
x
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... i
LỜI CẢM ƠN ........................................................................................................... ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT........................................ iii
DANH MỤC CÁC BẢNG ...................................................................................... vi
DANH MỤC CÁC HÌNH VẼ............................................................................... viii
MỤC LỤC .................................................................................................................. x
MỞ ĐẦU .................................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 4
1.1. BỆNH UNG THƯ CỔ TỬ CUNG........................................................................................... 4
1.1.1. Các nguyên nhân gây ung thư ......................................................................................... 4
1.1.2. Điều trị ............................................................................................................................. 5
1.1.3. Phòng ngừa ...................................................................................................................... 6
1.2. LIÊN HỆ GIƯA CÂU TRUC VA HOẠT TÍNH ....................................................................... 6
1.3. TÍNH TOÁN THÔNG TIN CÂU TRUC .................................................................................. 9
1.3.1. Cơ học phân tử ................................................................................................................ 9
1.3.2. Cơ học lượng tử ............................................................................................................... 9
1.3.3. Phương pháp bán thực nghiệm ...................................................................................... 11
1.4. CÁC MÔ HINH TOÁN HOC ................................................................................................ 12
1.4.1. Hồi quy đa biến ............................................................................................................. 12
1.4.2. Hồi quy thành phần chính.............................................................................................. 22
1.4.3. Bình phương tối thiểu riêng phần .................................................................................. 25
1.4.4. Giải thuật di truyền ........................................................................................................ 31
1.4.5. Mạng thần kinh nhân tạo (ANN) ................................................................................... 39
1.4.5.1. Khái niệm ............................................................................................................................. 39
1.4.5.2. Cấu trúc mạng ....................................................................................................................... 40
1.4.6. Thống kê đánh giá mô hình ........................................................................................... 45
1.4.7. Tính toán đóng góp của các tham số ............................................................................. 46
1.5. HỢP CHÂT FLAVONOID .................................................................................................... 46
1.5.1. Giới thiệu chung ............................................................................................................ 46
1.5.2. Phân loại dẫn xuất flavonoid ......................................................................................... 47
xi
1.5.3. Phân bố flavonoid trong tự nhiên .................................................................................. 48
1.5.4. Hoạt tính sinh học của flavonoid ................................................................................... 48
1.6. PHÂN LẬP VA XÁC ĐỊNH CÂU TRUC FLAVONOID ....................................................... 50
1.6.1. Phân lập flavonoid ......................................................................................................... 50
1.6.2. Xác định cấu trúc flavonoid .......................................................................................... 50
1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên ................................................................ 50
CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ...................... 51
2.1. SƠ ĐỒ NGHIÊN CỨU ......................................................................................................... 51
2.2. CƠ SỞ DƯ LIỆU, NGUYÊN LIỆU VA PHƯƠNG PHÁP .................................................... 52
2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử ..................................................................... 52
2.2.2. Nguyên liệu và phương pháp ......................................................................................... 52
2.2.2.1. Phần mềm ứng dụng ............................................................................................................. 52
2.2.2.2. Hóa chất, thiết bị ................................................................................................................... 52
2.2.2.3. Nguyên liệu .......................................................................................................................... 53
2.3. NGHIÊN CỨU LY THUYÊT ................................................................................................. 54
2.3.1. Phương pháp tính toán thông tin cấu trúc ...................................................................... 54
2.3.1.1. Cơ học phân tử...................................................................................................................... 54
2.3.1.2. Hóa lượng tử ......................................................................................................................... 54
2.3.1.3. Các tham số cấu trúc ............................................................................................................. 55
2.3.2. Xây dựng các mô hình QSAR ....................................................................................... 55
2.4. SANG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN ............................................................. 56
2.4.1. Phân lập các hợp chất flavonoid .................................................................................... 56
2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid ........................................................ 58
2.4.2.1. Phương pháp phô cộng hưởng từ hạt nhân ........................................................................... 58
2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể .............................................................................................. 59
2.4.3. Kỹ thuật thử hoạt tính in vitro ....................................................................................... 59
2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B ........................................................................ 59
2.4.3.2. Nuôi cấy tế bào ..................................................................................................................... 60
2.4.3.3. Nhuộm SRB .......................................................................................................................... 61
2.4.3.4. Xử lý kết quả ........................................................................................................................ 61
2.4.3.5. Xác định GI50 ........................................................................................................................ 61
2.5. THIÊT KÊ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID .................................................. 62
CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN ............................................................ 63
xii
3.1. NGHIÊN CỨU LY THUYÊT ................................................................................................. 63
3.1.1. Tính toán thông tin cấu trúc........................................................................................... 63
3.1.1.1. Khảo sát phương pháp cơ học phân tử.................................................................................. 63
3.1.1.2. Khảo sát phương pháp hóa lượng tử ..................................................................................... 64
3.1.2. Tham số cấu trúc và tính chất phân tử ........................................................................... 65
3.1.2.1. Điện tích .............................................................................................................................. 65
3.1.2.2. Phô 13C-NMR, 15O-NMR và độ dịch chuyển hóa học .......................................................... 66
3.1.2.3. Tham số hóa lý ..................................................................................................................... 66
3.1.2.4. Tham số hình học 2D, 3D ..................................................................................................... 66
3.2. XÂY DỰNG MÔ HINH QSAR .............................................................................................. 66
3.2.1. Khảo sát các biến số mô hình ........................................................................................ 66
3.2.2. Xây dựng các mô hình QESAR ..................................................................................... 70
3.2.2.1. Mô hình tuyến tính QESARMLR ............................................................................................ 70
3.2.2.2. Mô hình mạng thần kinh QESARANN ................................................................................... 74
3.2.2.3. Kiểm tra khả năng dự đoán ................................................................................................... 75
3.2.3. Xây dựng các mô hình QSDAR .................................................................................... 75
3.2.3.1. Mô hình tuyến tính QSDARMLR ........................................................................................... 75
3.2.3.2. Mô hình mạng thần kinh QSDARANN ................................................................................... 78
3.2.3.3. Kiểm tra khả năng dự đoán ................................................................................................... 78
3.2.4. Xây dựng mô hình QSSRMLR ........................................................................................ 79
3.2.4.1. Nguyên tắc xây dựng ............................................................................................................ 79
3.2.4.2. Tính toán các tham số hóa lý ................................................................................................ 80
3.2.4.3. Xây dựng mô hình ................................................................................................................ 80
3.2.4.4. Kiểm tra khả năng dự đoán ................................................................................................... 84
3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) ..................................................... 85
3.2.5.1. Dữ liệu .................................................................................................................................. 85
3.2.5.2. Xây dựng mô hình QSARMLR (3.16) .................................................................................... 85
3.2.5.3. Xây dựng mô hình QSARANN(1) ............................................................................................ 89
3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1) ........................................ 90
3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN ...................... 91
3.2.6.1. Dữ liệu .................................................................................................................................. 91
3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) ......................................................... 91
3.2.6.3. Xây dựng mô hình QSARPCA-ANN ......................................................................................... 94
3.2.6.4. Khả năng dự đoán của các mô hình ...................................................................................... 95
xiii
3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2) ......................... 96
3.2.7.1. Dữ liệu .................................................................................................................................. 96
3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) ..................................................... 96
3.2.7.3. Xây dựng mô hình QSARANN(2) ............................................................................................ 99
3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới .............................................................. 100
3.3. SANG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN ........................................................... 101
3.3.1. Phân lập cynaroside từ actiso ...................................................................................... 101
3.3.2. Phân lập quercetin từ xa kê ......................................................................................... 102
3.3.3. Phân lập luteolin từ tía tô ............................................................................................. 103
3.3.4. Phân lập daidzin từ đậu nành ....................................................................................... 105
3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR........................................................... 105
3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X ........................... 106
3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió ..................................................... 107
3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR ........................ 107
3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X ...... 109
3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ gừng gió . 110
3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên .......................... 111
3.4. THIÊT KÊ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID ................................................ 113
3.4.1. Mô hình QESAR ......................................................................................................... 113
3.4.2. Mô Hình QSDAR ........................................................................................................ 115
3.4.3. Mô hình QSSRMLR ....................................................................................................... 116
3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1) ................................................................ 121
3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN ............................................... 123
3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) ...................................... 124
KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 127
DANH MỤC CÔNG TRÌNH ............................................................................... 129
TÀI LIỆU THAM KHẢO .................................................................................... 131
PHỤ LỤC ............................................................................................................... 144
1
MỞ ĐẦU
Các phương pháp phòng và trị bệnh ung thư hiện nay như phẫu thuật, xạ trị,
hóa trị. Tuy nhiên các phương pháp này vẫn có những tác dụng phụ nhất định đối
với bệnh nhân. Nhu cầu về dược chất kháng ung thư có khả năng phòng và trị bệnh
đang rất lớn nhưng khả năng đáp ứng còn hạn chế [70, 71]. Các nhà khoa học, dược
học đã và đang quan tâm nghiên cứu, tìm kiếm các loại dược chất mới. Trong đó
nhóm flavone, isoflavone nói riêng là nhóm dược chất có nhiều trong thực vật với
hoạt tính kháng oxi hóa, kháng ung thư, kháng viêm, … hiệu quả [45, 104]. Các
nghiên cứu thực nghiệm trên thế giới và Việt Nam đã cung cấp một cơ sở dữ liệu
quý giá về nguồn dược chất trong tự nhiên, nhưng các nghiên cứu thực nghiệm
thuần túy còn nhiều hạn chế để tạo ra hợp chất có hoạt tính kháng ung thư hiệu quả,
nhanh chóng, kinh tế [41, 42]. Các nghiên cứu lý thuyết trên thế giới nói chung,
trong nước nói riêng về nhóm flavone và isoflavone có hoạt tính kháng ung thư cô
tử cung còn khá khiêm tốn [90, 103]. Nghiên cứu mối quan hệ cấu trúc - hoạt tính
nhằm thiết kế các dẫn xuất flavone, isoflavone mới có hoạt tính được cải thiện; các
nghiên cứu lý thuyết là rất cần thiết để thúc đẩy và làm tiền đề cho các nghiên cứu
thực nghiệm, nhằm tìm kiếm các dược chất kháng ung thư hiệu quả [80, 90].
Trong nghiên cứu này, chúng tôi sử dụng các thông tin mô tả cấu trúc điện
tích nguyên tử, độ dịch chuyển hóa học, tính chất hóa lý, tham số 2D và 3D của
phân tử kết hợp các kỹ thuật phân tích hồi quy, mạng nơ ron, phân tích thành phần
chính, giải thuật di truyền, bình phương cực tiểu riêng phần để xây dựng các mối
quan hệ định lượng cấu trúc - hoạt tính (QSAR) [89]. Các flavonoid được xây dựng
và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Các tham số mô tả phân
tử 2D, 3D được sử dụng để xây dựng các mô hình đa biến như hồi quy tuyến tính đa
biến (MLR), phân tích thành phần chính (PCR), bình phương cực tiểu riêng phần
(PLS) và mạng nơ ron nhân tạo (ANN) [80, 90]. Xây dựng các mô hình QSAR
nhằm xác định những yếu tố tham số mô tả phân tử ảnh hưởng đến tác dụng kháng
ung thư cô tử cung từ đó xác định hướng thiết kế phân tử mang lại hoạt tính cao hơn
[86, 90, 103]. Trong nghiên này cũng đã tiến hành chiết tách và phân lập flavonoid
2
từ gừng gió, đậu nành, tía tô, xa kê, actiso, một vài kỹ thuật phân tích hóa lý cũng
được sử dụng để xác định cấu trúc phân tử các dẫn xuất flavonoid. Các phân tử
flavonoid đã phân lập sẽ được dự báo hoạt tính, và sử dụng làm chất mẫu để thiết kế
hợp chất mới có hoạt tính cao hơn. Từ các cơ sở trên, chúng tôi nghiên cứu đề tài
“Thiết kế, sàng lọc một số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên
dòng tế bào Hela dựa vào các tính toán hóa lượng tử”.
Mục tiêu của luận án
Tính toán, sàng lọc các tham số mô tả phân tử gồm: tham số điện tích, độ
dịch chuyển hóa học, tính chất hóa lý, tham số 2D, 3D của các dẫn xuất flavonoid.
Xây dựng các mô hình quan hệ cấu trúc – hoạt tính có khả năng dự đoán hoạt tính
kháng ung thư của các dẫn xuất flavone và isoflavone có cấu trúc tương tự.
Sàng lọc, phân lập, xác định cấu trúc và thử nghiệm in vitro hoạt tính kháng
ung thư 6 hợp chất flavonoid từ actiso, xa kê, đậu nành, tía tô, gừng gió.
Thiết kế, sàng lọc các dẫn xuất flavone và isoflavone và đánh giá hoạt tính
kháng ung thư cô tử cung cũng như các tính chất hóa lý của các dẫn xuất flavonoid
mới thiết kế từ flavonoid mẫu.
Ý nghĩa khoa học của luận án
Nghiên cứu này đã sử dụng các tính toán lý thuyết và xây dựng các mối quan
hệ định lượng cấu trúc - hoạt tính (QSAR). Các flavone và isoflavone được xây
dựng và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Điện tích nguyên
tử, độ dịch chuyển hóa học, các tính chất hóa lý và các tham số mô tả phân tử 2D,
3D từ các phương pháp lý thuyết được sử dụng để xây dựng các mô hình đa biến
như hồi quy tuyến tính đa biến (MLR), hồi quy thành phần chính (PCR), hồi quy
bình phương cực tiểu riêng phần (PLS) và mạng nơ ron nhân tạo (ANN). Các kỹ
thuật thực nghiệm chụp cộng hưởng từ hạt nhân, phô khối lượng và kỹ thuật đo
nhiễu xạ tia X đơn tinh thể cũng được sử dụng để xác định cấu trúc phân tử các dẫn
xuất flavonoid chiết xuất.
Các mô hình QSAR được xây dựng nhằm xác định được những vị trí nguyên
tử ảnh hưởng đến tác dụng kháng ung thư cô tử cung từ đó xác định vị trí tác dụng
mạnh để xem xét gắn nhóm thế nhằm tạo ra hợp chất mới và chọn lựa được những
3
hợp chất có hoạt tính cao. Ngoài ra với kỹ thuật QSAR có thể xây dựng các mô hình
khác nhau để dự đoán các tính chất hóa lý khác của các hợp chất. Từ công trình này,
có thể ứng dụng phương pháp, kết quả nghiên cứu trong các nghiên cứu thực
nghiệm, lý thuyết với sự hỗ trợ của công nghệ máy tính nhằm giảm thiểu đáng kể
chi phí cho các nghiên cứu thực nghiệm. Kết quả nghiên cứu của luận án mở ra
hướng nghiên cứu mới, phù hợp với định hướng nghiên cứu trên thế giới và Việt
Nam. Đây là cơ sở khoa học để áp dụng trong thiết kế, sàng lọc các hợp chất hữu cơ
có cấu trúc tương tự, đồng thời dự đoán hoạt tính sinh học và các tính chất hóa lý
của hợp chất làm tiền đề cho các quá trình thực nghiệm một cách hiệu quả.
Những đóng góp mới của luận án
Công trình này xác định được cấu trúc và thử hoạt tính pGI50 in vitro đối
với 6 hợp chất flavonoid phân lập từ lá tía tô, lá xa kê, lá actiso, hạt đậu nành và
củ gừng gió. Đã tính toán và sàng lọc các tham số mô tả cấu trúc phân tử như tham
số điện tích, tham số độ dịch chuyển hóa học, tham số 2D, 3D ảnh hưởng chính đến
hoạt tính kháng ung thư của các dẫn xuất flavonoid. Đã xây dựng và đánh giá thành
công khả năng dự báo của các mô hình QSAR. Các mô hình QESAR, QSDAR,
QSSR, QSARNMR, QSARANN, QSARPCA-ANN, QSARPCR, QSARPLS đã dự đoán được
hoạt tính kháng ung thư và tính chất hóa lý của các hợp chất mới được thiết kế từ
các chất mẫu và hợp chất tự nhiên. Hoạt tính kháng ung thư của các hợp chất mới
tốt hơn hoạt tính kháng ung thư của chất mẫu, hợp chất phân lập từ gừng gió, đậu
nành, tía tô, xa kê, actiso. Như vậy, việc tiến hành nghiên cứu xây dựng các mô
hình QSAR trong nghiên cứu này là một định hướng hữu ích trong nghiên cứu tìm
kiếm và tông hợp các flavonoid khác nhau từ tự nhiên.
Cấu trúc của luận án gồm các phần sau
- Mở đầu
- Chương 1: Tông quan tài liệu
- Chương 2: Nội dung và phương pháp nghiên cứu
- Chương 3: Kết quả và thảo luận
- Kết luận và kiến nghị
- Danh mục các công trình liên quan đến luận án
- Tài liệu tham khảo
4
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. BỆNH UNG THƯ CỔ TỬ CUNG
1.1.1. Các nguyên nhân gây ung thư
Ung thư là một tập hợp các bệnh liên quan đến sự phân chia tế bào một cách
mất kiểm soát, tiếp theo là quá trình các tế bào đó xâm lấn và di căn đến các mô
khác qua hệ thống bạch huyết và máu [6]. Giai đoạn di căn là nguyên nhân chính
gây tử vong của bệnh nhân ung thư. Hiện nay có trên 100 bệnh ung thư có loại từ
bắp thịt và xương, có loại từ da hoặc lớp lót của các cơ quan, có loại xuất phát từ
máu. Ở nam giới thường gặp ung thư phôi, gan, đại trực tràng, dạ dày, vòm hầu,
thanh quản, thực quản, tuyến tiền liệt, ung thư máu [58, 70]. Ở nữ giới thường gặp
ung thư vú, cô tử cung, đại trực tràng, phôi, tuyến giáp, buồng trứng, gan, dạ dày,
thân tử cung, da [70]. Ung thư làm cho cơ thể bệnh nhân tử vong bằng nhiều cách,
nhưng đa số là làm cho cơ thể suy kiệt với các bệnh cơ hội. Trong đó, bệnh ung thư
cô tử cung hình thành ở biểu mô cô tử cung (cô tử cung là cơ quan nối giữa âm đạo
với buồng trứng) [57, 96].
Ung thư cô tử cung bắt đầu ở niêm mạc cô tử cung, tại đây các tế bào phát
triển bất bình thường và khó kiểm soát dẫn đến hình thành khối u. Phụ nữ trong độ
tuôi từ 30 đến 59 thường dễ mắc bệnh hơn cả. Đây là căn bệnh có thể điều trị và
phòng ngừa nếu phát hiện sớm [96, 112].
Triệu chứng biểu hiện bệnh: âm đạo xuất huyết bất thường, có mùi khó chịu,
cơ thể bệnh nhân gầy gò, da trắng bệch, cơ thể đau nhức [32].
Điều trị bệnh: tuỳ theo giai đoạn phát triển của bệnh mà được điều trị theo
phác đồ khác nhau: giai đoạn 1 ung thư khu trú tại cô tử cung; giai đoạn 2 ung thư
xâm lấn vùng lân cận; giai đoạn 3 ung thư xâm lấn xa hơn; giai đoạn 3 di căn sang
các bộ phận khác của cơ thể [96].
Giai đoạn 1 và 2: chỉ cần mô và chiếu xạ thì khả năng khỏi bệnh sẽ rất cao, tỉ
lệ khỏi bệnh là 80 – 90%. Giai đoạn 3 và 4 chủ yếu là xạ trị, tỉ lệ khỏi bệnh rất thấp
từ 3 – 25 %, tuỳ theo mức độ nặng hay nhẹ của bệnh [96].
5
Các yếu tố bên ngoài gây bệnh ung thư bao gồm: các tia X, chất phóng xạ,
tia cực tím, hóa chất gây hư hại cấu trúc gen di truyền. Các sản phẩm công nghiệp
như: amiăng gây ung thư phôi; polivinylclorua gây ung thư gan; nitrosamin gây ung
thư bao tử; các phẩm màu trong bánh kẹo, hay một số sản phẩm trong thuốc nhuộm
tóc, các hoá chất kích thích trong chăn nuôi nhiễm estrogen cũng gây ung thư; thuốc
ngừa thai và các chất kích thích nội tiết tố như DES (diethylstilbestrol) có khả năng
gây ung thư; thuốc trừ sâu, rầy như DDT cũng có khả năng gây ung thư [23, 99]. Ô
nhiễm không khí: các hoá chất gây ô nhiễm không khí như CO2, hidrocacbon,
benzopiren, bụi amiăng, khói thuốc lá gây ung thư phôi [70]. Ngoài ra còn có độc
tố của nấm mốc chứa aflatoxin có trong nấm Aspergillus gây ung thư [26].
Các yếu tố do lối sống có thể là nguyên nhân gây bệnh ung thư như các hoá
chất trong thuốc lá gây ung thư phôi, rượu gây ung thư thực quản; chế độ ăn gây
ung thư: ăn nhiều mỡ động vật, bơ, ăn nhiều calo, ăn thiếu chất xơ, uống rượu, hay
sử dụng thực phẩm không an toàn là nguyên nhân gây ung thư [23, 62].
Yếu tố sinh học gây ung thư thể hiện ở một số ít căn bệnh ung thư ở người
được cho là do vi rút như ung thư gan, ung thư vòm họng, ung thư cô tử cung [26].
Yếu tố di truyền gây ung thư chiếm tỉ lệ thấp, một số loại như ung thư mắt,
ung thư vú, có khuynh hướng dễ gặp trong cùng một gia đình. Tuy nhiên, yếu tố di
truyền không có tầm quan trọng về mặt thực tiễn [62].
1.1.2. Điều trị
Một số liệu pháp chính trong điều trị ung thư: phẫu trị là dùng lưỡi dao mô
để loại bỏ tận gốc khối u; xạ trị là phương pháp sử dụng dùng tia phóng xạ tàn tiêu
diệt các tế bào ung thư; hoá trị là dùng hoá chất để tiêu diệt tế bào ung thư; liệu
pháp miễn dịch là liệu pháp tăng cường khả năng đề kháng tự nhiên của cơ thể để
kháng lại sự phát triển của tế bào ung thư [23, 58].
Phẫu thuật và xạ trị có ưu điểm là tấn công mạnh các loại ung thư thời kì còn
khu trú, nhưng phương pháp này không hiệu quả khi ung thư di căn trên cơ thể
người bệnh. Đối với phương pháp hoá trị chỉ cho kết quả tạm thời và không hiệu
6
quả. Liệu pháp miễn dịch chưa được nghiên cứu chuyên sâu nên chỉ là phương pháp
bô trợ trong điều trị bệnh [58, 96].
1.1.3. Phòng ngừa
Biện pháp phòng ngừa ung thư bao gồm một số biện pháp như: Giảm thiểu
việc tiếp xúc với thuốc lá, rượu, hoá chất công nghiệp; thực hiện các biện pháp bảo
vệ cơ thể chặt chẽ khi tiếp xúc với tia phóng xạ; ngừa ung thư qua việc chọn lựa chế
độ ăn uống an toàn như không nên ăn một số thức ăn được khuyến cáo có thể gây
ung thư, thức ăn có chứa các hóa chất nguy hiểm và các hormon; khám sức khoẻ
định kỳ, tầm soát ung thư sớm đều đặn; tiêm vacxin ngừa ung thư; lối sống lành
mạnh [47, 99].
1.2. LIÊN HỆ GIỮA CÂU TRUC VÀ HOẠT TÍNH
Liên hệ giữa cấu trúc – hoạt tính là nguyên tắc cơ bản nhất để xây dựng các
mô hình quan hệ cấu trúc – hoạt tính (QSAR) hay mô hình quan hệ cấu trúc – tính
chất (QSPR), mô hình quan hệ cấu trúc - cấu trúc để dự đoán tính chất vì cấu trúc –
tính chất - hoạt tính có mối quan hệ biện chứng với nhau, là các mối liên hệ nhân –
quả có thể được tính toán một cách chính xác và thiết lập theo những mô hình toán
học rõ ràng [17, 93]. Theo Testa và Kier, quan hệ định lượng cấu trúc – tác dụng là
tông hòa các mối quan hệ thể hiện trên Hình 1.1. Trên cơ sở này nhiều kiểu mô
hình được xây dựng với các thông tin về cấu trúc khác nhau. Mô hình tông quát
dạng QSXR: X có thể là A – hoạt tính (Activity); tính chất – P (Property); cấu trúc
– S (Structure) [17, 93].
Cấu trúc – tính chất không phải lúc nào cũng được phân định rõ ràng, nên
mối liên quan giữa chúng được biểu hiện bằng phần giao trên giản đồ Venn, Hình
1.2 [17, 93]. Tính chất – tác dụng có thể là một trong một số trường hợp nên mối
liên quan giữa tính chất và tác dụng cũng được diễn tả bằng giản đồ Venn có phần
giao. Cấu trúc – hoạt tính có sự phân định rõ ràng nên mối liên quan giữa cấu trúc
và tác dụng, điều này được mô tả bởi hai vòng tròn không có phần giao nhau mà
tiếp xúc tại một điểm.
7
Dữ liệu
cấu trúc
Hoạt tính
Tính chất
Mô hình
phân tử
Sàng lọc dữ liệuQSXR
X=aixi + b0
Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính
Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93]
Theo quan điểm hóa học, một phân tử có tác dụng sinh học mang hai nhóm
chức: nhóm tác dụng (thường có cấu tạo đặc biệt) và nhóm ảnh hưởng (thường là
các nhóm có khả năng thay đôi tính chất lý hóa của phân tử như hydroxyl, halogen,
carboxyl, nitro, ...) [17, 93].
Theo quan điểm sinh hóa, một phân tử có tác dụng sinh học có 2 thành phần
chính: Khung phân tử đặc trưng cho tính chất lý hóa, còn nhóm chức quyết định
hoạt tính sinh học [17, 93].
Theo quan điểm hiện đại, phân tử hợp chất là một thể thống nhất (gồm các
nguyên tử tạo khung phân tử, nhóm chức...). Tác dụng sinh học không những do
Tác dụng
Tính chất Cấu trúc
8
cấu trúc phân tử trực tiếp quyết định mà còn gián tiếp chịu ảnh hưởng bởi các quá
trình như hấp thụ, vận chuyển, phân bố hay chuyển hóa của phân tử trong cơ thể
sinh vật [17, 93]. Do đó, khi nghiên cứu mô hình liên quan giữa cấu trúc với tác
dụng, cấu trúc với hoạt tính người ta không những phải khảo sát cấu trúc mà còn
xem xét những yếu tố ảnh hưởng.
Mô tả cấu trúc phân tử: cấu trúc hóa học là sự sắp xếp trong không gian của
các nguyên tử trong lượng mô tả hay thông tin cấu trúc [17, 93].
Mức hình học: cấu trúc phân tử có thể được trình bày dưới dạng 2 chiều
(thông tin cấu trúc gồm độ liên kết nguyên tử, cấu hình Z/E) hay 3 chiều (thông tin
cấu trúc gồm cấu hình tương đối cũng như cấu hình tuyệt đối). Các thông tin của
cấu trúc 2 chiều (2D) và 3 chiều (3D) hữu ích cho nghiên cứu mối liên quan định
lượng cấu trúc và tác dụng [17, 93].
Mức lập thể điện tử: đó là vật thể có thể tích và hình thù nhất định như cấu
trúc lập thể có tính chất cơ động hay là cấu trúc lập thể với sự phân bố mật độ điện
tử của các nguyên tử [17, 93]. Các thông tin cấu trúc bao gồm thể tích, diện tích bề
mặt, sự thay đôi cấu dạng, sự phân bố điện tử, thế tĩnh điện phân tử, .... Các thông
tin này có thể có từ tính toán trên máy tính, đặc biệt là sử dụng các phương pháp
hóa lượng tử.
Mức tương tác với môi trường: cấu trúc phân tử thể hiện hoạt tính, độc tính,
điểm chảy, điểm sôi, khả năng solvat hóa, tính chất sắc ký, hệ số phân bố, độ tan, áp
suất tới hạn, v.v, trong môi trường sinh học [17, 93].
Cấu trúc phân tử ảnh hưởng đặc biệt quan trọng đối với hoạt tính sinh học,
đó là chìa khóa quan trọng để thiết lập mối quan hệ giữa cấu trúc và hoạt tính. Sự
phát triển của mối liên hệ này làm nền tảng để xây dựng các mô hình có khả năng
dự đoán. Với một chuỗi các hợp chất có cấu trúc tương tự, có thể xây dựng các mô
hình quan hệ giữa cấu trúc - hoạt tính (QSAR) [17, 93].
9
1.3. TÍNH TOÁN THÔNG TIN CÂU TRÚC
1.3.1. Cơ học phân tử
Trong các phương pháp lý thuyết liên quan đến việc tối ưu hóa hình học của
cấu trúc thì phương pháp cơ học phân tử (Molecular Mechanic - MM) khá thông
dụng. Phương pháp MM có thể tính toán chính xác về cấu trúc hình học và năng
lượng tương đối của các phân tử lớn vượt quá khả năng đối với các phương pháp
hóa lượng tử [25].
Năng lượng của phân tử trong trường được tính theo phương trình 1.1 [25]:
E = Eb + Ea + Et + Ev + Eh + Ee (1.1)
Trong đó: Eb là năng lượng do sự biến dạng liên kết; Ea là năng lượng do sự
khép mở góc liên kết; Et là năng lượng do sự xoay quanh liên kết; Ev là năng lượng
tương tác van der Waals; Eh là năng lượng do liên kết hydrogen; Ee là năng lượng
tương tác tĩnh điện.
Giữa cấu trúc và năng lượng có sự liên quan mật thiết với nhau, do đó tối ưu
hóa hình học của cấu trúc sẽ dẫn đến tối thiểu hóa năng lượng của phân tử [102].
Quá trình này tạo một cấu trúc ứng với trạng thái năng lượng tối thiểu (tối ưu về
hình học hay bền về năng lượng) để từ đó có thể xem xét tọa độ của các nguyên tử
của phân tử. Cấu trúc tối ưu về hình học hay bền về năng lượng có thể sử dụng để
tính toán phương pháp lượng tử: phương pháp nguyên lý ban đầu (ab-initio) hay
phương pháp bán thực nghiệm [60] [100].
1.3.2. Cơ học lượng tử
Cơ học lượng tử (Quantum Mechanic - QM) là mô tả toán học chính xác của
trạng thái điện tử và tính chất hóa học. Về lý thuyết, QM có thể dự đoán chính xác
bất kỳ tính chất nào của từng nguyên tử hoặc phân tử [60, 100]. Trong thực tế,
phương pháp QM chỉ được giải quyết chính xác cho một hệ thống điện tử [60,
100]. Vô số các phương pháp đã được phát triển cách giải gần đúng cho các hệ
thống đa điện tử. Hai phương trình QM được phát triển bởi Schrödinger và
Heisenberg. Phương trình Schrödinger là phương trình cơ bản cho hầu hết các
phương pháp hóa tính toán [60, 100].
10
Ĥ = E (1.2)
Trong phương trình Schrödinger Ĥ là toán tử Hamiltoni, là hàm sóng, E là
năng lượng. Phương trình này được gọi là phương trình riêng. được gọi là hàm trị
riêng, E là trị riêng.
Hàm sóng là hàm xác định vị trí của electron và hạt nhân. Electron được
mô tả như một hàm sóng. Nó mô tả xác suất của trạng thái điện tử. Như vậy, nó có
thể mô tả xác suất tìm thấy các electron ở các vị trí nhất định, nhưng nó không thể
đoán chính xác vị trí điện tử. Hàm sóng cũng được gọi là mật độ xác suất bởi vì
bình phương của hàm sóng là hàm xác suất. Đây là ý nghĩa chính xác của hàm sóng.
Để có được một giải pháp vật lý thích hợp có liên quan của phương trình
Schrödinger, hàm sóng phải liên tục, đơn trị [60, 100].
Toán tử Hamilton Ĥ
2
ij
ˆ2
p pi ji
i i ji
q qH
m r
(1.3)
2 2 22
2 2 2i
i i ix y z
(1.4)
Với 2
i là toán tử Laplac đối với hạt (p) i, các hạt gồm cả điện tử và hạt
nhân, mi và qi là khối lượng và điện tích hạt i, p là tông số hạt, rij là khoảng cách
giữa các hạt. Số hạng đầu tiên biểu thị cho động năng của hạt trong một phương
trình sóng. Các số hạng bô sung có thể xuất hiện trong toán tử Hamiltonion tương
tác với bức xạ điện từ hoặc trường được tính đến. Trong phần mềm QSARIS hiện
có, toán tử Hamiltonion ở trên là gần như chưa từng được sử dụng. Vấn đề có thể
được đơn giản hóa bằng cách tách các chuyển động hạt nhân và electron. Điều này
được gọi là xấp xỉ Born – Oppenheimer. Toán tử Hamilton cho một phân tử với các
hạt nhân tĩnh là:
2
ij ij
1ˆ2
e n e ei i
i i j i j
ZH
r r
(1.5)
11
Ở đây chỉ xét động năng của electron và lực hút giữa electron và hạt nhân và
lực đẩy của các điện tử. Sự chuyển động của hạt nhân có thể được mô tả bằng cách
xem xét toàn bộ tính toán thế năng khi các hạt nhân di chuyển [60, 100].
Khi hàm sóng đã được xác định, bất kỳ thuộc tính nào của phân tử đều có thể
được xác định. Điều này được thực hiện bằng cách tính giá trị mong muốn của toán
tử cho tính chất đó, được biểu thị bằng dấu ngoặc vuông < >. Ví dụ, năng lượng là
giá trị kỳ vọng của toán tử Hamilton được đưa ra bởi:
* ˆE H (1.6)
Đối với một hàm sóng gần đúng, có thể tính xấp xỉ năng lượng, đó là cơ sở
cho nhiều kỹ thuật được mô tả trong các tính toán khác. Bằng cách thay thế các toán
tử khác, có thể có được các tính chất quan sát rõ ràng, chẳng hạn như moment lưỡng
cực hoặc mật độ electron. Một cách khác để có được tính chất phân tử là sử dụng
định lý Hellmann-Feynman. Định lý này khẳng định rằng các thuộc tính năng lượng
với tính chất P mong muốn được cho bởi:
dE H
dP P
(1.7)
Mối quan hệ này thường được sử dụng để tính toán tính chất electron. Không
phải tất cả phương pháp xấp xỉ tuân theo định lý Hellmann-Feynman. Chỉ các
phương pháp biến thể tuân theo định lý Hellmann-Feynman [60, 100].
1.3.3. Phương pháp bán thực nghiệm
Các phương pháp bán thực nghiệm sử dụng trong luận án gồm phương pháp
CNDO, INDO, MNDO, AM1, PM3, TNDO (Phụ lục 60) [60, 100].
Phương pháp QM dùng để tính toán các thông tin cấu trúc phân tử như: điện
tích (Qi), cấu trúc phô NMR (i), tham số hóa lý, …. Phương pháp hóa lượng tử
được chọn phải phù hợp với đối tượng nghiên cứu, mức độ chính xác, thời gian tính
toán cũng như kích thước của hệ [60, 100]. Các tham số cấu trúc phân tử được tính
toán được đưa ra ở Phụ lục 58.
12
1.4. CÁC MÔ HÌNH TOÁN HOC
1.4.1. Hồi quy đa biến
Trong hồi quy, các biến số độc lập x và biến phụ thuộc y là các giá trị quan
sát. Tương ứng với một giá trị của x chỉ có 1 giá trị y duy nhất lúc này y là hàm của
x có dạng (y = f (x)) [51, 66]. Tuy nhiên, chúng ta hay gặp trường hợp cùng một giá
trị x trong các thí nghiệm có thể có các giá trị y khác nhau do ảnh hưởng của các
yếu tố khác. Khi đó sự phụ thuộc được gọi là xác suất và các giá trị y là một hàm
với các giá trị ngẫu nhiên. Nếu chỉ có trường hợp Y là biến ngẫu nhiên rời rạc và X
là giá trị rời rạc, để xác định y bằng cách sử dụng phân phối như ma trận sau:
Y X
x1 x2 … xm
y1 p1(x1) p1(x2) … p1(xm)
y2 p2(x1) p2(x2) … p2(xm)
… … … … …
yN pN (x1) pN (x2) … pN (xm)
Trong đó xk (k = 1, 2, …, m) là các giá trị có thể có của X, yi (i = 1, 2, ..., N)
là các giá trị có thể có Y và pi(xk) là xác suất xuất hiện của yi nếu X = xk , với k bất
kỳ, ta có đẳng thức sau:
1)(1
N
i
ki xp (1.8)
Giả sử Y/(X = xk) là biến ngẫu nhiên tương ứng với giá trị của xk. Phân bố
nằm trong cột thứ k của ma trận. Các giá trị trung bình (M) của biến Y được tính:
N
i
kiik xpyxXYM1
)()]/([ (1.9)
Và các giá trị X khác nhau, được xem như hàm ]/[)( XYMXg . Hàm g(X)
được gọi là hàm hồi quy của Y đối với X.
Như đề cập ở phần trên cho trường hợp phụ thuộc ngẫu nhiên của biến Y với
nhiều biến độc lập X1, X2, …, Xp, sự phân bố của Y trong trường hợp này được mô tả
13
bằng xác suất ),,,(21 pkkki xxxp , với
jkx là các giá trị khác nhau của các biến X1, X2,
…, Xp. Khi X1 = x1, X2 = x2, …, Xp = xp các giá trị trung bình của Y có dạng:
N
i
piipp xxxpyxXxXxXYM1
212211 ),,,()]())(/([ (1.10)
Các biến X1, X2, …, Xp, là hàm g(X1, X2, …, Xp):
],,/[),,( 2121 pp XXXYMXXXg (1.11)
Hàm g(X1, X2, …, Xp) là hàm hồi quy đa biến của Y với các biến độc lập X1, X2,
…, Xp.
Để xây dựng hàm hồi quy của các biến ngẫu nhiên Y phụ thuộc X1, X2, …, Xp,
trên thực tế điều đó là không thể, vì xác suất pi(xk1, xk2, …, xkp) thường không xác
định. Vấn đề đặt ra là xây dựng hàm toán từ hàm g(X1, X2, …, Xp), như
hàm ),,(ˆ21 pXXXg được gọi là mô hình hồi quy tương quan với hàm g cho bởi
phương trình 1.12 [51, 66]:
),,(),,(ˆ),,( 212121 ppp XXXeXXXgXXXg (1.12)
Với e(X1, X2, …, Xp) là sai số của mô hình.
Mô hình hồi quy được xây dựng trên cơ sở dữ liệu thống kê giữa biến phụ
thuộc Y trên X1, X2, …, Xp. Các giá trị quan sát được trình bày theo ma trận sau:
k X1 X2 … Xp Y
1 x11 x12 … x1p y1
2 x21 x22 … x2p y2
… … … … … …
N xN1 xN2 … xNp yN
Mỗi hàng trong ma trận đại diện cho mỗi quan sát cụ thể (thí nghiệm) được
gọi là mẫu hoặc trường hợp. Các biến độc lập đóng vai trò là một phần của biến dự
đoán, phụ thuộc vào giá trị của chúng, giá trị quan sát Y là các giá trị ngẫu nhiên
khác nhau [51, 66]. Vấn đề chọn dạng của hàm ),,(ˆ21 pXXXg (hoặc thuật toán để
tính toán) để xây dựng mô hình hồi quy là khó khăn nhất. Việc chọn mô hính hồi
quy phải thỏa mãn hai yếu tố sau:
14
1. Hàm mô phỏng ),,(ˆ21 pXXXg phải đại diện được cho hàm hồi quy.
2. Việc tính toán các giá trị của hàm phải dựa trên khả năng đáp ứng của nguồn
dữ liệu tính toán có sẵn.
Nếu mô hình ),,(ˆ21 pXXXg được chọn, giá trị của nó trong trường hợp thứ
k bằng ),,(ˆˆ21 kpkkk xxxgy và được xem là giá trị dự đoán của yk. Sự khác biệt giữa
yk và ky là độ lệch (sai số): kkk eyy ˆ .
Các biến độc lập X1, X2, …, Xp ở trên đã được xác định. Khi nhiều thí nghiệm
được thực hiện, các biến độc lập có các giá trị khác nhau (cột trong ma trận). Vì
vậy, có thể xem các biến này là biến ngẫu nhiên và giá trị dự báo Y1, Y2, …, Yp là dựa
trên các biến ngẫu nhiên [51, 66]. Theo quan điểm toán học, điều quan trọng không
phải các giá trị dự đoán là ngẫu nhiên hay không. Trong tất các các tính toán, các
giá trị dự đoán có tính chất tông quát. Nó giải thích các số hạng cụ thể cho các giá
trị ngẫu nhiên được chuyển sang các giá trị dự đoán xác định. Hơn nữa chúng ta
không chú ý đến các giá trị dự đoán sử dụng.
Các giá trị dự đoán và giá trị quan sát ngẫu nhiên Y, các tham số của các mô
hình được tìm thấy là kết quả của kinh nghiệm lấy mẫu ngẫu nhiên. Vì vậy các tham
số của mô hình ),,(ˆ21 pXXXg cũng được coi là biến ngẫu nhiên [51, 66].
Dạng đơn giản và phô biến nhất được sử dụng trong mô hình hồi quy tuyến
tính là:
),,(),,(),,(ˆ21212221110 pqqpp XXXbXXXbXXXbby (1.13)
Ở đây ),,( 21 pi XXX là các hàm cơ bản và bi là các hệ số (hoặc các yếu
tố) tính được sao cho mô hình được xây dựng tốt nhất.
Trong thực tế, nếu có nhiều biến độc lập, mô hình tuyến tính của dạng:
pp XbXbXbby 22110ˆ , (1.14)
Với 0b được gọi là hệ số tự do trong mô hình.
15
Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66]
Việc lựa chọn các hệ số hồi quy bk đảm bảo tính thích hợp lớn nhất cho mô
hình tuyến tính được xây dựng. Để giải quyết vấn đề này, phương pháp tốt sử dụng
phương pháp bình phương cực tiểu. Lúc này hệ số bk được tìm kiếm từ một điều
kiện để giảm thiểu tông bình phương độ chênh lệch giữa các giá trị quan sát được
và dự đoán của biến phụ thuộc:
N
i
iip yyRSS1
2)ˆ( (1.15)
Với ippiii xbxbxbby 22110ˆ (1.16)
Khi p = 2 minh họa hình học đơn giản của phương pháp bình phương cực
tiểu Hình 1.3. Ví dụ, hình ảnh trên cho thấy không gian tiếp cận sự phụ thuộc giữa
hai biến độc lập X1, X2 và biến phụ thuộc Y.
Hồi quy thường là phương pháp đơn giản nhất trong phân tích hồi quy. Nó
được sử dụng để giải quyết các trường hợp với số lượng biến độc lập nhỏ, không
tương quan chặt chẽ [51, 66]. Tuy nhiên, phương pháp này tạo cơ sở để hiểu các
phương pháp hồi quy khác phức tạp hơn. Chúng ta hãy xem xét các ma trận sau đây
đại diện cho các kết quả quan sát:
)( 10
10
222120
111110
YXX p
NNpNN
p
p
yxxx
yxxx
yxxx
XX
16
Với Xj là cột thứ j được xem là vec tơ dự đoán và Y là vec tơ biến phụ thuộc.
Giá trị trung bình được tính cho mỗi biến Xj theo phương trình:
N
i
ijj xN
x1
1 (1.17)
và độ lệch chuẩn có dạng sau:
N
i
jijj xxN
s1
22 )(1
1
(1.18)
Hệ số tương quan được tính cho các cặp biến khác nhau dưới dạng sau:
N
k
jkjiki
ji
ij xxxxsNs
c1
))((1
(1.19)
Các hệ số tương quan này tạo thành một ma trận tương quan mẫu.
Cột thứ nhất X0 được đưa vào trong ma trận nếu một hệ số trong (1.14) khác
không. Giả sử bỏ qua cột X0. Có thể thu được bằng cách căn giữa các dữ liệu theo
cách sau: jijij xxx , với jx là giá trị trung bình của biến jx .
Cách đơn giản nhất để hiểu được bản chất của hồi quy đa biến thường là xem
xét một ví dụ đơn giản với p = 2 và N = 3 với minh họa hình học cụ thể.
Xét ma trận X = (X1 X2) trong đó bao gồm các vec tơ trung tâm dự đoán và
vector Y là một vec tơ trung gian dự đoán. Chúng ta có:
3
2
1
3231
2221
1211
,
y
y
y
xx
xx
xx
YX
Mô hình hồi quy có dạng XbXXy 2211ˆ bb , với )( 21 bbb . Vì vậy, vec
tơ y trong không gian P được biểu thị qua các vec tơ X1, X2 (Hình 1.4). Véc tơ độ
lệch: yYe ˆ . Chiều dài của vec tơ này là:
N
i
ii yy1
2)ˆ( (1.20)
Chiều dài này là cực tiểu nếu véc tơ e trực giao với không gian P, nghĩa là
trực giao với vec tơ X1, X2. Điều kiện trực giao có dạng sau:
17
)2,1()ˆ( j,j 0yYX , hay 0 )( XBYX (1.21)
Với jX là vec tơ chuyển vị của jX (vec tơ hàng) và X là ma trận chuyển vị
của ma trận X.
Từ mối quan hệ thứ hai ta có cách tính các hệ số hồi quy:
YXXbX (1.22)
Với ma trận XXC gồm các yếu tố:
)2,1,(,1
jixxcN
k
kjkiij . (1.23)
Giá trị trung bình của ma trận C tỷ lệ thuận với ma trận hiệp phương sai của
ma trận vec tơ dự báo jX .
Yếu tố ijc của ma trận C là các yếu tố trong của ma trận ji XX , . Vì vậy iic
bằng chiều dài của vec tơ iX . Ta có:
ij
ij
jj
osii
cc
c c với φij là góc giữa hai vec tơ Xi, Xj.
Vì vậy, góc giữa hai vec tơ ji XX , (Hình 1.4) nghĩa là jjiiij ccc / gần 1 (tức
là có tương quan mạnh mẽ giữa các giá trị dự đoán). Ngược lại, nếu ji XX , không
tương quan, thì các vec tơ tương ứng trực giao. Trường hợp này xảy ra khi các vec
tơ )(,,,, Nll XXX 21 nằm trong không gian siêu phẳng (hiện tượng đa cộng
tuyến), hiện tượng đa cộng tuyến dẫn đến sự suy biến của ma trận C và kết quả là
khó khăn trong thiết lập phương trình (1.23).
18
1
2
3
X1
X2
Y yYe ˆ-
P
2211ˆ XXy bb
Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66]
Nếu ma trận C không suy biến, vec tơ b được tính theo phương trình sau:
YXCb 1 (1.24)
Công thức cho hệ số hồi quy (1.24) đúng trong trường hợp số lượng biến
trong mô hình bằng p. Xác định hệ số bk được coi là ước lượng thống kê của các hệ
số ngẫu nhiên của hệ số bk trong mô hình tuyến tính (1.14). Một số trường hợp bk
ước tính với giá trị nhỏ ( 0kb ). Điều đó chỉ ra rằng bk = 0 (biến không phụ thuộc
biến Xk) và giá trị bk khác không, được xác định từ dữ liệu nhiễu ban đầu. Vì vậy,
cần kiểm tra mức độ ý nghĩa của biến Xk (hoặc của hệ số Bk) trong mô hình được
xem xét [51, 66]. Theo quan điểm thống kê, có nghĩa là cần kiểm tra giả thuyết H0:
[ bk = 0]. Cách đơn giản nhất để minh họa cho nguyên tắc chung của việc kiểm tra
một giả thuyết như vậy là đưa ra một ví dụ về một mô hình một chiều 11 XbY , với
X1 và Y là các giá trị trung bình có ý nghĩa [51, 66]. Về mặt hình học các giá trị X1
và Y không tương quan có nghĩa là các vectơ X1 và Y trực giao. Tuy nhiên, vì quan
sát là ngẫu nhiên, các vectơ X1 và Y có thể không hoàn toàn trực giao, sẽ dẫn đến
một hệ số hồi quy khác không b1 (Hình 1.5).
Nếu giả thuyết H0 đúng, góc nhỏ. Độ lớn của góc này có thể được ước
lượng:
)(
)(
)ˆ(
ˆˆ
tan
1
2
1
2
2
2
2
residualSS
regressionSS
yy
y
N
i
ii
N
i
i
e
y (1.25)
19
Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66]
Tuy nhiên, trong thống kê, xem xét bình phương trung bình sẽ thuận tiện
hơn, có nghĩa là tính tông của bình phương theo bậc tự do được xem xét.
Bậc tự do DF đặc trưng số lượng các tham số độc lập, ảnh hưởng đến độ lớn
của tông bình phương. Với tông bình phương hồi quy SS(hồi quy) độ tự do hồi quy
DF(hồi quy) bằng 1, vì tông
N
i
i
N
i
i xby1
2
1
1
2 )(ˆ được xác định bởi giá trị của tham số
đơn b1. Vì vậy SS(quan sát), bằng
N
i
iy1
2 , độ tự do DF(quan sát) bằng N-1, bởi vì
các giá trị quan sát trung tâm được tính bởi phương trình:
N
i
iy1
0 . Nghĩa là N-1
biến độc lập. Ta có liên hệ sau: SS(quan sát = SS(hồi quy) + SS(dư). Từ đó ta có:
DF(quan sát) = DF(hồi quy) + DF(dư). Vì vậy, SS(dư) có bậc tự do DF(dư) bằng
N-2. Do đó, độ lệch của vector Y trực giao với vector X, (tức là giả thuyết
]0[:0 kBH đúng), theo thống kê sau đây [51, 66]:
( ) / ( ) ( )
( ) / ( ) ( ) / ( 2)
SS hoiquy DF hoiquy SS hoiquyF
SS du DF du SS du N
(1.26)
Thống kê này được gọi là chuẩn F
Chúng ta hãy xem xét các giả định sau liên quan đến các biến ngẫu nhiên
iii yye ˆ :
1. ei độc lập với nhau;
2. ei có phân phối chuẩn giống nhau );0( 2N .
Vì vậy chuẩn F có phân bố F với (1, N-2) bậc tự do.
20
Nếu giả định H0 với b1 bằng 0 là đúng F lớn với xác xuất bé. Chúng ta có thể
chỉ định giới hạn DF(α), có thể vượt quá tiêu chí F chỉ với một xác suất nhỏ. Nếu
giá trị của thống kê F, được tính theo công thức (1.26), lớn hơn DF(α), nó có nghĩa
là giả thuyết H0 sai, các hệ số hồi quy b1 có ý nghĩa [51, 66].
Kiểm tra ý nghĩa biến có thể được khái quát theo các cách khác nhau trong
trường hợp có nhiều biến. Một trong những biến thể của khái quát này đang xem xét
một phần thử nghiệm F-test.
Hình 1.6 Giải thích F-test [51, 66]
Giả sử rằng phương trình hồi quy với hai biến thu được bằng phép chiếu
chính xác của vector Y trong không gian được kéo dài qua các vectơ 21 , XX (Hình
1.5). Phương trình hồi quy này như sau:
2
)1(
21
)1(
1
)1(ˆ XXy bb (1.27)
Trong trường hợp này, tông bình phương các giá trị hồi quy bằng với bình
phương của vector được xác định bởi các hệ số )1(
2
)1(
1 , bb :
2
2
)1(
21
)1(
1
2)1()1(
2
)1(
1ˆ),( XXy bbbbSS (1.28)
Nếu chúng ta xem xét mô hình với biến đã lược bỏ X2, giá trị dự đoán sẽ có
dạng sau: 1
)2(
1
)2(ˆ Xy b , với )2(y thu được bằng phép chiếu của véc tơ Y đến vec tơ
X1 (Hình 1.6). Khi đó, hệ số )2(
1b khác hệ số )1(
1b . Khi vec tơ X1 và X2 trực giao (tức
là 021 XX ), điều đó là ngoại lệ, khi đó )1(
1
)2(
1 bb . Tông bình phương do giá trị dự
21
đoán từ hồi quy trong trường hợp thứ hai bằng với chiều dài bình phương của véc tơ
)2(y được xác định bởi hệ số )2(
1b . Tông bình phương này có dạng sau:
2
1
)2(
1
2)2()2(
1ˆ)( Xy bbSS (1.29)
Số bình phương phần dư bằng hiệu giữa tông bình phương trong trường hợp
thứ nhất và thứ hai (nó là hiệu bình phương )2()1( ˆˆ yy Hình 1.6) [51, 66]. Giá trị
này gọi là ‘tông bình phương b2 và b1’ theo phương trình:
2)2()1()2(
1
)1(
2
)1(
112ˆˆ)(),()|( yy bSSbbSSbbSS (1.30)
Có nghĩa là )|( 12 bbSS mô tả tông dư X2 trong mô hình hồi quy hoặc ý nghĩa
của hệ số hồi quy b2. Kiểm tra ý nghĩa thống kê của hệ số b2 (nghĩa là kiểm tra giả
thuyết ]0[: 20 BH ) với kiểm định F-test trong trường hợp cụ thể này được gọi là
một phần F2/1-test và có dạng sau [51, 66]:
2 1 2 1 2 12/1
( | ) / ( | ) ( | ) / (2 1)
( ) / ( ) ( ) / ( 2)
SS b b DF b b SS b bF
SS du DF du SS du N
(1.31)
Nói chung, hai mô hình được xem xét tương ứng với các biến sau:
pXXX ,,, 21 và qXXX ,,, 21 (q<p). Tông bình phương pq bb ,,1 thu được từ
qbb ,,1 bằng:
),,(),,(),,|,,( )2()2(
1
)1()1(
111 qpqpq bbSSbbSSbbbbSS (1.32)
Giá trị F tương ứng là:
! 1
( 1,..., )/(1,..., )
( ,..., ) | ( ,..., ) / ( )
( ) / ( )
q p q
q p q
SS b b b b p qF
SS du N p
(1.33)
Thống kê ),,1/(),,1( qpqF có phân bố sau đây: F(p-q, N-p), để có thể kiểm tra
giả thuyết ]0[: 10 pq BBH tại α. Giá trị BF(α) có thể được tính toán bởi một
hàm chuẩn trong Microsoft Excel FDISTINV( ; p-q; N-p). F được sử dụng trong
hồi quy từng bước để thăm dò các biến quan trọng [51, 66].
Một phương pháp ước lượng các hệ số hồi quy là tính các khoảng tin cậy.
Lúc này kiểm định t tính đối với hệ số bk theo công thức:
22
)()(
k
k
kbSE
bbt (1.34)
Với SE(bk) là độ lệch chuẩn của hệ số bk, tính toán theo công thức:
( ) . ( ) / ( )k kkSE b a SS du N p (1.35)
Với akk là một phần tử chéo của ma trận A. Ma trận A là ma trận nghịch đảo
của ma trận XXC của đánh giá chéo độ lệch các biến [51, 66].
Hệ số bk là một giá trị mẫu của biến ngẫu nhiên Bk. Khoảng tin cậy cho biến
ngẫu nhiên Bk có thể được tính theo biểu thức sau đây:
Với t là một phần tư của thứ tự )1(2
với t-distribution (phân phối
Student) với độ tự do N-1.
Nếu khoảng tin cậy này chứa a điểm 0, khi đó hệ số bk có nghĩa. Điều
kiện )]();([0 kkkk bSEtbbSEtb tương đương với : tbt k )( . Khi đó hệ số bk
có thể được coi là quan trọng ở một giá trị khá lớn t(bk), cụ thể là, khi chúng ta có
các điều kiện sau:
tbt k )( (1.36)
Điều kiện (1.36) được gọi là hai phía phân bố t. Quan hệ giữa phân bố t và
phân bố F theo (1.37).
),1,1( NFt (1.37)
1.4.2. Hồi quy thành phần chính
Phương pháp tính toán phân tích hồi quy cho một biến phụ thuộc dựa trên
một tập hợp các thành phần chính được tính toán từ các biến độc lập. Phương pháp
thành phần chính hữu ích khi các biến độc lập đa lớp hoặc tương quan cao với nhau.
Điều này thường có thể được biết khi thực hiện một số chương trình hồi quy khác.
Sự đa cộng tuyến giữa các biến độc lập cho thấy sự tương quan giữa chúng. Sự
tương quan này được tính thông qua các điểm riêng của ma trận hiệp phương sai
hoặc ma trận chéo [52, 107].
23
Giả sử X = (X1 X2 … Xp) là ma trận với cột là các vec
tơ )( 21 Nkkkk xxx X . Ma trận chéo XXC đối xứng và không xác định được.
Vì vậy, có các cặp vec tơ song song pzzz ,,, 21 , với p là số biến số z. Các vec tơ
riêng tương ứng với các giá trị dương p ,,, 21 .
kl
pk
lkkk
pkkk
,0,1
,,1,0, 21
zzzz
zzXX . (1.38)
Các giá trị riêng và vec tơ riêng trong ma trận chéo được tính toán theo
phương pháp Jacobi trong QSARIS.
Các vector p, được gọi là các thành phần chính của quan sát:
pkkk ,,1, zXw . (1.39)
Từ phương trình (1.38) và (1.39) và các thành phần chính trực giao và độ dài
của chúng được k :
kllkklklkkkkkkkkkk ,0,2
zzzXXzwwzzzXXzwww .
Nếu các thành phần chính được xem như là các vector của một biến độc lập
mới Wk, các mối quan hệ đã đề cập có nghĩa là các biến này là cặp không tương
quan và chúng có chênh lệch bằng k [52, 107].
Tương quan giữa các biến độc lập gốc Xk (dự báo) và các thành phần chính
Wk có thể được biểu diễn dưới dạng sau:
W=XZ hay X = WZ’ (1.40)
Trong đó W là ma trận với cột )( 21 Nkkkk www w và Z là một ma trận trực
giao với các cột tương đương với các vec tơ riêng
)( 21 pkkkk zzz z , ZZ 1 .
Từ phương trình (1.40) các vec tơ của các biến độc lập Xk là các thành phần
chính theo phương trình sau:
'Wk kX z hay1
w , 1,..., , 1,... ,p
ik ij kj
j
x z i N k p
(1.41)
và các điểm thành phần chính có giá trị:
24
k kw Xz hay 1
, 1,..., , 1,... ,p
ik ij kj
j
w x z i N k p
(1.42)
Ý nghĩa hình học của các thành phần chính của một quan sát khi p = 2 và N
= 3. Các thành phần chính w1 và w2 nằm trong cùng mặt phẳng với các vec tơ của
biến độc lập X1 và X2. Góc giữa X1 và X2 nhỏ. Điều đó có nghĩa là các vec tơ này
tương quan chặt chẽ. Đồng thời, các thành phần chính w1 và w2 trực giao với nhau
(không tương quan) và bình phương của chiều dài của chúng bằng với các giá trị
riêng tương ứng của ma trận C, Hình 1.7 [52, 107]. Hồi quy riêng phần tương quan
với w1 theo phương trình: 11
)1(ˆ wy và tương quan với w2 theo phương
trình22
)2(ˆ wy . Vec tơ dự đoán có dạng:
2211
)2()1( ˆˆˆ wwyyy (1.43)
Bình phương độ dài của vec tơ y ảnh hưởng đến giá trị R2 và trực giao của w1 và w2
được tính toán theo phương trình:
2
2
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2ˆ wwy (1.44)
Vec tơ w1 dài, nó tương ứng với trị riêng lớn hơn 1 . Vec tơ này đóng góp
quan trọng vào giá trị dự đoán.
Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107]
Vì vậy, mô hình hồi quy được xây dựng với các biến tương ứng có giá trị
riêng lớn hơn. Các biến khác được đưa vào mô hình có tông tích lũy của các giá trị
riêng gần với tông của tất cả các giá trị riêng. Rõ ràng không nên xem xét các thành
phần chính tương ứng với các giá trị riêng bằng không. Các điều kiện cần có: các
25
thành phần chính có giá trị riêng thấp thì không đạt yêu cầu. Hệ số hồi quy thành
phần chính được tính toán cho biến Y:
p
j
pjjk
k
p
kkk
k Cz1
1,12
111CzXYz
w
Ywkk
k (1.45)
Với C là ma trận chéo mở rộng và Cp+1 là cột thứ (p+1) của ma trận mục tiêu
của biến phụ thuộc. Tương quan giữa thành phần chính wk với biến phụ thuộc Y =
Xp+1 được tính:
Y
kkk
pks
r
Y
w
Yw
Yw k
k
k
1, (1.46)
Với Ys là sai số của Y.
Ý nghĩa của các thành phần chính trong mô hình được đánh giá thông qua
giá trị F. Nó được thể hiện thông qua giá trị RSS
N
j
j yyRSS1
22
0 )(Y (1.47)
Tông bình phương độ lệch của mô hình với k thành phần chính được tính:
pkRSSRSS kkkk ,,1,2
1 (1.48)
Với tông giá trị hồi quy F với k thành phần chính được tính:
)1/(
)( 0
kNRSS
RSSRSSFTOT
k
k
k (1.49)
Và F của thành phần chính thứ k được tính:
)1/(
)( 1
kNRSS
RSSRSSF
k
kk
k (1.50)
1.4.3. Bình phương tối thiểu riêng phần
Giống như PCR, bình phương tối thiểu riêng phần (PLS) tạo ra một chuỗi
các mô hình và ước tính nào là tốt nhất với các biến ẩn. Tuy nhiên, tập hợp các mô
hình tạo thành trình tự có trật tự, khác với các mô hình được xây dựng bởi PCR. Giả
sử X = (X1 X2 … Xp) là một ma trận có các cột là vectơ của quan sát trung tâm và
quan sát hiệu chỉnh sai lệch )( 21 Nkkkk xxx X . XXC là một ma trận chéo .
26
Ma trận này đối xứng và không xác định [51, 106]. Do đó, các vector riêng của cặp
vector trực giao pppp ,,, 21 với p số vec tơ. Các vec tơ riêng tương ứng với các giá
trị riêng dương p ,,, 21 , …
kl
pk
lkkk
pkkk
,0,1
,,1,0, 21
pppp
ppXX (1.51)
Vec tơ
pkkk ,,2,1, Xpt , (1.52)
Là các thành phần chính tính từ (1.51) và (1.39) sau đó:
' ' ' ' ' ', =
( )( ) ( )0,neu
k
k l k l k l k l l
neu k lt t p X Xp p X X p p p
k l
(1.53)
Từ 1.53 các thành phần chính là N vec tơ trực giao với kk t . Nếu ma trận
pNp )( 21 tttT bao gồm các thành phần chính và ma trận pNp )( 21 tttT gồm
các vec tơ riêng ppp )( 21 pppP , khi đó (1.39) có dạng
XPT (1.54)
Ma trận P là ma trận trực giao, tức là PP 1 . Vì vậy
PTX (1.55)
Theo (1.55) X gọi là thừa số của ma trận có dạng:
p
k
kkp
1
2
1
21 )( pt
p
p
p
tttX
p
.
Nếu hạng của ma trận X bằng r, khi đó giá trị riêng: 021 prr và
021 prr ttt . Trong trường hợp này:
r
k
kk
1
ptX (1.56)
Từ (1.56) là cột của ma trận X (vec tơ Xj) có thể được trình bày dưới dạng kết hợp
tuyến tính của các thành phần chính trực giao song song tk theo:
27
r
k
kjkj p1
tX (1.57)
Ma trận:
r
mk
kkm ptE (1.58)
Được gọi là “phần thừa thứ m của x”. Vec tơ Em trực giao với vec tơ t1, t2, …,tm-1.
Để minh họa cho tk và pk, một trường hợp cho hai biến X1 và X2, trong không
gian hai chiều P được mở rộng từ hai vec tơ này, chỉ ra trong Hình 1.8 Ma trận
tương quan cho vec tơ chuẩn hóa X1 và X2 là ma trận [51, 106]:
1cos
cos1C (1.59)
Với là góc giữa vec tơ X1 và X2. Giá trị riêng của ma trận là
cos1,cos1 21 và giá trị riêng được tính:
)2/12/1(),2/12/1( 21 pp (1.60)
Khi đó các thành phần chính được tính (1.52 và Hình 1.8):
2/)()(,2/)()( 21221222112111 XXpXXXptXXpXXXpt .
Các vec tơ X1 và X2 được tính
2/)(,2/)( 212211 ttXttX (1.61)
Hình 1.8 Thành phần chính với p = 2 [51, 106]
Phương trình (1.61), là phương trình cơ bản trong PLS, có thể tính xấp xỉ các
giá trị riêng với các phần tử không tuyến tính theo phương pháp NIPALS
(Nonlinear Iterative Partial Least Squares).
28
Các tính toán dựa trên các mối quan hệ sau:
,1,0;,,1,/
)1()1(
2)()()1(
jrkj
kk
j
k
j
k
j
kk
j
k
pEt
ttEp (1.62)
Các mối liên hệ từ (1.56), (1.57) và (1.58) áp dụng với ma trận ‘X’ bắt đầu
với )0(
kt :
XEptEE 01 ,kkkk (1.63)
Mối liên hệ (1.62) gọi là liên hệ ngoài (outer relations), và (1.64) gọi là liên
hệ trong (inner relations), liên kết các biến phụ thuộc và độc lập, cũng được xem
xét để xây dựng một mô hình hồi quy. Trong một trường hợp đơn giản, chúng có
dạng sau:
r
k
kkb1
ˆ ty (1.64)
Với 2
/ kk tb kty là phép chiếu của y lên tk, y là giá trị dự đoán của y.
Khi tiến hành PLS, khi biến phụ thuộc bị giới hạn bởi một bước lặp lại trong
(1.62). các giá trị ban đầu của )0(
kt được tính:
(0)
k 1k kt E w Với '
k 1 1 k kw E y ; yk-1 là độ lệch. (1.65)
Sau đó thuật toán PLS (với X và y có ý nghĩa tương quan)
0 0ˆ; ; 0y y E X y là biến độc lập X và giá trị dự đoán.
Cho k = 1 đến r là một chu kỳ thành lập theo nguyên tắc thành phần chính.
'
1 1k k kw E y là các vec tơ trọng số để tính thành phần chính thứ k.
1 1k k kt E y là giá trị gần đúng của thành phần chính.
2'
1 / ; /k k k k k k kp E t t p p p là giá trị gần đúng của vec tơ riêng.
2'
1 /k k k kb y t t là hệ số hồi quy giữa các thành phần.
1k k k ky y b t là độ lệch của giá trị quan sát.
29
1ˆ ˆ
k k k ky y b t là giá trị dự đoán của biến kế tiếp.
'
1k k k kE E t p là độ lệch của biến X.
' 0k kE E là phần sai số X.
Phần quan trọng của hồi quy là dự đoán sự phụ thuộc của biến phụ thuộc từ
các biến độc lập Xnew.
PLS không cho biết rõ ràng về giá trị dự đoán. Thay vào đó, sự phân tích các
biến độc lập X để tính toán giá trị y.
Đối với vec tơ mục tiêu pk, wk và hệ số hồi quy bk được tính cho bước tiếp
theo. Các biến dự đoán mới Xnew với Nnew mẫu thay vì N.
Giá trị dự đoán trong PLS được thực hiện
0 0ˆ; 0newE X y khởi tạo độ lệch X và giá trị dự đoán.
Với k từ 1 đến r
0ˆ wk kt E ; giá trị gần đúng đối với thành phần chính của biến quan sát.
'
1ˆ
k k k kE E t p là độ lệch thực tế của X.
1ˆˆ ˆ
k k k ky y b t là giá trị dự đoán.
Sơ đồ PLS đưa ra trong Hình 1.9. Bước thứ nhất trong thuật toán độ lệch của X:
E0= X= (X1 X2) và độ lệch thứ nhất của giá trị dự đoán y0 = y được tính toán. Sau đó
vec tơ trọng số được tính:
' '
1 1 1' '
1 0 0 ' 1221 2
cosw
cos
X X yE y X y y
X X y
(1.66)
Góc Xk và y, vec tơ t1, được tính
)cosos(ccos
cos)( 2211
2
1
21101 XXXXwEt
(1.67)
30
Trong không gian (P1), dọc theo vec tơ 21 , XX , và nó là thành phần chính thứ
nhất. vec tơ riêng p1 từ thừa số tính theo phương trình 1.62:
2
1
12
11
2
1
1
2
1
2
1
2
1101
1
111/
X
X
tX
tX
tt
X
X
tttEp
t
t
pr
pr (1.68)
Hệ số hồi quy b1 và mối tương quan của y0 với t1:
2
1101 / ttyb (1.69)
2
P1
X1
X2
yy 0
t1
111ˆ ty b
2211ˆ tty bb
P2 t2
222ˆ ty b
1
2
3
)1(
1X
)1(
1X
)1(
2X
)1(
2X
1y
1y
1
)( )1(
2
)1(
11 XXE
)( 210 XXE
Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106]
Hơn nữa, độ lệch 1101 tyy b và giá trị gần đúng cho biến mục tiêu
111101 ˆˆ ttyy bb được tính toán. Véc tơ )1(
2
)1(
1 , XX để tính giá trị E1 thứ nhất của
khối X được tìm ra như là thành phần chính của 21 , XX , nó trực giao với t1. Cuối
cùng, kiểm tra các vec tơ )1(
2
)1(
1 , XX có phải vec tơ 0 hay không.
Bước thứ hai trong hồi quy là tìm không gian P2, trực giao với t1. Vec tơ t2, là
sự tô hợp tuyến tính giữa vec tơ )1(
2
)1(
1 , XX , thì trực giao với t1, và hệ số hồi quy b2 từ
phép chiếu y1 lên t2. Mô hình hồi quy thu được sau hai bước có
dạng: 22112212ˆˆ tttyy bbb . Độ lệch thứ E2 của nhóm X được thành lập từ các
thành phần chính của vec tơ )1(
2
)1(
1 , XX , nó trực giao với t2, nghĩa là vec tơ 0. Hay
đẳng thức '
2 2 0E E là đúng, thuật toán đã hoàn thành. Sử dụng các mô hình với giá
trị dự đoán y với các vec tơ )2,1(, kkk pw .
31
1.4.4. Giải thuật di truyền
Việc lựa chọn các biến độc lập tối ưu để thu được một mô hình tốt là vấn đề
chính trong mô hình hồi quy hay mô hình mạng thần kinh (ANN) có số lượng lớn
các biến số độc lập [10, 77]. Trong những năm gần đây, giải thuật di truyền
(genetic algorithm - GA) được áp dụng trong chọn lựa biến độc lập bằng phương
pháp hóa tính toán [10]. Thuật toán di truyền dựa trên các nguyên tắc sự tiến hóa
của Darwin, đã được sử dụng rộng rãi để tối ưu hoá tô hợp biến [10, 77]. GA sử
dụng các quá trình tiến hóa để mô phỏng tiến trình này nhằm giải quyết vấn đề bằng
máy tính [10]. Các quá trình cơ bản sử dụng ở đây là đột biến ngẫu nhiên. Sự kết
hợp di truyền và việc sử dụng chúng dẫn đến việc tối ưu hóa các các tiêu chí lựa
chọn được xác định trước. Sự khác biệt của các phương pháp này từ các chiến lược
tìm kiếm khác là sử dụng một tập hợp các biện pháp trung gian. Sau đó, các biện
pháp này được sử dụng để xây dựng các biện pháp mới và hy vọng cải thiện được
các vấn đề [69, 110]. Về mặt sinh học, các biện pháp riêng biệt được so sánh với
các cá thể trong một quần thể. Các quá trình khác nhau được sử dụng để tạo ra thế
hệ con cái làm tăng sức mạnh của quần thể. Trong tự nhiên, các cá thể phù hợp nhất
để cạnh tranh với các nguồn tài nguyên hạn chế như thực phẩm, không gian để tồn
tại và duy trì nòi giống [110]. Chúng tạo ra thế hệ con cái, cho phép chuyển đôi di
truyền của chúng bằng các gen có trong nhiễm sắc thể. Điều này cần thiết cho mỗi
loài để thích ứng với điều kiện môi trường thay đôi. Do đó, chọn lọc tự nhiên dẫn
đến sự sống còn của các cá thể phù hợp, nhưng nó cũng tiềm ẩn sự sống còn của các
gen thích hợp nhất. Quá trình sinh sản cho phép đa dạng hóa nguồn gen của một
loài. Sự tiến hoá được bắt đầu khi nhiễm sắc thể từ hai cha mẹ tái kết hợp trong quá
trình sinh sản. Sự kết hợp mới của gen được tạo ra từ những gen trước đó và do đó
gen mới được hình thành. Các phân đoạn của hai nhiễm sắc thể mẹ được trao đôi
trong quá trình cắt ngang, tạo ra khả năng kết hợp các gen tốt cho các cá thể tốt hơn.
Các đột biến đưa ra sự thay đôi ít và ngẫu nhiên trong nhiễm sắc thể. Sự lựa chọn,
lai chéo và đột biến lặp lại gây ra sự tiến hoá liên tục của các gen của một loài và
tạo ra những cá thể tồn tại trong một môi trường cạnh tranh [110]. Thuật toán di
truyền vận hành thông qua một chu kỳ đơn giản bao gồm các giai đoạn cơ bản sau:
32
1. Cơ chế mã hoá;
2. Định nghĩa chức năng thể trạng;
3. Tạo quần thể
4. Thao tác di truyền với quần thể
1) Mã hóa
Các chương trình mã hóa được sử dụng trong QSARIS được dựa trên gen cơ
bản. Các mô hình hồi quy có thể (các giải pháp) khác nhau bằng một tập hợp các
biến đang được sử dụng. Nếu tông số các biến độc lập bằng N, thì một số tương ứng
với bất kỳ giải pháp nào bao gồm một chuỗi các chữ số nhị phân N (bits) được gọi
là các gen [7, 110].
Mỗi giá trị đại diện cho một biến độc lập (0 = vắng mặt, 1 = có mặt).
Ví dụ, nếu một tập tất cả các dự đoán là (X1, X2, X3, X4, X5) thì nhiễm sắc thể của
giải pháp với các dự đoán (X2, X3, X5) sẽ là (0, 1, 1, 0, 1).
Hàm mục tiêu
Mỗi mô hình (giải pháp) có liên quan đến một giá trị mục tiêu phản ánh sự so
sánh tốt với các cá thể khác trong quần thể (các giải pháp khác) [7, 110]. Hai hàm
mục tiêu được sử dụng trong QSARIS. Hàm chức năng thứ nhất hay Fit1 (mô hình)
bằng R2ad được tính bằng SWR cho mô hình được xác định bởi nhiễm sắc thể của mô
hình. Ưu tiên cho cá thể có giá trị Fit1 lớn. Bất lợi của hàm Fit1 là có thể dẫn đến
các mô hình thừa biến (over-fitting). Hàm chức năng thứ hai Fit2 (mô hình) dựa
trên cơ sở của phương trình của Friedman [7, 110].
12( )
( )Fit cathe
LOF cathe (1.70)
Với
2
( ) /( )
( 1)1
pRSS cathe NLOF cathe
d p
N
(1.71)
Trong hàm LOF: p là số biến số độc lập của mô hình; N là số lượng
mẫu trong bộ dữ liệu;
33
RSSp (mô hình) là tông bình phương độ lệch của mô hình hồi quy sử dụng các
biến độc lập p, d là số yếu tố (tham số của hàm LOF, xác định bởi quá trình tính
toán). Nhìn chung nếu kích thước nhỏ hơn LOF (lớn hơn Fit2) thì mô hình tốt hơn
[7, 110]. Tất cả các thuật ngữ trong phương trình (1.7.1) khá rõ ràng ngoại trừ yếu
tố d. Có thể thấy rằng với giá trị cho trước d (mặc định là 2), khi N lớn, LOF gần
với giá trị trung bình của RSSp [7, 110]. Mô hình tốt khi giá trị p nhỏ. Như vậy,
LOF tăng khi giá trị (p+1)/N đủ lớn. Đối với một giá trị d nhất định của mô hình,
khi thêm biến mới vào mô hình, RSSp giảm, nhưng khi tỷ số (p+1)/N tăng, LOF đạt
giá trị nhỏ nhất. Với giá trị d xác định ở giá trị tối thiểu. Tuy nhiên, khi p càng nhỏ
thì d càng lớn. Ví dụ, nếu chúng ta giả sử rằng các hệ số hồi quy bk (dựa trên các
thành phần chính) tỉ lệ nghịch với chỉ số k, thì RSSp được tính gần đúng [7, 110]:
1
1
1
11
1
2
1
2
Npconst
k
k
constRSSN
k
p
k
p (1.72)
và
2))1(()1(
pdNp
pNconstLOF (1.73)
Giá trị LOF nhỏ nhất khi:
dN
p
981175.0
1 (1.74)
Rõ ràng là các mô hình tối ưu với số lượng biến nhỏ tương ứng với giá trị d lớn.
Tham số d thường được lựa chọn bằng cách xem xét các trường hợp thực tế. Các
giá trị ban đầu được đề nghị là từ 1 đến 4. Sơ đồ hoạt động khác của các phương
pháp di truyền được mô tả trong Hình 1.10. Sau đây, chúng tôi sẽ xem xét mô tả
các tùy chọn khác nhau của GA.
Tạo dữ liệu nguồn (quần thể nguồn)
Trong việc tạo ra một tập dữ liệu ban đầu, cần phải có hai quyết định: kích cỡ
dữ liệu và dự đoán ban đầu của giải pháp. Hành động chính trong GA là kết hợp hai
34
nhiễm sắc thể để tạo ra một nhiễm sắc thể mới [10, 110]. Ví dụ, tất cả các nhiễm
sắc thể trong quần thể chứa cùng một bit ở một vị trí đặc biệt của chuỗi gen, không
có sự kết hợp của nhiễm sắc thể có thể đưa một giá trị khác vào vị trí đó.
Hình 1.10 Sơ đồ giải thuật di truyền [10]
Điều này làm giảm đáng kể chiều kích của vấn đề tìm kiếm bằng một, vì giá
trị đó sẽ được cố định mãi mãi. Việc giảm kích thước của vấn đề sẽ được gọi là tập
trung. Nếu tập dữ liệu (số lượng quần thể) đủ lớn sẽ chọn lọc được nhiễm sắc thể
ban đầu có sự tương thích tương đối cao và có nhiều điểm chung với các giải pháp
tối ưu. Nếu tập dữ liệu ban đầu quá nhỏ, một cá thể thể ban đầu tương đối tốt có thể
có nhiều giá trị chung với một giải pháp tối ưu và làm tăng khả năng của giải pháp
này [10, 110]. Ngược lại, nếu tập dữ liệu quá lớn, nhiễm sắc thể ban đầu có nhiều
điểm chung với giải pháp tối ưu có thể bị nhiễu bởi các giải pháp khác và có thể
không có ảnh hưởng đến toàn bộ quần thể (dữ liệu) [10, 110].
Thông thường, giải pháp tốt nhất chọn một tỷ lệ phần trăm nhỏ của tất cả các
biến, và sau đó trong nhiễm sắc thể 0 là cao hơn nhiều so với 1. Sự khởi tạo của tập
dữ liệu, trong đó mỗi bit được cho một giá trị 0 hoặc 1 ngẫu nhiên với cùng một xác
suất, sẽ gần như không thể áp dụng được [10, 110]. Vì quần thể ban đầu sẽ được
35
hình thành bởi các nhiễm sắc thể tương ứng với các tập con có chứa trung bình các
biến của bộ dữ liệu.
Thực tế trong một số trường hợp các nhiễm sắc thể này không thể đánh giá
được. Giải pháp áp dụng cho vấn đề này là: ở giai đoạn tạo ra quần thể ban đầu, xác
suất có '1' thấp hơn nhiều so với việc có '0'. Do đó, quần thể ban đầu được hình
thành bởi các nhiễm sắc thể mục tiêu để tập con chứa số ít biến. Với tư cách là
hướng dẫn, cho mỗi gen xác suất là ‘1’ để thiết lập bộ 5 biến [10, 110]. Sau đó,
trung bình 5 biến sẽ được chọn trong mỗi nhiễm sắc thể. Điều này có nghĩa là ở giai
đoạn đầu tiên một số lượng nhiễm sắc thể cao hơn nhiều và được đánh giá và các
biến "xấu" có thể được loại ra dễ dàng hơn, vì chúng không đủ tin cậy đối với
nhiễm sắc thể mục tiêu, trong đó chỉ một vài biến tốt được lựa chọn. Trong mỗi lần
chạy, sự kết hợp của các khối nhỏ, có tính thông tin cao sẽ dẫn đến sự gia tăng dần
dần số lượng các biến được lựa chọn, cho đến khi nó được 'tối ưu' [10, 110].
Chọn thế hệ cá thể ban đầu
Lựa chọn cá thể ban đầu trong một GA là cung cấp khả năng sinh sản tốt
nhất. Có ba cách để thực hiện trong QSARIS.
36
- Phương pháp thông thường là lựa chọn giải pháp di truyền và tiến hóa. Trong đó,
chọn lựa ngẫu nhiên một tập hợp cá thể sau đó chọn ra cá thể tốt nhất.
- Thuật toán di truyền cô điển cũng sử dụng chương trình lựa chọn bánh xe lăn
(roulette wheel) [10, 76], ở đây xác suất của mỗi thế hệ được lựa chọn tỷ lệ thuận
với khả năng của nó. Để thực hiện loại hình lựa chọn này, các phân đoạn sau bị loại
trên trục [xk-1; xk] (k = 1, 2, …, m). Chiều dài của các đoạn này bằng với số cá thể
(Hình 1.11). Sau đó, một điểm ngẫu nhiên xrand được đưa vào đoạn tông hợp [0; xm]
và nó có sự phân bố đồng đều dọc theo phân đoạn nhất định. Cá thể tương ứng với
đoạn được chọn làm cha mẹ trong đoạn [0; xm] [10, 110].
Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76]
Sự lựa chọn thế hệ cha mẹ theo phương pháp xếp hạng tuyến tính tương tự
như lựa chọn theo phương pháp bánh xe lăn.
Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76]
Sự khác biệt là xác suất của mỗi cá thể được lựa chọn trực tiếp dự kiến đến số thứ
tự của nó trong tập dữ liệu ban đầu. Do đó, đối với tập hợp của m cá thể các đoạn có
chiều dài m, m-1, m-2, …, 1 được rút ra trên trục (Hình 1.12) [10, 110]. Sau đó,
một điểm n gẫu nhiên với tọa độ xrand được đưa vào phân đoạn [0; xm]. Dấu chấm
ngẫu nhiên này được phân bố đồng đều dọc theo phân đoạn nhất định. Mỗi cá thể
mục tiêu tương ứng với phần mà ngẫu nhiên được chọn làm thế hệ cha mẹ [10, 76].
37
2) Tổ hợp
Hình 1.13 Toán tử chéo đơn điểm [76]
Hình 1.14 Toán tử chéo hai điểm [76]
Tô hợp là một hoạt động mà hai cá thể được kết hợp để tạo ra các thế hệ mới.
Trong QSARIS, các toán tử chéo được sử dụng trong tô hợp. Toán tử đơn giản nhất
được gọi là chéo đơn điểm (one-point crossover) [10, 76]. Nó xảy ra khi hai cá thể
cha mẹ (P1, P2) được đôi chỗ sau một điểm cắt được lựa chọn ngẫu nhiên, tạo ra hai
con lai (O1, O2) (Hình 1.13). Trong toán tử chéo hai điểm (Two-point crossover),
hai điểm được chọn ngẫu nhiên và các phân đoạn của nhiễm sắc thể giữa chúng
được trao đôi (Hình 1.14) [10, 76].
Số điểm có thể được tăng liên tục cho đến khi mỗi giá trị cho một con cái
nhất định có thể được lựa chọn độc lập từ cha hoặc mẹ. Thế hệ con lai khác chỉ đơn
giản nhận được giá trị bô sung. Được gọi là chéo đồng nhất (uniform crossover).
Nếu nó nhận được từ cha và mẹ, nó được gọi là chéo đồng nhất cân bằng (unbiased
38
uniform crossover). Loại crossover (số điểm cắt) cần xác định các vấn đề ảnh
hưởng đến việc tìm kiếm. Ví dụ, chúng ta giả định rằng mục tiêu của sự lựa chọn là
một tập gồm 11 mô tả, không có trong bộ số liệu 100, dự đoán chính xác một số
thuộc tính. Đồng thời chúng ta giả sử rằng bộ mô tả tốt nhất, hoặc chiếm ưu thế là:
(g1, g2, g3, g4, g5, g6, g7, g8, g9, g10, g11) [10, 76].
Nếu một điểm chéo một điểm được sử dụng, với xác suất 0,9 cho các bộ mô
tả liền kề (ví dụ: g4 và g5) sẽ được chuyển sang cùng một dạng lai tạo, và xác suất
bằng không là các mô tả đầu tiên và cuối cùng sẽ được chuyển sang cùng một đứa
con của cha mẹ này. Tương tự, nếu g1 và g3 là bộ mô tả "tốt" và g2 không, thì
không thể tạo ra thế hệ con lai g1 và g3 từ cha mẹ. Trong trường hợp này, một chéo
hai điểm hoặc chéo đồng dạng có thể là thích hợp hơn [76].
GA có thể sử dụng toán tử phối giống với một xác suất nhất định Pmate. Nếu
tô hợp không xảy ra, sau đó các bản sao của cha mẹ được thêm vào dân số. Những
dòng vô tính này có thể được thay đôi bởi đột biến [76].
3) Đột biến
Đột biến đơn giản sửa đôi một nhiễm sắc thể đơn với xác suất cho trước.
Trong tiêu chuẩn GA, xác suất đột biến (Pmutate trong Hình 1.10) rất nhỏ và hành
động của nó là cố gắng ngăn ngừa hội tụ đến một giải pháp tối ưu [10, 76]. Một đột
biến trong nhiễm sắc thể có thể bô sung 1 hay nhiều bit. Cũng như lai chéo, có thể
xác định k-đột biến (k = 1 hay 2), khi k gen được chọn ngẫu nhiên 1 hay nhiều lần
với xác suất Pmutate. Hơn nữa, 1 điểm đột biến đồng nhất (uniform mutation) có thể
xảy ra, khi ít nhất 1 gene được thay đôi với xác suất Pmutate. Vì vậy, mỗi bit được
thay đôi với xác suất [10]:
mPq /1)1(1 mutate (1.75)
Với m là số gen trong nhiễm sắc thể.
4) Tiến trình lai
Không nhất thiết yêu cầu số các thể lai phải bằng số cá thể ban đầu, hoặc tất
cả cá thể con phải được đưa vào tập dữ liệu. Có thể định nghĩa số cá thể con từ cặp
cá thể gốc (nghĩa là hoàn thành một số chu kỳ lai với cùng một cặp cá thể ban đầu).
39
Nếu số cá thể con trùng với số lượng cá thể ban đầu hiện có thì nó không được coi
là tiếp cận và thu nhập từ việc lai. Tông số tất cả các cá thể con là riêng biệt. Con số
này nên chia cho số cá thể của cùng một bậc cá thể ban đầu [10].
Cập nhập dữ liệu
Thế hệ cá thể con có thể được thêm vào dữ liệu hiện tại bằng cách chuyển
một thành viên hiện có. Vì các biến thể sau có thể thực hiện được: thay thế một số
thành viên yếu nhất trong tập hợp bằng cá thể con tốt nhất; tăng dữ liệu tiếp theo từ
cá thể lai tốt nhất [76].
Mặc dù lựa chọn thứ hai là phô biến nhất, nó cũng là tập trung nhất. Vì thế
hệ con sẽ có một số gen chung với thế hệ ban đầu, tất cả được đưa chung vào tập dữ
liệu. Khi gia tăng số lượng các biện pháp lai với một cặp cá thể gốc sau khi mỗi con
được sinh ra. Điều này cũng có lợi thế là thông tin di truyền có giá trị có thể chứa
trong thành viên ít nhất trong tập hợp sẽ bị mất trước khi có cơ hội chuyển thông tin
này cho một cá thể con. Cần hạn chế số lượng quần thể sinh ra để thoát khỏi chu
trình cơ bản và để hoàn thành một thuật toán [76, 107].
1.4.5. Mạng thần kinh nhân tạo (ANN)
1.4.5.1. Khái niệm
Mạng thần kinh nhân tạo (nơ ron) là một hệ thống nhận thức dựa trên sự
nhận thức của hệ thống thần kinh sinh học tự nhiên Hình 1.15.
Ba công cụ trí tuệ nhân tạo gồm mạng thần kinh, logic mờ và thuật toán di
truyền được kết hợp hài hòa trong quá trình thiết lập mô hình liên quan nhân quả tối
ưu. Mạng thần kinh: thiết lập mô hình liên quan nhân quả (X, Y) và dự đoán (Y) từ
(X) là các yếu tố đã biết [30]. Thuật toán di truyền: tối ưu hóa dựa trên mô hình liên
quan nhân quả đã được thiết lập bởi mạng thần kinh, dùng khi cần cải thiện (Y)
bằng cách thay đôi (X). Logic mờ: làm cho mạng thần kinh hiệu quả hơn trong việc
thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức tạp, cả định lượng và
không định lượng đồng thời giúp cho thuật toán di truyền được thuận lợi hơn trong
sự tối ưu hóa với các mục tiêu liên quan [101].
40
Hình 1.15 Hệ thống thần kinh sinh học tự nhiên
1.4.5.2. Cấu trúc mạng
Mạng thần kinh nhân tạo (ANN) có cấu trúc giống hệ thần kinh động vật,
tương tự như bộ não có chức năng xử lý thông tin. ANN gồm nhiều nơ ron gắn kết
cấp cao với nhau để giải quyết các vấn đề một cách rõ ràng. ANN giống như bộ não
người, trải qua quá trình học, tích lũy kinh nghiệm để xử lý các vấn đề trong từng
tình huống phù hợp [30, 50].
Năm 1943 nhà thần kinh học Warren McCulloch và nhà logic học Walter
Pits đã nghiên cứu ANN [50]. Tuy nhiên, các nghiên cứu ANN thời bấy giờ còn
hạn chế. Ngày nay ANN khá phô biến, phát triển và ứng dụng rộng rãi trong nhiều
lĩnh vực. Một số lĩnh vực điển hình như các ngành khoa học tự nhiên, y học, kinh
tế, quân sự, điện, điện tử, kỹ thuật chế tạo [77]. Mới nhất là các nghiên cứu ứng
dụng trong lĩnh vực khoa học tự nhiên. Tại Việt Nam việc nghiên cứu ứng dụng
ANN vào hóa học chỉ mới bắt đầu trong vài năm gần đây và cần được phát triển.
Điển hình như các lĩnh vực: Hóa học môi trường; Hóa học hữu cơ (phân tích hữu
cơ, tông hợp hữu cơ…); Hoá học phân tích (phân tích môi trường, giám sát ô
nhiễm…); Công nghệ hóa học ( kỹ thuật nano, kỹ thuật dầu khí, tách chất…); Công
nghệ xử lý môi trường (đánh giá xử lý, mô phỏng xử lý…) [30].
41
Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50]
Mạng thần kinh nhân tạo ngày nay được ứng dụng trong rất nhiều ngành
khoa học. Trong đó Hóa học là một lĩnh vực có nhiều ứng dụng của mạng thần kinh
nhân tạo mà phương pháp truyền thống không thể giải quyết được, quá trình luyện
mạng thần kinh dẫn ra ở Hình 1.16. Mạng thần kinh có thể thiết lập các mô hình
nhân quả thích hợp và mềm dẻo với nhiều loại số liệu đơn giản hay phức tạp tuyến
tính hay không tuyến tính [101].
Đưa dữ liệu đầu vào gồm biến độc lập (X) và biến phụ thuộc (Y) qua lớp ẩn
để mạng thần kinh định lượng mối quan hệ giữa X và Y để dự đoán Y từ X, quá
trình định lượng này có thể tuyến tính hoặc không trên hệ thống các hàm toán,
thông dụng như hàm Sigmoid, Tanh có phương trình của hàm cụ thể [86]. Quá trình
học (luyện mạng) như vậy tạm hiểu là quá trình học của hệ thần kinh tự nhiên, học,
cải tiến, có kế thừa và phát huy và khả năng ghi nhớ, sao chép, rõ ràng đây là mô
hình tối ưu hơn mô hình tuyến tính thuần túy.[77]
Cấu trúc mạng nơ ron
Đầu vào (Qi, i..)
Chỉnh mức quan trọng
Nhóm luyện
Đầu ra (pGI50)
Xử lý đầu ra
Mạng được luyện
Kết quả
42
Mạng nơ ron bao gồm các nút mạng cho chức năng xử lý thông tin. Lớp
nhập (input), lớp xuất (output), trọng số của từng lớp input, trọng số tông của mạng
nơ ron Hình 1.17 [5, 102].
Thông số ảnh hưởng đến
ngưỡng ra của output
Trọng số 1
Hàm toán OutputInput 2
Input 3
Input 1
Trọng số 2
Trọng số 2
Trọng số
Hình 1.17 Cấu trúc mạng nơ ron [101]
Các hàm toán trong mạng nơ ron có các đặc tính sau: Hàm có tính đơn điệu;
Hàm bị chặn trên và chặn dưới; Hàm phải có tính liên tục và trơn. Một số hàm toán
trong mạng nơ ron [50, 77]:
Hàm Threhold
f(u) = 1 nếu u > 0; f(u) = 0 nếu u < 0 (1.76)
Hàm piecewwise – linear
f(u) = 1 nếu u > 1/2; f(u) = u nếu 1/2 > u > -1/2; f(u) = 0 nếu u < -1/2
Hàm sigmoid (logistic)
1( )
1 exp(- )f u
au
(1.77)
Hàm tanh – hyperbol
-
-
-( ) tanh ( )
u u
u u
e ef u u
e e
(1.78)
Quá trình luyện mạng và thử của mạng nơ ron
Trong tiến trình học, mạng nơ ron nhận diện dữ liệu, các thông số tự do được
thay đôi liên tục do dự thay đôi của môi trường và các giá trị này được ghi nhớ lại
[95], Hình 1.18 [16, 21].
43
Input
Input
Input
Trọng số 1
Trọng số 2
Trọng số n
Teach/use
Output
Nơ ron
Teaching input
Hình 1.18 Quá trình học của mạng nơ ron [16]
Trong quá trình luyện, nhập các giá trị lớp input vào hệ thống luyện nhằm
tạo ra các giá trị output. Tiếp theo mạng nơ ron so sánh các trị output từ mạng nơ
ron với các giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì quá trình
luyện mạng đạt yêu cầu. Nếu sai số giữa hai giá trị này quá lớn thì quá trình luyện
mạng được lặp lại, thay đôi các thông số luyện mạng [5, 21, 30].
Quá trình luyện mạng được lặp lại liên tục, cho đến khi tìm ra các giá trị
trọng số phù hợp sao cho giá trị xuất do mạng nơ ron xuất ra đạt yêu cầu. Do đó
trong quá trình luyện mạng, cần thiết lập yêu cầu về sai số, hoặc yêu cầu về số vòng
lặp cần xác định [97, 114].
Khác với chương trình máy tính khác được lập trình sẵn một cách rành mạch,
mạng thần kinh nhân tạo phải được luyện với các nhóm luyện có sẵn. Quá trình
luyện mạng có tính chất lặp lại, cải thiện chất lượng mô hình một cách liên tục
thường sử dụng thuật toán lan truyền ngược gồm các bước [50]: chọn một cặp đầu
vào – đầu ra từ nhóm luyện để làm vector đầu vào cho đầu vào của mạng thần kinh;
tính đầu ra của mạng; tính sự khác biệt giữa đầu ra của mạng và đầu ra mong muốn;
điều chỉnh mức quan trọng để giảm thiểu sai số; lặp lại bước điều chỉnh cho đến khi
sai số luyện mạng được chấp nhận [50].
Khi luyện mạng các mô hình nhân quả có thể được thiết lập riêng rẽ hay một
lượt. Các mức quan trọng được điều chỉnh cho phù hợp với dữ liệu luyện mạng, có
khả năng mạng thần kinh được luyện quá mức. Khi ấy mạng thần kinh có thể chỉ dự
44
đoán tốt cho nhóm luyện mà không chính xác đối với trường hợp thử. Do đó dữ liệu
nghiên cứu thường được chia thành hai nhóm: luyện và thử, dùng nhóm luyện để
luyện mạng và dùng nhóm thử để đánh giá về mạng. Nếu giá trị dự đoán gần với giá
trị quan sát thì khả năng dự đoán là tốt (R2pr và R2
tr cao) [90].
Giải thuật lan truyền ngược (Back – Propagation)
Trọng số các kết nối được điều chỉnh bằng thuật toán lan truyền ngược sao
cho sai số E là nhỏ nhất [7, 22].
1
, –n
i
E
2
i it x w y x (1.79)
Với t (xi, w): giá trị của tập mẫu; y (xi): giá trị output của mạng.
Trên từng nơ ron, đều có lớp input và output, các giá trị này đều có một trọng
số để đánh giá mức độ ảnh hưởng của các giá trị [22]. Thuật toán lan truyền ngược
điều chỉnh các trọng số sao cho ej = Tj – yj là nhỏ nhất. Cần xác định vị trí của từng
nơ ron, nơ ron lớp ẩn, lớp output, [5, 21, 90] Hình 1.19.
x1
x2
xi-1
xi
W1j
W2j
W(i-1)j
Wij
f (.)sum
Nơ ron j
tj
ej
Hình 1.19 Mô hình tính toán một nơ ron [69, 77]
Trong đó: wij: vector trọng số của nơ ron số đầu vào i.
Giá trị sai số ej của nơ ron tại vòng lặp thứ n:
ej (n) = tj (n) – yj (n) (1.80)
Tông bình phương sai số của mạng nơ ron:
2
1
1( )
2
k
j
j
E e n
(1.81)
Tại nơ ron ta có tông trọng số input (uj):
ij
0
( ) W . ( )p
j j
j
u n X n
(1.82)
Giá trị lớp xuất của nơ ron j:
yj (n) = fj (uj(n))
45
Tùy theo hàm hoạt động để tính toán các giá trị điều chỉnh trọng số tương
ứng theo thuật toán lan truyền ngược [22, 69].
Mạng thần kinh nhân tạo không thích hợp với vấn đề đòi hỏi về kí tự và bộ
nhớ. Mạng thần kinh cấu tạo bởi nhiều lớp: I(j) – HL(k) – HL(m) – O(n). Trong đó:
I là lớp vào, j là số nút đi vào, HL là lớp ẩn, k là số nút của lớp ẩn thứ nhất, m là số
nút của lớp ẩn thứ hai, O là lớp đi ra, n là số nút đi ra [90].
1.4.6. Thống kê đánh giá mô hình
Kỹ thuật đánh giá chéo loại bỏ dần từng trường hợp: Một hợp chất trong
nhóm luyện được loại bỏ. Mô hình QSAR sau đó được xây dựng từ các phân tử còn
lại và kết hợp với các biến mô tả ban đầu được lựa chọn và hoạt tính của hợp chất bị
loại bỏ được dự đoán bằng phương trình QSAR [51]. Chu kỳ này được lặp đi lặp lại
cho đến khi tất cả các hợp chất được loại bỏ một lần và hoạt tính của chúng được dự
báo [51]. Cuối cùng, mô hình có được kiểm tra khả năng dự báo dựa vào các tham
số PRESS, R2 (Q2), độ lệch chuẩn SDEP tính từ PRESS [72, 73].
2
tn ddPRESS Y Y (1.83)
PRESSSDEP
n (1.84)
2
tn(luyen) dd(luyen)2
2 2
( ) ( )tn(luyen) tn(luyen)
1 1
luyen luyen
Y Y PRESSQ
Y Y Y Y
(1.85)
Trong phương trình Ytn và Ydd tương ứng với các giá trị thực nghiệm và giá trị
dự đoán, n là số hợp chất, Ytn (luyen), Ydd (luyen) là giá trị thực nghiệm và giá trị dự đoán
của các hợp chất trong nhóm luyện bằng kĩ thuật loại bỏ dần từng trường hợp
(Leave – one – out), giá trị Q2 ≥ 0.5.
Tính R2pr
Giá trị R dự đoán (Rdd) phản ánh mức độ tương quan giữa giá trị thực nghiệm
và giá trị dự đoán của nhóm chất trong nhóm kiểm tra (kt) [51].
46
2
tn(kt) dd(kt)2
dd 2
( )tn(kt)
1
luyen
Y YR
Y Y
(1.85)
Ở đây, Ytn(kt) và Ydd(kt) là giá trị hoạt tính thực nghiệm và giá trị hoạt tính dự
đoán của các hợp chất trong tập kiểm tra. Y luyen chỉ ra các giá trị hoạt tính thực
nghiệm trung bình của các chất trong nhóm luyện. Vì vậy giá trị R2pr cao hơn 0,5
thì mô hình có khả năng dự đoán. Giá trị R2pr càng tiến gần đến 1 càng tốt.
1.4.7. Tính toán đóng góp của các tham số
Các giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% (3) [90] được
tính toán theo công thức:
1
1,%
k
m i m i
i
GMP x MP xn
với1
1,%
k
m i m ii
MP x P xm
;total
,% 100i i
m i
b xP x
C ; total , ,
1
k
m i m i
i
C b x
(1.86)
Trong đó: m là số mô hình kiểm tra tương ứng với số biến số k; k là tông số
biến số trong mỗi mô hình; n là tông số mô hình dùng để kiểm tra; Ctotal là tông
đóng góp của các tham số mô tả trong một hợp chất; Pmx i , % là phần trăm đóng
góp trung bình của mỗi tham số mô tả phân tử đối với m mô hình;
MPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả phân tử đối với
từng mô hình; GMPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả
phân tử đối với từng mô hình.
1.5. HỢP CHÂT FLAVONOID
1.5.1. Giới thiệu chung
Flavonoid là các hợp chất C15, gồm hai nhân phenol liên kết với nhau qua
một đơn vị C3. Quy ước đánh số trên khung phân tử flavonoid như Hình 1.20.
Flavonoid là nhóm chất rất phô biến trong tự nhiên, thường gặp trong dược
liệu có nguồn gốc thực vật, trong đó nhóm chancone anthocyanidin và auronon là
được biết đến là các chất tạo màu sắc cho thực vật [74].
47
Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74]
1.5.2. Phân loại dẫn xuất flavonoid
Có một số loại dẫn xuất flavonoid có thể kể tới như: Euflavonoid là các dẫn
xuất flavonoid có gốc aryl ở vị trí C2: flavone, flavonol, flavanone, flavanol,
chalcone, anthocyanin, anthocyanidin, flavane; Isoflavonoid có gốc aryl ở vị trí C3:
isoflavone, isoflavanone, rotenoid. Neoflavonoid có gốc aryl ở vị trí C4:
calophylloid; Biflavonoid là các dẫn xuất flavonoid dimmer; Triflavonoid cấu tạo
bởi 3 monomer flavonoid; Flavolignan là các dẫn xuất flavonoid mà phân tử có một
phần cấu trúc lignan [20].
Hình 1.21 Một số dẫn xuất flavonoid [20, 74]
Chancon Flavononoid
Anthocyanidin
Isoflavone
flavane
Aurone
48
1.5.3. Phân bố flavonoid trong tự nhiên
Flavonoid là nhóm chất có mặt trong hầu hết các bộ phận của các loài thực
vật bậc thấp và thực vật bậc cao. Hiện nay có trên 10.000 hợp chất được phân lập và
xác định cấu trúc [81]. Các họ thực vật chứa flavonoid như Leguminosae,
Rutaceae, Moraceae, Ericaceae và Anacardiaceae. Đối với isoflavonoid chỉ xuất
hiện giới hạn trong phân họ Papillionoideae của họ Leguminosae [81].
1.5.4. Hoạt tính sinh học của flavonoid
Flavonoid là nhóm chất có phô hoạt tính rất phong phú, rộng rãi đặc biệt
trong lĩnh vực y học, dược phẩm, chúng có một số hoạt tính đặc trưng sau:
Hoạt tính chống oxi hoá: flavonoid có khả năng vô hoạt các tác nhân oxi
hoá như các anion O2-, gốc OH., ROO.. Có nhiều nghiên cứu về khả năng chống oxi
hoá của flavonoid, các nghiên cứu mối quan hệ định lượng giữa cấu trúc – hoạt tính
kháng oxi hoá của chúng được thiết lập [67, 81]. Các công trình nghiên cứu này đã
chỉ ra nhóm >C=O (C-4 cacbonyl) và liên kết đôi C-2 và C-3 là các yếu tố quan
trọng ảnh hưởng đến hoạt tính kháng oxi hoá của các dẫn xuất flavonoid [67].
Một số nghiên cứu chỉ ra rằng, flavone có hoạt tính cao hơn isoflavone;
flavonoid ức chế men sản sinh ra anion O2- như protein kinase, xanthin oxidase.
Bên cạnh đó, một số flavonoid ức chế cyclooxygenase, lipoxygenase, glutathion S-
tranferase, NaDH oxidase là các loại men tham gia tạo gốc oxy hoạt động. Về mặt
nhiệt động học, thế oxi hoá khử của flavonoid thấp nên có thể nhường hidro:
FLA-OH + R. →FLA-O. + RH
Flavonoid trong cơ thể chưa được công bố nhiều, vì việc phân lập khó khăn.
Phần lớn các flavonoid vào cơ thể bị chuyển hoá thành các axit phenolic, các axit
này vẫn có khả năng bắt gốc tự do [12, 81]. Tuy nhiên, các flavonoid đã chuyển
hoá và chưa chuyển hoá đều có tác dụng chống oxi hoá.
Hoạt tính kháng vi sinh vật: Flavonoid và các polyphenol có khả năng bảo
vệ thực vật khỏi sự xâm hại của vi sinh vật. Ngày nay, các nhà khoa học ngày càng
quan tâm đến việc sử dụng flavonoid để phòng, chữa bệnh. Hợp chất baicalin từ cây
Scutelleria baicalensis ức chế trực tiếp virus HIV [54]. Hợp chất biflavone
49
(robustaflavone, hinokiflavone) ức chế các enzym cần thiết cho quá trình phiên mã
của virus IC50 = 65 M. Các nghiên cứu khác cho thấy, flavonol và auron kháng
HIV mạnh, quercetin 5ml ức chế 70% virus HIV [45].
Hoạt tính ức chế emzim: các nghiên cứu chỉ ra rằng, liên kết đôi C-2 và C-
3, nhóm xeton ở C4 và nhóm OH ở vị trí 3’, 4’, 5’ đóng vai trò quan trọng trong hoạt
tính ức chế enzym NADH–oxidase, một số flavonoid ức chế enzym xanthin oxidase
là loại men xúc tác quá trình oxy hoá xanthin, hypoxanthin thành axit uric [42, 56] .
Hoạt tính kháng viêm: flavonoid có hoạt tính ức chế men cyclo-oxygenase,
men 5-lipoxygenase trong quá trình trao đôi chất theo con đường arachinonat. Như
hợp chất 8- hydroxyluteolin ức chế chọn lọc men 5-lipoxygenase với IC50 gần 10
µ[78] Hoặc cyanidin ức chế men prostaglflavonoidin endoperoxid hydrogen
synthase -1 và -2 với IC50 tương ứng là 90 và 60 µApigenin có hoạt tính ức chế
tăng sinh nguyên bào sợi trong khoảng nồng độ từ 0,01 – 100 mg/ml. Ở đây,
nguyên bào sợi đóng vai trò quan trọng trong việc tạo hạt, sẹo và tương tác với hệ
miễn dịch khi cơ thể bị viêm nhiễm. Các nguyên bào sợi làm cho hầu hết các vết
thương lâu lành. Hay như hợp chất quercetin, curcumin có tác dụng làm lành vết
thương trong quá trình thay thận [19].
Hoạt tính kháng u và gây độc tế bào: Chalcone pedicin phân lập từ lá cây
Fissistigma lamguinosum có hoạt tính ức chế sự liên kết của tubulin thành
microtubule với IC50 là 300 µM [74]. Ngoài ra từ lá cây Fissistigma lamguinosum
cũng phân lập được fissistin và isofissistin có hoạt tính gây độc tế bào. Từ lá cây
Baeckea frutescens người ta cũng phân lập được hai hợp chất flavanone có hoạt tính
gây độc tế bào ung thư bạch cầu L210 với IC50 bằng 0,25 µg/ml [105]. Từ rễ cây
Scutellaria baicalensis phân lập được các dẫn xuất flavonone là baicalein và baicalin
có hoạt tính ức chế tế bào ung thư gan, ung thư tụy. Từ cây Wikstroemia indica (L)
C.A. Meyer đã phân lập được kaempferol-3-O-β-D-glucopyranosid và tricin có hoạt
tính ức chế tế bào ung thư máu. Ngoài ra, flavonoid còn có một số hoạt tính khác
như hoạt tính đối với mạch máu, hoạt tính oestrogen và có vai trò quan trọng trong
sự tương tác giữa động vật và thực vật [81].
50
1.6. PHÂN LẬP VÀ XÁC ĐỊNH CÂU TRÚC FLAVONOID
1.6.1. Phân lập flavonoid
Sử dụng phương pháp ngâm ethanol để trích ly các hợp chất ra khỏi nguyên
liệu [105]. Sử dụng phương pháp sắc ký cột với chất nhồi cột là silicagel pha
thường, sephadex LH20, pha đảo Rp18 kết hợp sắc ký lớp mỏng để phân lập các
dẫn xuất flavonoid tinh khiết [3, 59]. Phát hiện dẫn xuất flavonoid bằng đèn tử
ngoại ở hai bước sóng 254 nm và 365 nm và dùng thuốc thử dung dịch
H2SO4/EtOH [37, 94].
1.6.2. Xác định cấu trúc flavonoid
Các phương pháp xác định cấu trúc flavonoid: Phương pháp phô cộng hưởng
từ hạt nhân, Phụ lục 64 gồm phô 1H-NMR, phô 13C-NMR, phô hai chiều HSQC và
Phô HMBC. Phương pháp nhiễu xạ tia X đơn tinh thể, Phụ lục 58 [4].
1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên
Quá trình thử nghiệm xác định hoạt tính ung thư Hela của các dẫn xuất
flvonoid được thực hiện theo phương pháp so màu (SRB). Tế bào ung thư Hela
được nuôi cấy trong môi trường E'MEM (Sigma), bô sung phenol red 0,4%, L-
glutamine 200 mM, NaHCO3 7,5%, HEPES 1M, Penicillin - Streptomycin 200
IU/mL, Amphotericin - B 0,1% và huyết thanh phôi thai bò 5%, trên đĩa 96 giếng
với mật độ 104 tế bào/giếng, trong điều kiện vô trùng, ở 37 oC, 5% CO2 [91, 98].
Sau 24 giờ, tế bào nuôi cấy được xử lý với dung dịch flavonoid 100 µg/mL. Sau 48
h, tế bào Hela được nhuộm SRB, đo mật độ quang (optical density – OD) ở bước
sóng 490 nm và 620 nm. Chất đối chứng dương sử dụng là Camptothecin
0,01µg/mL, chất đối chứng âm là nước cất vô trùng 10% pha trong môi trường và
DMSO 0,25%. Tỉ lệ ức chế tăng trưởng tế bào tính theo công thức (1.87) [91, 98].
I(%) = (1 – (ODThử nghiệm / OD đối chứng)) x 100% (1.87)
Tất cả các thí nghiệm được lặp lại 3 lần. Số liệu được xử lý bằng phần mềm
Microsoft Office Excel 2007.
51
CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. SƠ ĐỒ NGHIÊN CỨU
Sơ đồ nghiên cứu tông quát được đưa ra ở Hình 2.1. Nghiên cứu lý thuyết
bao gồm: tính các tham số điện tích, tham số độ dịch chuyển hóa học, tham số hóa
lý, tham số 2D, 3D của các dẫn xuất flavonoid; xây dựng các mô hình QSAR: xác
định định lượng các tham số điện tích, tham số độ dịch chuyển hóa học, tham số
hóa lý, tham số 2D, 3D ảnh hưởng quan trọng đến hoạt tính kháng ung thư; kiểm tra
khả năng dự đoán của mô hình.
Cấu trúc phân tửTác dụng kháng
ung thư pGI50
Cấu trúc điện tử
Qi, i, LD50, 2D, 3D
tính chất hóa lý…
Nghiên cứu lý thuyết
Các mô hình QSAR
Hóa lượng tử
Cơ học phân tử
Chuyển dạng
dữ liệuCơ học phân tử
Tập luyệnTập kiểm tra
MLR, PCAANN, GA
LOO,
ARE %,
Kiểm tra khả năng
dự đoán
Hợp chất chiết xuất
Cấu trúc phân tử
NMR X ray
Tác dụng kháng
ung thư pGI50
SRBQSAR
SRB
Hợp chất mới
Tham số cấu trúc
MM+; PM3Cơ học phân tử
Dự báo hoạt tính
Thực vật chiết xuất
SKC SKLM
Hình 2.1 Sơ đồ nghiên cứu tông quát
Thực nghiệm sàng lọc flavonoid: Phân lập và tinh chế một số flavonoid từ
gừng gió, đậu nành, tía tô, xa kê, actiso, sử dụng các phương pháp sắc ký cột và sắc
ký lớp mỏng [3]. Xác định cấu trúc flavonoid chiết xuất sử dụng phương pháp phô
cộng hưởng tử hạt nhân 1H-NMR, 13C-NMR NMR, DEPT, HSQC, HMBC và
phương pháp đo nhiễu xạ tia X đơn tinh thể [1, 109]. Thử in vitro hoạt tính kháng
Hela của các flavonoid chiết xuất sử dụng phương pháp so màu SRB [98]. Thiết kế,
sàng lọc flavone và isoflavone mới từ các hợp chất mẫu. Thiết kế, sàng lọc một số
52
dẫn xuất flavonoid mới từ các dẫn xuất flavonoid chiết xuất. Dự đoán hoạt tính
kháng ung thư cô tử cung của các dẫn xuất flavonoid chiết xuất và hợp chất thiết kế
mới từ hợp chất mẫu chiết xuất ra từ thực vật và hợp chất tông hợp [80], bằng cách
sử dụng các mô hình QSAR.
2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP
2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử
Dữ liệu sử dụng để xây dựng mô hình QSAR bao gồm các hợp chất flavone
và isoflavone và hoạt tính GI50 (μg/M) (nồng độ ức chế 50 % sự phát triển của tế
bào ung thư) được thu nhận từ nghiên cứu của Wang và cộng sự [80, 103] Phụ lục
1a. Giá trị GI50 được chuyển đôi sang giá trị pGI50 (pGI50 = -log(GI50) nhằm giảm
biên độ biến thiên của tập dữ liệu đồng thời giảm sai số và tăng khả năng dự đoán
của các mô hình QSAR [86, 88].
2.2.2. Nguyên liệu và phương pháp
2.2.2.1. Phần mềm ứng dụng
Các phần mềm được sử dụng trong đề tài này gồm 3 nhóm chính: xây dựng
và tính toán các tham số, xây dựng các mô hình và phân tích, thống kê, vẽ đồ thị.
Phần mềm Ứng dụng
ChemOffice 2008 Tính toán các tính chất hóa lý
HyperChem v8.0 Tính toán điện tích, độ dịch chuyển hóa học
QSARIS Tính toán các tham số cấu trúc 2D, 3D
INForm v2.0 Xây dựng các mô hình mạng nơ ron
Visual Gene Developer v1.7 Xây dựng các mô hình mạng nơ ron
Essential Regression 97 Thiết lập các mô hình tuyến tính
MS-EXCEL 2003 Phân tích thống kê, xây dựng dữ liệu
Origin v7.0 Vẽ đồ thị z
2.2.2.2. Hóa chất, thiết bi
Hóa chất và dụng cụ sử dụng trong luận án bao gồm:
53
Hóa chất Ứng dụng
Silica gel cỡ hạt 40-60 m, 30-50 m hãng
Himedia, Scharlau, Merck.
Dùng trong sắc ký cột pha thường
và pha đảo Rp18
Hexane, chloroform, methanol, ethyl acetate
ethanol, nước cất (merck)
Dung môi sử dụng trong quá trình
phân lập flaovnoid
H2SO4/EtOH (Merck) Thuốc thử nhận biết vết flavonoid
trên bản mỏng
Dụng cụ Ứng dụng
Bản mỏng nhôm tráng sẵn silica gel 60F254
(Merck) 0,2 mm Sắc ký lớp mỏng
Đèn UV tử ngoại cầm tay, hiệu UVITEC hiện màu thuốc thử trên bản mỏng
cột sắc kí đường kính từ 2-5,5 cm máy sắc ký
trung áp Sắc ký cột
Bruker AM500 FT-NMR Spectrometer Đo phô NMR
2.2.2.3. Nguyên liệu
Thu hái nguyên liệu: Các mẫu thực vật được dùng trong nghiên cứu bao
gồm: actiso (Cynara scolymus L.) [2], xa kê (Artocarpus incisa L.) [2], đậu nành
(Glucine max L.) [2], [2], tía tô (Perilla ocymoides L.) [2], gừng gió (Zingiber
zerumbet L.) [2] (Hình 2.2) được thu hái tại Đà Lạt, Việt Nam, tháng 8, 9 năm
2012. Các tiêu bản tươi của nhóm thực vật chiết gồm bộ phận chiết và lá để định
danh thực vật và lưu mẫu [11, 59]. Các mẫu thực vật được định danh thực vật và
lưu tiêu bản tại Viện công nghệ sinh học và môi trường Trường (IBE), Đại học Tây
Nguyên, Phụ lục 11. Nguyên liệu sau khi thu hái được loại bỏ phần đất cát, sâu
bệnh, rửa sạch, để ráo sau đó sấy khô, nghiền hoặc thái nhỏ để sử dụng cho quá
trình chiết và phân lập [59].Tiến hành định lượng nguyên liệu trong từng giai đoạn
để tính toán hiệu quả của quá trình chiết [27, 56, 105].
54
Actiso Xa kê Đậu nành
Tía tô Gừng gió
Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2]
2.3. NGHIÊN CỨU LÝ THUYẾT
2.3.1. Phương pháp tính toán thông tin cấu trúc
2.3.1.1. Cơ học phân tử
Dữ liệu về năng lượng phân tử, điện tích nguyên tử và moment lưỡng cực
được tính toán trên phần mềm HyperChem [38]. Dựa trên kết quả khảo sát, mức
gradient và tùy chọn thích hợp sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu
cơ nghiên cứu. Chọn thuật toán phù hợp với nhóm dẫn xuất nghiên cứu. Phương
pháp phân tích phương sai hai yếu tố không lặp được dùng để khảo sát ảnh hưởng
của các thuật toán: Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton -
Raphson theo năng lượng (kcal/mol) [38]. Phương pháp phân tích phương sai hai
yếu tố không lặp được dùng để khảo sát ảnh hưởng của: các mức gradient bằng 10;
1; 0,1; 0,01 đối với năng lượng (kcal/mol) và tùy chọn lưỡng cực liên kết và điện
tích nguyên tử trên các tham số hóa lượng tử. Dựa trên kết quả khảo sát, thuật toán
sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu cơ nghiên cứu.
2.3.1.2. Hóa lượng tử
Phương pháp hóa lượng tử bán thực nghiệm (CNDO, INDO, MNDO, AM1,
RM1, PM3, TNDO) được sử dụng để xác định các tham số điện tích nguyên tử, độ
dịch chuyển hóa học của phô 13C-NMR, 15O-NMR, các tham số hóa lý và các tham
55
số 2D, 3D [38]. Sử dụng phương pháp phân tích phương sai 2 yếu tố không lặp
(yếu tố điện tích nguyên tử và momemt lượng cực để thăm dò các phương pháp hóa
lượng tử. Từ đó, chọn lựa phương pháp hóa lượng tử thích hợp để tính toán điện
tích (Qi), độ dịch chuyển hóa học (i) của phô 13C-NMR, 15O-NMR, tham số hóa lý,
cấu trúc 2D, cấu trúc 3D [38].
2.3.1.3. Các tham số cấu trúc
Sử dụng phương pháp cơ học phân tử MM+ để tối ưu hóa cấu trúc phân tử
flavone và isoflavone. Các tham số mô tả cấu trúc được tính toán bằng các phương
pháp cơ học phân tử [52], phương pháp Grid [28, 48], phương pháp Gasteiger trên
phần mềm QSARIS [28].
2.3.2. Xây dựng các mô hình QSAR
Các mô hình hồi quy đa biến được xây dựng theo các bước như trong Hình
2.3. Tập dữ liệu cấu trúc và hoạt tính kháng ung thư của các dẫn xuất flavone và
isoflavone trong phụ lục 1a được chia thành tập luyện (80 – 85%) và tập kiểm tra
(15-20%) bằng phương pháp chọn lựa ngẫu nhiên hoặc chọn lựa thông minh trên
phần mềm INForm [40, 77]. Khả năng dự đoán của mô hình QSAR (xây dựng từ
tập luyện) được đánh giá chéo bằng kỹ thuật loại bỏ dần từng trường hợp, so sánh
kết quả dự đoán với hoạt tính pGI50 của các hợp chất trong nhóm kiểm tra.
Hồi quy đa biến [51] được sử dụng để xây dựng mô hình quan hệ giữa dữ
liệu điện tích và hoạt tính (QESARMLR); mô hình quan hệ giữa dữ liệu phô và hoạt
tính (QSDARMLR); mô hình quan hệ giữa cấu trúc - cấu trúc (QSSRMLR), mô hình
quan hệ giữa dữ liệu tham số 2D, 3D và hoạt tính (QSARMLR, QSARPLS).
Chất lượng của mô hình hồi quy tuyến tính đa biến được xác định bằng các
giá trị hệ số xác định bởi R2tr, giá trị R2
pr, sai số (SE) [84, 90].
56
Hình 2.3 Xây dựng các mô hình hồi quy đa biến
Mạng nơ ron là một công cụ rất mềm dẻo xây dựng mối liên hệ giữa cấu trúc
và hoạt tính bao gồm tính chất tuyến tính và phi tuyến [89, 92]. Mô hình QSAR
(QESARANN, QSDARANN, QSARANN; QSARPCA-ANN) được xây dựng bằng kỹ thuật
neuro-fuzzy kết hợp với thuật toán di truyền trong phần mềm INForm [51]. Mạng
nơ ron cấu tạo thường ba lớp: I(j) – HL(m) – O(n). Trong đó: I là lớp nhập với j là
số nơ ron bằng số tham số mô tả phân tử trong mô hình tuyến tính QSARMLR; HL là
lớp ẩn, m là số nơ ron của lớp ẩn, O là lớp xuất, n là số nơ ron lớp xuất, tức là hoạt
tính pGI50 [51].
Ảnh hưởng của các tham số cấu trúc đến hoạt tính kháng ung thư tính toán từ
các mô hình QSAR tuyến tính theo mục 1.4.7. Kiểm tra khả năng dự đoán của các
mô hình tuyến tính và mô hình mạng thần kinh bằng các kỹ thuật đánh giá thống kê,
kỹ thuật phân tích phương sai, và các giá trị thống kê sai số ARE, % và MARE, %.
2.4. SÀNG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN
2.4.1. Phân lập các hợp chất flavonoid
Quy trình phân lập và tinh chế các dẫn xuất flavonoid từ actiso, xa kê, tía tô,
đậu nành, gừng gió theo Hình 2.4.
57
Nguyên liệu
Cao EtOH
Cao n hexan
A1 A2 A3
Trích ngâm dầm với EtOH
Lọc, cô quay loại dung môi
Trích lần lượt với các dung môi n-Henxan,
CHCl3, EtOAc và MetOH.
Cô quay loại dung môi.
Cao CHCl3 Cao EtOAc Cao MetOH
A4 A5 A … An
SKC silica gel
CHCl3:MetOH (100:0)
B1 B2 B3 B5 B … BnB4
SKC silica gel
CHCl3:MetOH (100:0)
Kết tinh
Hợp chất chiết xuất
Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59]
Nguyên liệu đem ngâm dầm trong dung môi EtOH 96%, lọc bỏ bã, lấy phần
dịch chiết EtOH đem cô loại dung môi dưới áp suất kém thu được cao EtOH [29,
75]. Từ cao EtOH chiết lỏng lỏng với hệ dung môi có độ phân cực tăng dần: n-
hexan, CHCl3, EtOAc, MetOH. Loại bỏ dung môi từ các dịch chiết thu được cao
tương ứng [42, 59]. Cao EtOAc đem SKC silica gel pha thường với hệ dung môi
CHCl3 : MetOH có thể tích CHCl3 thay đôi từ 100%-0%. Dựa vào kết quả SKLM
để gom các phân đoạn (A). Tiếp tục SKC silica gel pha thường lần 2 với hệ dung
môi rửa giải CHCl3 : MetOH theo tỉ lệ thể tích CHCl3 thay đôi từ 100% - 40% thu
được các phân đoạn (B1 - Bn). Tiếp tục SKC silica gel pha thường lần 3 trong hệ
CHCl3 : MetOH với tỉ lệ thể tích CHCl3 giảm dần thu được các phân đoạn. Quá trình
sắc ký được thực hiện liên tục cho đến khi thu được chất kết tinh, đem rửa sạch và
58
kiểm tra bằng SKLM. Quy trình phân lập flavonoid phân lập từ lá actiso, lá xa kê, lá
tía tô, hạt đậu nành, củ gừng gió:
Lá actiso khô (2,2 kg) → cao EtOAc (190 g) → Lấy phân đoạn thứ A7 (17 g)
→ B2 (2,7 g) → C3 ứng với tỉ lệ CHCl3: MetOH là (60 : 40) → 12 mg hợp chất
sạch (CSL1).
Lá xa kê khô 1,7 kg → EtOAc (120 g) → Lấy phân đoạn thứ A5 (10g) → B4
ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 7 mg hợp chất sạch (AIL1).
Lá tía tô khô 2 kg → EtOAc (140g) → Lấy phân đoạn thứ A4 (11,5 g) → B4
(95 mg) → C2 ứng với tỉ lệ CHCl3: MetOH là (95 : 5) → 8 mg hợp chất sạch
(POL1).
Hạt đậu nành khô 2 kg → EtOAc (95 g) → Lấy phân đoạn thứ A3 (8 g) →
B3 (1 g) → C4 (80 mg) ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 8 mg hợp chất
sạch (GML1).
Củ gừng gió khô 1 kg → EtOAc (30 g) → Lấy phân đoạn thứ A2 (4 g) → B3
(80 mg) ứng với tỉ lệ CHCl3: MetOH (85 : 15) → 7 mg hợp chất sạch (ZZL1); B2
(120 mg) ứng với tỉ lệ CHCl3 – MetOH (90 : 10) → 9 mg tinh thể sạch, (ZZL2) .
2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid
Dựa vào cấu trúc phô 1H-NMR, 13C-NMR, DEPT 90 và 135, HSQC, HMBC
kết hợp với các phương pháp hoá học và phương pháp đo nhiễu xạ tia X đơn tinh
thể để xác định cấu trúc của các hợp chất flavonoid phân lập từ actiso, xa kê, đậu
nành, tía tô, gừng gió [79]. Hoạt tính sinh học các hợp chất flavonoid phân lập được
thử nghiệm in vitro trên dòng tế bào ung thư Hela bằng phương pháp SRB [98].
Nhiệt độ nóng chảy của hợp chất được đo trên máy Electrothermal IA 9000 series,
dùng mao quản không hiệu chỉnh đo tại phòng hợp chất thiên nhiên, Viện công
nghệ Hóa học, số 1, Mạc Đĩnh Chi, Quận 1, TP. HCM.
2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân
Các phương pháp thường sử dụng để xác định cấu trúc hợp chất hữu cơ bao
gồm các phương pháp như: Phô cộng hưởng từ hạt nhân [4]: 1H-NMR (500 MHz),
13C-NMR (125 MHz), DEPT, HSQC, HMBC được ghi trên máy Bruker AM500
59
FT-NMR Spectrometer [1, 4]. Độ dịch chuyển hoá học (ppm), hằng số tương tác J
tính bằng Hz, chất nội chuẩn là TMS (Tetrametyl Silan). Viện Hóa học, Viện Khoa
học và Công nghệ Việt Nam. Dung môi được sử dụng bao gồm các dung môi
DMSO-d6, CD3OD-d4, CDCl3, pyridine-d5. Đây là các dung môi có khả năng hòa
tan các dẫn xuất flavonoid chiết xuất [4].
2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể
Kỹ thuật nhiễu xạ tia X gồm ba bước [8, 34]: 1) thu thập tinh thể tốt, các
chiều lớn hơn 100 micron, không có tạp chất, không sứt mẻ và có cấu trúc ôn định.
2) đặt tinh thể vào tâm hướng chiếu của tia X, thường có bước sóng đơn, nhằm tạo
ra các mẫu nhiễu xạ. Tinh thể xoay từ từ và dữ liệu về ảnh nhiễu xạ được ghi nhận.
3) dùng kỹ thuật tính toán, dữ liệu hoá học bô xung để đưa ra mô hình về sự sắp xếp
các nguyên tử trong đơn tinh thể. Dữ liệu nhiễu xạ đơn tinh thể của các hợp chất
hữu cơ phân lập được đo trên máy Bruker D8 Quest (tại Khoa Hóa học, Trường ĐH
KHTN) ở nhiệt độ 100 K, đối âm cực Mo với bước sóng Kα (λ = 0,71073 Å) [8].
Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi đơn tinh thể được thực
hiện trên phần mềm Apex 2 của máy đo [82, 109]. Cấu trúc được xác định theo
phương pháp trực tiếp. Sử dụng phần mềm XT tích hợp trong Olex2 để tính và tối
ưu hoá cấu trúc [8, 109].
2.4.3. Kỹ thuật thử hoạt tính in vitro
2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B
Xác định khả năng gây độc tế bào: Thực hiện sàng lọc thô, xác định độc tính
tế bào của hợp chất ở nồng độ 100 µg/ml, với dung môi hòa tan là
dimethylsulfoxide (DMSO) trên các dòng tế bào ung thư người bằng phương pháp
Sulforhodamine B (SRB) đã được Viện ung thư Hoa Kỳ (NCI) sử dụng cho chương
trình sàng lọc [33, 65, 98]. Dòng tế bào ung thư HeLa do NCI cung cấp, quá trình
thí nghiệm và kết quả sàng lọc được trình bày dưới dạng tỉ lệ % gây độc tế bào
[98].
Với những chất có khả năng gây độc tế bào cao sẽ tiếp tục xác định nồng độ
của chất có khả năng gây chết 50% trên quần thể tế bào nuôi cấy (GI50). Toàn bộ
60
quá trình thí nghiệm diễn ra trong 3 - 4 tuần. Lượng nguyên liệu cần để xác định
khả năng gây độc tế bào ít nhất là 5 mg/chất [31, 35].
Nguyên tắc: Thử nghiệm Sulforhodamine B (SRB) là một phương pháp so
màu đơn giản và nhạy để xác định độc tính tế bào của một chất. SRB là một thuốc
nhuộm tích điện âm sẽ liên kết tĩnh điện được với các phần điện tích dương của
protein trong tế bào ung thư Hela. Lượng thuốc nhuộm liên kết sẽ phản ánh lượng
protein của tế bào [64]. Trong thử nghiệm, tế bào được cố định trong suốt có màu
hồng. Mật độ quang đo được của dung dịch tương quan với lượng protein tông hay
số lượng tế bào. Sự thay đôi lượng tế bào ung thư so với mẫu đối chứng phản ánh
hoạt tính gây độc tế bào của các dẫn xuất flavonone và isoflavone [46].
2.4.3.2. Nuôi cấy tế bào
Quy trình khảo sát hoạt tính gây độc bằng phương pháp SRB: Giải đông
nguồn tế bào ung thư bảo quản trong nitơ lỏng, nuôi cấy tế bào đến thế hệ thứ 4
(P4): Nuôi cấy tế bào trong bình cấy đạt độ phủ khoảng 70 – 80%; Phủ tế bào vào
các đĩa 96 giếng với mật độ tế bào/giếng ban đầu là 104 tế bào/giếng (đối với dòng
tế bào HeLa và MCF-7) và 7,5. 103 tế bào/giếng (đối với dòng NCl-H460) theo thiết
kế khảo sát sau: một mẫu đối chứng dương là tế bào với camptothecin ở nồng độ 0,
01 (µg/ml); một mẫu chứng âm là tế bào với dung môi hòa tan chất thử (DMSO
0,25%); các dẫn xuất flavone, isoflavone cần thử nghiệm hoạt tính gây độc. Trong
trường hợp xác định GI50 thì mẫu thử nghiệm sẽ được pha loãng ở các nồng độ 0,1;
3; 6; 9; 10; 12; 20; 30; 40; 50; 100 (μg/ml) [31, 68].
Thiết kế thử nghiệm của 1 mẫu gồm: Hai giếng tế bào có môi trường nuôi
cấy chứa chất thử ở nồng độ khảo sát; 2 giếng không có tế bào có môi trường nuôi
cấy chứa chất thử ở nồng độ khảo sát (2 giếng trắng (blank); Ủ ở 37 oC, 5 % CO2,
24 giờ; Bô sung môi trường chứa chất thử với nồng độ gấp đôi nồng độ thuốc muốn
thử (không loại bỏ môi trường cũ đã có ở trong giếng); Ủ ở 37 oC, 5 % CO2, 48 giờ
[31, 68, 91]. Cố định tế bào trong giếng với trichloroacetic acid (TCA): Đối với
dòng tế bào Hela là dòng tế bào có bám dính: sử dụng dung dịch TCA 50% vào mỗi
giếng (cho vào từ từ không quá nhanh) [31]: đặt đĩa vào trong tủ lạnh (4oC), 1 đến 3
61
giờ, loại bỏ chất trong mỗi giếng; rửa nhẹ nhàng với nước (200 μl/giếng) 5 lần; để
khô tự nhiên ở nhiệt độ 25 oC, 12 đến 24 giờ.
2.4.3.3. Nhuộm SRB
Quá trình nhuộm SRB được thực hiện theo các bước sau: Cho dung dịch
SRB 0,2% vào mỗi giếng; Ủ ở nhiệt độ phòng, 5-20 phút; Loại bỏ dung dịch SRB;
Rửa nhẹ bằng dung dịch acetic acid 1 % (5 lần); Để khô tự nhiên ở nhiệt độ phòng
12-24 giờ [24]. Đọc kết quả: Cho 200 µl Tris-base 10mM vào mỗi giếng; Lắc trên
máy lắc khoảng 10-15 phút cho đến khi SRB tan hoàn toàn; Đo mật độ quang ở
bước sóng 492 nm và 620 nm [24].
2.4.3.4. Xử lý kết quả
Sau khi có giá trị mật độ quang ở bước sóng 492 nm (OD492) và 620 nm (OD620):
- Tính giá trị OD = OD492 - OD620 (2.1)
- Tính OD492 (hoặc OD620) = ODtb - ODblank (2.2)
- Tính tỉ lệ (%) gây độc tế bào theo công thức:
% 1 100%TN
C
ODI
OD
(2.3)
Với: ODtb: giá trị OD của giếng chứa tế bào; ODblank: giá trị OD của giếng
trắng; ODTN: giá trị OD của mẫu thử tính từ công thức (2.1) và (2.2); ODC: giá trị
OD của mẫu đối chứng dương tính từ công thức (2.1) và (2.2).
2.4.3.5. Xác đinh GI50
GI50 (µg/ml) được xác định như sau: Xây dựng đồ thị biểu diễn tỷ lệ (%)
gây độc tế bào theo nồng độ khảo sát của chất cần thử nghiệm. Từ đồ thị, nội suy ra
giá trị nồng độ cho tỉ lệ gây độc tế bào 50% bằng cách: Tính phương trình đường
thẳng qua 2 điểm có tỉ lệ gây độc tế bào gần 50% nhất (1 điểm có tỉ lệ gây độc tế
bào nhỏ hơn 50%, điểm còn lại có tỉ lệ gây độc tế bào lớn hơn 50%); Từ phương
trình trên (có dạng y = ax + b), thế y = 50 vào, ta suy ra được giá trị nồng độ x chính
là GI50 [98].
62
2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TINH CỦA FLAVONOID
Sau khi xây dựng các mô hình QSAR, phân lập các hợp chất tự nhiên, chúng
tôi tiến hành dự báo hoạt tính sinh học nhóm kiểm tra; thiết kế, sàng lọc và dự báo
hoạt tính kháng ung thư từ các chất mẫu và hợp chất tự nhiên trên cơ sở vị trí
nguyên tử cacbon trong phân tử flavonoid còn trống, có thể gắn các nhóm thế mới
khi thiết kế dẫn xuất mới. Các hợp chất mới được thiết kế và các hợp chất chiết xuất
được dự đoán hoạt tính sinh học để xác định hợp chất có hoạt tính sinh học cao.
63
CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN
3.1. NGHIÊN CỨU LÝ THUYẾT
3.1.1. Tính toán thông tin cấu trúc
Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng
chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán
Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được
tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS.
3.1.1.1. Khảo sát phương pháp cơ học phân tử
Chọn lựa gradient
Chọn lựa gradient cũng như thuật toán trong là vô cùng quan trọng, ảnh
hưởng trực tiếp đến các kết quả tính toán thông tin cấu trúc phân tử.
Nhằm tối thiểu hóa năng lượng phân tử bằng phương pháp cơ học phân tử
dựa trên giá trị gradient, thuật toán và tùy chọn phù hợp với cấu trúc phân tử nghiên
cứu. Kết quả thăm dò về ảnh hưởng của mức gradient và thuật toán đối với năng
lượng phân tử của isoflavone (isofla-30) trình bày ở Bảng 3.1.
Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30)
Thuật toán (B) Gradient (A)
10 1 0,1 0,01
Steepest descent 56,750 32,119 29,493 29,388
Fletcher-Reeves 46,823 29,743 29,394 29,386
Polak-Ribiere 47,067 29,698 29,395 29,384
Newton-Raphson 46,000 30,736 29,401 29,385
Bằng phương pháp phân tích phương sai một yếu tố cho thấy mức gradient
có ảnh hưởng đến năng lượng phân tử (F = 63,853 > F0,05 = 3,863) [61, 83].
Sự giảm năng lượng phân tử theo mức gradient thể hiện trên Bảng 3.1, Hình
3.1, cho thấy với gradient ≤ 0,1 năng lượng phân tử thấp nhất và ôn định nhất.
Chính vì vậy trong đề tài này mức gradient ≤ 0,1 được chọn để tối ưu hóa cấu trúc
phân tử cho các dẫn xuất flavonoid.
64
Trong nghiên cứu, này điện tích nguyên tử (Atomic charges) sẽ được chọn vì
phần lớn các tham số hóa lượng tử được dùng để thiết lập mô hình QSAR dựa trên
cấu trúc điện tử của các nguyên tử trên khung phân tử.
25
30
35
40
45
50
55
60
10 1 0,1 0,01
Mức gradient
E(K
cal/
mo
l)Steepest descent
Fletcher-Reeves
Polak-Ribiere
Newton-Raphson
Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient
Chọn lựa thuật toán
Kết quả thăm dò về ảnh hưởng của thuật toán trên năng lượng phân tử của
hợp chất isoflavone (isofla-30) Phụ lục 1a cũng được thể hiện trong Bảng 3.1.
Phương pháp phân tích phương sai một yếu tố cho thấy các thuật toán
Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton-Raphson không có ảnh
hưởng đến năng lượng phân tử (F = 1,599 < F0,05 = 3,863).
Như vậy, trong đề tài thuật toán có thể được chọn bất kỳ, chọn thuật toán
Polak – Ribiere để tối ưu hóa cấu trúc phân tử cho các dẫn xuất flavonoid.
3.1.1.2. Khảo sát phương pháp hóa lượng tử
Tính toán các thông tin cấu trúc như điện tích nguyên tử, độ dịch chuyển hóa
học, các tham số hóa lý, tham số hình học 3D, 3D của nhóm dẫn xuất flavone và
isoflavone bằng phương pháp hóa lượng tử phù hợp. Tiếp theo, chúng tôi khảo sát
ảnh hưởng của phương pháp hóa lượng tử trên giá trị moment lưỡng cực phân tử.
65
Kết quả thăm dò về ảnh hưởng của các phương pháp hóa lượng tử bán thực
nghiệm đối với các tham số hóa lượng tử, với tham số chọn làm chuẩn là moment
lưỡng cực được trình bày ở Bảng 3.2.
Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone
Hợp chất Phương pháp hóa lượng tử
CNDO INDO MNDO AM1 RM1 PM3 TNDO
fla-1 3,372 3,310 3,525 3,680 3,993 3,128 2,949
fla-2 3,132 3,145 2,939 3,063 3,445 2,836 2,617
isofla-3 4,977 5,250 4,661 4,920 5,100 5,186 4,620
fla-4 4,033 4,381 3,419 3,608 3,597 4,209 3,726
fla-5 3,437 3,475 3,332 3,239 3,500 2,889 2,847
fla-6 4,935 5,030 4,348 4,403 4,617 4,166 4,491
isofla-7 4,851 5,058 4,648 5,009 5,208 5,220 4,578
fla-8 3,935 4,199 3,475 3,826 3,857 4,326 3,738
fla-9 2,927 3,189 2,658 2,963 3,003 3,194 2,510
fla-10 4,060 4,420 4,242 4,113 4,345 4,418 3,685
Phân tích phương sai hai yếu tố không lặp cho thấy các phương pháp hóa
lượng tử bán thực nghiệm: CNDO, INDO, MNDO, AM1, RM1, PM3, TNDO [38]
có F = 0,632 < F0,05 = 2,246 cho thấy các phương pháp hóa lượng tử không ảnh
hưởng đến kết quả tính toán của tham số hóa lượng tử, moment lưỡng cực.
Vì vậy, chúng tôi chọn phương pháp PM3 để tính điện tích (Qi) và tham số
hóa lý, chọn phương pháp TNDO để tính toán độ dịch chuyển hóa học (i) của các
dẫn xuất flavonoid. Đây là các phương pháp cho phép sai số thấp nhất trong quá
trình tính toán như trong một số nghiên cứu trước đó [30, 100].
3.1.2. Tham số cấu trúc và tính chất phân tử
3.1.2.1. Điện tích
Các dẫn xuất flavone và isoflavone trong Phụ lục 1a được xây dựng lại cấu
trúc phân tử, tối ưu hóa cấu trúc và tính toán các tham số điện tích nguyên tử trong
khung phân tử, sử dụng phương pháp cơ học phân tử MM+ và hóa học lượng tử bán
66
thực nghiệm SCF PM3 trong HyperChem [38]. Điện tích nguyên tử sử dụng làm dữ
liệu để xây dựng các mô hình quan hệ giữa cấu trúc điện tử và hoạt tính tuyến tính
(QESARMLR) và mạng thần kinh (QESARANN). Kết quả tính toán được đưa ra ở Phụ
lục 1b.
3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dich chuyển hóa học
Cấu trúc thực nghiệm của flavone và isoflavone được xây dựng lại và tối ưu
bằng phương pháp cơ học phân tử MM+ ở mức gradient 0,05. Dữ liệu độ dịch
chuyển hóa học i của 13C-NMR và 15O-NMR tính bằng phương pháp hóa lượng tử
phiên bản mới TNDO/2 SCF trên module HyperNMR [38, 39]. Các mô hình quan
hệ giữa cấu trúc phô và hoạt tính (QSDARMLR và QSDARANN) được xây dựng dựa
trên giá trị độ dịch chuyển hóa học (i) của các nguyên tử carbon và oxy trong
khung phân tử flavone, isoflavone. Kết quả tính toán giá trị độ dịch chuyển hóa học
cho ở Phụ lục 2.
3.1.2.3. Tham số hóa lý
Tính chất hóa lý của một số dẫn xuất trong Phụ lục 1a và một số dẫn xuất trong
các hợp chất tự nhiên được tính toán từ phương trình bán thực nghiệm [15] mục
2.3. Kết quả tính toán trình bày ở Bảng 3.16 và Bảng 3.28.
3.1.2.4. Tham số hình học 2D, 3D
Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng
chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán
Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được
tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS [28, 49].
3.2. XÂY DỰNG MÔ HÌNH QSAR
3.2.1. Khảo sát các biến số mô hình
Chọn loại biến phụ thuộc: Trong quá trình xây dựng mô hình hồi quy tuyến
tính, dạng biến phụ thuộc Y cũng có thể ảnh hưởng đến chất lượng mô hình. Cần
khảo sát các kiểu chuyển dạng của giá trị GI50, 1/GI50 và pGI50 = -log(GI50) kết quả
khảo sát ảnh hưởng của dạng biến phụ thuộc dựa trên giá trị R2tr cho ở Bảng 3.3.
67
Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2tr
Biến độc lập (X) Biến phụ thuộc (Y)
GI50exp 1/ GI50exp pGI50exp
Điện tích nguyên tử (QESARMLR) 0,921 0,774 0,938
Độ dịch chuyển hóa học (QSDARMLR) 0,906 0,786 0,906
Từ Bảng 3.3 kết quả phân tích ANOVA một yếu tố không lặp cho thấy: các
dạng biến phụ thuộc không ảnh hưởng đến giá trị R2tr (Ftt = 2,134 < F0,05 = 4,118)
như vậy có thể chọn dạng biến phụ thuộc là pGI50 để xây dựng mô hình [61, 83].
1 2 3 4 5 6 7 8 9 10
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
R2
thu
R2
luyen
k
SE
0.6
0.8
1.0
SE
R2
Hình 3.2 Ảnh hưởng của k đến R2 và SE
Chọn số biến số: Sự thay đôi số biến số trong mô hình cũng có thể tác động
đến giá trị hồi quy R2 khi xây dựng các mô hình tuyến tính và mạng thần kinh, kết
quả khảo sát cho ở Hình 3.2, theo đó ta chọn lựa khoảng số biến số (k) từ 5 đến 7 là
phù hợp vì R2tr cao và ôn định.
Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2tr, R2
pr, SE
k 2 3 4 5 6 7 8 9 10
R2tr 0,327 0,484 0,636 0,802 0,861 0,906 0,909 0,921 0,921
R2pr 0,036 0,204 0,38 0,631 0,673 0,8 0,713 0,678 0,641
SE 0,287 0,257 0,221 0,167 0,143 0,121 0,122 0,118 0,121
Mạng thần kinh nhân tạo
68
Chọn số lớp ẩn: Kết quả thăm dò ảnh hưởng của số nút của lớp ẩn đến giá trị
R2tr, cấu trúc mạng sử dụng I(6) – HL(m) – O(1), I(7) – HL(m) – O(1) giá trị m thay
đôi từ 1 - 6 kết quả ở Bảng 3.5.
Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2tr
m 1 2 3 4 5 6
QESARANN 95,569 90,480 88,374 89,146 88,928 88,398
QSDARANN 92,423 93,392 93,121 93,417 92,572 92,228
Phân tích ANOVA một yếu tố cho thấy cấu trúc mạng với số nút của lớp ẩn
thay đôi không ảnh hưởng đến giá trị R2tr (Ftt = 0,0335 < F0,05 = 2,7729) [61].
Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2tr và R2
pr
Số lớp ẩn Cấu trúc mạng R2tr R2
pr
1 I(6) - HL(2) - O(1) 0,905 0,837
2 I(6) - HL(2) - HL(2) - O(1) 0,863 0,888
3 I(6) - HL(2) - HL(2) - HL(2)- O(1) -0,23 -0,017
1 I(7) - HL(2) - O(1) 0,924 0,800
2 I(7) - HL(2) - HL(2) - O(1) 0,853 -0,021
3 I(7) - HL(2) - HL(2) - HL(2)- O(1) -0,292 -0,285
Kết quả khảo sát chọn lựa số lớp ẩn là 1 để xây dựng mô hình, hơn nữa các
mạng có hai lớp ẩn có thể hiện các hàm với hình dáng bất kỳ, nên về mặt lý thuyết
không có lý do nào cần sử dụng nhiều hơn hai lớp ẩn. Một số nghiên cứu đã chỉ ra
rằng đối với phần lớn các bài toán cụ thể, chỉ cần sử dụng một lớp ẩn cho quá trình
luyện mạng là đủ.
Chọn số nút trên mỗi lớp ẩn: Kết quả khảo sát ảnh hưởng của sự tăng số lớp
ẩn đến giá trị R2tr cho ở Bảng 3. chọn cấu trúc một lớp ẩn để luyện mạng với R2
tr =
0,905 cao hơn cả.
Chọn hàm truyền: Để xác định loại hàm truyền cho quá trình luyện mạng,
chúng tôi khảo sát ảnh hưởng của loại hàm truyền đến giá trị R2tr và R2
pr kết quả cho
trong Bảng 3.7
69
Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2tr và R2
pr
Biến độc lập (k)
R2tr R2
pr
Hàm truyền (C) Hàm truyền (C)
Linear Sigmoid Tanh Linear Sigmoid Tanh
QESAR (k = 6) -3,443 0,905 0,858 -1,660 0,837 0,885
QSDAR (k = 7) -2,577 0,9242 -0,578 -73,746 0,800 -0,054
Phân tích ANOVA cho thấy loại hàm truyền có (Ftt = 1,104 < F0,05 = 5,050)
không ảnh hưởng đến giá trị R2tr. Hàm truyền Sigmoid cho giá trị R2
tr cao nên sẽ
chọn làm hàm truyền cho quá trình luyện mạng với mục đích làm giảm mức độ
phức tạp của các tính toán.
Chọn moment và mức độ sai số luyện: kết quả khảo sát ảnh hưởng của
moment và sai số luyện mạng đến giá trị R2tr và R2
pr được cho ở Bảng 3.8.
Kết quả phân tích phương sai hai yếu tố không lặp cho thấy các giá trị
moment không ảnh hưởng đến kết quả luyện mạng (Ftt = 0,013 < F0,05 = 3,020), các
mức độ sai số luyện ảnh hưởng đến kết quả luyện mạng (Ftt = 11,736 > F0,05 =
3,084). Chọn sai số luyện 0,0001 ứng với giá trị R2tr = 0,956 và R2
pr = 0,837 vì nếu
chọn mức độ sai số luyện nhỏ hơn cũng không làm tăng R2tr và R2
pr hơn nữa các tính
toán lại tốn quá nhiều thời gian và dung lượng đĩa [61].
Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2tr
Giá trị moment của mô hình QESARANN ứng với k = 6
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
R2tr 0,917 0,908 0,909 0,909 0,907 0,956 0,905 0,911 0,870 0,907
R2pr 0,808 0,814 0,819 0,825 0,831 0,837 0,837 0,817 0,884 0,831
Mức độ sai số luyện của mô hình QESARANN ứng với k = 6
0,000001 0,00001 0,0001 0,001 0,01 0,1
R2tr 0,905 0,905 0,956 0,905 0,869 -0,079
R2pr 0,837 0,837 0,837 0,836 0,848 -0,842
70
Chọn số vòng lặp, giải thuật lan truyền và tốc độ học: chọn vòng lặp để cải
thiện mô hình mạng thần kinh, kết quả khảo sát về ảnh hưởng của cấu trúc mạng và
số vòng lặp trên giá trị R2tr, được dẫn ra ở phụ lục 3 với yếu tố A là cấu trúc mạng,
yếu tố B là số vòng luyện.
Phân tích ANOVA cho thấy số vòng luyện ảnh hưởng đến giá trị R2tr (Ftt =
4,144 > F0,05 = 1,l462), như vậy có thể chọn số nút ẩn tùy từng mô hình sao cho các
tính toán nhanh chóng. Chọn số vòng lặp là 10000 cho quá trình luyện mạng, đây là
số vòng lặp có giá trị R2tr cao, ôn định, sai số nhỏ hơn.
Chọn giải thuật lan truyền ngược cho quá trình luyện để tính đạo hàm của
hàm lỗi (tông của tất cả các lỗi tại mỗi mẫu) nhằm giảm thiểu sai số cho quá trình
luyện mạng. Sự thay đôi tham số tốc độ học (learning rate) cũng ảnh hưởng hiệu
suất của mạng đối với số vòng lặp xác định. Giá trị tham số này càng nhỏ thì mạng
hiệu chỉnh trọng số càng chậm. Nhưng muốn đạt đến trạng thái tối ưu thì ta phải
tăng số vòng lặp nhiều hơn ở đây chúng tôi chọn tốc độ học 0,7 do mạng thần kinh
điều chỉnh cho mô hình xây dựng là tốt nhất.
Từ các kết quả thăm dò trên rút ra kết luận: biến phụ thuộc là pGI50; biến độc
lập là điện tích nguyên tử và độ dịch chuyển hóa học; số biến số trong các mô hình
từ 5 đến 7; hàm truyền Sigmoid; số lớp ẩn là 1, số nút trên mỗi lớp ẩn là 2; moment
bằng 0,7; mức độ sai số luyện bằng 0,0001; số vòng lặp bằng 10000; giải thuật lan
truyền ngược; tốc độ học 0,7.
3.2.2. Xây dựng các mô hình QESAR
3.2.2.1. Mô hình tuyến tính QESARMLR
Chọn tập luyện và tập kiểm tra
Chọn tập luyện và tập kiểm tra từ tập dữ liệu về cấu trúc và hoạt tính kháng
ung thư cô tử cung pGI50 của nhóm dẫn xuất flavone và isoflavone (Phụ lục 1a).
Để khách quan trong quá trình phát triển các mô hình, từ tập dữ liệu về hoạt
tính của nhóm dẫn xuất flavone và isoflavone chọn lựa tập luyện (a) và tập kiểm tra
(b) (19%) bằng phương pháp chọn lựa thông minh trong INForm (smart selection)
kết quả cho ở Phụ lục 4.
71
Xây dựng mô hình và tính toán đóng góp của các tham số
Quá trình thực hiện xây dựng và đánh giá mô hình: Mỗi mô hình QESAR
được thành lập từ nhóm luyện (Phụ lục 4), sử dụng hoạt tính kháng ung thư pGI50
và điện tích nguyên tử cacbon và oxy trong khung phân tử các dẫn xuất flavone và
isoflavone, trên phần mềm Regress [13, 85].
Quá trình này được thực hiện bằng cách thay đôi điện tích nguyên tử trong
cấu trúc phân tử. Lựa chọn điện tích nguyên tử đưa vào mô hình QESAR bằng giải
thuật thêm dần và loại bỏ dần từng biến.
Các quá trình được thực hiện liên tục, tuần hoàn cho đến khi xây dựng được
mô hình có giá trị thống kê gồm: R2tr, SE, R2
adj, Ftt, ttt và R2kiemtra. Các mô hình tuyến
tính QESARMLR được trình bày ở Bảng 3.9.
Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê
k Nguyên tử trong các mô hình R2tr SE R2
test
2 O1, C7 0,816 0,1390 0,765
3 O1, C4, C6 0,860 0,1240 0,800
4 O1, C2, C4, C5 0,901 0,1070 0,829
5 O1, C2, C4, C5, C3' 0,924 0,0957 0,873
6 O1, O11, C3, C4, C6, C7 0,938 0,0887 0,903
7 O11, C4, C6, C8, C9, C2', C6' 0,906 0,0743 0,714
8 O11, C3, C6, C7, C8, C9, C10, C3' 0,970 0,0653 0,696
9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,0574 0,563
10 O1, O11, C3, C6, C7, C8, C9, C2', C3', C6' 0,978 0,0595 0,358
Chúng tôi tiến hành xác định phần trăm đóng góp điện tích các nguyên tử có
mặt trong 3 mô hình tuyến tính QESARMLR (với k = 5, 6, 7).
Giá trị thống kê tương ứng của 3 mô hình QESARMLR (với k = 5 – 7) được
dẫn ra trong Bảng 3.10.
Mô hình QESARMLRứng với k = 5
pGI50 = -0,9332 – 101,2080O1 – 15,4264C2 – 6,8735C4 – 7,9686C5 –
16,1166C3' (3.1)
72
Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7)
k R2tr R2
adj SE R2pr
5 0,924 0,905 0,096 0,873
6 0,938 0,919 0,089 0,903
7 0,959 0,943 0,074 0,879
Mô hình QESARMLR ứng với k = 6
pGI50 = 6,7116 – 42,3105O1 – 8,1592O11 + +3,0139C3 – 19,0370C4 + 6,6117C6 +
4,6038C7 (3.2)
Mô hình QESARMLR ứng với k = 7
pGI50 = 4,714 – 32,8026O11 – 60,0703C4 + 20,8772C6 + 16,9016C8 +
95,4205C9 – 24,4720C2' – 25,4219C6' (3.4)
C5 C2 C7 C6' C3 C8 C3' C6 C2 C9 O11 O1 C4
0
5
10
15
20
25
30
35
GM
mP
xi,%
Vi tri
Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi
Giá trị phần trăm đóng góp trung bình MPmxk của các biến độc lập trong mỗi
mô hình QESARMLR (với k = 5 – 7) được xác định từ phần trăm đóng góp Pmxk của
biến số. Giá trị này được xác định qua giá trị đóng góp tông cộng của các biến số
73
Ctotal trong một hợp chất. Phần trăm đóng góp trung bình toàn cục GMmPmxk của
mỗi biến được mô tả ở Hình 3.3, Bảng 3.11.
Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các
mô hình QESARMLR (với k = 5 – 7)
GIÁ TRỊ
GMPmxi,% m = 5, i = 1 - 5 m = 6, i = 1 - 6 m = 7, i = 1 - 7
m = 5,6,7 Hệ số P5xi, % Hệ số P6xi, % Hệ số P7xi, %
R2tr 0,924 0,938 0,959
R2adj 0,905 0,919 0,943
SE 0,09569 0,0887 0,0743
R2pr 0,873 0,903 0,879
hằng số -0,933 6,712 4,714
O1 27,41 -101,21 57,6 -42,31 24,63
C2 4,47 -15,43 13,42
C3 1,41 3,014 4,22
C4 31,98 -6,874 15,12 -19,04 42,45 -60,07 38,39
C5 0,69 -7,969 2,06
C6 4,12 6,612 6,57 20,88 5,78
C7 1,17 4,604 3,51
C8 1,9 16,9 5,7
C9 7,53 95,42 22,6
O11 13,36 -8,159 18,63 -32,8 21,46
C2 0,83 -24,47 2,5
C3' 3,93 -16,12 11,8
C6' 1,19 -25,42 3,58
Sự đóng góp mức độ quan trọng của điện tích nguyên tử trong cấu trúc phân
tử của flavone và isoflavone có mặt trong 3 mô hình QESARMLR được sắp xếp theo
trật tự dựa vào giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3’. Các vị trí C4,
O1 và O11 được xem là vị trí quan trọng trong phân tử vì đó là các nguyên tử thuộc
nhóm carbonyl C4 = O11, nguyên tử O1 có cặp điện tử tự do kết hợp với điện tử
74
của liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11
có các tính chất phản ứng của hệ carbonyl. Các vị trí trung tâm quan trọng nhất đã
được đưa ra ở Hình 3.3 điều này cũng phù hợp với thực nghiệm [18, 103].
Ngoài ra, C6 là vị trí trí quan trọng và đã được thăm dò gắn các nhóm thế vào
vị trí này [80, 103]. Các C9 và C3’ cũng thể hiện vai trò quan trọng, nhưng C9 không
phải là vị trí còn trống, nên không được chọn để gắn nhóm thế. Như vậy có thể chọn
C6 để gắn nhóm thế mới vào trong một số hợp chất flavone và isoflavone. C3’ còn
trống và cũng có thể sử dụng gắn thêm nhóm thế mới và hy vọng tạo ra một hợp
chất có hoạt tính cao và độc tính thấp. Từ định hướng này, chọn hợp chất flavone 1a
và isoflavone 6b trong Phụ lục 4 để làm chất mẫu có hoạt tính đã biết, tiến hành gắn
thử nhóm thế mới vào C6 và C3’.
Chọn mô hình QESARMLR (với k = 6) có các giá trị R2tr = 0,938 và R2
pr =
0,903 trong Bảng 3.11 để dự đoán tính hoạt tính sinh học của nhóm dẫn xuất
flavone và isoflavone vì ở mô hình này phù hợp về thống kê nhất, tất cả các hệ số
hồi quy được đánh giá bằng chuẩn student đều có giá trị P < 0,05 (ttt > t0,05) Phụ lục
5, đánh giá sự tương thích của phương trình hồi quy bằng chuẩn Fisher (Ftt > F0,05
hay P < 0,05). Chọn các vị trí O1, O11, C3, C4, C6, C7 để xây dựng mô hình mạng
thần kinh QESARANN.
3.2.2.2. Mô hình mạng thần kinh QESARANN
Mô hình QESARANN được xây dựng trên phần mềm INForm [40, 87].
Kiến trúc mạng thần kinh I(6)-HL(2)-O(1) gồm: lớp nhập I(6) có 6 yếu tố
đầu vào là điện tích nguyên tử O1, O11, C3, C4, C6 và C7 có mặt trong mô hình
QESARMLR; lớp xuất O(1) gồm 1 yếu tố đi ra là giá trị hoạt tính pGI50; lớp ẩn HL(2)
phía trong gồm 2 nút; thuật toán lan truyền ngược và sai số được chọn để luyện
mạng; hàm truyền sigmoid đặt trên mỗi nút mạng của các lớp; tham số luyện mạng
gồm tốc độ học là 0,7; moment là 0,7; sai số giám sát mục tiêu MSE = 0,005882; số
vòng lặp 10000; sau quá trình luyện mạng, giá trị R2tr = 0,956 và R2
pr = 0,837.
75
3.2.2.3. Kiểm tra khả năng dự đoán
Hoạt tính pGI50 của 6 hợp chất trong nhóm kiểm tra Phụ lục 4 được dự đoán
bằng mô hình QESARMLR và QESARANN, kết quả đưa ra ở Bảng 3.12. Kiểm tra khả
năng dự đoán từ các mô hình QESAR được đánh giá cẩn thận dựa vào các chuẩn
thống kê phù hợp, các giá trị tuyệt đối của các sai số tương đối ARE,%, giá trị trung
bình của các sai số tương đối MARE,%. Giá trị sai số MARE,% của mô hình
QESARANN nhỏ hơn giá trị sai số MARE,% mô hình QESARMLR, cho thấy khả năng
dự đoán của mô hình mạng thần kinh QESARANN tốt hơn mô hình tuyến tính
QESARMLR.
Sau khi sử dụng mô hình tuyến tính QESARMLR và QESARANN để dự đoán
hoạt tính pGI50 của các chất trong nhóm kiểm tra cho thấy mức độ đúng và chính
xác chấp nhận được, sai lệch của dự đoán nằm trong khoảng không chắc chắn của
các phép đo thực nghiệm. Như vậy các mô hình QESARMLR và QESARANN này đáp
ứng yêu cầu dùng để dự đoán các chất mới.
Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN
Hợp chất pGI50,exp pGI50,pr ARE,%
QESARMLR QESARANN QESARMLR QESARMLR
1b 5,921 6,008 5,891 1,468 0,513
2b 5,745 5,692 5,743 0,930 0,033
3b 6,097 5,759 5,788 5,549 5,068
4b 5,699 5,651 5,712 0,840 0,221
5b 5,699 5,651 5,735 0,835 0,623
6b 5,137 5,092 5,109 0,883 0,543
MARE,% 1,751 1,167
3.2.3. Xây dựng các mô hình QSDAR
3.2.3.1. Mô hình tuyến tính QSDARMLR
Chọn tập luyện và tập kiểm tra
Tập dữ liệu về tham số độ dịch chuyển hóa học và hoạt tính kháng ung thư
pGI50 của các dẫn xuất flavone và isoflavone trong Phụ lục 1a được chia thành tập
76
luyện và tập kiểm tra. Tập kiểm tra gồm các hợp chất kí hiệu là a1, a2, a3, a4, a5 và a6
(Phụ lục 6).
Xây dựng mô hình và tính toán đóng góp của các tham số
Các mô hình QSDARMLR (với k = 2 đến 10) Bảng 3.13 bằng cách kết hợp
hoạt tính kháng ung thư pGI50 và độ dịch chuyển hóa học (i) sử dụng phần mềm
Regress. Quá trình thực hiện bằng cách thay đôi độ dịch chuyển hóa học (i) của các
nguyên tử oxy và cacbon. Thêm hoặc loại bỏ một biến độ dịch chuyển hóa học (i)
vào hoặc ra khỏi mô hình QSDARMLR. Khi xây dựng xong mô hình tiến hành đánh
giá mô hình bằng kỹ thuật đánh giá chéo loại và bỏ dần từng trường hợp tương tự
như đối với mô hình QESAR. Kiểm tra khả năng dự đoán của các mô hình
QSDARMLR dựa trên các giá trị R2tr, R2
pr, R2ad (R2 hiệu chỉnh), sai số chuẩn SE và
chuẩn Fisher, Student.
Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê
k Nguyên tử trong các mô hình R2tr R2
ad SE R2pr
2 O1, C4 0,327 0,268 0,287 0,036
3 O1, C4, C11 0,484 0,413 0,257 0,204
4 O1, C4, C5, C6 0,636 0,566 0,221 0,38
5 O1, O11, C4, C6, C7 0,802 0,752 0,167 0,631
6 O1, O11, C3, C4, C6, C7 0,861 0,817 0,143 0,673
7 O1, O11, C2, C3, C6, C7, C2’ 0,906 0,869 0,121 0,800
8 O1, O11, C2, C3, C4, C5, C6, C7 0,909 0,867 0,122 0,713
9 O1, O11, C2, C3, C4, C5, C6, C7, C2’ 0,921 0,877 0,118 0,678
1
0
O1, O11, C2, C3, C4, C5, C6, C7, C1’,C2’ 0,921 0,869 0,121 0,641
Bảng 3.13 cho thấy khi R2tr càng tăng, SE càng giảm, giá trị R2
tr và SE tương
ứng với số biến số k = 5 trở đi thay đôi không đáng kể, hơn nữa việc đưa quá nhiều
biến số vào mô hình cũng không làm tăng giá trị R2tr lên bao nhiêu. Chính vì vậy
chúng tôi khảo sát các mô hình ứng với k = 5, 6 và 7 bao gồm các nguyên tử O1,
O11, C2, C3, C4, C6, C7 và C2’, chọn các vị trí này để xác định phần trăm đóng góp
77
của các nguyên tử quan trọng đối với hoạt tính kháng ung thư. Kết quả tính MPmxi,
%, GMPmxi, % và các giá trị thống kê của các mô hình QSDARMLR (với k = 5, 6 và
7) cũng được đưa ra trong Bảng 3.14.
Độ dịch chuyển hóa học quan trọng của các nguyên tử cacbon và oxy trong
phân tử flavone và isoflavone đã thể hiện bằng cách sắp xếp giá trị độ lớn
GMPmxi,% như C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’.
Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch
chuyển hóa học i trong các mô hình QSDARMLR
Biến số xi QSDARMLR MPxk,%
GMPmxi,% m = 5 m = 6 m = 7 m = 5 m = 6 m = 7
R2tr 0,802 0,861 0,906 - - - -
R2ad 0,752 0,817 0,869 - - - -
SE 0,167 0,143 0,121 - - - -
R2pr 0,631 0,673 0,800 - - - -
Hệ số 14,459 37,055 32,99 - - - -
O1 0 0,014 0,016 0,133 7,649 9,949 5,91
O11 0,004 0,008 0,006 18,599 11,386 9,501 13,162
C2 - - -0,045 - - 16,448 5,483
C3 - -0,058 -0,063 - 14,348 17,603 10,65
C4 -0,068 -0,078 - 71,64 27,471 - 33,037
C6 0,006 -0,059 -0,047 5,169 16,424 14,965 12,186
C7 -0,005 -0,075 -0,059 4,46 22,722 20,312 15,832
C2' - - -0,037 - - 11,222 3,741
Vị trí O1, C2, C3 và C4 như là các vị trí quan trọng trong phân tử. Bởi vì các
nguyên tử này là các nguyên tử cacbon và oxy của nhóm carbonyl C4 = O11 và
nguyên tử O1 với các electron tự do. Trong trường hợp này các electron của các
liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11 có
thể thực hiện các phản ứng oxy hóa khử. Điều này phù hợp với các nghiên cứu thực
nghiệm. Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng đã
78
khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, C6 và C7 để
thiết kế các dẫn xuất mới.
Mô hình QSDARMLR (với k = 7) có giá trị sai số SE thấp nhất, cho giá trị hồi
quy là phù hợp nhất, tất cả các hệ số hồi quy và phương trình hồi quy đều có giá trị
P < 0,05 Phụ lục 7, hơn nữa đây là mô hình có giá trị R2tr = 0,906 và R2
pr = 0,800 cao
nhất, SE = 0,121 thấp nhất cho thấy đây là mô hình tuyến tính QSDARMLR tốt hơn
cả. Mô hình QSDARMLR (với k = 7) có dạng:
pGI50 = 32,99 + 0,016O1 + 0,006O11- 0,045C2 - 0,063C3 - 0,047C6 - 0,059C7 -
0,037C2' (3.5)
3.2.3.2. Mô hình mạng thần kinh QSDARANN
Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần kinh
trên phần mềm INForm [40] đã được khảo sát kiến trúc mạng. Kiến trúc I(7)-
HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được chọn là O1, O11, C2,
C3, C6, C7 và C2’ là các biến số trong mô hình tuyến tính QSDARMLR với k = 7 và
một lớp xuất O(1) với yếu tố đầu ra (pGI50) như là biến mục tiêu, cấu trúc một lớp
ẩn HL(2) với hai nút. Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để
luyện kiểu mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học
0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm truyền
sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. Sau khi luyện mô
hình thần kinh QSDARANN, R2pr = 0,800; giá trị R2
tr đạt được 0,924 cao hơn giá trị
R2tr = 0,906 đối với mô hình tuyến tính QSDARMLR.
3.2.3.3. Kiểm tra khả năng dự đoán
Khả năng dự đoán của các mô hình QSDARANN và QSDARMLR được đánh giá
cẩn thận bằng kỹ thuật đánh giá chéo loại bỏ từng trường hợp. Trong trường hợp
này 6 dẫn xuất flavone và isoflavone trong nhóm kiểm tra được chọn ngẫu nhiên
như trong Phụ lục 6. Các giá trị hoạt tính kháng ung thư pGI50 của 6 dẫn xuất trong
nhóm kiểm tra dẫn ra ở Bảng 3.15 nhận được từ mô hình tuyến tính QSDARMLR
được so sánh với các giá trị nhận được từ mô hình mạng nơ ron sử dụng giá trị tuyệt
đối của các sai số tương đối ARE,%.
79
Khả năng dự đoán của 2 mô hình cũng dựa vào giá trị MARE,%. Giá trị
MARE,% = 1,119 đối với mô hình QSDARANN là nhỏ hơn giá trị MARE,% = 2,391
đối với mô hình QSDARMLR. Như vậy các giá trị dự đoán pGI50 nhận được từ mô
hình QSDARANN là gần với các hoạt tính thực nghiệm [80]. Với pGI50,exp và pGI50,pr
là các hoạt tính thực nghiệm và kiểm tra. Sai số MARE,% được sử dụng để đánh giá
sai số toàn cục của các mô hình QSDARMLR và QSDARANN.
Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các
mô hình QSDARMLR (với k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1)
Hợp
chất pGI50,exp
pGI50,pr ARE,%
QSADRMLR QSDARANN QSDARMLR QSDARANN
a1 5,745 5,781 5,789 0,636 0,764
a2 5,699 5,758 5,796 1,039 1,697
a3 5,796 5,808 5,708 0,209 1,515
a4 5,921 6,181 5,957 4,389 0,606
a5 5,699 5,394 5,755 5,344 0,975
a6 5,658 5,503 5,723 2,730 1,157
MARE,% 2,391 1,119
Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán hoạt
tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự đoán là có thể
chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa mãn các đòi hỏi thực tế để
dự đoán hoạt tính kháng ung thư pGI50 của các dẫn xuất mới. Một lần nữa chúng tôi
khẳng định khả năng dự đoán của các mô hình quan hệ cấu trúc hoạt tính là hoàn
toàn đáng tin cậy.
3.2.4. Xây dựng mô hình QSSRMLR
3.2.4.1. Nguyên tắc xây dựng
Xây dựng mô hình quan hệ cấu trúc – cấu trúc (QSSRMLR) để dự đoán hoạt tính
cũng như tính chất hóa lý của các hợp chất flavonoid. Mô hình được xây dựng dựa
vào tính chất tương tự của các cấu trúc phân tử dẫn đến các tính chất hóa học hay
những tính chất khác cũng có mối tương quan, vì vậy có thể xây dựng mối quan hệ
80
cấu trúc với cấu trúc để từ đó xác định được tính chất của một hợp chất chưa biết
dựa vào tính chất của các cấu trúc đã biết. Trong nghiên cứu này có hai nhóm chất
có cấu trúc tương tự là nhóm flavone và isoflavone. Sử dụng quan hệ giữa cấu trúc
– cấu trúc để dự đoán tính chất, hoạt tính kháng ung thư cúa các dẫn xuất flavonoid
trong nhóm kiểm tra và flavonoid phân lập.
3.2.4.2. Tính toán các tham số hóa lý
Các hợp chất trong Phụ lục 1a được xây dựng, tối ưu hóa cấu trúc phân tử bằng
phương pháp cơ học phân tử MM+, mức gradient 0,05. Tham số hóa lý tính toán
như mục 2.3.1 [15] Các tham số cấu trúc này được sử dụng làm dữ liệu để kiểm tra
khả năng dự đoán của các mô hình QSSRMLR.
3.2.4.3. Xây dựng mô hình
Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các kỹ thuật
hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc (QSSRMLR) là mối quan hệ
giữa những hợp chất (y) và các hợp chất có cấu trúc tương tự (x). Các mô hình
QSSRMLR được xây dựng bằng phương pháp hồi quy tuyến tính. Sự phù hợp tốt
nhất của mô hình QSSRMLR được thể hiện ở giá trị R2tr và khả năng dự đoán của các
mô hình thể hiện ở giá trị R2pr. Sử dụng các hợp chất trong Phụ lục 1a để xây dựng
các mô hình QSSRMLR.
Mô hình QSSRMLR được xây dựng từ các thay đôi điện tích các nguyên tử
của những hợp chất. Sự xắp xếp dọc theo thứ tự giá trị tương quan của mối quan hệ
tuyến tính giữa những hợp chất sử dụng điện tích nguyên tử và tính chất hóa lý
được chỉ ra ở Hình 3.4.
81
a) b)
Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính
chất hóa lý
■: fla-A23 và fla-A11; ▲: fla-A15 và isofla-A32; ○: isofla-A32 và isofla-A4.
Những hợp chất trong Phụ lục 1a được lựa chọn ngẫu nhiên để đánh giá mối
tương quan điện tích nguyên tử và tính chất hóa lý giữa các hợp chất. Kết quả tính
toán hệ số tương quan điện tích giữa các hợp chất được cho ở Bảng 3.1 .
Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử
fla-A23 fla-A6 fla-A15 fla-A22 isofla-A32 fla-A28 fla-A5 isofla-A4
fla-A23 1,0000
fla-A6 0,8664 1,0000
fla-A15 0,9220 0,8254 1,0000
fla-A22 0,9984 0,8548 0,9132 1,0000
isofla-A32 0,9247 0,7565 0,9659 0,9254 1,0000
fla-A28 0,9222 0,8259 1,0000 0,9134 0,9656 1,0000
fla-A5 0,9986 0,8696 0,9267 0,9983 0,9261 0,9270 1,0000
isofla-A4 0,9250 0,7560 0,9659 0,9257 1,0000 0,9657 0,9264 1,0000
fla-A11 0,9999 0,8668 0,9225 0,9981 0,9236 0,9227 0,9986 0,9239
Những hợp chất có cấu trúc tương tự có tính chất tương quan tốt với nhau.
Mô hình hồi quy tuyến tính của các hợp chất flavone và isoflavone (Y) được xây
dựng từ điện tích nguyên tử được trình bày ở Bảng 3.17. Mô hình tuyến tính
82
QSSRMLR với các giá trị thống kê rất tốt R2tr = 0,999 và R2
pr = 0,999. Bảng 3.17 đưa
ra 10 mô hình từ 32 hợp chất nghiên cứu trong Phụ lục 1a đại diện cho khả năng dự
đoán dựa trên mối quan hệ cấu trúc – cấu trúc.
Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất
nghiên cứu bằng mô hình QSSRMLR và các chất dùng để dự đoán
Tính chất hóa lý và hoạt tính kháng ung thư pGI50 Phương pháp
ARE% QSSR Tham khảo [15]
Mô hình QSSR của Fla-A1 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00020159
Fla-A1 = 0,00015 + 1,018 (Fla-A5) -0,513 (Fla-A21)+ 0,497 (Fla-A22 ) (3.6)
Độ khả phân cực bề mặt lưới 68,453 68,120 0,489
pGI50 5,663 5,699 0,638
Mô hình QSSR của Fla-A2 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00035399
Fla-A2 = -0,00020+1,260 (Fla-A6)+0,871 (Fla-A14)-1,134 (Fla-A24) (3.7)
Nhiệt nóng chảy (Tm) ở 1 atm 741,521 745,496 0,533
Nhiệt độ tới hạn (Tc) 931,125 934,452 0,356
Mol Refractivity 8,711 8,715 0,053
Nhiệt độ sôi, (Tb) ở 1 atm 978,789 980,510 0,176
pGI50 6,473 5,921 9,321
Mô hình QSSR của Fla-A3 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00010411
Fla-A3 = 0,00002+0,935 (Fla-A7) +0,582 (Fla-A16) -0,517 (Fla-A28) (3.8)
Nhiệt nóng chảy (Tm) ở 1 atm 737,884 745,496 1,021
Nhiệt độ tới hạn (Tc) 932,899 934,452 0,166
Hiệu ứng nhiệt KJ/mol -318,085 -313,160 1,573
Hằng số Henry 7,266 7,240 0,355
pGI50 5,726 5,699 0,469
Mô hình QSSR của Fla-A4 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00013747
isoFla-A4 = -0,000002+0,980 (isoFla-A8)-0,233(isoFla-A18)+ 0,252(isoFla-A19) (3.9)
Nhiệt nóng chảy (Tm) ở 1 atm 718,146 745,496 3,669
Nhiệt độ tới hạn (Tc) 914,478 934,452 2,138
83
Hằng số Henry 7,237 7,240 0,042
pGI50 5,084 5,009 1,495
Mô hình QSSR của Fla-A5 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00019793
Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) (3.10)
Nhiệt độ tới hạn (Tc) 936,289 913,478 2,497
Chỉ số khúc xạ phân tử 8,731 9,179 4,884
Nhiệt độ sôi, (Tb) ở 1 atm 977,737 933,630 4,724
Hằng số Henry 7,034 7,110 1,073
LogP 8,731 9,179 4,884
pGI50 5,734 5,699 0,618
Mô hình QSSR của Fla-A6 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00026038
Fla-A6 = 0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) (3.11)
Nhiệt nóng chảy (Tm) ở 1 atm 730,455 717,167 1,853
Nhiệt độ tới hạn (Tc) 927,997 914,743 1,449
Khối lượng mol 324,833 323,343 0,461
pGI50 5,772 6,046 4,533
Mô hình QSSR của Fla-A7 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00013549
Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) (3.12)
Nhiệt nóng chảy (Tm) ở 1 atm 743,221 717,167 3,633
Nhiệt độ tới hạn (Tc) 932,252 914,743 1,914
Hiệu ứng nhiệt KJ/mol -309,816 -313,790 1,267
Hằng số Henry 7,228 7,240 0,171
pGI50 5,700 5,658 0,750
Mô hình QSSR của Fla-A8 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00119054
isoFla-A8 = 0,0000051+ 1,006(isoFla-A4)+ 0,253(isoFla-A18)-0,259(isoFla-A19) (3.13)
Nhiệt độ sôi, (Tb) ở 1 atm 746,066 717,167 4,030
Nhiệt độ tới hạn (Tc) 936,202 914,743 2,346
Hằng số Henry 7,243 7,240 0,038
pGI50 4,994 5,071 1,503
84
Mô hình QSSR của Fla-A9 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00018592
Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) (3.14)
Nhiệt nóng chảy (Tm) ở 1 atm 836,779 817,055 2,414
Nhiệt độ tới hạn (Tc) 1029,858 1011,888 1,776
Hằng số Henry 7,052 7,050 0,026
LogP 4,663 4,537 2,772
PGI50 5,698 5,745 0,810
Mô hình QSSR của Fla-A10 với R2tr = 0,9999; R2
pr = 0,9999; SE = 0,00042716
Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) (3.15)
Nhiệt nóng chảy (Tm) ở 1 atm 815,011 814,381 0,077
Áp suất tới hạn (Pc), Bar 18,820 18,692 0,683
Nhiệt độ tới hạn (Tc) 1003,621 1004,806 0,118
Hiệu ứng nhiệt KJ/mol -404,221 -387,410 4,339
Chỉ số khúc xạ phân tử 10,963 10,930 0,305
Log P 3,766 3,740 0,694
Hằng số Henry 7,063 7,050 0,190
PGI50 5,652 5,678 0,448
3.2.4.4. Kiểm tra khả năng dự đoán
Mô hình hồi quy tuyến tính nhận được từ các dẫn xuất flavone và isoflavone
này có thể ứng dụng để dự đoán tính chất hóa lý cũng như hoạt tính kháng ung thư
của các flavone và isoflavone có cấu trúc tương tự.
Các mô tả cấu trúc phân tử của các hợp chất để xây dựng mô hình QSSRMLR
được tính toán một cách cẩn trọng, kết quả dự đoán tính chất hóa lý và pGI50 cho ở
Bảng 3.17, Hình 3.5 chỉ ra rằng mô hình hồi quy tuyến tính QSSRMLR của các hợp
chất flavone và isoflavone là hoàn toàn đáng tin cậy.
Phân tích ANOVA một yếu tố cũng chỉ ra rằng kết quả dự đoán tính chất hóa
lý và hoạt tính kháng ung thư của các dẫn xuất flavone và isoflavone từ mô hình
QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị hoạt tính
kháng ung thư xác định từ thực nghiệm [28] với (Ftt = 0,0010 < F0,05 = 3,9423).
85
Các mô hình QSSRMLR đã được xây dựng và dự đoán thành công tính chất
hóa lý, hoạt tính pGI50 của nhóm dẫn xuất kháng ung thư flavone và isoflavone có
cấu trúc tương tự.
Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm
3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1)
3.2.5.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất
và hoạt tính kháng tế bào ung thư cô tử cung GI50/M trong Phụ lục 1a.
Các tham số cấu trúc 2D, 3D được tính toán bằng phương pháp cơ học phân
tử trên phần mềm QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a
đến Phụ lục 10h.
3.2.5.2. Xây dựng mô hình QSARMLR (3.16)
Trong nghiên cứu này, các mô hình QSARMLR (3.16), phương trình 3.16 và
QSARANN(1) thu được thông qua 2 nhóm: nhóm luyện được chọn lựa ngẫu nhiên và
nhóm kiểm tra. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)
được đánh giá bằng cách so sánh kết quả dự đoán và hoạt tính thực nghiệm của các
hợp chất trong nhóm kiểm tra, là nhóm không được sử để thiết lập mô hình
QSARMLR (3.16) và QSARANN(1) từ nhóm luyện.
Giá
trị
dự đ
oán
Giá trị thực nghiệm
86
Sự biến thiên các giá trị R2, R2pred và SE trong các mô hình QSARMLR với các
tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18.
Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE
k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²pred
2 a1, a2 0,063 0,657 0,630
3 a1, a2, a3 0,034 0,820 0,798
4 a2, a3, a4, a5 0,027 0,866 0,843
5 a2, a5, a6, a7, a8 0,023 0,891 0,867
6 a2, a5, a6, a8, a9, a10 0,019 0,914 0,890
7 a2, a5, a6, a8, a9, a10, a11 0,015 0,933 0,910
8 a5, a8, a10, a12, a13, a14, a15, a16 0,015 0,936 0,909
9 a5, a6, a8, a10, a11, a16, a17, a18, a19 0,012 0,955 0,932
10 a5, a6, a8, a10, a11, a15, a16, a17, a18, a19 0,012 0,955 0,928
Kí hiệu a1 là xvc3, a2 là dipole, a3 là xvpc4, a4 là xvp6, a5 là logP, a6 là xp8,
a7 là volume, a8 là knotpv, a9 là xvp8, a10 là SHBa, a11 là Hmaxpos, a12 là xp6, a13 là
SaaCH, a14 là k2, a15 là nvx, a16 là knotp, a17 là ABSQ, a18 là SsOH, a19 là phia.
Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được chọn
lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D được chọn dựa trên
cơ sở các giá trị thống kê R2, SE và F-stat. Các mô hình được đánh giá chéo bằng kĩ
thuật loại bỏ dần từng trường hợp (LOO) để xác định giá trị R2pred. 9 mô hình phù
hợp nhất được chỉ ra trong Bảng 3.18. Các mô hình QSARMLR (với k từ 2 đến 10)
được xắp xếp một cách trật tự với sự thay đôi các giá trị R2, SE và R2pred. Trong
Bảng 3.18, các mô hình QSARMLR (với k từ 8 đến 10) là các mô hình có giá trị
R2pred cao hơn cả. Cụ thể, trong mô hình QSARMLR với k = 9 có R2 cao nhất là 0,955
và R2pred là 0,932. Vì vậy, chúng tôi lựa chọn ba mô hình (với k là 8, 9 và 10) để xác
định giá trị phần trăm đóng góp của các tham số mô tả 2D, 3D đối với hoạt tính
kháng ung thư.
87
Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và
GMPmxi,% đối với các tham số mô tả phân tử 2D và 3D trong các mô hình
QSARMLR (với k là 8, 9 và 10)
QSARMLR MPmxi,%
GMPmxi, % m = 8 M = 9 m = 10 m = 8 m = 9 m = 10
R2tr 0,936 0,955 0,955
R2 pr 0,909 0,932 0,928
SE 0,124 0,107 0,110
Hệ số -13,133 3,044 2,946
k2 -4,926 - - 23,638 7,879
xp6 -2,899 - - 6,399 2,133
xp8 - 4,473 4,282 14,301 12.181 8,827
nvx 3,487 - 0,036 45,229 1,138 15,456
knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092
knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790
SHBa -0,225 0,019 0,016 4,398 1,004 0,770 2,057
Hmaxpos - -1,203 -1,201 3,439 3,060 2,166
SaaCH -0,166 - - 1,490 0,497
ABSQ - -5,982 -5,939 33,101 29,255 20,785
SsOH - 0,359 0,358 2,924 2,609 1,844
phia - 3,067 2,999 21,167 18,413 13,193
logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675
Các giá trị phần trăm đóng góp trung bình MPmxi,%, GMPmxi, % và các giá
trị thống kê khác đối với các mô hình (với k là 8, 9 và 10), được đưa ra trong Bảng
3.19. Giá trị phần trăm đóng góp trung bình MPmxi của các biến độc lập trong mỗi
mô hình QSARMLR (với k là 8, 9 và 10), được xác định từ giá trị phần trăm đóng
góp Pxk của mỗi biến độc lập trong từng trường hợp quan sát tương tứng Pmxi được
tính toán từ giá trị đóng [86] góp tông cộng Ctotal của mỗi biến trong từng hợp chất
88
[86]. Kết quả tính toán giá trị phần trăm đóng góp trung bình MPmxi,% và giá trị
phần trăm đóng góp trung bình toàn cục GMPmxi,% được đưa ra trong Bảng 3.19.
Giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% [86] trong Bảng
3.19 đã mô tả mức độ quan trọng của các tham số mô tả 2D, 3D của các flavone và
isoflavone. Sự xắp xếp mức độ ảnh hưởng quan trọng của các tham số 2D, 3D trong
các mô hình QSARMLR theo thứ tự là GMPmxi,%: SaaCH < SsOH < SHBa < xp6 <
Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. Các tham số
mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP được xem là các tham số
mô tả quan trọng nhất trong mỗi phân tử. Ngoài ra, các tham số mô tả phân tử đại
diện cho các nhóm carbonyl C4 = O11 và nguyên tố O1. Các nguyên tố này có các
cặp electron tự do với electron của liên kết C2 = C3 và C4 = O11 tạo hệ liên hợp.
Nhóm carbonyl C4 = O11 thể hiện toàn bộ phản ứng tự nhiên của nhóm của nhóm
cacbonyl [80, 103].
Vì vậy, các tham số mô tả phân tử cũng chứng minh được định lượng tông
điện tích trên toàn phân tử bởi giá trị GMPmxi và chúng cũng phù hợp với các giá trị
thực nghiệm [54, 80, 103]. Vì vậy, vị trí các nguyên tử C6 và C3’ còn trống, có thể
gắn các nhóm thế mới trong nghiên cứu dẫn xuất mới [80, 89, 103]. Các vị trí khác
cũng có thể đại điện tác động đến hoạt tính sinh học GI50, nhưng chúng là các vị trí
không thể gắn thêm nhóm thế nên không được sử dụng để thiết kế dẫn xuất mới.
4.0
4.5
5.0
5.5
6.0
6.5
4.0 4.5 5.0 5.5 6.0 6.5
pG
I50
pGI50Pred
a)
5.6
99
5.6
99
5.6
19
8
5.6
38
3
5.6
99
5.0
86
25.7
37
11
6.0
47
81
5.7
66
19
5.6
84
34
5.7
05
77
4.9
36
49
fla1 fla11 fla24 fla25 fla26 fla30
2
3
4
5
6
7
Val
ues
pG
I 50
Test substance flavonoid
pGI50,exp
pGI50,Pred
Hợp chất flavonoid trong nhóm kiểm tra
b)
Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid
trong nhóm kiểm tra
89
Các vị trí C6 và C3’ được lựa chọn để gắn thêm các nhóm thế mới tạo thành
các flavonoid mới. Tương tự, vị trí C2’ cũng còn trống và có thể sử dụng để gắn các
nhóm mới vào phân tử. Điều này cho phép tạo nên các hợp chất mới có hoạt tính
sinh học cao hơn hợp chất mẫu. Từ đó, các flavonoid chiết xuất có thể chọn lựa làm
hợp chất mẫu để thiết kế thuốc mới có hoạt tính cao hơn. Điều này được chỉ ra trong
phần thảo luận bên dưới.
Các mô tả phân tử được ứng dụng trọng kỹ thuật phân tích hồi quy đa biến để
thiết lập mô hình QSAR với quá trình lựa chọn biến số độc lập bằng cách sử dụng
mô hình MLR [86, 107]. Mô hình QSAR cuối cùng với các tham số mô tả k = 9 là
mô hình tốt nhất [106]. Chín biến số độc lập bao gồm xp8, ABSQ, SsOH,
Hmaxpos, phia, knotp, knotpv, SHBa và LogP được lựa chọn để xây dựng mô hình
QSARMLR. Kết quả dự đoán hoạt tính sinh học được minh chứng qua giá trị R2 dự
đoán (R2Pr) phù hợp với dữ liệu thực nghiệm. Mô hình QSARMLR (3.16) như sau:
pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH - 1,203×Hmaxpos
+ 3,067×phia - 2,673×knotp + 15,540×knotpv + 0,019×SHBa + 0,839×LogP
(3.16)
Với n = 34; R2tr = 0,955; R2
Adj= 0,932; R2pr = 0,745; SE = 0,107; F = 42,182
3.2.5.3. Xây dựng mô hình QSARANN(1)
Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với thuật
toán di truyền sử dụng phần mềm INForm [40]. Mô hình mạng thần kinh nhân tạo
có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến trúc mạng này bao gồm
lớp input I(9) với 9 nơ ron tương ứng với 9 biến độc lập xp8, ABSQ, SsOH,
Hmaxpos, phia, knotp, knotpv, SHBa và LogP; lớp ẩn HL(5) với 5 nơ ron và lớp
output O(1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược
được ứng dụng để luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp
tuyến Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá trình
luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học là 0.01; sai số
tông cộng là 0,0003017, sai số dự đoán là 0,00001 với 300000 vòng lặp. Sau khi
90
luyện mạng mô hình mạng thần kinh thu được có kiến trúc I(9)-HL(5)-O(1), với giá
trị thống kê R2tr là 0,8963 và R2
pr là 0,8883.
3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)
Khả năng dự đoán của các mô hình QSARMLR (3.16) và QSARANN(1) được đánh
giá cẩn thận bằng kỹ thuật loại bỏ từng trường hợp (LOO) và giá trị R2pr. Sáu hợp
chất trong nhóm kiểm tra được sử dụng để kiểm tra khả năng dự đoán hoạt tính sinh
học của các mô hình QSARMLR (3.16) và QSARANN(1). Hoạt tính dự đoán của các
flavonoid trong nhóm kiểm tra được so sánh với dữ liệu thực nghiệm, cho ở Bảng
3.20. Hoạt tính sinh học dự đoán từ các mô hình QSAR được so sánh với hoạt tính
sinh học thực nghiệm và so sánh giữa các mô hình với nhau bởi giá trị sai số tương
đối trung bình MARE,%. Các giá trị MARE,% cho thấy rằng khả năng dự đoán của
mô hình QSARMLR (3.16) thì thấp hơn của mô hình QSARANN(1) chỉ ra trong Bảng
3.20. Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự đoán hoạt
tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ ra khả năng dự đoán
chính xác của các mô hình QSAR với các sai số nằm trong khoảng tin cậy của phép
đo thực nghiệm. Tuy nhiên, các mô hình QSARMLR (3.16) và QSARANN(1) đều có
khả năng dự báo tốt đối với hoạt tính sinh học của các hợp chất mới.
Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR
(3.16) và QSARANN(1)
Hợp chất pGI50,exp pGI50,pred ARE,%
M1 M2 M1 M2
Fla-1 5,699 5,3879 5,7371 5,4589 0,6685
Fla-11 5,699 5,9188 6,0478 3,8568 6,1204
Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051
Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158
Fla-26 5,699 5,8841 5,7058 3,2479 0,1193
Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433
MARE,% 4,3979 2,2121
M1: Mô hình QSARMLR (3.16); M2 là mô hình QSARANN (1)
91
3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN
3.2.6.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất
và hoạt tính kháng tế bào ung thư cô tử cung GI50/M (Phụ lục 1a). Các tham số cấu
trúc 2D, 3D được tính toán bằng phương pháp cơ học phân tử trên phần mềm
QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a - 10h. Các tham số
này sử dụng để xây dựng hồi quy tuyến tính (QSARMLR) [86], hồi quy thành phần
chính (QSARPCR) [9] và mạng nơ-ron nhân tạo (mô hình QSARPCA-ANN [40].
3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18)
Dữ liệu ban đầu được chia thành tập luyện và tập kiểm tra bằng phương pháp
lấy mẫu ngẫu nhiên. Các mô hình QSAR xây dựng từ nhóm luyện. Sự thay đôi các
giá trị R2, R2pred và SE trong các mô hình QSARMLR với các tham số 2D và 3D được
chỉ ra trong Bảng 3.21. Các mô hình QSARMLR, các mô tả phân tử 2D và 3D được
chọn bằng thuật toán hồi quy bằng thuật toán hồi quy.
Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE
k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2pred SE
2 a1, a2 0,756 0,731 0,430
3 a1, a2, a3 0,774 0,732 0,417
4 a1, a2, a3, a4 0,805 0,772 0,390
5 a1, a2, a3, a4, a5 0,832 0,756 0,365
6 a1, a4, a5, a6, a7, a8 0,854 0,812 0,342
7 a1, a2, a3, a4, a5, a9, a10 0,836 0,721 0,365
8 a1, a2, a3, a4, a5, a8, a9, a10 0,837 0,693 0,367
9 a1, a2, a3, a4, a5, a8, a9, a10, a11 0,838 0,682 0,369
10 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11 0,841 0,650 0,368
(Với a1 là LogP, a2 là MaxNeg, a3 là ka2, a4 là SdO, a5 là MaxQp, a6 là
Ovality, a7 là SdssC, a8 là ka3, a9 là ABSQ, a10 là ABSQon, a11 là dipole).
92
Quy trình lựa chọn cho mô tả 2D và 3D dựa trên sự thay đôi của các giá trị
thống kê R2, SE và F-stat. Các mô hình QSARMLR đánh giá chéo bằng kỹ thuật
LOO, các giá trị R2pred được xác định. 9 mô hình phù hợp nhất được đưa ra trong
Bảng 3.21.
Các mô hình QSARMLR (với k từ 2 đến 10) được xắp xếp theo trật tự thay đôi
của các giá trị thống kê R2, SE và R2pred. Trong Bảng 3.21, các mô hình QSARMLR
(với k từ 5 đến 7) cho thấy giá trị R2pred lớn hơn.
Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các
tham số mô tả phân tử 2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7)
Biến số QSARMLR MPmxi,% GMPmxi,
% m m = 5 m = 6 m = 7 m = 5 m = 6 m = 7
R2 0,832 0,854 0,836
R2adj 0,820 0,841 0,820
SE 0,365 0,342 0,365
R2pred 0,756 0,812 0,721
Hệ số 3,883 8,509 4,790
ABSQ -0,222 - -0,257 27,945 18,636 19,005 21,862
ABSQon - - 0,0143 - - 0,433 0,144
MaxQp 3,416 2,8540 3,588 24,043 25,862 25,908 25,271
MaxNeg - - 6,122 - 24,203 23,890 16,031
SdO 0,0125 0,0247 0,0126 6,192 3,792 3,665 4,550
ka2 0,133 - 0,143 27,484 17,617 17,426 20,842
LogP 0,156 0,2192 0,163 15,651 9,829 9,672 11,717
Ovality - -3,6969 - 5,292 4,393 2,315 4,000
SdssC - 0,2969 - 4,382 5,613 7,236 5,744
ka3 - 0,3635 - 5,351 9,324 3,473 6,049
Đặc biệt, mô hình QSARMLR (3.17) R với k = 6 với giá trị R2tr là 0,854 và R2
pr
là 0,812 cao hơn các mô hình còn lại. Mô hình QSARMLR (3.17) với k = 6:
pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 3,6969Ovality +
0,2969SdssC + 0,3635ka3 (3.17)
93
Vì vậy, ba mô hình tốt nhất (với k của 5, 6 và 7) được chọn để xác định tỷ lệ
phần trăm đóng góp của mô tả 2D, 3D đến hoạt tính kháng ung thư. Tỷ lệ đóng góp
có giá trị MPmxi, GMPmxi và các giá trị thống kê khác nhau của các mô hình (với k
bằng 5, 6 và 7) tương ứng được trình bày trong Bảng 3.22.
Giá trị phần trăm đóng góp MPmxi của biến số độc lập trong từng mô hình
QSARMLR (với k bằng 5, 6 và 7) được xác định từ phần trăm đóng góp phần trăm
Pmxi của từng biến tương ứng trong mỗi trường hợp quan sát [86]. Giá trị này được
xác định từ tông giá trị đóng góp tông cộng các biến trong một chất [66, 86]. Như
vậy tỷ lệ đóng góp trung bình MPmxi, và GMPmxi [86] của mỗi biến độc lập cho 3
mô hình được xác định, kết quả cho ở trong Bảng 3.22.
Phần trăm đóng góp trung bình toàn cục GMPmxi,% trong Bảng 3.22 mô tả
mức độ ảnh hưởng của mô tả phân tử 2D và 3D của nhóm dẫn xuất flavone và
isoflavone. Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử
2D và 3D được sắp xếp theo các giá trị GMPmxi,%: MaxQp > ABSQ > ka2 >
MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon.
Các tham số mô tả ABSQ, MaxQp, ka2, MaxNeg và LogP được xem như
các bộ tham số mô tả quan trọng nhất trên mỗi phân tử. Bên cạnh những tham số
mô tả phân tử này còn cho thấy theo bản chất của nhóm cacbonyl C4 = O11 và
nguyên tử O1. Các nguyên tử này có cặp electron tự do liên hợp với điện tử C2 = C3
và C4 = O11 để hình thành hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất phản
ứng hoàn toàn của chất carbonyl [80, 103]. Vì vậy, những mô tả này có thể được
chứng minh tông điện tích trên phân tử bằng các giá trị GMPmxi,% và chúng cũng
phù hợp với các đánh giá thực nghiệm [80, 103, 113].
Ngoài ra, các vị trí nguyên tử C6 và C3' cũng là vị trí trống và có thể gắn các
nhóm chức mới. Các vị trí khác cũng có thể có ảnh hưởng quan trọng đối với các
hoạt tính sinh học GI50, nhưng chúng không phải là vị trí trống, vì vậy không thể
gắn những nhóm thế mới. Do đó các vị trí C6 và C3' được chọn để gắn các nhóm thế
mới vào tạo thành flavonoid mới. Tương tự, vị trí C2' cũng còn trống và có thể được
sử dụng để gắn nhóm chức mới. Việc này sẽ tạo thành các hợp chất mới và có thể
94
cải thiện hoạt tính sinh học so với chất mẫu. Từ đó, flavonoid phân lập có thể được
lựa chọn như chất mẫu để thiết kế các loại thuốc mới có hoạt tính cao hơn. Điều này
được thể hiện trong phần thảo luận dưới đây.
Các mô tả phân tử được áp dụng bằng kỹ thuật PCR để xây dựng mô hình
QSAR [106, 111]. Mô hình QSAR với số biến số k = 6 là mô hình tốt nhất được
chọn có các tham số mô tả phân tử MaxQp, SdO, ka3, LogP, Ovality và SdssC
[63].
0
20
40
60
80
100
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
PC1 PC2 PC3 PC4 PC5 PC6
Cu
mu
lati
ve
var
iab
ilit
y (
%)
Eig
env
alue
Principle Component
3
4
5
6
7
8
9
3 4 5 6 7 8 9p
GI 5
0pGI50, pred
Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50
Kết quả dự đoán hoạt tính sinh học với giá trị R2pred phù hợp với dữ liệu thực
nghiệm. Số lượng các thành phần chính được trích ra bằng kỹ thuật phân tích thành
phần chính và tương quan giữa pGI50 và pGI50pred được chỉ ra trong Hình 3.7. Mô
hình hồi quy thành phần QSARPCR (3.18) có dạng:
pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 +
0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6 (3.18)
với n = 26; R2tr
= 0,833; R2adj= 0,820, R2
pr =0,812, SE = 0,342, MSE =
0,1236; F = 63,172
3.2.6.3. Xây dựng mô hình QSARPCA-ANN
Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với thuật
toán di truyền bằng chương trình INForm [40, 87]. Kiến trúc mạng nơ-ron nhân tạo
I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN bao gồm lớp đầu vào
I(6) với 6 nơ ron là các biến độc lập PC1, PC2, PC3, PC4, PC5 và PC6 tương ứng với
các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron
thần kinh và lớp đầu ra O (1) với nơ ron là hoạt tính sinh học pGI50. Thuật toán lan
Thành phần chính
Giá
trị
riê
ng
Phần
tr
ăm
tích
lũy, %
95
truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi nơ ron
được sử dụng là hàm truyền sigmoid; các thông số khác được sử dụng để huấn
luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và tốc độ học 0,7; sai số MSE
= 0,003447 với số vòng lặp là 5000. Sau khi luyện mạng nơ ron I(6) - HL(9)- O(1),
giá trị R2tr
là 0,897298 và R2pr là 0,88718.
3.2.6.4. Khả năng dự đoán của các mô hình
Khả năng dự đoán của các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN đã được đánh giá cẩn thận bằng kỹ thuật (LOO) với giá trị tương
quan dự đoán R2pred. Năm hợp chất trong nhóm kiểm tra được sử dụng để đánh giá
khả năng dự đoán của các mô hình QSAR này. Các hoạt tính dự báo cho flavonoid
trong nhóm thử nghiệm được so sánh với dữ liệu thực nghiệm, như được trình bày
trong Bảng 3.23.
Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR
(3.17), QSARPCR và QSARPCA-ANN
Hợp chất pGI50,exp pGI50,pred ARE,%
M1 M2 M3 M1 M2 M3
Flav-8
A2
5,921 5,234 5,526 5,471 3,214 8,979 7,890
Flav-22
A9
5,745 5,485 5,699 5,556 3,755 0,001 2,513
Flav-32
A12
6,097 5,423 5,697 5,351 5,567 10,895 4,161
Flav-74
1-3-5-11-15-26
5,699 5,815 5,895 5,736 1,964 3,362 0,585
Flav-80
1-3-5-11-15-26
5,699 6,034 6,288 6,086 0,773 3,399 0,083
MARE,% 3,055 5,327 3,045
Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR (3.18); M3 là
mô hình QSARPCA-ANN.
Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt tính
thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung bình sai số tương
đối MARE%. Các giá trị MARE,% cho thấy rằng khả năng dự báo của mô hình
QSARPCA-ANN thấp hơn mô hình QSARMLR (3.17), QSARPCR. như trong Bảng 3.23.
Do giá trị MARE,% mô hình QSARPCR là cao nhất. Sau khi sử dụng các mô hình
QSARMLR (3.17), QSARPCR và QSARPCA-ANN để dự đoán các hoạt tính sinh học
96
pGI50 của sáu hợp chất trong nhóm thử nghiệm khả năng dự đoán chính xác của một
mô hình QSAR được thể hiện bởi các sai số có thể chấp nhận được trong khoảng tin
cậy của phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR và
QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới.
Mối quan hệ giữa các tham số mô tả phân tử 2D, 3D và các hoạt tính kháng
ung thư GI50 (μM) của các dẫn xuất flavonoid. Mô hình QSARMLR (3.18) cho thấy
các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC ảnh hưởng quan trọng đến
sự thay đôi hoạt tính GI50 thử nghiệm in vitro trên tế bào Hela của các dẫn xuất
flavonoid. Mô hình QSARMLR (3.18) cũng tìm ra các vị trí quan trọng nhất C6 và C3
để gắn các nhóm thế mới nhằm tạo ra các flavonoid mới với hoạt tính cao hơn
flavonoid cô lập. Mô hình QSARPCA-ANN với kiến trúc I(6) - HL(9) - O (1) có thể dự
đoán hoạt tính của flavonoid tốt hơn. Các hoạt tính sinh học dự đoán từ các mô hình
QSAR phù hợp với những kết quả từ dữ liệu thực nghiệm.
Các mô hình QSAR được mô tả trong nghiên cứu này hữu ích cho đánh giá
độc tính in vitro đối với tế bào ung thư Hela của flavonoid. Nghiên cứu này đã xây
dựng các mô hình QSAR khác nhau có thể hữu ích cho việc tìm kiếm các tác nhân
trị liệu mới trong bệnh ung thư.
3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2)
3.2.7.1. Dữ liệu
Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 26 hợp chất
và hoạt tính kháng tế bào ung thư cô tử cung GI50/M (GI50 là nồng độ ức chế 50%
sự phát triển của tế bào ung thư) gồm 32 hợp chất trong Phụ lục 1a.
Điện tích nguyên tử sử dụng làm dữ liệu để xây dựng các mô hình QSARMLR.
QSARPLS và QSARANN thể hiện mối quan hệ giữa cấu trúc điện tử và hoạt tính. Dữ
liệu điện tử cho ở phụ lục 1b.
3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20)
Các mô hình QSARMLR và QSARPLS được xây dựng thể hiện mối quan hệ
của điện tích nguyên tử và các hoạt tính sinh học pGI50 [86]. Các mô hình và các
97
giá trị R2, R2pred và SE với các tham số điện tích nguyên tử được chỉ ra trong Bảng
3.24.
Để xây dựng các mô hình QSARMLR, các tham số điện tử nguyên tử đã được
chọn sử dụng thuật toán hồi quy từng bước. Quá trình lựa chọn mô tả điện tích
nguyên tử dựa trên sự thay đôi của các giá trị thống kê R2, SE, R2pred và F-stat. Các
mô hình QSARMLR đã được đánh giá chéo bằng cách sử dụng kỹ thuật LOO để xác
định R2pred, 9 mô hình được thể hiện trong Bảng 3.24. Các mô hình QSARMLR (với k
từ 2 đến 10) được sắp xếp trong một sự thay đôi có trật tự của các giá trị R2tr
và R2pr.
Trong các mô hình ở Bảng 3.24, các mô hình QSARMLR với k từ 5 đến 7 có các giá
trị lớn hơn R2pred hơn các mô hình khác.
Bảng 3.24 Các mô hình QSARMLR với các giá trị R2tr
, SE và R2pr tương ứng
k Điện tích nguyên tử trong các mô hình R2tr
SE R2pr
2 O1, C7 0,816 0,139 0,765
3 O1, C4, C6 0,86 0,124 0,8
4 O1, C2, C4, C5 0,901 0,107 0,829
5 O1, C2, C4, C5, C3’ 0,924 0,096 0,873
6 O1, O11, C3, C4, C6, C7, 0,938 0,089 0,903
7 O11, C4, C6, C8, C9, C2’, C6’ 0,959 0,074 0,879
8 O11, C3, C6, C7, C8, C9, C10, C3’ 0,97 0,065 0,696
9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,057 0,563
10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’ 0,978 0,059 0,358
Cụ thể, mô hình QSARMLR (3.19) với k = 6 với giá trị R2tr là 0,938 và giá trị
R2pr cao nhất là 0,903.
pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 6,6117
C6 +4,6038C7 (3.19)
Vì vậy, chúng tôi chọn các mô hình tốt nhất (với k bằng 5, 6 và 7) để xác
định tỷ lệ đóng góp của các điện tích nguyên tử. Giá trị đóng góp MPmxi, GMPmxi và
các giá trị thống kê của các mô hình tương ứng (với k bằng 5, 6 và 7), được trình
bày trong Bảng 3.25.
Giá trị phần trăm đóng góp MPmxi các biến độc lập trong mỗi mô hình
QSARMLR (với k bằng 5, 6 và 7) được xác định từ tỷ lệ đóng góp Pxk tương ứng của
98
các biến trong từng trường hợp. Giá trị Pxk được xác định bởi giá trị đóng góp tông
cộng các biến trong một chất [18]. Vì vậy, tỷ lệ phần trăm đóng góp trung bình
MPmxi và GMPmxi của mỗi biến được xác định, các kết quả được mô tả trong Bảng
3.25. Phần trăm đóng góp trung bình toàn cục của GMPmxi trong Bảng 3.25 thể hiện
mức độ quan trọng của điện tích nguyên tử trong flavone và isoflavone. Đối với 3
mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử quan trọng sắp xếp
theo các giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3. Các nguyên tử C4, O1,
O11 là các các vị trí quan trọng nhất trong các phân tử. Ngoài các nguyên tử trong
nhóm carbonyl C4 = O11 và nguyên tử O1 có cặp electron liên kết điện tử π của C2 =
C3 và C4 = O11 để tạo thành một hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất
phản ứng hoàn toàn của nhóm carbonyl. Vì vậy, các nguyên tử quan trọng này được
chứng minh bằng cách sử dụng các giá trị GMPmxi, % và cũng phù hợp với các dự
đoán từ nghiên cứu thực nghiệm [18, 54, 103].
Ngoài ra, nguyên tử C6 cũng là một vị trí quan trọng và được khám phá để
gắn các chất thay thế mới [80, 103]. Các vị trí nguyên tử C9 và C3 cũng ảnh hưởng
quan trọng đối với các hoạt tính sinh học GI50, nhưng nguyên tử C9 không phải là vị
trí còn trống nên không chọn để gắn các chất thay thế mới. Vì vậy, C6 là vị trí còn
trống có thể được lựa chọn để gắn thêm các nhóm thế vào hợp chất flavone mẫu
trong Phụ lục 1a hoặc flavonoid chiết xuất. Tương tự, vị trí C3' cũng còn trống và có
thể được sử dụng để gắn các nhóm thế mới. Điều này có thể hy vọng sẽ tạo ra các
hợp chất mới với hoạt tính cao hơn. Từ hướng nghiên cứu này, flavonoid cô lập đã
được lựa chọn như là chất mẫu để thiết kế các dẫn xuất mới có hoạt tính cao hơn.
Mô hình QSARPLS cũng được xây dựng từ các tham số điện tích nguyên tử,
các tham số này được lựa chọn cho mô hình QSARPLS theo. Sáu biến số O1, O11, C3,
C4, C6 và C7 cũng được sử dụng để xây dựng mô hình QSARPLS. Mô hình QSARPLS
được có dạng:
pGI50 = 5,168 − 20,643 × O1 − 0,358 × C3 − 7,892 × C4 + 0,425 × C6 − 0,583
× C7 − 3,465 × O11 (3.20)
Với n = 26; R2pr = 0,943; SE = 0,360; R2
pr = 0,912
99
Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của
điện tích nguyên tử trong các mô hình QSARMLR
Biến QSARMLR MPmxi
GMPmxi m = 5 m = 6 m = 7 m = 5 m = 6 m = 7
R2tr 0,924 0,938 0,959
R2ad 0,905 0,919 0,943
SE 0,096 0,089 0,074
R2pr 0,873 0,903 0,879
Hằng số −0,933 6,712 4,714
O1 −101,208 −42,311 − 57,602 24,629 − 27,410
O11 − −8,159 −32,8026 − 18,632 21,462 13,365
C2 −15,426 − − 13,418 − − 4,473
C3 − 3,014 − − 4,216 − 1,405
C4 −6,874 −19,037 −60,070 15,121 42,447 38,387 31,985
C5
− −
− −
C6 − 6,612 20,877 − 6,572 5,779 4,117
C7 − 4,604 − − 3,505 − 1,168
C8 − − 16,902 − − 5,696 1,899
C9 − − 95,421 − − 22,597 7,532
C2' − − −24,472 − − 2,497 0,832
C3' −16,117 − − 11,801 − − 3,934
C6' − − −25,422 − − 3,582 1,194
3.2.7.3. Xây dựng mô hình QSARANN(2)
Mô hình QSARANN(2) được xây dựng bằng kỹ thuật neuro-fuzzy với các thuật
toán di truyền sử dụng chương trình Visual Gene Developer v1,7 [43]. Kiến trúc
mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp đầu vào I(6) bao gồm
sáu nơ ron là các tham số O1, O11, C3, C4, C6 và C7; Nơ ron lớp đầu ra O(1) là hoạt
tính sinh học pGI50; Lớp ẩn HL(4) bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử
dụng thuật toán lan truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút
của mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ học 0,7;
sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện mạng thần kinh, giá trị
100
R2tr là 0,993 và R2
pr là 0,971 trong khi đối với mô hình QSARMLR (3.19), giá trị R2tr
là 0,938 và R2pr là 0,903.
3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới
Khả năng dự báo của các mô hình QSARMLR (3.19), QSARPLS và
QSARANN(2) được đánh giá cẩn thận bằng cách sử dụng kỹ thuật LOO để xác định
giá trị R2pred; Các flavonoid được chia ngẫu nhiên từ dữ liệu trong Phụ lục 1a thành
nhóm luyện gồm 26 hợp chất và nhóm kiểm tra gồm sáu hợp chất.
Các hoạt tính sinh học của 6 chất flavonoid trong nhóm thử nghiệm trong
Phụ lục 1a được dự đoán từ các mô hình QSARMLR, QSARPLS và QSARANN. Các
giá trị dự đoán của các hoạt tính sinh học của những hợp chất này được so sánh với
các giá trị thực nghiệm, được trình bày trong Bảng 3.2 .
Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR
(3.19), QSARPLS (3.20) và QSARANN(2)
Hợp chất pGI50,exp pGI50,pred ARE,%
M1 M2 M3 M1 M2 M3
Fla 2 5,921 6,008 5,801 5,851 1,472 2,020 1,180
Fla 9 5,745 5,692 5,608 5,741 0,925 2,376 0,070
Fla 12 6,097 5,759 5,842 5,814 5,548 4,188 4,646
Fla 15 5,699 5,651 5,652 5,712 0,840 0,828 0,236
Fla 16 5,699 5,651 5,655 5,719 0,835 0,775 0,347
Isofla 32 5,137 5,092 5,083 5,112 0,877 1,046 0,490
MARE,% 1,749 1,872 1,161
Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS; M3 là
mô hình QSARANN(2).
Khả năng dự báo của mô hình QSARMLR (3.19) thấp hơn các mô hình
QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.2 . Mô hình QSARANN (2)
có sai số có giá trị MARE % là 1,161 nhỏ hơn MARE,% của cả hai mô hình
QSARMLR (3.19) và QSARPLS.Vì vậy, khả năng dự báo của mô hình QSARANN (2)
tốt hơn so với mô hình QSARMLR (3.19) và QSARPLS. Sau khi sử dụng các mô hình
QSARMLR (3.19), QSARPLS và QSARANN(2) để dự đoán các hoạt tính sinh học pGI50
của sáu hợp chất trong nhóm thử nghiệm, sai số dự đoán nằm trong khoảng sai số số
101
không chắc chắn của thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS
và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các hợp chất
flavonoid mới.
3.3. SÀNG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN
3.3.1. Phân lập cynaroside từ actiso
CSL1 phân lập và tinh chế từ actiso (mục 2.4.1.) CSL1 kết tinh dạng bột,
trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy
256 – 257 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (60 : 40). hiện màu
bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,6).
Phô 1H-NMR (500 MHz, DMSO, δ ppm). Các proton trong vòng thơm: Độ
dịch chuyển của H liên kết với Csp2 thơm trung bình là 7,27, tuỳ vào các liên kết với
các nhóm thế khác nhau mà có sự thay đôi từ 6 - 9. Dễ dàng nhận thấy, từ độ dịch
chuyển hoá học của H6 và H8 cho thấy đây là hai mũi proton của nhân thơm, ghép
cặp metha với nhau. Một mũi đôi của proton trong nhân thơm ở H2’ mũi bốn ở H3’ là
hai proton ghép cặp ortho. Một mũi đôi của proton nhân thơm tại δH 6,90 ppm (d, J
= 8,5 Hz) và một mũi bốn của của proton nhân thơm tại δH 7,44 ppm (dd, J = 8,5Hz,
J = 2) chứng tỏ chúng ở vị trí ortho. Mũi đôi proton H6’ và H2’ ghép cặp meta với
nhau. Cụ thể là δ 6.39 (s, H3); 6.44 (d, J = 2 Hz, H6); 6.78 (d, J = 2 Hz, H8); 5.08
(1H, d, J = 7,5Hz , H1"); 7,41 (d, J = 8.5 H6’); 6,90 (d, J = 8,5Hz, H3’); 7,44 (dd, J =
8,5Hz, J = 2, H2’); Các proton của nhóm OH: quan sát trên phô có mũi proton với
độ dịch chuyển ở 12,89 ppm. Các mũi đa proton trong vòng đường gồm có: 3,489
(1H, m, H2’’); 3,476 (1H, m, H4’’); 3,466 (1H, m, H3’’); 3,500 (1H, m, H5’’); 3,725
(1H, dd, J = 12,3; 2,5 HZ, H6’’); 3,702 (1H, dd, J = 12,4; 6,3 HZ, H6’’); Mũi đôi
proton H1’’ (1H, d, J = 7,5Hz) được suy ra từ phô 1H-NMR kết hợp với phô HSQC,
cho thấy đường nối với khung aglycon bằng liên kết β. Mặt khác có tương tác giữa
δH1’’ và C7 trong phô HMBC. Vậy CSL1 có một đơn vị đường gắn vào khung
glycon ở C7 trong phân tử.
Phô 13C-NMR (DMSO, δ ppm, 125 MHz) và DEPT: Phô 13C-NMR (DMSO,
δ ppm,125 MHz) kết hợp phô DEPT và phô phô cộng hưởng từ hạt nhân 2 chiều
102
HSQC VÀ HMBC cho thấy CSL1 là một hợp chất flavonoid có 21 C. Có một nhóm
>C=O: 181,785 (C4). Có một nhóm >CH2: 60,6(C6’’). Có 5 nhóm –CH<: 76,4 (C2’’);
77,2 (C3’’); 69,5 (C4’’); 78 (C5’’); và mũi acetan đặc trưng 99,9 (C1’’) của đường. Có
6 nhóm cacbon bậc ba (–CH=): 105,3(C3); 100,2(C6); 95(C8); 113,6(C2’); 145,7
(C3’); 119,2 (C6’). Có 8 nhóm C bậc 4 (<C=): δ164,5 (C2); 161,2 (C5); 162,9(C7);
156,9(C9); 103,1(C10); 121,4(C1’); 149,9 (C4’); 115,9 (C5’); Tương tác của C và H
trong phô HMBC và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 -
C1’- C3’- C4’ - C6’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.
Phô 1H-NMR của cynaroside (Phụ lục 13), phô 13C-NMR (Phụ lục 15), phô
DEPT (Phụ lục 14), phô HMBC P lục 16), phô HSQC (Phụ lục 17). Tham khảo với
phô của hợp chất CSL1 trong nghiên cứu phân lập hợp chất cynaroside từ hạt
capparis decidua (forsk) của V. K. SAXENA và cs. [78] cho thấy CSL1 là
cynaroside. Cấu trúc Cynaroside được cho ở Hình 3.8.
Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11
Danh pháp khác của cynaroside là luteolin-7-O-β-d-glucopyranoside hay
2-(3,4-dihydroxyphenyl)-5-hydroxy-7-((2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-
(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one.
3.3.2. Phân lập quercetin từ xa kê
AIL1 phân lập từ xa kê theo mục 2.4.1. AIL1 kết tinh dạng bột, trong hỗn
hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 314 – 316
oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20). Hiện màu bằng dung
dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0.35)
Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 24), phô 13C-NMR
(Phụ lục 25), phô DEPT (Phụ lục 26), kết hợp với phô HSQC (Phụ lục 27), HMBC
(Phụ lục 28): Có 5 proton trong vòng thơm trong đó: 6,26 (1H, d, J = 1,5 Hz, H6)
103
ghép cặp metha với 6,52 (1H, s giống t, H8); 6,98 (1H, d, J=8,5 Hz, H6') ghép
cặp metha với 7,82 (1H, d, J = 1,5 Hz, H2') và ghép cặp ortho với 7,68 (1H, dd, J
= 8,5 và 2 Hz, H5'). Tín hiệu proton ở 12,16 (1H, s); cho thấy hợp chất có nhóm
OH. Phô 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phô DEPT, HSQC, HMBC: hai
cacbon olefin C 146,9 (C2) và C 136,6 (C3). Hai cacbon >C= là: C 146,9 (C2); C
136,6 (C3); 12 cacbon vòng thơm: C 176,5, (C4); 162,2 (C5); 164,9 (C7);
157,7 (C9); 145,7 (C3'); 148,2 (C4'); Trong đó có hai cacbon bậc 4: δC 121,4 (C1')
và 104,0 (C-10); có năm cacbon –CH=: 99,1 (C6); 94,4 (C8); 116,1 (C2');
115,6 (C5'); C 123,7 (C6'); Quan sát tương tác của H và C trong phô HSQC, HMBC
cho thấy phô nghiệm của AIL1 thì phù hợp. H6-C5-C7-C8-C10; H8-C6-C7-C9-C10, H2’-
C1’-C6’-C3’-C4’-C2; H3’-C2’-C1’-C3’- C4’; H6’-C1’-C2-C2’-C4’-C5’.
Phô tham khảo từ nghiên cứu sự phân lập quercertin từ lá hồ lô ba (trigonella
foenum-graecum) của Bharathi Sambflavonoidam và cs. [11] và nghiên cứu phân
lập quercertin từ thân cây Costus igneus rhizome (CiREE) của
PazhanichamyKalailingam và cs. [44] cho thấy AIL1 là quercetin. Cấu trúc
quercetin cho ở Hình 3.9.
Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7
Danh pháp: 2-(3,4-dihydroxyphenyl)-3,5,7-trihydroxy-4H-chromne-4-one.
3.3.3. Phân lập luteolin từ tía tô
POL1 phân lập từ tía tô theo mục 2.4.1. POL1 kết tinh dạng bột, trong hỗn
hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 327-328
oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (95 : 5) hiện màu bằng dung
104
dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,34), cho phản ứng dương
tính với thuốc thử FeCl3/EtOH cho thấy đây là một dẫn xuất phenolic.
Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 29) kết hợp với phô
HSQC (Phụ lục 33), HMBC (Phụ lục 32): Sáu H trong vòng thơm: δ 6.65 (1H; s,
H3); 6.19 (1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H;
d; J = 8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); bốn H của nhóm OH: 9.4 (1H, s, C4’-
OH ); 9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH), có một H của nhóm OH kiềm nối:
H [12.95 (s; 5-OH)].
Hình 3.10 Cấu trúc POL1, C15H10O6
Danh pháp: 2-(3,4-dihydroxyphenyl)-5,7-dihydroxy-4H-benzopyran-4-one
Phô 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 30) kết hợp với phô DEPT (Phụ
lục 31), HSQC, HMBC: Có 5 C thơm –CH=: 98.9(C6); 93.8(C8); 113.4(C2’);
116.0(C5’); 118.9(C6’). Có 6 C bậc 3 liên kết với oxy: δ163.1 (C2); 161.4(C5);
164.1(C7); 157.3 (C9); 145.7(C3’); 149.7(C4’); có 3 C bậc 4: 103.7(C10); 121.5(C1’);
có một cacbon cacbonyl 181.6(C4). Tương tác của C và H trong phô HMBC và phô
HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -
C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. So sánh phô
chuẩn của POL1 với nghiên cứu sự phân lập luteolin [108], cho thấy POL1 là
luteolin. Cấu trúc luteolin cho ở Hình 3.10.
TÓM TẮT PHỔ
Cấu trúc POL1 được xác định bằng cách sử dụng các phô khác nhau: 1H-
NMR (DMSO-d6, 500 MHz, δ ppm) with HSQC, HMBC: δ 6.65 (1H; s, H3); 6.19
(1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H; d; J =
8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); 12.95 (1H, s; C5-OH); 9.4 (1H, s, C4’-OH );
9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH). The 13C-NMR (DMSO-d6, 125 Hz) kết
105
hợp với phô DEPT, HSQC, HMBC: δ163.1 (C2); 102.8(C3); 181.6(C4); 161.4(C5);
98.9(C6); 164.1(C7); 93.8(C8); 157.3 (C9);103.7(C10); 121.5(C1’); 113.4(C2’);
145.7(C3’); 149.7(C4’); 116.0(C5’); 118.9(C6’). Tương tác C – H trong phô HMBC
và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’
-C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 -C1’ - C2’ - C4’ - C5’.
3.3.4. Phân lập daidzin từ đậu nành
3.3.4.1. Xác đinh cấu trúc daidzin bằng phương pháp NMR
GML1 được phân lập từ đậu nành theo mục 2.4.1. GML1 kết tinh dạng tinh
thể trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng
chảy 246 - 248 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20) hiện
màu bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,4).
Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 18): 6 proton trong
vòng thơm: H6 ghép cặp ortho với H5 và ghép cặp metha với H8: 8,06 (1H, d, J =
8,0Hz, H5); 7,15 (1H, d, J = 1,5 Hz, H6); 7,23 (1H, d, J = 2,0Hz, H8); H3’, H5’
ghép cặp metha 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); H6’, H2’ ghép cặp metha:
7,42 (2H, d, J = 8,0 Hz, H6’, H2’); có một tín hiệu H trong vòng A δ 6.80 (1H; s,
H2); có một tín hiệu H anomeric 5,10 (1H, m, H1’’), phân tử có một gốc đường với
các tín hiệu H đường 3,70-3,73 (6H, m, H2’’, H3’’, H4’’, H5’’ , H6’’, H6’’).
Phô 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 19) kết hợp với phô DEPT (Phụ
lục 20), HSQC (Phụ lục 22), HMBC (Phụ lục 21): Có 7 cacbon –CH= trong vòng
thơm: δ 126,9 (C5), δ 115,6 (C6), δ 103,4 (C8), δ 130,0 (C2’), δ 115,0 (C3’), δ 115,0
(C5’), δ 130,0 (C6’). Có 3 C bậc ba, thơm, liên kết trực tiếp với oxi: δ 157,0 (C9), δ
157,2 (C4’), ), δ 161,3 (C7). Có 1 cacbon cabonyl: δ 174,7 (C4). Có 1 C thơm có H
liên kết trực tiếp với oxy: δ153,2 (C2). Có 2 C bậc 4 thơm: δ 118,5 (C10), δ 123,7
(C1’). Có 1 cacbon bậc 4 không thơm: δ 122,3 (C3). Có 6 C trong gốc đường: δ
100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ 69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).
So sánh phô chuẩn của GML1 với nghiên cứu sự phân lập daidzin [53, 55],
cho thấy GML1 là daidzin. Cấu trúc daidzin được đưa ra trong Hình 3.11.
106
Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9
Danh pháp daidzin: 3-(4-hydroxyphenyl)-7-((2S,3R,4S,5S,6R)-3,4,5-
trihydroxy-6-(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one
TÓM TẮT PHỔ
Cấu trúc GML1 được xác định bằng phương pháp đo phô 1H-NMR:
δ8,06 (1H, d, J = 8,0Hz, H5); δ 7,15 (1H, D, J = 1,5 Hz, H6); δ 7,23 (1H, d, J =
2,0Hz, H8); δ 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); δ 7,42 (2H, d, J = 8,0 Hz, H6’,
H2’); phô 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phô DEPT, HSQC, HMBC:
δ153,2 (C2), δ 122,3 (C3), δ 174,7 (C4), δ 126,9 (C5), δ 115,6 (C6), δ 161,3 (C7), δ
103,4 (C8), δ 157,0 (C9), δ 118,5 (C10), δ 123,7 (C1’), δ 130,0 (C2’), δ 115,0 (C3’), δ
157,2 (C4’), δ 115,0 (C5’), δ 130,0 (C6’), δ 100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ
69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).
3.3.4.2. Xác đinh cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X
Cấu trúc daidzin còn được xác định bằng phương pháp đo nhiễu xạ tia X đơn
tinh thể: Dữ liệu nhiễu xạ đơn tinh thể của daidzin được đo trên máy Bruker D8
Quest (tại Khoa Hóa học, Trường Đại học Khoa Học Tự Nhiên, Hà Nội) ở nhiệt độ
100 K, đối âm cực Mo với bước sóng K = 0,71073 Å). Ảnh nhiễu xạ được ghi
trên detector huỳnh quang dạng đĩa trong đường kính 34 cm, khoảng cách từ tinh
thể đến detector là 10 cm. Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi
đơn tinh thể được thực hiện trên phần mềm chuẩn - Apex 2 của máy đo. Cấu trúc
được xác định theo phương pháp trực tiếp (direct method). Sử dụng phần mềm XT
tích hợp trong Olex2 để tính và tối ưu hoá cấu trúc. Vị trí của nguyên tử hidro được
xác định theo các thông số lý tưởng và được tính bằng phần mềm SHELXL.
Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu xạ
tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.
107
Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được
trình bày trong Phụ lục 44-50.
Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50%
Kết quả đo về độ dài liên kết, góc liên kết của hợp chất daidzin phù hợp giữa
lý thuyết và thực nghiệm (Ftt= 1,214 < F= 4,734). Kết quả đo độ dài các liên kết
đôi C=C trong daidzin trong khoảng 1,337 – 1,407 Å; liên kết C-C từ 1,509 – 1,530
Å. Các liên kết C=O thực nghiệm đo được đối với C7-O8 là 1,237 Å. Liên kết thực
nghiệm đo được đối với C3-O4 là 1,369 Å; đối với C5-O4 là 1,341 Å. Cấu trúc phân
tử Daidzin dưới dạng elipxoit với xác xuất 50% từ đậu nành (Hình 3.12).
3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió
3.3.5.1. Xác đinh cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR
ZZL1 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. ZZL1 thu được
dưới dạng tinh thể, màu vàng, điểm nóng chảy 249 – 250 oC; sắc ký lớp mỏng
(TLC) triển khai bằng dung môi CHCl3 – MetOH (85:15) hiện màu bằng dung dịch
H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,3. Phô 1H-MNR (500
MHz, DMSO, δ ppm) (Phụ lục 34): có H trong nhân thơm: H6 và H8 ghép cặp
metha với nhau δ6,20 (1H, d, J = 2, H6) 6,44 (1H, d, J = 2, H8); H6’ ghép cặp metha
với H2’ và ghép cặp ortho với H5’ 7,93 (2H, d, H6’, H2’); H5’ ghép cặp metha với H3’
6,94 (2H, d, J = 9, H5’,H3’). Có một nhóm OH kiềm nối δ12,68 (1H, s, 5-OH), có 3
H của nhóm methyl 3,78 (3H, s, H11). Phô 13C-NMR (125MHz, δ ppm) (Phụ lục
35): có 1 C cacbonyl: 177,9 (C4); có 6 C thơm –CH=: 98,5 (C6); 93,7 (C8); 130,1
108
(C2’); 115,6 (C3’); 115,6 (C5’); 130,1 (C6’). Có 2 C thơm bậc 4: 104,2 (C10); 120,5
(C1’); có 6 C thơm bậc 3, liên kết trực tiếp với oxi: δ155,6 (C2); 137,6 (C3); 161,2
(C5); 164,1 (C7 ); 156,3 (C9); 160,1 (C4’); Tương tác của C và H có trong phô
HMBC (Phụ lục 37) và HSQC (Phụ lục 38): H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 -
C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’;
H6’ - C2 - C1’ - C2’ - C4’ - C5’.
Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6
Danh pháp 5-hydroxy-2-(4-hydroxyphenyl)-7-methoxy-4H- benzopyran-4-
one. Phô tham khảo từ nghiên cứu sự phân lập kaempferol từ thân cây Costus
igneus rhizome (CiREE) của PazhanichamyKalailingam và cs [44] cho thấy ZZL1
là kaempferol- 3-O-methylether. Cấu trúc ZZL1 được đưa ra trong Hình 3.13.
TÓM TẮT PHỔ
Cấu trúc ZZL1 được xác định từ dữ liệu phô nghiệm: 1H-MNR (500 MHz,
DMSO, δ ppm): δ6,20 (1H, d, J = 2, H6); 6,44 (1H, d, J = 2, H8); 7,93 (2H, d, H6’,
H2’); 6,94 (2H, d, J = 9, H5’,H3’); 12,68 (1H, s, 5-OH); 3,78 (3H, s, H11). 13C-NMR
(125MHz, δ ppm): δ155,6 (C2); 137,6 (C3); 177,9 (C4); 161,2 (C5); 98,5 (C6); 164,1
(C7 ); 93,7 (C8); 156,3 (C9); 104,2 (C10); 120,5 (C1’); 130,1 (C2’); 115,6 (C3’); 160,1
(C4’); 115,6 (C5’); 130,1 (C6’).
Tương tác dị proton giữa C và H qua nhiều liên kết (HMBC) và qua một liên
kết (HSQC) đã giúp xác định được sự có mặt của các nguyên tố chính xác hơn: H6 -
C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -
C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.
109
3.3.5.2. Xác đinh cấu trúc kaempferol-3-O-methylether bằng phương pháp đo
nhiễu xạ tia X
Cấu trúc ZZL1 được xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh
thể. Dữ liệu nhiễu xạ đơn tinh thể ZZL1 được đo tương tự như đối với hợp chất
daidzin. Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu
xạ tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.
Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được
trình bày trong phụ lục 51-57.
Liên kết đôi C=C theo lý thuyết có độ dài liên kết 1,33 Å. Kết quả đo nhiễu
xạ tia X đơn tinh thể C1=C2, C8=C10, C7=C14, C11=C13, C16=C22, C17=C18 có độ dài
thực nghiệm từ 1,360 đến 1,399 Å. Liên kết C – C thông thường có độ dài 1,54 Å,
kết quả thực nghiệm độ dài liên kết C1-C16 là 1,47 Å. Liên kết C=O có độ dài lý
thuyết là 1,20 Å. Kết quả thực nghiệm cho thấy độ dài C5-O6 là 1,264 Å. Liên kết
C-O có độ dài lý thuyết là 1,43 Å. Kết quả thực nghiệm cho thấy độ dài liên liên kết
C2-O3 là 1,3766 Å, liên kết O3-C4 là 1,445 Å, liên kết C8-O9 là 1,3489 Å, liên kết
C11-O12 là1,348 Å, liên kết C19-O20 là 1,362 Å.
Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50%
Các góc của Csp2 theo lý thuyết là 120o; ở đây kết quả đo X-ray cho kết quả
phù hợp. Các tham số cấu trúc: độ dài liên kết, góc liên kết của ZZL1 sau khi tối ưu
hóa được tính toán bằng phương pháp hóa lượng tử PM3 bằng Hyperchem phù hợp
110
với độ dài và góc từ phô chụp X-ray đơn tinh thể (Ftt = 1,280 < F4,567).
Điều đó cho thấy các kết quả đo về độ dài, về góc giữa lý thuyết và thực
nghiệm là hoàn toàn phù hợp. Cấu trúc phân tử kaempferol gừng gió dưới dạng
elipxoit với xác xuất 50% được chỉ ra trong Hình 3.14.
3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ
gừng gió
ZZL2 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. Hợp chất ZZL2
thu được dưới dạng bột vô định hình, màu vàng, nhiệt độ nóng chảy: 111-114 oC;
sắc kí lớp mỏng (SKLM) triển khai bằng hệ CHCl3 – MetOH (90 : 10) hiện màu
bằng dung dịch H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,42. Phô
Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12)
1H-MNR (500 MHz, DMSO, δ ppm) (Phụ lục 39): Có 6 H trong vòng thơm:
H6 và H8 ghép cặp metha δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2, H8); H3’
và H5’ ghép cặp metha δH 6,94 (2H, d, J = 8,5, H3’, H5’); H2’ và H6’ ghép cặp metha
δH 6,95 (2H, d, J = 8,5, H2’, H6’). Có H trong nhóm OH kiềm nối δH 12,53 (1H, d,
OH). Có 9 H trong nhóm methyl: δH 0,73 (3H, d, J = 6, H6’’); δH 1,98 (3H, s, H10’’);
δH 2,05 (3H, s, H8’’), dựa vào các tương tác C và H cho thấy hợp chất bị acetyl hoá
tại C2’’ và C4’’. Có 1 proton anome δH 5,40 (1H, d, J = 1, H1’’), xác nhận là đường
α. có 3 H trong –CH< trong phần đường kề oxy: δH 4,60(1H, t, J = 9,5, H4’’)’ δH
5,11 (2H, dd, J = 1,5 H3’’ và 3,5, H2’’) cho thấy ZZL2 có một đơn vị đường.
111
Phô 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 40) kết hợp với phô DEPT (Phụ
lục 41), HSQC (Phụ lục 43), HMBC (Phụ lục 42): Có 6 cacbon –CH= trong vòng
thơm: δC 98,8 (C6), δC 93,8 (C8), δC 129,9 (C2’); δC 114,2 (C3’); δC 130,5 (C2’, C6’); δC
115,4 (C3’, C5’). Có 2 cacbon bậc 4 trong vòng thơm: δC 104,0 (C10); δC 120,1 (C1’).
Có 4 cacbon thơm bậc 3 liên kết trực tiếp với oxy δC 156,5 (C9), δC 161,2 (C5), δC
164,3 (C7), δC 160,2 (C4’). Có 2 cacbon bậc 3 trong vòng A liên kết trực tiếp với oxi:
δC 157,4 (C2), δC 133,2 (C3). Có 1 cacbon cacbonyl δC 177,6 (C4). Có 3 cacbon
(CH3): δC 16,9 (C6’’); δC 20,4 (C8’’); δC 20,7 (C10’’ ); Có 2 cacbon cacbonyl trong
vòng đường: δC 169,7 (C7’’); δC 169,4 (C9’’). Có 5 cacbon trong vòng đường: δC 69,9
(C2’’); δC 67,8 (C3’’, C5’’); trong đó có 1 cacbon acetal δC 97,9 (C1’’).
So sánh dữ liệu phô của ZZL2 với nghiên cứu phân lập kaempferol-3-O-(2,4-
O-diacetyl-alpha-L-rhamnopyranoside cho thấy ZZL2 là kaempferol-3-O-(2,4-O-
diacetyl-alpha-L-rhamnopyranoside (Hình 3.15) [42].
Danh pháp: (3R,4S,6R)-2-(5,7-dihydroxy-2-(4-hydroxyphenyl)-4-oxo-4H-
chromen-3-yloxy)-4-hydroxy-6-methyltetrahydro-2H-pyran-3,5-diyl diacetate
TÓM TẮT PHỔ
Đối với hợp chất ZZL2 được xác định cấu trúc, với dữ liệu phô nghiệm: 1H-
MNR (500 MHz, DMSO, δ ppm): δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2,
H8); δH 6,94 (2H, d, J = 8,5, H3’, H5’); δH 4,61(1H, t, J = 9,5, H4’); δH 7,15 (2H, d, J =
8,5, H2’, H6’): δH 12,54 (1H, d, OH). δH 5,40 (1H, d, J = 1, H1’); δH 0,74 (3H, d, J = 6,
H6’’); δH 1,98 (3H, s, H10’’); δH 2,05 (3H, s, H8’’). Tương tự, đối với phô 13C-NMR
(DMSO-d6, 125 Hz) với dữ liệu phô DEPT, HSQC, HMBC: δC 157,4 (C2), δC 133,2
(C3), δC 177,6 (C4); δC 161,2 (C5), δC 98,8 (C6), δC 164,3 (C7), δC 93,8 (C8), δC 156,5
(C9), δC 104,0 (C10); δC 120,1 (C1’); δC 129,9 (C2’); δC 114,2 (C3’); δC 160,2 (C4’); δC
130,5 (C2’, C6’); δC 115,4 (C3’, C5’); δC 97,9 (C1’’); δC 69,9 (C2’’); δC 67,8 (C3’’, C5’’);
δC 16,9 (C6’’); δC 169,7 (C7’’); δC 20,4 (C8’’); δC 169,4 (C9’’); δC 20,7 (C10’’ );
3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên
Các hợp chất flavonoid phân lập có tác động gây độc tế bào (GI50) ở nồng độ
cao 100 (µg/ml), tiếp tục khảo sát ở các nồng độ khác nhau Bảng 3.27. Với các hợp
112
chất GML1 POL1, CSL1, AIL1, ZZL1, và ZZL2 được phân lập từ actiso, xa kê,
đậu nành, tía tô và gừng gió.
Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế
bào Hela ở các nồng độ khác nhau
Mẫu Nồng độ
(µg/ml)
Phần trăm gây độc tế bào (%)
Lần 1 Lần 2 Lần 3 TB ĐLC
CSL1
(cynaroside)
12 68,33 63,45 66,13 65,97 2,443
9 46,18 51,23 48,80 48,74 2,528
6 58,35 58,97 55,19 57,50 2,027
3 42,59 36,77 40,25 39,87 2,928
1 8,58 4,15 3,53 5,42 2,753
AIL1
(Quercetin)
12 70,05 62,22 68,30 66,86 4,109
9 83,00 79,37 82,78 81,72 2,033
6 65,83 61,43 70,35 65,87 4,459
3 36,82 40,25 42,53 39,87 2,876
1 -4,37 1,01 6,27 0,97 5,320
POL1
(luteolin)
9 56,01 50,67 54,28 53,65 2,721
6 57,10 54,82 58,38 56,77 1,803
3 40,09 31,61 34,32 35,34 4,331
1 12,79 10,43 5,70 9,64 3,610
0,1 -3,28 1,35 -4,10 -2,01 2,937
GML1
(daidzin)
9 55,23 56,61 55,99 55,94 0,695
6 38,07 39,13 42,19 39,79 2,141
3 28,08 34,64 34,44 32,39 3,730
1 -2,18 -3,03 10,95 1,91 7,836
0,1 56,01 50,67 54,28 53,65 2,721
ZZL1
(kaempferol-3-O
-methylether)
50 80,03 81,61 79,82 80,49 0,982
40 62,71 63,79 64,31 63,60 0,814
30 58,50 56,50 60,43 58,48 1,966
20 58,03 56,73 57,58 57,45 0,664
10 41,81 42,60 39,45 41,29 1,638
ZZL2
(kaempferol-3-O
-(2,4-O-diacetyl
-alpha-L
-rhamnopyranoside)
50 63,34 70,74 65,45 66,51 3,813
40 50,70 53,48 52,34 52,17 1,394
30 30,58 35,87 31,01 32,49 2,940
20 10,61 7,17 17,10 11,63 5,043
10 -0,87 -1,23 2,39 0,13 1,977
Dựa vào kết quả khảo sát ở Bảng 3.27, xây dựng đồ thị biểu diễn tỷ lệ (%)
gây độc tế bào. Từ đồ thị, nội suy giá trị nồng độ cho tỷ lệ gây độc tế bào 50%. Kết
quả nội suy giá trị GI50 (µg/ml) của các flavonoid phân lập từ actiso, xa kê, đậu
nành, tía tô và gừng gió được trình bày trong Bảng 3.28.
113
Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực
nghiệm in vitro
Flavonoid GI50 (µg/ml) GI50 (µM) pGI50
Lần 1 Lần 2 Lần 3 TB ± ĐLC TB TB
CSL1 4,41 4,79 4,96 4,72 ± 0,280 10,533 4,977
AIL1 4,36 4,38 3,81 4,18 ± 0,327 13,839 4,859
POL1 4,75 5,38 4,95 5,03 ± 0,321 17,584 4,755
GML1 8,09 7,87 7,70 7,88 ± 0,195 18,937 4,723
ZZL1 15,05 15,24 15,82 15,37 ± 0,401 51,223 4,291
ZZL2 39,65 38,03 38,90 38,86 ± 0,814 75,292 4,123 \
3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TINH CÁC FLAVONOID
3.4.1. Mô hình QESAR
Thiết kế phân tử flavone và isoflavone mới: thử nghiệm gắn các nhóm thế
vào các vị trí C6 và C3' trong khung phân tử của các chất mẫu flavone 1a, isoflavone
6b (phụ lục 4). Các hợp chất mới thiết kế được dự đoán hoạt tính kháng ung thư
pGI50 [115] bằng các mô hình QESARMLR và QESARANN.
5.80
5.85
5.90
5.95
6.00
6.05
6.10
6.15
6.20
fla-1a
(mẫu)
fla-1c fla-2c fla-3c fla-4c fla-5c
Hợp chất flavone
pG
I50
4.80
4.90
5.00
5.10
5.20
5.30
5.40
5.50
5.60
isofla-6b
(mẫu)
isofla-7c isofla-8c isofla-9c isofla-10c isofla-11c
Hợp chất isoflavone
pG
I50
Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các
flavone, isoflavone mới và chất mẫu
Chúng tôi chọn ra các chất mới có hoạt tính cao nhất tính toán điện tích của
các nguyên tử cho ở phụ lục 8, kết quả dự đoán thể hiện ở được trình bày ở Bảng
3.29, Hình 3.16. Như vậy, hợp chất mới thiết kế từ vị trí C6 và C3’ cho hoạt tính
sinh học pGI50 mạnh hơn chất mẫu flavone 1a, isoflavone 6b và hợp chất ZZL1,
ZZL2 phân lập.
114
Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô
hình QESARMLR và QESARANN
Hợp chất Nhóm thế pGI50,pr
vị trí C6 vị trí C3' QESARMLR QESARANN
fla-1a [103] -H -H 5,954 5,709
fla-1c -OCH2CONHCH3 -OH 5,928 5,795
fla-2c -OCH2CONHCH3 -H 5,954 5,814
fla-3c -OCH2(CH3)C=NOH -OH 5,974 5,816
fla-4c -OH -OCH2CONHCH3 6,128 5,873
fla-5c -OH -OCH2CH3C=NOH 6,172 5,886
isofla-6b [103] -H -H 5,092 5,011
isofla-7c -OCH2CONHCH3 -OH 5,328 5,308
isofla-8c -OCH2CONHCH3 -H 5,367 5,341
isofla-9c -OCH2(CH3)C=NOH -OH 5,369 5,350
isofla-10c -OH -OCH2CONHCH3 5,502 5,452
isofla-11c -OH -OCH2CH3C=NOH 5,543 5,486
ZZL1 (*) -H -H 4,291(*) 4,291(*)
Flav-11(n) -OCH2CONHCH3 -OH 4,345 4,387
Flav-12(n) -OCH2CONHCH3 -OH 4,789 4,715
Flav-13(n) -OCH2(CH3)C=NOH -OH 4,963 4,960
Flav-14(n) -OH -OCH2CONHCH3 5,528 5,512
Flav-15(n) -OH -OCH2CH3C=NOH 5,530 5,513
ZZL2 (*) -H -H 4,123 (*) 4,123(*)
Flav-16(n) -OCH2CONHCH3 -OH 4,139 4,159
Flav-17(n) -OCH2CONHCH3 -OH 4,398 4,414
Flav-18(n) -OCH2(CH3)C=NOH -OH 4,615 4,870
Flav-19(n) -OH -OCH2CONHCH3 4,980 5,103
Flav-20(n) -OH -OCH2CH3C=NOH 5,100 5,231
115
(*) Giá trị thử nghiệm in vitro hoạt tính kháng ung thư trên tế bào Hela trong
nghiên cứu của chúng tôi.
Với ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-
O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.
Bằng các kỹ thuật tính toán cơ học phân tử, hóa lượng tử, hồi quy tuyến tính
và mạng thần kinh nhân tạo đã xây dựng mô hình quan hệ định lượng giữa cấu trúc
điện tử và hoạt tính sinh học kháng ung thư của nhóm flavone và isoflavone thành
công. Mô hình tuyến tính QESARMLR gồm 6 nguyên tử O1, O11, C3, C4, C6 và C7 và
mô hình nơ ron QESARANN có cấu trúc I(6)-HL(2)-O(1). Các mô hình tuyến tính đã
tìm được vị trí quan trọng C6 và C3’ để định hướng gắn thêm nhóm thế tạo ra các
hợp chất mới từ flavone, isoflavone và hợp chất ZZL1, ZZL2 phân lập có hoạt tính
cao hơn chất mẫu (Bảng 3.29).
3.4.2. Mô Hình QSDAR
Thiết kế phân tử flavone và isoflavone mới: Các cấu trúc của 12 flavone và
isoflavone mới được thiết kế từ các dẫn xuất mẫu flavone 22 và isoflavone 26 bằng
cách gắn thử nghiệm nhóm thế vào vị trí C6, C3 còn trống (Bảng 3.30).
Các giá trị hoạt tính pGI50 dự đoán từ các mô hình tuyến tính và mạng thần
kinh của các chất mới có hoạt tính cao hơn chất mẫu.
Tính toán hóa lượng tử, hồi quy tuyến tính và kỹ thuật thần kinh mờ đã được
sử dụng thành lập thành công mối quan hệ định lượng giữa hoạt tính kháng ung thư
pGI50 và độ dịch chuyển hóa học i của các nguyên tử oxy và cacbon từ dữ liệu phô
13C-NMR và 15O-NMR của các flavone và isoflavone. Mô hình tuyến tính
QSDARMLR với 7 biến số O1, O11, C2, C3, C6, C7 và C2’, mô hình mạng nơ ron
QSDARANN với cấu trúc I(7)-HL(2)-O(1) được sử dụng dự đoán chính xác hoạt tính
kháng ung thư của flavone và isoflavone trong nhóm kiểm tra. 18 dẫn xuất mới
được thiết kế từ vị trí C3, C6 và C7 còn trống của flavone 22 và isoflavone 26. Các
hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn flavone 22 và
isoflavone 26, tương ứng. Các mô hình QSDARMLR và QSDARANN đã phát triển là
tin cậy và có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50.
116
Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán
từ mô hình QSDARMLR (M1) và QSDARANN (M2)
Cấu trúc phân tử Nhóm thế pGI50,pr
M1 M2
flavone 22 [103] 5,3570 5,2808
1b, R1 = Me 5,4157 5,8444
2b, R1 = C6H5 5,3669 5,7736
3b, R1 = p-F- C6H4 5,3855 5,8263
4b, R1 = Me 6,0412 6,0728
5b, R1 = C6H5 6,0063 6,0622
6b, R1 = p-F- C6H4 5,9579 6,0535
7b, R1 = Me 7,5843 5,9761
8b, R1 = C6H5 7,5843 5,9749
9b, R1 = p-F- C6H4 7,6042 5,9863
isoflavone 26 [103] 5,0698 5,08715
10b, R1 = Me 5,1145 5,1742
11b, R1 = C6H5 5,0957 5,1716
12b, R1 = p-F- C6H4 5,0973 5,1724
13b, R1 = Me 5,8170 5,4754
14b, R1 = C6H5 5,7985 5,4744
15b, R1 = p-F- C6H4 5,8204 5,4704
16b, R1 = Me 7,2093 5,2362
17b, R1 = C6H5 7,1880 5,2312
18b, R1 = p-F- C6H4 7,1716 5,2219
3.4.3. Mô hình QSSRMLR
Các nghiên cứu ở trên các mô hình tuyến tính và mạng thần kinh
(QESARMLR, QSDARMLR, QSSRMLR) đã được đánh giá, kiểm tra về độ tin cậy,
chúng tôi tiến hành dự đoán tính chất hóa lý cũng như hoạt tính của một số hợp chất
có trong tự nhiên chưa biết hoạt tính được đưa ra trong tài liệu của Đỗ Tất Lợi [3].
Các hợp chất bao gồm dữ liệu về cấu trúc được cho ở Hình 3.17 và Hình 3.18.
117
O
O
OH
OH
OH
MeO
OMe
Ramnazin
O
O
OH
OH
OH
OH
OMe
Isoramnetin
;
Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2]
O
O
OH
OH
OMe
Woogonin (Scutelarin)
O
O
OH
RO
Baicalin (R là gốc acid)
O
O
OH
OH
OH
OMe
Scutelarein
O
O
OH
OH
OH
Baicalein
Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2]
118
Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn
xuất flavone và isoflavone tương tự được nghiên cứu từ mô hình QSSRMLR
Tính chất hóa lý và hoạt tính kháng ung thư pGI50 Phương Pháp
ARE,% QSSRMLR Tham khảo [15]
Mô hình QSSRMLR của fla-baicalein với R2tr = 0,970; R2
pr = 0,945; SE = 0,038
fla-baicalein = 0,01569 + 2,599 (fla-A3) – 1,607 (fla-A27)
Nhiệt chảy (Tm) ở 1 atm 920,448 927,250 0,734
Nhiệt độ tới hạn (Tc) 901,978 938,937 3,936
Mô hình QSSRMLR của fla-baicalin với R2tr = 0,954 ; R2
pr = 0,876; SE = 0,042
fla-baicalin = 0,01421+ 0,685 (fla-A14) – 0,338 (fla-A29)
Nhiệt chảy (Tm) ở 1 atm 851,541 757,617 12,397
Nhiệt độ tới hạn (Tc) 1050,039 952,636 10,225
Mô hình QSSRMLR của fla-isoramnetin với R2tr = 0,901; R2
pr = 0,838; SE = 0,079
fla-isoramnetin = 0,02726 + 1,094 (fla-A1) + 0,921 (fla-A16) + -1,019 (fla-A26)
Nhiệt chảy (Tm) ở 1 atm 736,333 812,173 9,338
Nhiệt độ tới hạn (Tc) 919,084 1006,060 8,645
Mô hình QSSRMLR của fla-ramnazin với R2tr = 0,890; R2
pr = 0,840; SE = 0,081
fla-ramnazin = 0,02519+ 0,947 (fla-A10) – 0,884 (fla-A25) + 0,898 (fla-A28)
Nhiệt chảy (Tm) ở 1 atm 1080,891 1074,690 0,577
Nhiệt độ tới hạn (Tc) 964,954 990,614 2,590
Mô hình QSSRMLR của fla-scutelarein với R2tr = 0,919; R2
pr = 0,840; SE = 0,055
fla-scutelarein = 0,02209 + 0,343 (fla-A6) + 0,617 (fla-A27)
Nhiệt chảy (Tm) ở 1 atm 983,841 1007,870 2,384
Nhiệt độ tới hạn (Tc) 925,409 969,420 4,540
Mô hình QSSRMLR của fla-woogonin với R2tr = 0,888; R2
pr = 0,859; SE = 0,074
fla-woogonin = 0,015+ 0,989 (fla-A7) -0,00236 (fla-A21)
Nhiệt chảy (Tm) ở 1 atm 920,448 927,250 0,734
Nhiệt độ tới hạn (Tc) 901,978 938,937 3,936
119
Các hợp chất tự nhiên được xây dựng lại cấu trúc trên phần mềm
HyperChem. Tối ưu hóa cấu trúc phân tử bằng cơ học phân tử MM+ (mức gradient
0,05, thuật toán Polak- Ribiere). Tính toán các tham số điện tích nguyên tử bằng
hóa học lượng tử bán thực nghiệm SCF PM3 trong HyperChem. Tính chất hóa hóa
lý được xác định từ phương trình bán thực nghiệm từ ChemOffice [15].
Mô hình QSSRMLR được xây dựng tương tự như đã trình bày ở mục 3.2.4 kết
quả được cho ở Bảng 3.31, các mô hình hồi quy tuyến tính (QSSRMLR) đều có các
giá trị thống kê phù hợp.
Phân tích ANOVA một yếu tố chỉ ra rằng kết quả dự đoán tính chất hóa lý
của các dẫn xuất flavone và isoflavone từ mô hình QSSRMLR không khác các giá trị
tính chất hóa lý tham khảo (Ftt = 0,004 < F0,05 = 4,149). Giá trị ARE, % nhận được từ
các mô hình QSSRMLR nằm trong khoảng sai số của các phép đo thực nghiệm. Sự khác
nhau giữa các giá trị thực nghiệm và các giá trị dự đoán từ mô hình là không đáng kể. Xây
dựng mô hình QSSRMLR đã dự đoán thành công tính chất hóa lý của các hợp chất tự nhiên
có cấu trúc tương tự. Hoạt tính pGI50 của các hợp chất tự nhiên dự đoán từ mô hình
QSSRMLR, QESARMLR, QSDARMLR được cho ở Bảng 3.32.
Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR
Hợp chất QSSRMLR QESARMLR QSDARMLR
fla-baicalein 6,504 6,491 5,129
fla-baicalin 6,018 6,928 4,716
fla-isoramnetin 5,701 5,446 5,078
fla-ramnazin 5,416 5,872 5,175
fla-scutelarein 5,294 6,945 5,829
fla-woogonin 5,594 5,583 6,69
So sánh khả năng dự đoán hoạt tính kháng ung thư pGI50 của 3 mô hình
tuyến tính QSSRMLR, QSDARMLR và QESARMLR bằng phân tích ANOVA một yếu
tố. Sự khác nhau giữa 3 mô hình là không có ý nghĩa (F = 2,374 < F0,05 = 6,359).
Các mô hình QSSRMLR đã dự đoán thành công hoạt tính kháng ung thư của nhóm
hợp chất tự nhiên.
120
Bằng kỹ thuật phân tích hồi quy tuyến tính đa biến số, các mô hình QSSRMLR
(các phương trình từ 3.21 đến 3.26) được xây dựng dựa trên mối quan hệ cấu trúc
3D với nhau. Các tham số cấu trúc 3D bao gồm: LogP, ABSQ, ABSQon, Dipole;
MaxHp, MaxNeg, MaxQp, Ovality, Polarizability, SpcPolarizability, Surface,
Volume. Với các mô hình QSSRMLR xây dựng được, lần lượt thay thế giá trị nhiệt
độ nóng chảy của các hợp chất đã biết (biến độc lập x) ta dự báo được giá trị nhiệt
độ nóng chảy chưa biết của các hợp chất mục tiêu (biến phụ thuộc Y).
Các mô hình QSSRMLR (các phương trình từ 3.21 đến 3.26) của các hợp chất
flavonoid phân lập được sử dụng để dự đoán nhiệt độ nóng chảy của các hợp chất
phân lập Bảng 3.33. Nhiệt độ nóng chảy thực nghiệm được so sánh với giá trị dự
đoán với giá trị sai số trung bình MARE, % là 0,243 % cho thấy khả năng dự báo rất
tốt của các mô hình QSSRMLR.
Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của
các dẫn xuất flavonoid chiết xuất.
Hợp chất Tm (oC) ARE, %
Thực nghiệm QSSRMLR QSSRMLR
CSL1 256,500 257,646 0,447
POL1 327,500 327,607 0,033
ZZL1 249,500 248,456 0,418
ZZL2 112,500 112,688 0,167
AIL1 315,000 315,236 0,075
GML1 247,000 247,789 0,319
MARE, % 0,243
Với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là
quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-
O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô
và gừng gió.
Mô hình QSSRMLR của CSL1 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,00081
CSL1 = - 0,019 + 1,681(POL1) - 1,377(ZZL1) + 0,450(ZZL2) (3.21)
121
Mô hình QSSRMLR của AIL1 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,0001030
AIL1 = 0,095 - 0,424(CSL1) + 1,059(POL1) + 0,244(ZZL2) (3.22)
Mô hình QSSRMLR của GML1 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,000906
GML1 = 0,051 + 0,522(CSL1)+0,412(POL1) - 0,187(ZZL2) (3.23)
Mô hình QSSRMLR của POL1 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,00010
POL1 = 0,007 + 0,429(CSL1) + 1,120(ZZL1) - 0,329(ZZL2) (3.24)
Mô hình QSSRMLR của ZZL1 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,00014
ZZL1 = - 0,002 - 0,280(CSL1) + 0,812(POL1) + 0,218(ZZL2) (3.25)
Mô hình QSSRMLR của ZZL2 với R2tr = 0,999; R2
pr = 0,999; MSE = 0,0005345
ZZL2 = - 1,332 - 7,023(CSL1) + 11,524(POL1) - 5,900(AIL1)
3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1)
Hoạt tính pGI50 của hợp chất ZZL1 và ZZL2 được dự đoán từ các mô hình
QSARMLR (3.16), phương trình 3.16 và QSARANN(1), được thể hiện trong Bảng 3.34.
So sánh khả năng dự báo của các mô hình QSARMLR (3.16) và QSARANN (1) qua giá
trị phần trăm sai số ARE,% (Bảng 3.34). Một lần nữa chúng tôi khẳng định rằng các
mô hình QSARMLR (3.16) và QSARANN (1) xây dựng theo mục 3.2.5 có khả năng dự
báo rất tốt hoạt tính kháng ung thư của các hợp chất tự nhiên.
Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các
mô hình QSARMLR (3.16) và QSARANN(1)
Hợp chất pGI50,exp pGI50,pr ARE,%
QSARMLR (3.16) QSARANN(1) QSARMLR
(3.17)
QSARANN(1)
ZZL1 4,291 4,136 4,251 3,612 0,932
ZZL2 4,123 4,017 4,109 2,571 0,340
Trong công trình này, chúng tôi lựa chọn hợp chất phân lập là ZZL1, ZZL2
với các vị trí còn trống C6, C2’ và C3’ như là một hợp chất mẫu để thiết kế 10 hợp
chất mới, các vị trí C6, C2’ và C3’ được gắn các nhóm thế mới. Hoạt tính sinh học
pGI50 của các hợp chất mới thiết kế được dự đoán bằng mô hình QSARANN(1), được
đưa ra trong Bảng 3.35.
122
Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình
QSARANN(1
Hợp chất mới C6 C2’ C3’ pGI50 Phương ppháp
ZZL1 H H H 4,291 Công trình này
flav-1(n) H CH3 H 5,781 QSARANN(1)
flav-2(n) CH3CO- H OCH3 6,155 QSARANN(1)
flav-3(n) CH3CO- OCH3 H 6,158 QSARANN(1)
flav-4(n) CH3 OCH3 H 6,488 QSARANN(1)
flav-5(n) CH3 H OCH3 6,538 QSARANN(1)
Hợp chất mới C6 C2’ C3’ pGI50 Phương pháp
ZZL2 H H H 4,123 Công trình này
flav-6(n) H CH3 H 4,231 QSARANN(1)
flav-7(n) CH3 OCH3 H 4,634 QSARANN(1)
flav-8(n) CH3CO- H OCH3 4,639 QSARANN(1)
flav-9(n) CH3CO- OCH3 H 5,238 QSARANN(1)
flav-10(n) CH3 H OCH3 5,424 QSARANN(1)
Ký hiệu (n) là chất mới; ZZL1 là kaempferol-3-O-methylether và ZZL2 là
kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.
ZZL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)
2
3
4
5
6
7
pG
I 50
Hop chat flavonoid
ZZL2 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
2
3
4
5
6
pG
I 50
Hop chat flavonoid
a) b)
Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2
Kết quả dự đoán giá trị pGI50 của các hợp chất mới được chuyển đôi về giá
trị GI50 (µM) và so sánh với giá trị thực nghiệm của ZZL1, ZZL2 xem Hình 3.19.
Hoạt tính GI50 (µM) của 10 hợp chất mới bằng cách gắn nhóm thế vào các vị trí C6,
123
C2’ và C3’ của ZZL1 và ZZL2 cao hơn hợp chất mẫu tương ứng. Từ đây, các hợp
chất mới thiết kế hứa hẹn trong tông hợp các dược phẩm mới từ hợp chất tự nhiên.
3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN
Sau khi tách hai chất flavonoid luteolin và daidzin, hoạt tính sinh học pGI50
đã được tiến hành để kiểm tra độc tính in vitro đối với tế bào Hela trong phòng thí
nghiệm sinh học phân tử, trường đại học khoa học tự nhiên, TP. HCM.
Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập
luteolin và daidzin từ các mô hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN
Hợp chất pGI50.exp pGI50,pr ARE.%
M1 M2 M3 M1 M2 M3
luteolin 4,755 4,634 4,715 4,739 2,545 0,841 0,336
daidzin 4,723 4,671 4,729 4,692 1,101 0,127 0,656
(Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR; M3 là mô
hình QSARPCA-ANN).
POL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)
2
3
4
5
6
7
pG
I 50
Hop chat flavonoid
GML1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
2
3
4
5
6
7
pG
I 50
Hop chat flavonoid
a) b)
Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a)
POL1; b) GML1
Các hoạt tính sinh học pGI50 của các chất luteolin và daidzin tính toán từ các
mô hình QSARMLR (3.17) phương trình 3.17, QSARPCR và QSARPCA-ANN được trình
bày trong Bảng 3.3 . Trong nghiên cứu này, chúng tôi chọn luteolin với các vị trí
trống C6, C2' và C3' làm hợp chất mẫu để thiết kế 5 hợp chất mới khác nhau. Các vị
trí C6, C2' và C3' được gắn các nhóm thế mới.
124
Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô
hình QSARPCA-ANN )
Flavonoid C6 C2’ C3’ pGI50 Phương pháp
POL1 H H H 4.755 Công trình này
flav-1(n) H NO2 H 5,781 QSARPCA-ANN
flav-2(n) CH3CO- H NO2 6,155 QSARPCA-ANN
flav-3(n) CH3CO- NO2 H 6,158 QSARPCA-ANN
flav-4(n) NO2 NO2 H 6,488 QSARPCA-ANN
flav-5(n) NO2 H NO2 6,538 QSARPCA-ANN
Flavonoid C6 C2’ C3’ pGI50 Phương pháp
GML1 H H H 4.723 Công trình này
flav-6(n) H NO2 H 5,238 QSARPCA-ANN
flav-7(n) NO2 H H 5,413 QSARPCA-ANN
flav-8(n) CH3CO- H HO- 5,987 QSARPCA-ANN
flav-9(n) NO2 H H 6,176 QSARPCA-ANN
flav-10(n) HO- H NO2 6,376 QSARPCA-ANN
Với (n) là chất mới, GML1 là daidzin, POL1 là luteolin phân lập từ đậu
nành, tía tô.
Hoạt tính sinh học pGI50 của flavonoid mới thiết kế đã được dự đoán bằng
cách sử dụng mô hình QSARPCA-ANN như trong Bảng 3.37, Hình 3.20. Kết quả dự
đoán hoạt tính sinh học pGI50 đối với các chất mới được so sánh với hoạt tính thử
nghiệm của POL1 và GML1, như được mô tả trong Hình 3.20. Hoạt tính kháng ung
thư của năm hợp chất mới được thiết kế bằng cách gắn nhóm thế vào các vị trí C6,
C2' và C3 của luteolin mạnh hơn hoạt tính của POL1 và GML1. Các hợp chất mới
được thiết kế nhằm tạo ra các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên
có hoạt tính sinh học được cải thiện.
3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2)
Sau khi phân lập hai flavonoid cynarosid và quercetin, chúng tôi tiến hành
kiểm tra độc tính in vitro đối với tế bào Hela của chúng trong phòng thí nghiệm sinh
học phân tử, Trường Đại Học Khoa Học Tự Nhiên, TP. Hồ Chí Minh. Hoạt tính
125
pGI50 của hai flavonoid này cũng được dự đoán từ các mô hình QSARMLR (3.19),
QSARPLS và QSARANN (2), như trình bày trong Bảng 3.38.
Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR
(3.19), QSARPLS (3.20) và QSARANN (2)
Hợp chất pGI50,exp pGI50,pred ARE, %
M1 M2 M3 M1 M2 M3
CSL1 4,977 5,191 4,912 5,017 4,300 1,306 0,804
AIL1 4,859 4,681 4,675 4,740 3,663 3,787 2,449
Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS (3.20);
M3 là mô hình QSARANN(2).
Trong nghiên cứu này, chúng tôi chọn quercetin flavonoid với các vị trí C6
và C3' còn trống làm hợp chất mẫu để thiết kế năm hợp chất mới. Các nhóm thế
được gắn vào hai vị trí trống C6 và C3’ , như thể hiện trong Bảng 3.38.
Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn
nhóm thế vào vị trí C6, C3’ của quercetin, dự đoán từ mô hình QSARANN(2)
Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ pGI50 Phương pháp
AIL1 -H -H 4,859 Công trình này
Fla-1(n) -OCH2CONHCH3 -OH 5,382 M3
Fla-2(n) -OCH2CONHC6H4F -H 5,382 M3
Fla-3(n) -OH -OCH2CONHCH3 5,385 M3
Fla-4(n) -OCH2(CH3)C=NOH -OH 5,385 M3
Fla-5(n) -OCH2CONHC6H4OCH3 -H 5,385 M3
Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ pGI50 Phương pháp
CSL1 H H 4,977 Công trình này
flav-6(n) -OCH2CONHCH3 -OH 5,537 M3
flav-7(n) -OH -OCH2CONHCH3 5,612 M3
flav-8(n) -OCH2CONHC6H4F -H 5,613 M3
flav-9(n) -OCH2CONHC6H4OCH3 -H 5,635 M3
flav-10(n) -OCH2(CH3)C=NOH -OH 5,665 M3
126
Với (n) là chất mới; M3 là mô hình QSARANN(2); CSL1 là cynaroside, AIL1
là quercetin phân lập từ actiso, xa kê.
Các hợp chất được thiết kế mới cũng dự đoán với các hoạt tính sinh học
pGI50 sử dụng mô hình QSARANN (2). Sau đó, các hoạt tính dự báo pGI50 đã được
chuyển về dạng ban đầu GI50 (μM), như Bảng 3.39.
Các kết quả dự đoán pGI50 đối với các chất mới so sánh với hoạt tính thử
nghiệm của hợp chất AIL1 và CSL1 mẫu, trong (Hình 3.21). Do đó, các hợp chất
mới với nhóm thế ở vị trí C6 và C3' trong phân tử quercetin cho thấy hoạt tính mạnh
hơn GI50 (μM) so với mẫu. Ở đây, các hợp chất được thiết kế mới sẽ hứa hẹn đưa ra
một kế hoạch thiết kế cho các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên.
AIL1 Fla-1(n) Fla-2(n) Fla-3(n) Fla-4(n) Fla-5(n)
2
3
4
5
6
7
pG
I 50
Hop chat flavonoid
CSL1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)
2
3
4
5
6
7
pG
I 50
Hop chat flavonoid
a) b)
Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu
a) AIL1; b) CSL1
127
KẾT LUẬN VÀ KIẾN NGHỊ
KẾT LUẬN
Luận án đã đạt được các mục tiêu đề ra:
1) tính toán và sàng lọc được các tham số cấu trúc phân tử ảnh hưởng đến
hoạt tính kháng ung thư bao gồm: các tham số điện tích (O1, O11, C3, C4, C6 và C7),
các tham số độ dịch chuyển hóa học (O1, O11, C2, C3, C6, C7 và C2’); các tham số 2D
và 3D (xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP; MaxQp,
SdO, ka3, LogP, Ovality và SdssC)
2) Đã xây dựng được các mô hình QSAR có khả năng dự báo rất tốt hoạt tính
kháng ung thư gồm: mô hình QESARMLR, QESARANN, QSDARMLR, QSDARANN,
QSSRMLR, QSARMLR (3.16), QSARMLR (3.17), QSARPCA-ANN, QSARMLR (3.19),
QSARPLS (3.20), QSARANN(1), QSARANN(2).
3) Đã phân lập và sàng lọc được các dẫn xuất flavonoid có nguồn gốc tự
nhiên có hoạt tính kháng ung thư gồm 6 hợp chất daidzin, luteolin, cynaroside,
quercetin, kaempferol-3-O-methylether và kaempferol-3-O-(2,4-O-diacetyl-alpha-l-
rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió..
4) Đã thử nghiệm in vitro hoạt tính kháng ung thư của các dẫn xuất flavonoid
phân lập.
5) Đã đánh giá hoạt tính kháng ung thư, tính chất hóa lý, của các dẫn xuất
flavonoid của các dẫn flavonoid phân lập.
6) Đã nghiên cứu, thiết kế các dược chất mới bằng cách gắn các nhóm thế
quan trọng vào các vị trí phân tử ảnh hưởng lớn đến hoạt tính ung thư gồm các vị trí
C3, C6 và C7 và C3’ và các nhóm thế -OCH2CONHC6H4F; -
OCH2CONHC6H4OCH3; -OCH2(CH3)C=NOH; -OCH2CONHCH3; -
OCH2CH3C=NOH; CH3CO- ; -CH3 ; -OCH3; -NO2; -OH.
7) Đã sàng lọc được các hợp chất mới có hoạt tính kháng ung thư cao hơn
hợp chất ban đầu.
128
KIẾN NGHỊ
Những kết quả đạt được trong luận án đã mở ra những định hướng nghiên
cứu triển vọng có thể tiếp cận trong thời gian tới: 1) Mở rộng các kỹ thuật xây dựng
mô hình QSAR. 2) Tiến hành tông hợp các dẫn xuất flavonoid mới
129
DANH MỤC CÔNG TRÌNH
1. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van
Trung, Hoang Thi Kim Dung, Pham Van Tat (2015), "Prediction of
anticancer activities of luteolin flavonoid daidzin in leaf of plants Perilla
ocymoides L. flavonoid Glucine max L. using 2D, 3D descriptors", Viet Nam
Journal of Chemistry, 6e4(53), pp, 232-239.
2. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Vo Thanh Cong, Phung Van
Trung, Hoang Thi Kim Dung, Tran Duong, Pham Van Tat (2016),
"Anticancer agents of kaempferol-3-O-methylether flavonoid kaempferol-3-
O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) in leaf of plants Zingiber
zerumbet Sm. using 2D, 3D descriptors", Viet Nam Journal of Chemistry,
54(6), pp, 710-718.
3. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van
Trung, Nguyen Minh Quang, Hoang Thi Kim Dung, Pham Van Tat, (2016),
"Prediction of anticancer activities of cynaroside flavonoid quercetin in leaf
of plants Cynara scolymus L. flavonoid Artocarpus incisa L. using structure–
activity relationship", Cogent Chemistry Taylor & Francis 2(1), pp, 1-12.
4. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần
Dương, Phạm Văn Tất (2017), "Nghiên cứu hoạt tính kháng ung thư của
kaempferol-1, daidzin từ Zingiber zerumbet Sm. và Glucine max L. sử dụng
các tham số mô tả phân tử 2D và 3D", Tạp Chí Khoa học và Công nghệ
Trường Đại học Khoa Học Huế: Khoa học Tự nhiên, pp. 1-10. (Đã có giấy
nhận đăng)
5. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần
Dương, Phạm Văn Tất (2017), " Dự báo hoạt tính kháng ung thư cô tử cung
của các hợp chất flavonoid phân lập từ Cynara scolymus L. Và Artocarpus
incisa L. Sử dụng mô hình QSAR 2D và 3D ", Tạp chí khoa học đại học
Huế, 126 (S 1D), pp. 1-9.
130
6. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,
Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "In silico Modelling of
2D, 3D Molecular Descriptors for Prediction Of Anticancer Activities Of
Luteolin And Daidzin From Plants Perilla ocymoides L and Glucine max L",
Organic & Medicinal Chemistry International Journal (OMCIJ), pp. 1-13.
ISSN: 2474-7610.
7. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,
Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "Prediction Of
Anticancer Activities Of Kaempferol-3-O-Methylether And Kaempferol-3-
O-(2,4-O-Diacetyl-Alpha-L-Rhamnopyranoside) Isolating From Plant
Rhizome Zingiber Zerumbet Sm using QSDAR Models from 13C-NMR and
15O-NMR Simulation Spectra Data", Organic & Medicinal Chemistry
International Journal (OMCIJ), pp. 1-15. ISSN: 2474-7610.
8. Thuy, B.T.P., Chau, H.V., Dai, T.T., Nhung, N.T.A., Trung, P.V., Dung,
H.T.K., Duong, T., Tat, P.V. (2018), "Appreciation of cytotoxic activity on
hela cell of flavonoid derivatives using multiple linear regression and
artificial neural network", The 4th International Integated (Web & offline)
Conference & Concert on Convergence (IICCC2018) (ISSN 2384-4418), 4,
pp. 323-332.
131
TÀI LIỆU THAM KHẢO
1. Hồng, N.T. (2007), Các phương pháp phổ trong hóa hữu cơ, NXB Khoa học
và kỹ thuật,Hà Nội
2. Lợi, Đ.T. (2009), Những cây thuốc và vị thuốc Việt Nam,Hà Nội, NXB Khoa
học kỹ thuật.
3. Phụng, N.K.P. (2007), Phương pháp cô lập hợp chất hữu cơ ĐHQG-HCM
4. Phụng, N.K.P. (2005), Phổ NMR sử dụng trong phân tích hữu cơ, NXB ĐH
Quốc gia TP. HCM.
5. 6543Wang, D., Zhang, M., Li, Z., Song, C., Fu, M., Li, J., Chen, X. (2017),
"System impairment compensation in coherent optical communications by
using a bio-inspired detector based on artificial neural network and genetic
algorithm", Optics Communications, 399, pp. 1-12.
6. Avendaño, C.,Menéndez, J.C. (2015), Chapter 1 - General Aspects of
Cancer Chemotherapy, in Medicinal Chemistry of Anticancer Drugs (Second
Edition)Elsevier, Boston, pp. 1-22.
7. Balaga, H., Gupta, N.,Vishwakarma, D.N. (2015), "GA trained parallel
hidden layered ANN based differential protection of three phase power
transformer", International Journal of Electrical Power & Energy Systems,
67, pp. 286-297.
8. Barbour, L.J. (2017), 2.03 - Single-Crystal X-ray Diffraction A2 - Atwood,
Jerry L, in Comprehensive Supramolecular Chemistry IIElsevier, Oxford,
pp. 23-43.
9. Bastien, P., Vinzi, V.E.,Tenenhaus, M. (2005), "PLS generalised linear
regression", Computational Statistics & Data Analysis, 48(1), pp. 17-46.
10. Beheshti, A., Pourbasheer, E., Nekoei, M., Vahdani, S. (2016), "QSAR
modeling of antimalarial activity of urea derivatives using genetic algorithm–
multiple linear regressions", Journal of Saudi Chemical Society, 20(3), pp.
282-290.
132
11. Bharathi, S., Devasena, T., Arivarasan, A., Pachaiappan, R. (2016),
"Extraction and isolation of flavonoid quercetin from the leaves of trigonella
foenum-graecum and their anti-oxidant activity", International Journal of
Pharmacy and Pharmaceutical Sciences, 8(6).
12. Birt, D.F., Hendrich, S.,Wang, W. (2001), "Dietary agents in cancer
prevention: flavonoids and isoflavonoids", Pharmacology & Therapeutics,
90(2–3), pp. 157-177.
13. BMDPnewsystem2.0 (2003), Statistical Solutions Ltd.,USA.
14. Bodor, N.,Huang, M.J. (1992), "An extended version of a novel method for
the estimation of partition coefficients", J Pharm Sci, 81(3), pp. 272-281.
15. CambridgeSoftCorporation (2008), CS Chem3D Ultra,USA.
16. Cao, W., Wang, X., Ming, Z., Gao, J. (2017), "A review on neural networks
with random weights", Neurocomputing, pp. 1-50.
17. Chen, B., Zhang, T., Bond, T., Gan, Y. (2015), "Development of quantitative
structure activity relationship (QSAR) model for disinfection byproduct
(DBP) research: A review of methods and resources", Journal of Hazardous
Materials, 299, pp. 260-279.
18. Chen, I.L., Chen, J.Y., Shieh, P.C., Chen, J.J., Lee, C.H., Juang, S.H., Wang,
T.C. (2008), "Synthesis and antiproliferative evaluation of amide-containing
flavone and isoflavone derivatives", Bioorg Med Chem, 16(16), pp. 7639-
7645.
19. Christensen, L.P.,Christensen, K.B. (2014), Chapter 23 - The Role of Direct
and Indirect Polyphenolic Antioxidants in Protection Against Oxidative
Stress, in Polyphenols in Human Health and DiseaseAcademic Press, San
Diego, pp. 289-309.
20. Corcoran, M.P., McKay, D.L.,Blumberg, J.B. (2012), "Flavonoid basics:
chemistry, sources, mechanisms of action, and safety", J Nutr Gerontol
Geriatr, 31(3), pp. 176-189.
133
21. De Gregorio, M.,Giordano, M. (2017), "Background estimation by
weightless neural networks", Pattern Recognition Letters, 96, pp. 55-65.
22. Devillers, J. (1996), 1 - Strengths and Weaknesses of the Backpropagation
Neural Network in QSAR and QSPR Studies, in Neural Networks in QSAR
and Drug DesignAcademic Press, London, pp. 1-46.
23. El Zoghbi, M., Salameh, P., Stücker, I., Paris, C., Pairon, J.C., Gislard, A.,
Siemiatycki, J., Bonneterre, V., Clin, B., Brochard, P., Delva, F., Lacourt, A.
(2017), "Phenotypes of lung cancer and statistical interactions between
tobacco smoking and occupational exposure to asbestos and crystalline silica
from a large case-only study: The CaProMat study", Lung Cancer, 112, pp.
140-155.
24. Farid, M.M., Hussein, S.R., Ibrahim, L.F., El Desouky, M.A., Elsayed, A.M.,
El Oqlah, A.A., Saker, M.M. (2015), "Cytotoxic activity and phytochemical
analysis of Arum palaestinum Boiss", Asian Pacific Journal of Tropical
Biomedicine, 5(11), pp. 944-947.
25. Feliu, M.,Keiji, M. (1995), "IMOMM: A new integrated ab initio +
molecular mechanics geometry optimization scheme of equilibrium
structures and transition states", Journal of Computational Chemistry, 16(9),
pp. 1170–1179.
26. Fucic, A., Guszak, V.,Mantovani, A. (2017), "Transplacental exposure to
environmental carcinogens: Association with childhood cancer risks and the
role of modulating factors", Reproductive Toxicology, 72, pp. 182-190.
27. Galbas, M., Porzucek, F., Wozniak, A., Slomski, R., Selwet, M. (2013),
"Isolation of low-molecular albumins of 2S fraction from soybean (Glycine
max (L.) Merrill)", Acta Biochim Pol, 60(1), pp. 107-110.
28. Gasteiger, J.,Marsili, M. (1980), "Iterative partial equalization of orbital
electronegativity—a rapid access to atomic charges", Tetrahedron, 36(22),
pp. 3219-3228.
134
29. Ghahari, S., Alinezhad, H., Nematzadeh, G.A., Tajbakhsh, M., Baharfar, R.
(2017), "Chemical Composition, Antioxidant and Biological Activities of the
Essential Oil and Extract of the Seeds of Glycine max (Soybean) from North
Iran", Curr Microbiol, 74(4), pp. 522-531.
30. Ghamali, M., Chtita, S., Ousaa, A., Elidrissi, B., Bouachrine, M., Lakhlifi, T.
(2017), "QSAR analysis of the toxicity of phenols and thiophenols using
MLR and ANN", Journal of Taibah University for Science, 11(1), pp. 1-10.
31. Giau, L.H., Nha To, N.N., Thi, N.D.T., Quang That, T.Q., Phung, N.K.P.,
Nguyen, P.T.K., Duus, F. (2015), "Biological test against breast
adenocarcinoma cells (MCF-7) of acylated products of 3-methyl-4-
thiorhodanine", Journal of Science & Technology Development, 8(1), pp.
63-69.
32. Grce, M. (2009), "Primary and secondary prevention of cervical cancer",
Expert Rev Mol Diagn, 9(8), pp. 851-857.
33. Griffon, G., Merlin, J.L.,Marchal, C. (1995), "Comparison of sulforhodamine
B, tetrazolium and clonogenic assays for in vitro radiosensitivity testing in
human ovarian cell lines", Anticancer Drugs, 6(1), pp. 115-123.
34. Gründer, Y.,Lucas, C.A. (2016), "Surface X-ray diffraction studies of single
crystal electrocatalysts", Nano Energy, 29, pp. 378-393.
35. Hanh, N.T.M., Phung, N.K.P.,Phuong, Q.N.D. (2017), "Studying on
Tyrosinase Inhibition Activity of Some Vietnamese Folk Plants Aims to Use
in Skin-Whitening Cosmetics", American Journal of Plant Sciences, 8(6).
36. Harry, W. (1947), "Structural determination of paraffin boiling points",
Journal of the American Chemical Society, 69(1), pp. 17-20.
37. Hossain, M.A.,Mizanur, R.S.M. (2015), "Isolation and characterisation of
flavonoids from the leaves of medicinal plant Orthosiphon stamineus",
Arabian Journal of Chemistry, 8(2), pp. 218-221.
38. Hypercube, I. (2002), HyperChem computational chemistry, Hypercube, Inc.
135
39. Hypercube.Inc. (2008), HyperChem Release 8.03 for Windows, Gainesville,
Florida, USA.
40. INFormv2.0 (2000), Intelligentsys Ltd.,UK. .
41. Jalal, T.K., Ahmed, I.A., Mikail, M., Momand, L., Draman, S., Isa, M.L.,
Abdull Rasad, M.S., Nor Omar, M., Ibrahim, M., Abdul Wahab, R. (2015),
"Evaluation of antioxidant, total phenol and flavonoid content and
antimicrobial activities of Artocarpus altilis (breadfruit) of underutilized
tropical fruit extracts", Appl Biochem Biotechnol, 175(7), pp. 3231-3243.
42. Jang, D.S., Han, A.R., Park, G., Jhon, G.J., Seo, E.K. (2004), "Flavonoids
and aromatic compounds from the rhizomes of Zingiber zerumbet", Arch
Pharm Res, 27(4), pp. 386-389.
43. Jung, S.K.,McDonald, K. (2011), "Visual gene developer: a fully
programmable bioinformatics software for synthetic gene optimization",
BMC Bioinformatics, 12, pp. 340.
44. Kalailingam, P., Balasubramanian, K., Kannaian, B., Mohammed, A.K.N.,
Meenakshisundram, K., Tamilmani, E., R., K. (2013), "Isolation and
quantification of flavonoids from ethanol extract of Costus igneus rhizome
(CiREE) and impact of CiREE on hypoglycaemic, electron microscopic
studies of pancreas in streptozotocin (STZ)-induced diabetic rats",
Biomedicine & Preventive Nutrition, 3(3), pp. 285-297.
45. Kamdem, W.A.F., Coombes, P.H., Mulholland, D.A., Nkengfack, A.E.,
Fomum, Z.T. (2006), "Flavones and isoflavones from the west African
Fabaceae Erythrina vogelii", Phytochemistry, 67(5), pp. 459-463.
46. Keepers, Y.P., Pizao , P.E., Peters, G.J., Van Ark-Otte, J., Winograd, B.,
Pinedo, H.M. (1991), "Comparison of the sulforhodamine B protein and
tetrazolium (MTT) assays for in vitro chemosensitivity testing", European
Journal of Cancer and Clinical Oncology, 27(7), pp. 897-900.
47. Keyser, E.A., Staat, B.C., Fausett, M.B., Shields, A.D. (2012), "Pregnancy-
Associated Breast Cancer", Rev Obstet Gynecol, 5(2), pp. 94-99.
136
48. Kier, L., Hall, H.,Lowell (1991), The Molecular Connectivity Chi Indices
and Kappa Shape Indices in Structure-Property Modeling. Vol. 2. VCH
publishers New York
49. Kier, L., Hall, H.,Lowell (1986), Molecular connectivity in structure-activity
analysis Vol. 10. Wiley & Sons, Inc.
50. Konar,Amit (2005), Computational Intelligence, Springer.
51. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 2 Statistical Methods in
QSAR/QSPR, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in
Molecular Science, pp. 37-59.
52. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 1 QSAR/QSPR
Methods, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in
Molecular Science, pp. 61-103.
53. Lapčík, O., Kle dus, B., Kokoška, L., Davidová, M., Afandi, K., Kubáň, V.,
Hampl, R. (2005), "Identification of isoflavones in Acca sellowiana and two
Psidium species (Myrtaceae)", Biochemical Systematics and Ecology,
33(10), pp. 983-992.
54. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line
concentration of flavonoids in Brassica oleracea by capillary electrophoresis
using large volume sample stacking", Food Chemistry, 133(1), pp. 205-211.
55. Li-ping, Q., Guo-rong, F., Jin-yong, P., He-ming, M. (2007), "Isolation of six
isoflavones from Semen sojae praeparatum by preparative HPLC",
Fitoterapia, 78(3), pp. 200-204.
56. López-Molina, D., Heering, H.A., Smulevich, G., Tudela, J., Thorneley,
R.N.F., Garcıa-Cánovas, F., Rodrıguez-López, J.N. (2003), "Purification and
characterization of a new cationic peroxidase from fresh flowers of Cynara
scolymus L", Journal of Inorganic Biochemistry, 94(3), pp. 243-254.
57. Lopez, C.S., Krauskopf, E., Villota, C.E., Burzio, L.O., Villegas, J.E. (2017),
"Cervical cancer, human papillomavirus and vaccines: assessment of the
137
information retrieved from general knowledge websites in Chile", Public
Health, 148, pp. 19-24.
58. Maresso, K.C.,Hawk, E. (2016), "Cancer Prevention Recommendations:
Impact of Adherence", Seminars in Oncology Nursing, 32(3), pp. 306-313.
59. Markham, K.R. (1975), Chapter 1 Isolation Techniques for Flavonoids, in
The FlavonoidsSpringer US, pp. 1-44.
60. Martin, J.F., Paul, A.B.,Martin, K. (1990), "A combined quantum
mechanical and molecular mechanical potential for molecular dynamics
simulations", Journal of Computational Chemistry, 11(6), pp. 700–733.
61. Molugaram, K.,Rao, G.S. (2017), Chapter 11 - ANOVA (Analysis of
Variance), in Statistical Techniques for Transportation
EngineeringButterworth-Heinemann, pp. 451-462.
62. Naik, P.P., Das, D.N., Panda, P.K., Mukhopadhyay, S., Sinha, N., Praharaj,
P.P., Agarwal, R., Bhutia, S.K. (2016), "Implications of cancer stem cells in
developing therapeutic resistance in oral cancer", Oral Oncology, 62, pp.
122-135.
63. P., B., V.V., S.,M., T. (2005), "PLS Generalised Regression. Computational
Statistics and Data Analysis" 48, pp. 17-46.
64. Pauwels, B., Korst, A.E., de Pooter, C.M., Pattyn, G.G., Lambrechts, H.A.,
Baay, M.F., Lardon, F., Vermorken, J.B. (2003), "Comparison of the
sulforhodamine B assay and the clonogenic assay for in vitro chemoradiation
studies", Cancer Chemother Pharmacol, 51(3), pp. 221-226.
65. Perez, R.P., Godwin, A.K., Handel, L.M., Hamilton, T.C. (1993), "A
comparison of clonogenic, microtetrazolium and sulforhodamine B assays
for determination of cisplatin cytotoxicity in human ovarian carcinoma cell
lines", Eur J Cancer, 29A(3), pp. 395-399.
66. QSARIS1.0 (2001), Statistical Solutions Ltd.,USA.
138
67. Raffa, D., Maggio, B., Raimondi, M.V., Plescia, F., Daidone, G. (2017),
"Recent discoveries of anticancer flavonoids", European Journal of
Medicinal Chemistry.
68. Rawat, P., Saroj, L.M., Kumar, A., Singh, T.D., Tewari, S.K., Pal, M.
(2016), "Phytochemicals and Cytotoxicity of Launaea procumbens on
Human Cancer Cell Lines", Pharmacogn Mag, 12(Suppl 4), pp. S431-S435.
69. Raza, A.,Zhong, M. (2017), "Lane-based short-term urban traffic forecasting
with GA designed ANN and LWR models", Transportation Research
Procedia, 25, pp. 1430-1443.
70. Rebecca, L.S., Kimberly, D.M.,Ahmedin, J. (2015), "Cancer Statistic, 2015",
CA: A Cancer journal for Clinicians, 65(1), pp. 5-29.
71. Rebecca, S., Deepa, N.,Ahmedin, J. (2012), "Cancer statistics, 2012", CA: A
Cancer journal for Clinicians, 62(1), pp. 10-29.
72. Roy, K.,Ambure, P. (2016), "The “double cross-validation” software tool for
MLR QSAR model development", Chemometrics and Intelligent Laboratory
Systems, 159, pp. 108-126.
73. Roy, K., Kar, S.,Das, R.N. (2015), Chapter 7 - Validation of QSAR Models,
in Understanding the Basics of QSAR for Applications in Pharmaceutical
Sciences and Risk AssessmentAcademic Press, Boston, pp. 231-289.
74. Sak, K. (2014), "Cytotoxicity of dietary flavonoids on different human
cancer types", Pharmacogn Rev, 8(16), pp. 122-146.
75. Sarawek, S., Feistel, B., Pischel, I., Butterweck, V. (2008), "Flavonoids of
Cynara scolymus possess potent xanthinoxidase inhibitory activity in vitro
but are devoid of hypouricemic effects in rats after oral application", Planta
Med, 74(3), pp. 221-227.
76. Sarkhosh, M., Khorshidi, N., Niazi, A., Leardi, R. (2014), "Application of
genetic algorithms for pixel selection in multivariate image analysis for a
QSAR study of trypanocidal activity for quinone compounds and design new
139
quinone compounds", Chemometrics and Intelligent Laboratory Systems,
139(Supplement C), pp. 168-174.
77. Sarosh, A.,Yun-Feng, D. (2016), "The GA-ANN expert system for mass-
model classification of TSTO surrogates", Aerospace Science and
Technology, 48, pp. 146-157.
78. Saxena, V.K.,Aprajita, G. (2008), "Isolation and study of the flavone
glycoside; luteolin-7- O-β-d-glucopyranoside from the seeds of the capparis
decidua (forsk)", International journal chemical sciences, 6(1), pp. 7-10.
79. Shan, Y. (2016), Chapter 4 - Isolation and Structural Identification of
Flavonoids From Citrus, in Comprehensive Utilization of Citrus By-
ProductsAcademic Press, pp. 59-64.
80. Si, Y.L., Jin, C.C., Li, Q.Y.S., Kang, C.Z. (2008), "QSAR, action mechanism
and molecular design of flavone and isoflavone derivatives with cytotoxicity
against HeLa", European Journal of Medicinal Chemistry, 43, pp. 2159-
2170.
81. Singh, M., Kaur, M.,Silakari, O. (2014), "Flavones: An important scaffold
for medicinal chemistry", European Journal of Medicinal Chemistry, 84, pp.
206-239.
82. Singh, S.K., Srivastava, K., Banerjee, R., Prasad, J. (2017), "Syntheses and
single crystal X-ray diffraction studies of hydroxynicotinic acid based
complexes involving supramolecular interactions", Polyhedron, 133, pp.
222-230.
83. Smalheiser, N.R. (2017), Chapter 11 - ANOVA, in Data LiteracyAcademic
Press, pp. 149-155.
84. Snedecor, G.,Cochran, W. (1967), Statistical methods, Oxford and IBH, New
Delhi.
85. Steppan, D.D., Werner, J.,Yeater, P.R. (2000), Essential Regression and
Experimental Design for Chemists and Engineers, USA.
140
86. Tat, P.V. (2009), Development of Quantitative Structure-Activity
Relationships (QSARs) and Quantitative Structure-Property Relationships
(QSPRs),Hanoi, NXB Natural Science and Technology.
87. Tat, P.V. (2009), "Prediction of thermodynamic properties of similar organic
compounds using artificial neural network", Vietnamese Journal of
Chemistry and Application, 4, pp. 611-616.
88. Tat, P.V. (2009 ), "Models QSAR of the group 6-aminoquinolone: new
anti-HIV agents", Vietnamese Journal of Chemistry and Application, 15, pp.
30-34
89. Tat, P.V. (2009), "QSDAR model: Quantitative Spectrum Data 13C-NMR
and 15O-NMR Activity Relationships (QSDAR) of a set of anti-cancer 3-
aminoflavonoid", Vietnamese Journal of Chemistry and Application, 14, pp.
43-46.
90. Tat, P.V. (2017), Development of new anticancer agents from Leaf of plants
in Viet Nam, LAP Lambert Academic Publishing. 01-80 trang.
91. Thavamani, B.S., Mathew, M.,Dhanabal, S.P. (2013), "In vitro cytotoxic
activity of menispermaceae plants against HeLa cell line", Anc Sci Life,
33(2), pp. 81-84.
92. Thuy, B.T.P.,Tat, P.V. (2012), "Development of QSDAR models for
anticancer flavone and isoflavone analogues Using 13C-NMR and 15O-
NMR", Viet Nam Journal of Chemistry, 50(5A), pp. 203-208.
93. Tomasz, P., Jerzy, L.,Mark, T.D.C. (2010), Recent Advances in QSAR
Studies Methods and Applications, springer.
94. Tong, J., Liu, S., Zhou, P., Wu, B., Li, Z. (2008), "A novel descriptor of
amino acids and its application in peptide QSAR", Journal of Theoretical
Biology, 253(1), pp. 90-97.
95. Torkashvand, A.M., Ahmadi, A.,Nikravesh, N.L. (2017), "Prediction of
kiwifruit firmness using fruit mineral nutrient concentration by artificial
141
neural network (ANN) and multiple linear regressions (MLR)", Journal of
Integrative Agriculture, 16(7), pp. 1634-1644.
96. Ventriglia, J., Paciolla, I., Pisano, C., Cecere, S.C., Di Napoli, M., Tambaro,
R., Califano, D., Losito, S., Scognamiglio, G., Setola, S.V., Arenare, L.,
Pignata, S., Della Pepa, C. (2017), "Immunotherapy in ovarian, endometrial
and cervical cancer: State of the art and future perspectives", Cancer
Treatment Reviews, 59, pp. 109-116.
97. Verma, R.P.,Matthews, E.J. (2015), "Estimation of the chemical-induced eye
injury using a Weight-of-Evidence (WoE) battery of 21 artificial neural
network (ANN) c-QSAR models (QSAR-21): Part II: Corrosion potential",
Regulatory Toxicology and Pharmacology, 71(2), pp. 331-336.
98. Vichai, V.,Kirtikara, K. (2006), "Sulforhodamine B colorimetric assay for
cytotoxicity screening", Nat Protoc, 1(3), pp. 1112-1116.
99. Viens, L.J., Clouston, S.,Messina, C.R. (2016), "Women's autonomy and
cervical cancer screening in the Lesotho Demographic and Health Survey
2009", Social Science & Medicine, 150, pp. 23-30.
100. Vreven, T., Byun, K.S., Komáromi, I., Dapprich, S., Montgomery, J.A.,
Morokuma, K., Frisch, M.J. (2006), "Combining Quantum Mechanics
Methods with Molecular Mechanics Methods in ONIOM", Journal of
Chemical Theory and Computation, 2(3), pp. 815-826.
101. Wang, G., Luo, H.,Peng, K. (2016), "Quality-related fault detection using
linear and nonlinear principal component regression", Journal of the
Franklin Institute, 353(10), pp. 2159-2177.
102. Wang, J., Wang, W., Kollman, P.A., Case, D.A. (2006), "Automatic atom
type and bond type perception in molecular mechanical calculations",
Journal of Molecular Graphics and Modelling, 25(2), pp. 247-260.
103. Wang, T.C., Chen, I.L., Lu, P., Wong, C., Liao, C., Tsiao, K., Chang, K.,
Chen, Y., Tzeng, C. (2005), "Synthesis, antiproliferative, and antiplatelet
142
activities of oxime- and methyloxime-containing flavone and isoflavone
derivatives", Bioorganic & Medicinal Chemistry, 13(21), pp. 6045-6053.
104. Wang, Y., Xu, K., Lin, L., Pan, Y., Zheng, X. (2007), "Geranyl flavonoids
from the leaves of Artocarpus altilis", Phytochemistry, 68(9), pp. 1300-
1306.
105. Weirong, C., Xiaohong, G.,Jian, T. (2010), "Extraction, Purification, and
Characterisation of the Flavonoids from Opuntia milpa alta Skin", Czech
Journal of Food Sciences, 28(2), pp. 108–116.
106. Wold, S. (1995), "PLS for multivariate linear modelling. In: van de
Waterbeemd H. (ed.), QSAR: Chemometric Methods in Molecular Design",
Wiley-VCH, Weinheim, Germany, 2, pp. 195-218.
107. XLSTATversion2014.4.08 (2014), XLSTAT Tutorials, Copyright
Addinsoft,U.S.A.
108. Yang, C., Chen, H., Lu, S., Zhang, M., Tian, W., Wang, M., Zhang, L.,
Song, Y., Shen, A., Zhou, Y., Zhu, J., Zheng, C. (2016), "Structural
modification of luteolin from Flos Chrysanthemi leads to increased tumor
cell growth inhibitory activity", Bioorganic & Medicinal Chemistry Letters,
26(15), pp. 3464-3467.
109. Yoshizawa, T., Hashimoto, H., Shimizu, T., Yamabe, M., Shichijo, N.,
Hanada, K., Hirano, H., Sato, M. (2011), "Purification, crystallization and X-
ray diffraction study of basic 7S globulin from soybean", Acta Crystallogr
Sect F Struct Biol Cryst Commun, 67(Pt 1), pp. 87-89.
110. Zhang, Y. (2014), "An improved QSPR method based on support vector
machine applying rational sample data selection and genetic algorithm-
controlled training parameters optimization", Chemometrics and Intelligent
Laboratory Systems, 134, pp. 34-46.
111. 2014.4.08, X.v. (2014), Copyright Addinsoft 1995-2014,U.S.A.
143
112. Basu, P., Mittal, S., Bhadra Vale, D., Chami Kharaji, Y. "Secondary
Prevention of Cervical Cancer", Best Practice & Research Clinical
Obstetrics & Gynaecology.
113. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line
concentration of flavonoids in Brassica oleraceaby capillary electrophoresis
using large volume sample stacking", Food Chemistry, 133, pp. 205-2011.
114. R.P., V.,E.J., M. (2015), "Estimation of the chemical-induced eye injury
using a weight-of-evidence (WoE) battery of 21 artificial neural network
(ANN) c-QSAR models (QSAR-21): Part I: Irritation potential", Regulatory
Toxicology and Pharmacology, 71(2), pp. 318-330.
115. StatisticalSolutionsLtd (2011), TOXSYS 1.3, USA.
144
PHỤ LỤC
Phụ lục 1a. Hoạt tính pGI50 của nhóm dẫn xuất mẫu flavone và isoflavone
a) b)
Khung cấu trúc: a) flavone và b) isoflavone
Hợp chất Khung hợp chất Vị trí thế Nhóm thế R pGI50
FLA1 flavone C3 -OCH2CCH3=NOH 5,6990
FLA2 flavone C6 -OCH2CCH3=NOH 5,9208
FLA3 flavone C7 -OCH2CCH3=NOH 5,6990
ISOFLA4 isoflavone C7 -OCH2CCH3=NOH 5,0088
FLA5 flavone C3 -OCH2CCH3=NOCH3 5,6990
FLA6 flavone C6 -OCH2CCH3=NOCH3 6,0458
FLA7 flavone C7 -OCH2CCH3=NOCH3 5,6576
ISOFLA8 isoflavone C7 -OCH2CCH3=NOCH3 5,0706
FLA9 flavone C3 -OCH2C(C6H5)=NOH 5,7447
FLA10 flavone C3 -OCH2C(4-F-C6H4)=NOH 5,6778
FLA11 flavone C3 -OCH2C(4-CH3O-C6H4)=NOH 5,6990
FLA12 flavone C6 -OCH2C(C6H5)=NOH 6,0969
FLA13 flavone C6 -OCH2C(4-F-C6H4)=NOH 5,7959
FLA14 flavone C6 -OCH2C(4-CH3O-C6H4)=NOH 6,0000
FLA15 flavone C7 -OCH2C(C6H5)=NOH 5,6990
FLA16 flavone C7 -OCH2C(4-F-C6H4)=NOH 5,6990
FLA17 flavone C7 -OCH2C(4-CH3O-C6H4)=NOH 5,6990
ISOFLA18 isoflavone C7 -OCH2C(C6H5)=NOH 5,0458
ISOFLA19 isoflavone C7 -OCH2C(4-F-C6H4)=NOH 5,1079
ISOFLA20 isoflavone C7 -OCH2C(4-CH3O-C6H4)=NOH 5,1192
FLA21 flavone C3 -OCH2C(C6H5)=NOCH3 5,7959
FLA22 flavone C3 -OCH2C(4-F-C6H4)=NOCH3 5,6990
FLA23 flavone C3 -OCH2C(4-CH3O-C6H4)=NOCH3 5,6990
FLA24 flavone C6 -OCH2C(C6H5)=NOCH3 5,6198
145
FLA25 flavone C6 -OCH2C(4-F-C6H4)=NOCH3 5,6383
FLA26 flavone C6 -OCH2C(4-CH3O-C6H4)=NOCH3 5,6990
FLA27 flavone C7 -OCH2C(C6H5)=NOCH3 5,1805
FLA28 flavone C7 -OCH2C(4-F-C6H4)=NOCH3 5,5686
FLA29 flavone C7 -OCH2C(4-CH3O-C6H4)=NOCH3 5,6021
ISOFLA30 isoflavone C7 -OCH2C(C6H5)=NOCH3 5,0862
ISOFLA31 isoflavone C7 -OCH2C(4-F-C6H4)=NOCH3 5,1938
ISOFLA32 isoflavone C7 -OCH2C(4-CH3O-C6H4)=NOCH3 5,1367
Phụ lục 1b. Điện tích nguyên tử trên khung phân tử flavone và isoflavone
Hợp chất O1 C2 C3 C4 C5 C6 C7 C8
Fla-1 -0,093 0,156 -0,117 0,327 0,018 -0,159 -0,029 -0,154
146
Fla-2 -0,096 0,187 -0,331 0,358 -0,088 0,064 -0,078 -0,114
Fla-3 -0,102 0,181 -0,321 0,364 0,051 -0,202 0,179 -0,253
Isofla-4 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251
Fla-5 -0,093 0,155 -0,116 0,326 0,017 -0,159 -0,029 -0,154
Fla-6 -0,097 0,186 -0,330 0,358 -0,038 0,062 -0,125 -0,113
Fla-7 -0,102 0,181 -0,322 0,364 0,051 -0,202 0,179 -0,253
isofla-8 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251
Fla-9 -0,091 0,153 -0,113 0,334 0,018 -0,161 -0,028 -0,155
Fla-10 -0,091 0,154 -0,113 0,334 0,019 -0,161 -0,027 -0,155
Fla-11 -0,091 0,153 -0,112 0,334 0,018 -0,161 -0,028 -0,155
Fla-12 -0,097 0,185 -0,330 0,358 -0,036 0,061 -0,129 -0,113
Fla-13 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113
Fla-14 -0,096 0,187 -0,332 0,360 -0,093 0,064 -0,076 -0,115
Fla-15 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258
Fla-16 -0,103 0,181 -0,321 0,364 0,051 -0,200 0,177 -0,257
Fla-17 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258
isofla-18 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255
isofla-19 -0,082 0,071 -0,177 0,369 0,054 -0,199 0,178 -0,255
isofla-20 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255
Fla-21 -0,094 0,150 -0,088 0,338 0,017 -0,162 -0,030 -0,159
Fla-22 -0,094 0,151 -0,088 0,338 0,017 -0,161 -0,030 -0,159
Fla-23 -0,092 0,153 -0,111 0,334 0,018 -0,161 -0,028 -0,155
Fla-24 -0,097 0,185 -0,330 0,358 -0,037 0,061 -0,129 -0,113
Fla-25 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113
Fla-26 -0,097 0,185 -0,330 0,358 -0,037 0,062 -0,129 -0,113
Fla-27 -0,099 0,182 -0,323 0,365 0,053 -0,252 0,178 -0,206
Fla-28 -0,103 0,181 -0,321 0,364 0,050 -0,200 0,177 -0,257
Fla-29 -0,103 0,180 -0,320 0,365 0,050 -0,200 0,179 -0,258
isofla-30 -0,082 0,072 -0,179 0,370 0,054 -0,200 0,179 -0,255
isofla-31 -0,082 0,071 -0,178 0,369 0,054 -0,200 0,178 -0,255
isofla-32 -0,082 0,072 -0,179 0,370 0,053 -0,200 0,179 -0,255 a
C9 C10 O11 C1' C2' C3' C4' C5' C6'
Fla-1 0,127 -0,231 -0,344 -0,073 -0,054 -0,122 -0,071 -0,120 -0,070
147
Fla-2 0,092 -0,186 -0,365 -0,078 -0,047 -0,118 -0,070 -0,116 -0,064
Fla-3 0,172 -0,266 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,066
Isofla-4 0,147 -0,271 -0,366 0,003 -0,081 -0,113 -0,097 -0,114 -0,118
Fla-5 0,127 -0,231 -0,343 -0,072 -0,054 -0,122 -0,072 -0,120 -0,071
Fla-6 0,091 -0,187 -0,359 -0,078 -0,048 -0,117 -0,070 -0,116 -0,065
Fla-7 0,172 -0,266 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,066
isofla-8 0,147 -0,272 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118
Fla-9 0,130 -0,235 -0,367 -0,073 -0,030 -0,136 -0,072 -0,126 -0,069
Fla-10 0,130 -0,236 -0,369 -0,073 -0,032 -0,135 -0,072 -0,125 -0,069
Fla-11 0,130 -0,235 -0,368 -0,073 -0,029 -0,136 -0,073 -0,126 -0,070
Fla-12 0,089 -0,188 -0,359 -0,077 -0,048 -0,118 -0,071 -0,116 -0,065
Fla-13 0,091 -0,187 -0,359 -0,078 -0,048 -0,117 -0,070 -0,116 -0,065
Fla-14 0,090 -0,186 -0,368 -0,078 -0,048 -0,118 -0,070 -0,116 -0,064
Fla-15 0,172 -0,268 -0,369 -0,075 -0,049 -0,117 -0,071 -0,116 -0,066
Fla-16 0,172 -0,267 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,067
Fla-17 0,171 -0,268 -0,369 -0,075 -0,066 -0,116 -0,072 -0,117 -0,049
isofla-18 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118
isofla-19 0,147 -0,272 -0,366 0,002 -0,081 -0,113 -0,097 -0,114 -0,118
isofla-20 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118
Fla-21 0,129 -0,230 -0,363 -0,061 -0,050 -0,122 -0,077 -0,121 -0,080
Fla-22 0,128 -0,230 -0,363 -0,062 -0,050 -0,122 -0,076 -0,121 -0,080
Fla-23 0,131 -0,234 -0,367 -0,067 -0,029 -0,133 -0,077 -0,127 -0,073
Fla-24 0,089 -0,188 -0,360 -0,077 -0,048 -0,118 -0,071 -0,116 -0,065
Fla-25 0,090 -0,187 -0,359 -0,077 -0,065 -0,116 -0,071 -0,117 -0,048
Fla-26 0,089 -0,188 -0,360 -0,077 -0,065 -0,116 -0,071 -0,118 -0,048
Fla-27 0,169 -0,268 -0,371 -0,077 -0,049 -0,118 -0,071 -0,116 -0,065
Fla-28 0,172 -0,267 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,067
Fla-29 0,171 -0,268 -0,369 -0,075 -0,049 -0,116 -0,072 -0,116 -0,067
isofla-30 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118
isofla-31 0,147 -0,272 -0,367 0,003 -0,081 -0,113 -0,097 -0,114 -0,118
Phụ lục 2. i của 13C-NMR và 15O-NMR trên khung phân tử flavone và isoflavone
Hợp chất O1 C2 C3 C4 C5 C6 C7 C8
Fla-1 302,7 152,3 164,7 180,4 133,5 134,4 134,1 128,7
Fla-2 279,8 157,6 118,4 176,0 130,1 172,5 129,1 130,8
148
Fla-3 276,8 159,2 117,2 174,5 132,6 129,7 170,9 125,2
Isofla-4 285,5 174,4 121,2 183,3 134,2 129,5 171,2 125,5
Fla-5 303,7 152,2 164,6 180,3 133,1 134,6 133,9 129,0
Fla-6 279,1 159,9 115,7 178,0 129,5 172,3 133,1 131,9
Fla-7 277,0 160,2 115,9 175,3 133,1 129,3 171,4 124,8
isofla-8 315,4 176,1 119,4 184,6 131,7 130,3 174,0 126,5
Fla-9 301,6 152,6 163,8 181,1 134,2 134,3 134,4 128,5
Fla-10 306,6 152,4 165,4 180,2 134,2 134,3 134,4 128,4
Fla-11 304,5 152,7 164,2 180,3 134,3 134,1 134,4 128,3
Fla-12 277,3 160,6 114,7 178,6 129,8 171,5 133,5 131,4
Fla-13 275,3 161,3 113,5 179,9 130,2 172,1 134,2 131,4
Fla-14 292,8 159,1 117,1 173,7 128,7 172,3 128,7 131,3
Fla-15 268,5 160,1 114,9 177,7 133,0 129,4 171,8 124,7
Fla-16 281,2 161,4 114,2 175,4 132,5 129,2 171,6 124,8
Fla-17 283,4 161,9 113,3 175,4 132,2 129,3 171,8 124,9
isofla-18 287,5 175,2 120,2 183,7 134,1 128,9 171,4 125,0
isofla-19 289,8 175,6 120,0 184,1 134,1 129,0 171,8 125,1
isofla-20 291,1 176,0 119,1 184,8 134,2 128,9 172,3 124,8
Fla-21 291,0 152,4 161,2 181,7 135,1 132,8 134,9 126,9
Fla-22 291,7 152,2 162,3 181,5 135,3 132,8 135,1 126,9
Fla-23 300,4 154,5 161,5 182,8 134,9 134,0 135,9 128,1
Fla-24 276,5 160,7 114,5 178,9 130,0 171,2 133,7 131,2
Fla-25 274,5 161,5 113,3 180,1 130,4 171,7 134,4 131,2
Fla-26 279,0 163,0 111,4 180,3 130,8 171,2 135,7 130,9
Fla-27 287,3 159,2 117,4 171,6 132,6 132,2 169,6 124,7
Fla-28 279,5 161,8 113,7 176,0 133,0 128,7 171,9 124,3
Fla-29 277,8 162,3 112,4 176,9 133,2 128,6 172,4 124,1
isofla-30 286,8 175,3 120,0 183,8 134,3 128,7 171,4 124,8
isofla-31 298,7 176,5 118,7 185,3 133,6 129,0 173,0 125,1
isofla-32 291,7 175,8 119,4 184,5 133,9 129,0 172,1 125,0 a
C9 C10 O11 C1' C2' C3' C4' C5' C6'
Fla-1 165,7 129,9 828,2 129,8 134,6 132,6 133,5 133,9 135,3
Fla-2 166,1 133,6 768,6 127,1 135,1 130,8 136,0 133,5 137,2
Fla-3 169,1 131,9 736,3 126,3 135,3 129,4 136,8 133,0 138,3
Isofla-4 166,7 132,0 810,1 132,4 135,6 133,7 129,9 137,8 135,8
149
Fla-5 165,5 130,2 829,7 130,1 134,3 132,8 133,4 134,2 135,3
Fla-6 167,3 129,6 759,8 124,4 137,0 127,4 138,3 131,8 140,1
Fla-7 169,8 131,0 734,4 125,1 135,9 127,9 137,8 132,4 139,7
isofla-8 169,4 130,9 768,0 138,7 136,9 132,3 118,4 143,7 135,0
Fla-9 165,7 129,3 829,3 128,4 133,4 130,7 133,1 133,2 134,8
Fla-10 166,0 129,6 806,2 128,4 133,3 130,6 133,2 133,2 135,1
Fla-11 166,1 129,2 805,0 128,2 133,4 130,4 133,2 133,0 135,1
Fla-12 167,8 128,4 759,1 123,4 137,9 126,2 139,1 131,1 141,0
Fla-13 168,0 127,7 777,3 122,3 138,7 124,9 140,2 130,5 142,2
Fla-14 167,2 134,3 697,0 126,2 134,8 128,7 136,9 133,1 139,1
Fla-15 169,6 130,6 804,7 124,6 136,6 127,1 139,0 132,3 140,4
Fla-16 170,1 130,7 734,3 123,9 136,2 125,8 139,5 132,1 141,7
Fla-17 170,5 130,7 730,4 123,3 142,8 132,0 140,2 124,8 136,0
isofla-18 167,8 131,3 789,1 134,8 134,9 134,9 126,7 140,0 134,6
isofla-19 168,0 131,1 791,2 135,5 135,0 135,0 125,7 140,7 134,5
isofla-20 168,8 130,5 786,0 137,2 134,6 135,6 123,3 142,2 133,7
Fla-21 165,4 126,8 838,3 126,7 135,2 130,1 134,0 132,1 135,4
Fla-22 165,5 126,8 836,8 126,5 135,2 130,0 134,2 132,1 135,6
Fla-23 166,9 128,1 829,6 126,2 134,0 128,5 135,3 132,1 137,2
Fla-24 168,0 128,1 759,0 123,1 138,2 125,9 139,3 130,9 141,2
Fla-25 168,2 127,4 776,6 122,1 142,4 130,3 140,3 124,6 139,0
Fla-26 169,4 126,5 754,5 120,4 144,7 129,5 141,9 122,2 139,5
Fla-27 167,2 132,7 680,5 127,0 134,0 129,3 136,3 133,6 138,5
Fla-28 170,6 130,1 734,0 123,3 136,8 125,2 139,9 131,6 142,2
Fla-29 171,0 129,6 746,7 122,3 137,0 123,8 140,9 131,2 143,4
isofla-30 168,0 131,1 787,5 135,2 134,6 135,2 126,4 140,3 134,4
isofla-31 169,3 130,3 781,4 138,5 135,1 135,1 120,8 143,5 133,6
isofla-32 168,6 130,8 784,0 136,8 134,8 135,2 123,7 141,9 134,0
Phụ lục 3. Giá trị R2tr theo sự thay đôi của cấu trúc mạng và số vòng lặp
QESARneural
Vòng luyện(B)
k = 6 R2tr
Cấu trúc mạng(A) 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
I(6) - HL(1) - O(1) 89,96 90,03 90,16 89,31 89,79 89,05 89,97 89,00 90,52 88,95
150
I(6) - HL(2) - O(1) 88,25 88,48 90,97 89,92 90,39 91,19 90,32 89,67 89,65 90,48
I(6) - HL(3) - O(1) 89,89 88,19 88,31 89,52 89,44 91,79 83,70 88,42 89,42 88,37
I(6) - HL(4) - O(1) 86,90 89,35 89,97 91,62 89,87 89,16 85,07 89,62 88,66 89,15
I(6) - HL(5) - O(1) 86,03 89,67 85,36 90,26 83,75 87,47 83,96 87,55 87,90 88,93
I(6) - HL(6) - O(1) 90,04 87,25 86,00 87,23 82,66 86,22 89,83 88,45 89,46 88,40
QESARneural
Vòng luyện(B)
k = 6 R2tr
Cấu trúc mạng(A) 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000
I(6) - HL(1) - O(1) 90,64 90,36 90,32 90,38 90,46 90,27 88,81 90,20 90,66 89,75
I(6) - HL(2) - O(1) 88,75 89,66 83,94 86,97 88,71 90,29 89,45 87,23 91,53 90,72
I(6) - HL(3) - O(1) 89,19 86,99 90,29 86,42 83,44 89,47 82,18 86,14 88,96 85,42
I(6) - HL(4) - O(1) 85,83 87,16 88,78 91,61 90,04 86,37 87,01 90,48 89,52 89,49
I(6) - HL(5) - O(1) 88,22 90,66 84,10 87,47 82,30 88,03 85,63 86,05 85,65 89,83
I(6) - HL(6) - O(1) 83,80 86,60 88,48 88,52 85,37 87,70 81,51 89,58 90,30 89,92
151
Phụ lục 4. Hoạt tính pGI50 ức chế phát triển tế bào của dẫn xuất flavone và
isoflavone
Thứ tự Hợp chất Vị trí thế Nhóm thế pGI50
Nhóm chất luyện (a)
fla-1a flavone C3-R2 -OCH2CCH3=NOH 5,699
fla-2a flavone C7-R1 -OCH2CCH3=NOH 5,699
isofla-3a isoflavone C7-R1 -OCH2CCH3=NOH 5,009
fla-4a flavone C3-R2 -OCH2CCH3=NOCH3 5,699
fla-5a flavone C3-R2 -OCH2CCH3=NOCH3 6,046
fla-6a flavone C7-R1 -OCH2CCH3=NOCH3 5,658
isofla-7a isoflavone C7-R1 -OCH2CCH3=NOCH3 5,071
fla-8a flavone C3-R2 -OCH2C(4-F-C6H4)=NOH 5,678
fla-9a flavone C3-R2 -OCH2C(4-CH3O-C6H4)=NOH 5,699
fla-10a flavone C6-R1 -OCH2C(4-F-C6H4)=NOH 5,796
fla-11a flavone C6-R1 -OCH2C(4-CH3O-C6H4)=NOH 6,000
fla-12a flavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOH 5,699
isofla-13a isoflavone C7-R1 -OCH2C(C6H5)=NOH 5,046
isofla-14a isoflavone C7-R1 -OCH2C(4-F-C6H4)=NOH 5,108
isofla-15a isoflavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOH 5,119
fla-16a flavone C3-R2 -OCH2C(C6H5)=NOCH3 5,796
fla-17a flavone C3-R2 -OCH2C(4-F-C6H4)=NOCH3 5,699
fla-18a flavone C3-R2 -OCH2C(4-CH3O-C6H4)=NOCH3 5,699
fla-19a flavone C6-R1 -OCH2C(C6H5)=NOCH3 5,620
fla-20a flavone C6-R1 -OCH2C(4-F-C6H4)=NOCH3 5,638
fla-21a flavone C6-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 5,699
fla-22a flavone C7-R1 -OCH2C(C6H5)=NOCH3 5,180
fla-23a flavone C7-R1 -OCH2C(4-F-C6H4)=NOCH3 5,569
fla-24a flavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 5,602
isofla-25a isoflavone C7-R1 -OCH2C(C6H5)=NOCH3 5,086
isofla-26a isoflavone C7-R1 -OCH2C(4-F-C6H4)=NOCH3 5,194
Nhóm chất kiểm tra (b)
fla-1b flavone C6-R1 -OCH2CCH3=NOH 5,921
fla-2b flavone C3-R2 -OCH2CC6H5=NOH 5,745
152
fla-3b flavone C6-R1 -OCH2CC6H5=NOH 6,097
fla-4b flavone C7-R1 -OCH2CC6H5=NOH 5,699
fla-5b flavone C7-R1 -OCH2C(4-F-C6H4)=NOH 5,699
isofla-6b isoflavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 5,137
153
Phụ lục 5. Giá trị thống kê của mô hình QESARlinear (với k = 5, 6, 7) biến số
GIÁ TRỊ
k = 5 k = 6 k = 7
Hệ số Pvalue Hệ số Pvalue Hệ số P
hằng số -0,933 0,6875 6,712 0,01067 4,714 0,003568
O1 -101,21 0,0002 -42,31 0,0009
C2 -15,43 0,0019
C3 3,014 0,00771
C4 -6,874 0,0088 -19,04 0,00979 -60,07 0,000001
C5 -7,969 0,00002
C6 6,612 0,00004 20,88 0,000002
C7 4,604 0,00067
C8 16,9 0,000499
C9 95,42 0,000017
O11 -8,159 0,03877 -32,8 0,000077
C2 -24,47 0,000396
C3' -16,12 0,0218
C6' -25,42 0,000141
154
Phụ lục 6. Giá trị thực nghiệm pGI50 và cấu trúc của flavone và isoflavone
Cấu trúc phân tử Nhóm thế pGI50
1a: R=OH, R1 = Me 5,699
2(a1): R= OH, R1 = C6H5 5,745
3: R= OH, R1 = p-F- C6H4 5,678
4: R= OH, R1 = p-OMe- C6H4 5,699
5(a2): R= Me, R1 = Me 5,699
6(a3): R= Me, R1 = C6H5 5,796
7: R= Me, R1 = p-F- C6H4 5,699
8: R= Me, R1 = p-OMe- C6H4 5,699
9(a4): R=OH, R2 = Me 5,921
10: R= OH, R2 = C6H5 6,097
11: R= OH, R2 = p-F- C6H4 5,796
12: R= OH, R2 = p-OMe- C6H4 6,000
13: R= Me, R2 = Me 6,046
14: R= Me, R2 = C6H5 5,62
15: R= Me, R2 = p-F- C6H4 5,638
16: R= Me, R2 = p-OMe- C6H4 5,699
17: R=OH, R3 = Me 5,699
18: R= OH, R3 = C6H5 5,699
19: R= OH, R3 = p-F- C6H4 5,699
20(a5): R= OH, R3 = p-OMe- C6H4 5,699
21(a6): R= Me, R3 = Me 5,658
22: R= Me, R3 = C6H5 5,181
23: R= Me, R3 = p-F- C6H4 5,569
24: R= Me, R3 = p-OMe- C6H4 5,602
25: R=OH, R3 = Me 5,009
26: R= OH, R3 = C6H5 5,046
27: R= OH, R3 = p-F- C6H4 5,108
28: R= OH, R3 = p-OMe- C6H4 5,119
29: R= Me, R3 = Me 5,071
30: R= Me, R3 = C6H5 5,086
31: R= Me, R3 = p-F- C6H4 5,194
32: R= Me, R3 = p-OMe- C6H4 5,137
155
Phụ lục 7. Giá trị thống kê của mô hình QSDARlinear (với k = 5, 6, 7) biến số
Biến số
xk
QSDARlinear P
k = 5 k = 6 k = 7 k = 5 k = 6 k = 7
Hệ số 14,4590 37,0550 32,9900 0,0000 0,0002 0,0005
O1 0,0000 0,0140 0,0160 0,9907 0,0858 0,0177
O11 0,0040 0,0080 0,0060 0,2083 0,0204 0,0052
C2 - - -0,0450 - - 0,0002
C3 - -0,0580 -0,0630 - 0,0106 0,0002
C4 -0,0680 -0,0780 - 0,0275 0,0054 -
C6 0,0060 -0,0590 -0,0470 0,4354 0,0235 0,0351
C7 -0,0050 -0,0750 -0,0590 0,5294 0,0086 0,0175
C2' - - -0,0370 - - 0,0306
156
Phụ lục 8. Điện tích nguyên tử của 10 dẫn xuất thiết kế từ mô hình QESAR
Hợp chất O1 C2 C3 C4 C5 C6 C7 C8
fla-1c -0,094 0,184 -0,325 0,358 -0,091 0,055 -0,069 -0,114
fla-2c -0,095 0,189 -0,333 0,360 -0,091 0,056 -0,069 -0,114
fla-3c -0,095 0,181 -0,324 0,358 -0,091 0,062 -0,075 -0,115
fla-4c -0,095 0,185 -0,326 0,357 -0,101 0,084 -0,076 -0,111
fla-5c -0,096 0,180 -0,321 0,356 -0,101 0,084 -0,077 -0,111
isofla-7c -0,073 0,087 -0,193 0,368 -0,090 0,058 -0,068 -0,110
isofla-8c -0,074 0,079 -0,187 0,365 -0,089 0,057 -0,068 -0,111
isofla-9c -0,074 0,086 -0,194 0,367 -0,090 0,064 -0,074 -0,111
isofla-10c -0,074 0,086 -0,192 0,368 -0,099 0,085 -0,074 -0,106
isofla-11c -0,075 0,084 -0,189 0,366 -0,098 0,085 -0,075 -0,107
C9 C10 O11 C1' C2' C3' C4' C5' C6'
fla-1c 0,095 -0,188 -0,367 -0,036 -0,098 0,121 -0,181 -0,069 -0,110
fla-2c 0,095 -0,187 -0,370 -0,080 -0,047 -0,118 -0,069 -0,116 -0,063
fla-3c 0,091 -0,187 -0,365 -0,034 -0,098 0,121 -0,182 -0,069 -0,111
fla-4c 0,089 -0,181 -0,364 -0,039 -0,098 0,100 -0,165 -0,076 -0,107
fla-5c 0,089 -0,181 -0,360 -0,036 -0,092 0,092 -0,170 -0,076 -0,106
isofla-7c 0,069 -0,192 -0,371 0,050 -0,189 0,121 -0,140 -0,071 -0,164
isofla-8c 0,069 -0,192 -0,367 0,005 -0,084 -0,113 -0,098 -0,112 -0,119
isofla-9c 0,065 -0,191 -0,369 0,051 -0,189 0,121 -0,141 -0,072 -0,165
isofla-10c 0,064 -0,187 -0,372 0,043 -0,182 0,094 -0,132 -0,075 -0,159
isofla-11c 0,064 -0,187 -0,367 0,043 -0,182 0,101 -0,138 -0,076 -0,161
157
Phụ lục 9. i của 13C-NMR và 15O-NMR 12 dẫn xuất thiết kế từ mô hình QSDAR
flavone O1 C2 C3 C4 C5 C6 C7 C8
1b 268,4 156,7 119,5 177,1 132,5 170,4 129,3 128,3
2b 268,7 156,9 119,4 177,4 132,7 170,9 129,4 128,5
3b 273,9 157,4 119,4 176,7 132,5 171,3 129,3 128,8
4b 264,7 155,8 120,0 176,7 135,8 132,7 134,9 127,1
5b 265,2 155,8 120,1 176,9 136,0 132,5 135,2 127,1
6b 265,5 155,6 120,1 176,9 136,1 132,4 135,3 127,0
C9 C10 O11 C1' C2' C3' C4' C5' C6'
1b 166,6 131,4 769,4 127,5 135,7 133,1 133,8 133,4 134,7
2b 166,6 131,5 770,8 127,5 136,0 133,0 133,9 133,5 134,8
3b 166,7 131,7 753,5 127,5 136,0 132,8 134,0 133,4 135,0
4b 168,5 129,1 762,4 129,6 131,0 171,9 130,1 136,4 134,1
5b 168,7 129,2 763,2 129,8 131,1 172,5 130,2 136,7 134,2
6b 168,8 129,1 765,0 129,9 131,0 173,0 130,1 136,9 134,4
Isoflavone O1 C2 C3 C4 C5 C6 C7 C8
7b 281,9 173,2 120,9 184,4 133,9 170,4 129,4 128,5
8b 282,2 173,5 120,8 184,6 134,0 170,9 129,5 128,8
9b 286,9 173,7 120,9 184,5 133,8 171,4 129,4 129,0
10b 281,0 172,8 121,0 182,6 136,6 132,7 134,7 127,7
11b 281,3 172,8 121,1 182,6 136,7 132,8 134,7 127,7
12b 282,2 172,9 121,1 182,5 136,7 132,8 134,7 127,7
C9 C10 O11 C1' C2' C3' C4' C5' C6'
7b 164,0 131,9 829,2 130,9 133,7 134,5 132,6 135,6 135,5
8b 164,0 132,0 831,0 131,2 133,6 134,9 132,3 135,9 135,4
9b 164,0 132,1 826,9 131,2 133,5 135,0 132,3 136,0 135,5
10b 165,6 129,4 795,6 134,3 131,0 173,2 127,5 135,7 135,3
11b 165,7 129,5 794,2 134,5 131,1 173,8 127,6 135,9 135,4
12b 165,8 129,5 790,5 134,6 131,0 174,4 127,6 136,0 135,5
158
Phụ lục 10a. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC pGI50 x0 x1 x2 xp3 xp4 xp5 xp6 xp7
fla1 5,6990 16,2338 11,2027 9,6198 8,3885 6,7154 5,6544 3,9683 3,0036
fla2 5,9210 16,2338 11,1690 9,8006 8,2488 6,4631 5,5899 3,7583 2,8146
fla3 5,6990 16,2338 11,1690 9,8006 8,2419 6,5192 5,4483 3,8584 2,8334
fla4 5,0090 16,2338 11,1859 9,6922 8,3913 6,6096 5,4563 3,7446 2,7668
fla5 5,6990 16,9409 11,7027 10,0002 8,4730 7,1484 5,7643 4,0118 3,0428
fla6 6,0460 16,9409 11,6690 10,1811 8,3333 6,8961 5,6998 3,7928 2,9011
fla7 5,6580 16,9409 11,6690 10,1811 8,3265 6,9522 5,5581 3,8929 2,9199
fla8 5,0710 16,9409 11,6859 10,0726 8,4758 7,0426 5,5661 3,7791 2,8533
fla9 5,7450 19,3467 13,7752 11,6728 10,4104 8,8196 7,2239 4,7433 3,6955
fla10 5,6780 20,2170 14,1690 12,2946 10,8211 8,9713 7,4480 5,0651 3,8478
fla11 5,6990 20,9241 14,7070 12,4637 11,2293 9,2819 7,5583 5,2393 4,0901
fla12 6,0970 19,3467 13,7415 11,8536 10,2707 8,5672 7,1412 4,6211 3,4566
fla13 5,7960 20,2170 14,1354 12,4755 10,6814 8,7189 7,3652 4,9428 3,6089
fla14 6,0000 20,9241 14,6734 12,6446 11,0896 9,0295 7,4755 5,1171 3,8512
fla15 5,6990 19,3467 13,7415 11,8536 10,2638 8,6234 6,9995 4,7212 3,4717
fla16 5,6990 20,2170 14,1354 12,4755 10,6745 8,7751 7,2235 5,0429 3,6240
fla17 5,6990 20,9241 14,6734 12,6446 11,0828 9,0857 7,3338 5,2171 3,8663
fla18 5,0460 19,3467 13,7584 11,7452 10,4132 8,7137 7,0075 4,6074 3,4051
fla19 5,1080 20,2170 14,1522 12,3671 10,8239 8,8654 7,2315 4,9291 3,5574
fla20 5,1190 20,9241 14,6902 12,5362 11,2322 9,1760 7,3418 5,1033 3,7997
fla21 5,7960 20,0538 14,2752 12,0532 10,5455 9,0329 7,5004 4,9047 3,8180
fla22 5,6990 20,9241 14,6690 12,6751 10,9562 9,1846 7,7244 5,2354 3,9152
fla23 5,6990 21,6312 15,2070 12,8442 11,3644 9,4952 7,8347 5,4096 4,1691
fla24 5,6200 19,3467 13,7415 11,8536 10,2707 8,5672 7,1412 4,6211 3,4566
fla25 5,6380 20,9241 14,6354 12,8559 10,8165 8,9323 7,6417 5,1042 3,7236
fla26 5,6990 21,6312 15,1734 13,0250 11,2247 9,2429 7,7520 5,2784 3,9775
fla27 5,1800 20,0538 14,2415 12,2341 10,3989 8,8368 7,2760 4,8735 3,6415
fla28 5,5690 20,9241 14,6354 12,8559 10,8096 8,9885 7,5000 5,2042 3,7387
fla29 5,6020 21,6312 15,1734 13,0250 11,2179 9,2991 7,6103 5,3784 3,9926
fla30 5,0860 20,0538 14,2584 12,1256 10,5483 8,9271 7,2840 4,7597 3,5749
fla31 5,1940 20,9241 14,6522 12,7475 10,9590 9,0788 7,5080 5,0904 3,6721
fla32 5,1370 21,6312 15,1902 12,9166 11,3672 9,3894 7,6183 5,2647 3,9260
CYNA 5,3260 23,1540 15,1888 14,3658 12,6969 10,2554 7,9789 6,0359 4,1744
LUTE 5,2980 15,1459 9,9524 9,6278 7,9232 6,8274 5,1656 3,9721 2,4808
KEM1 4,8130 15,8530 10,5072 9,7420 8,2254 7,3578 5,6141 4,2904 2,7435
KAEM2 4,4100 27,0158 17,4553 16,9885 13,1777 11,7282 9,7847 7,0298 5,2259
QUER 5,3790 16,0161 10,3799 10,0368 8,6116 7,1320 5,5473 4,1134 2,8022
DAID 5,1030 21,4135 14,3842 13,2004 11,9491 9,4219 7,6571 5,4352 3,8552
159
Phụ lục 10b. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC xp8 xp9 xp10 xc3 xpc4 xch6 xv0 xv1 xv2
fla1 2,1333 1,4731 0,8540 1,2227 3,2999 0,2308 12,5224 7,1204 5,0756
fla2 2,0930 1,5239 0,9367 1,3646 3,1692 0,2257 12,5224 7,1084 5,1228
fla3 2,0555 1,5682 0,9388 1,3646 3,1652 0,2257 12,5224 7,1084 5,1228
fla4 2,0689 1,4976 0,9326 1,2907 3,2783 0,2257 12,5224 7,1013 5,1264
fla5 2,2318 1,5306 0,9152 1,2227 3,2154 0,2308 13,4835 7,5112 5,2494
fla6 2,1424 1,5491 1,0067 1,3646 3,0846 0,2257 13,4835 7,4992 5,2967
fla7 2,1031 1,6083 0,9683 1,3646 3,0807 0,2257 13,4835 7,4992 5,2967
fla8 2,1166 1,5364 0,9699 1,2907 3,1937 0,2257 13,4835 7,4921 5,3003
fla9 2,6400 1,8728 1,2234 1,2674 3,7987 0,3328 14,9092 8,7810 6,1530
fla10 2,6462 1,8999 1,2792 1,5560 4,2070 0,3141 15,2098 8,8807 6,2939
fla11 2,7942 1,9204 1,2976 1,4715 4,2915 0,3141 16,2401 9,3041 6,5155
fla12 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 8,7691 6,2003
fla13 2,4954 1,9147 1,2585 1,6979 4,0763 0,3090 15,2098 8,8687 6,3412
fla14 2,6434 1,9310 1,2993 1,6134 4,1608 0,3090 16,2401 9,2921 6,5628
fla15 2,4836 1,8432 1,2829 1,4092 3,6640 0,3277 14,9092 8,7691 6,2003
fla16 2,4865 1,8917 1,3063 1,6979 4,0723 0,3090 15,2098 8,8687 6,3412
fla17 2,6345 1,9080 1,3471 1,6134 4,1568 0,3090 16,2401 9,2921 6,5628
fla18 2,4944 1,7872 1,2585 1,3354 3,7771 0,3277 14,9092 8,7620 6,2039
fla19 2,4974 1,8357 1,2819 1,6241 4,1854 0,3090 15,2098 8,8617 6,3448
fla20 2,6454 1,8520 1,3227 1,5395 4,2699 0,3090 16,2401 9,2850 6,5664
fla21 2,7974 1,9892 1,2846 1,2674 3,7499 0,3328 15,8702 9,1719 6,3269
fla22 2,8890 2,0055 1,3404 1,5560 4,1582 0,3141 16,1708 9,2715 6,4677
fla23 2,9807 2,0940 1,3589 1,4715 4,2427 0,3141 17,2011 9,6949 6,6894
fla24 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 8,7691 6,2003
fla25 2,6892 1,9880 1,3286 1,6979 4,0275 0,3090 16,1708 9,2596 6,5150
fla26 2,7809 2,0723 1,3693 1,6134 4,1120 0,3090 17,2011 9,6830 6,7366
fla27 2,5901 1,9422 1,3123 1,4092 3,6152 0,3277 15,8702 9,1599 6,3741
fla28 2,6785 1,9798 1,3358 1,6979 4,0235 0,3090 16,1708 9,2596 6,5150
fla29 2,7701 2,0642 1,3766 1,6134 4,1080 0,3090 17,2011 9,6830 6,7366
fla30 2,6009 1,8849 1,2957 1,3354 3,7283 0,3277 15,8702 9,1528 6,3777
fla31 2,6893 1,9226 1,3192 1,6241 4,1366 0,3090 16,1708 9,2525 6,5186
fla32 2,7809 2,0069 1,3600 1,5395 4,2211 0,3090 17,2011 9,6759 6,7402
CYNA 3,0496 2,3056 1,6305 2,6687 6,8166 0,2245 16,3214 9,4969 7,3091
LUTE 1,8085 1,2382 0,7968 1,8426 4,0566 0,1792 10,5695 5,9769 4,5164
KEM1 2,1192 1,1889 0,8336 1,7221 3,9473 0,1842 11,5305 6,3716 4,6785
KAEM2 3,9464 2,8367 2,0685 3,4056 6,7122 0,2296 19,9057 11,1273 8,4405
QUER 1,8037 1,2351 0,7568 1,9612 4,7464 0,1690 10,9393 6,1231 4,6504
DAID 2,7521 2,0727 1,4683 2,2014 5,9070 0,2523 15,5817 9,2093 6,9985
160
Phụ lục 10c. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC xvp3 xvp4 xvp5 xvp6 xvp7 xvp8 xvp9 xvp10 xvc3
fla1 3,3882 2,2411 1,5731 0,8571 0,5334 0,3141 0,1764 0,0828 0,5256
fla2 3,3753 2,1865 1,5451 0,8145 0,5032 0,3040 0,1775 0,0900 0,5584
fla3 3,3774 2,1865 1,5252 0,8257 0,5048 0,2996 0,1841 0,0878 0,5584
fla4 3,4493 2,2320 1,5444 0,8206 0,5046 0,3045 0,1788 0,0886 0,5638
fla5 3,4647 2,3944 1,5982 0,8690 0,5454 0,3252 0,1845 0,0888 0,5256
fla6 3,4517 2,3398 1,5702 0,8262 0,5177 0,3116 0,1830 0,0955 0,5584
fla7 3,4538 2,3398 1,5503 0,8375 0,5192 0,3072 0,1892 0,0923 0,5584
fla8 3,5257 2,3854 1,5695 0,8323 0,5190 0,3122 0,1840 0,0934 0,5638
fla9 4,3731 2,9766 2,0192 1,0333 0,6496 0,3836 0,2268 0,1220 0,5299
fla10 4,4435 2,9883 2,0390 1,0714 0,6545 0,3831 0,2280 0,1233 0,5929
fla11 4,6893 3,1295 2,1124 1,1493 0,7177 0,4001 0,2333 0,1286 0,5980
fla12 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627
fla13 4,4306 2,9338 2,0054 1,0456 0,6235 0,3611 0,2226 0,1226 0,6257
fla14 4,6764 3,0749 2,0788 1,1235 0,6867 0,3781 0,2280 0,1285 0,6308
fla15 4,3622 2,9220 1,9657 1,0187 0,6211 0,3584 0,2203 0,1236 0,5627
fla16 4,4327 2,9338 1,9854 1,0568 0,6260 0,3576 0,2225 0,1242 0,6257
fla17 4,6785 3,0749 2,0589 1,1347 0,6892 0,3746 0,2278 0,1301 0,6308
fla18 4,4341 2,9676 1,9849 1,0135 0,6209 0,3630 0,2169 0,1220 0,5681
fla19 4,5046 2,9793 2,0047 1,0517 0,6258 0,3622 0,2191 0,1227 0,6311
fla20 4,7504 3,1204 2,0782 1,1296 0,6890 0,3792 0,2244 0,1286 0,6361
fla21 4,4539 3,0793 2,0941 1,0739 0,6782 0,4043 0,2408 0,1280 0,5299
fla22 4,5243 3,0910 2,1138 1,1123 0,6803 0,4083 0,2411 0,1293 0,5929
fla23 4,7701 3,2321 2,1873 1,1902 0,7435 0,4251 0,2526 0,1346 0,5980
fla24 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627
fla25 4,5114 3,0364 2,0803 1,0863 0,6517 0,3828 0,2332 0,1280 0,6257
fla26 4,7572 3,1775 2,1537 1,1642 0,7149 0,3997 0,2447 0,1339 0,6308
fla27 4,4430 3,0247 2,0406 1,0592 0,6521 0,3756 0,2313 0,1282 0,5627
fla28 4,5134 3,0364 2,0603 1,0975 0,6543 0,3793 0,2327 0,1288 0,6257
fla29 4,7592 3,1776 2,1338 1,1754 0,7174 0,3962 0,2443 0,1347 0,6308
fla30 4,5149 3,0702 2,0598 1,0540 0,6519 0,3802 0,2279 0,1268 0,5681
fla31 4,5853 3,0819 2,0796 1,0924 0,6541 0,3839 0,2293 0,1275 0,6311
fla32 4,8311 3,2231 2,1531 1,1703 0,7172 0,4008 0,2409 0,1333 0,6361
CYNA 5,1440 3,4293 2,2712 1,2881 0,7165 0,4256 0,2635 0,1528 0,9943
LUTE 3,0546 2,0729 1,3590 0,7590 0,4060 0,2333 0,1339 0,0658 0,5908
KEM1 3,2513 2,2565 1,5076 0,8475 0,4610 0,2753 0,1388 0,0688 0,5715
KAEM2 5,6381 4,0553 2,8046 1,5742 0,9481 0,5703 0,3428 0,1953 1,1730
QUER 3,1730 2,1355 1,4097 0,7736 0,4248 0,2324 0,1299 0,0627 0,6309
DAID 5,0251 3,3211 2,2474 1,2284 0,6947 0,4105 0,2528 0,1458 0,8902
161
Phụ lục 10d. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC xvpc4 ABSQ ABSQon Dipole MaxHp MaxNeg MaxQp Ovality
fla1 0,9734 3,8385 1,4790 6,1796 0,2193 -0,3921 0,2193 1,5982
fla2 0,9603 3,7043 1,5376 8,0858 0,2193 -0,4050 0,2193 1,7309
fla3 0,9613 3,7278 1,5375 5,9397 0,2193 -0,4050 0,2193 1,6777
fla4 1,0363 3,7314 1,5445 5,6574 0,2193 -0,4043 0,2193 1,7187
fla5 0,9672 3,8088 1,4642 5,2716 0,0717 -0,3921 0,1955 1,6329
fla6 0,9541 3,6745 1,5227 7,1274 0,1094 -0,4050 0,1603 1,7660
fla7 0,9551 3,6981 1,5226 4,4376 0,1094 -0,4050 0,1602 1,7245
fla8 1,0301 3,7016 1,5296 4,3371 0,1023 -0,4043 0,1675 1,7569
fla9 1,1895 4,3686 1,4729 5,4187 0,2194 -0,3921 0,2194 1,6482
fla10 1,2622 4,5444 1,4717 7,2526 0,2194 -0,3921 0,2194 1,6533
fla11 1,3361 4,7856 1,8530 8,0366 0,2194 -0,3921 0,2194 1,7029
fla12 1,1763 4,2340 1,5314 6,0955 0,2194 -0,4050 0,2194 1,7439
fla13 1,2491 4,4099 1,5303 8,0687 0,2194 -0,4050 0,2194 1,7545
fla14 1,3229 4,6508 1,9119 8,3968 0,2194 -0,4050 0,2194 1,7948
fla15 1,1774 4,2576 1,5313 3,1659 0,2194 -0,4050 0,2194 1,7422
fla16 1,2501 4,4335 1,5302 3,9789 0,2194 -0,4050 0,2194 1,7375
fla17 1,3240 4,6744 1,9118 4,8887 0,2194 -0,4050 0,2194 1,7706
fla18 1,2524 4,2611 1,5383 3,2984 0,2194 -0,4043 0,2194 1,7182
fla19 1,3251 4,4370 1,5372 4,5294 0,2194 -0,4043 0,2194 1,7313
fla20 1,3990 4,6779 1,9188 5,3592 0,2194 -0,4043 0,2194 1,7957
fla21 1,1864 4,3389 1,4580 4,1934 0,0717 -0,3921 0,1955 1,6917
fla22 1,2591 4,5147 1,4569 6,2547 0,0717 -0,3921 0,1955 1,7002
fla23 1,3330 4,7559 1,8381 5,9079 0,0727 -0,3921 0,1955 1,6970
fla24 1,1763 4,2340 1,5314 6,0955 0,2194 -0,4050 0,2194 1,7439
fla25 1,2460 4,3802 1,5155 7,6373 0,1094 -0,4050 0,1603 1,7953
fla26 1,3199 4,6210 1,8971 7,9833 0,1094 -0,4050 0,1603 1,8383
fla27 1,1743 4,2279 1,5165 3,0914 0,1094 -0,4050 0,1602 1,7364
fla28 1,2470 4,4038 1,5154 4,5067 0,1094 -0,4050 0,1602 1,7388
fla29 1,3209 4,6446 1,8970 5,0137 0,1094 -0,4050 0,1602 1,8159
fla30 1,2493 4,2314 1,5234 2,5971 0,1023 -0,4043 0,1675 1,7774
fla31 1,3220 4,4073 1,5223 4,6180 0,1023 -0,4043 0,1675 1,7866
fla32 1,3959 4,6482 1,9039 5,0940 0,1023 -0,4043 0,1675 1,8398
CYNA 1,9313 8,2271 4,0815 3,1683 0,2101 -0,4034 0,2101 1,8285
LUTE 1,0655 4,5338 2,2335 1,3426 0,1755 -0,4034 0,1755 1,5373
KEM1 1,1015 4,5913 2,1548 4,3692 0,1776 -0,3933 0,2102 1,5684
KAEM2 2,0875 8,2078 4,1640 12,5381 0,2100 -0,4045 0,2440 1,8540
QUER 1,1726 5,1736 2,5479 5,9484 0,1973 -0,3890 0,2086 1,5559
DAID 1,8112 6,9913 3,3528 1,1196 0,2101 -0,4042 0,2101 1,7843
162
Phụ lục 10e. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC Polarizability SpcPolarizability Surface Volume xvch6 SdsCH SaaCH
fla1 5,8050 0,0205 333,3331 283,2407 0,0726 0,0000 16,2847
fla2 5,8050 0,0193 376,0768 301,1595 0,0709 1,4741 14,4994
fla3 5,8050 0,0204 350,5764 284,0417 0,0709 1,4869 14,4439
fla4 5,8050 0,0195 370,6593 297,7988 0,0709 1,4625 14,4005
fla5 6,5790 0,0221 351,5565 297,0492 0,0726 0,0000 16,5186
fla6 6,5790 0,0206 398,7162 318,9987 0,0709 1,4991 14,7067
fla7 6,5790 0,0218 375,2085 301,7779 0,0709 1,5075 14,6621
fla8 6,5790 0,0209 393,3637 315,0381 0,0709 1,4875 14,6078
fla9 6,5790 0,0208 369,4536 315,5677 0,1047 0,0000 25,4665
fla10 6,4880 0,0203 373,5784 319,3890 0,1004 0,0000 21,4513
fla11 7,3530 0,0223 392,7971 329,4254 0,1004 0,0000 23,2599
fla12 6,5790 0,0215 382,5937 305,5504 0,1029 1,4782 23,7859
fla13 6,4880 0,0209 388,9135 310,3409 0,0986 1,4450 19,8044
fla14 7,3530 0,0223 414,4890 329,9914 0,0986 1,4716 21,5743
fla15 6,5790 0,0195 408,6353 337,7878 0,1029 1,4902 23,7547
fla16 6,4880 0,0196 401,6805 330,5313 0,0986 1,4616 19,7569
fla17 7,3530 0,0234 396,2264 314,7684 0,0986 1,4845 21,5373
fla18 6,5790 0,0214 378,1292 306,9938 0,1029 1,4666 23,7053
fla19 6,4880 0,0208 385,0502 311,8765 0,0986 1,4334 19,7211
fla20 7,3530 0,0223 414,3353 329,5624 0,0986 1,4601 21,4910
fla21 7,3530 0,0211 405,2733 348,6615 0,1047 0,0000 26,0903
fla22 7,2620 0,0206 410,7555 353,1085 0,1004 0,0000 22,0241
fla23 8,1270 0,0246 392,5103 330,7671 0,1004 0,0000 23,8327
fla24 6,5790 0,0215 382,5937 305,5504 0,1029 1,4782 23,7859
fla25 7,2620 0,0220 414,1577 329,4795 0,0986 1,4700 20,3506
fla26 8,1270 0,0233 440,1802 348,4047 0,0986 1,4966 22,1205
fla27 7,3530 0,0240 381,7659 306,5485 0,1029 1,5109 24,3628
fla28 7,2620 0,0212 411,7310 342,6333 0,0986 1,4822 20,3139
fla29 8,1270 0,0244 421,6354 332,6838 0,0986 1,5052 22,0943
fla30 7,3530 0,0225 407,4250 326,3386 0,1029 1,4916 24,3025
fla31 7,2620 0,0219 413,4352 331,0153 0,0986 1,4584 20,2673
fla32 8,1270 0,0233 440,4050 348,2668 0,0986 1,4851 22,0372
CYNA 7,7400 0,0211 453,6429 367,4498 0,0858 1,1032 6,1253
LUTE 3,8700 0,0186 261,0753 208,1012 0,0596 1,1577 6,2125
KEM1 4,6440 0,0202 284,5858 229,8373 0,0614 0,0000 8,2974
KAEM2 9,2880 0,0224 498,6732 414,7864 0,0876 0,0000 7,5773
QUER 3,8700 0,0179 271,2661 216,4776 0,0576 0,0000 5,6409
DAID 7,7400 0,0243 402,8370 318,9727 0,0928 1,3003 10,5331
163
Phụ lục 10f. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC SdssC SaasC SdO k0 k1 k2 k3 ka1
fla1 0,5750 1,6814 12,7361 30,1156 17,8112 8,3927 4,1588 15,3016
fla2 0,8330 2,3045 12,3401 30,1156 17,8112 8,3927 4,5455 15,3016
fla3 0,8497 2,3120 12,2436 30,1156 17,8112 8,3927 4,5455 15,3016
fla4 0,8871 2,2976 12,5996 30,1156 17,8112 8,3927 4,3457 15,3016
fla5 0,9862 1,7789 12,8369 31,9209 18,7811 9,0873 4,6012 16,2646
fla6 1,1359 2,4450 12,4064 31,9209 18,7811 9,0873 5,0193 16,2646
fla7 1,1511 2,4555 12,2990 31,9209 18,7811 9,0873 5,0193 16,2646
fla8 1,1847 2,4381 12,6550 31,9209 18,7811 9,0873 4,8034 16,2646
fla9 0,4675 2,3437 13,0726 38,1122 21,2404 10,3469 5,0238 18,0053
fla10 0,1135 1,5631 13,0677 40,0013 22,2031 10,5434 5,2578 18,8922
fla11 0,3684 2,9209 13,1396 41,9054 23,1680 11,2277 5,5068 19,8774
fla12 0,7661 3,0072 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053
fla13 0,5319 2,1990 12,5580 40,0013 22,2031 10,5434 5,6266 18,8922
fla14 0,7009 3,5928 12,6101 41,9054 23,1680 11,2277 5,8800 19,8774
fla15 0,7832 3,0189 12,4286 38,1122 21,2404 10,3469 5,3890 18,0053
fla16 0,5503 2,2093 12,4255 40,0013 22,2031 10,5434 5,6266 18,8922
fla17 0,7184 3,6058 12,4706 41,9054 23,1680 11,2277 5,8800 19,8774
fla18 0,8222 3,0068 12,7846 38,1122 21,2404 10,3469 5,2016 18,0053
fla19 0,5941 2,2017 12,7815 40,0013 22,2031 10,5434 5,4375 18,8922
fla20 0,7587 3,5954 12,8267 41,9054 23,1680 11,2277 5,6888 19,8774
fla21 0,8787 2,5840 13,1734 40,0013 22,2031 11,0395 5,4375 18,9590
fla22 0,5247 1,8493 13,1685 41,9054 23,1680 11,2277 5,6888 19,8487
fla23 0,7796 3,2070 13,2404 43,8240 24,1349 11,9234 5,9259 20,8367
fla24 0,7661 3,0072 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053
fla25 0,8347 2,5283 12,6243 41,9054 23,1680 11,2277 6,0810 19,8487
fla26 1,0037 3,9221 12,6764 43,8240 24,1349 11,9234 6,3209 20,8367
fla27 1,0847 3,3053 12,4840 40,0013 22,2031 11,0395 5,8258 18,9590
fla28 0,8517 2,5415 12,4809 41,9054 23,1680 11,2277 6,0810 19,8487
fla29 1,0198 3,9380 12,5260 43,8240 24,1349 11,9234 6,3209 20,8367
fla30 1,1198 3,2902 12,8400 40,0013 22,2031 11,0395 5,6266 18,9590
fla31 0,8917 2,5309 12,8369 41,9054 23,1680 11,2277 5,8800 19,8487
fla32 1,0563 3,9247 12,8821 43,8240 24,1349 11,9234 6,1186 20,8367
CYNA -0,5621 -1,3488 12,5338 48,1648 25,1037 10,3180 5,1775 22,6371
LUTE -0,3573 -0,9230 12,0433 27,7666 15,8790 6,2457 3,2000 13,6247
KEM1 -0,4782 -0,0737 12,4767 28,3292 16,8438 6,8571 3,2986 14,5816
KAEM2 -3,0291 -1,2350 36,8317 56,8193 29,9700 12,6688 6,8402 26,8807
QUER -1,9188 -1,9610 12,1429 29,5333 16,8438 6,4815 3,1653 14,5432
DAID 0,0476 1,3775 12,8115 43,1095 23,1680 9,8681 4,8595 20,7887
164
Phụ lục 10g. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
HC ka2 ka3 Hother Hmax Gmax Hmin
fla1 6,6616 3,1183 14,2173 2,6945 12,7361 0,7651
fla2 6,6616 3,4269 14,4907 2,6663 12,3401 0,7261
fla3 6,6616 3,4269 14,5027 2,6681 12,2436 0,7284
fla4 6,6616 3,2671 14,5290 2,6655 12,5996 0,7251
fla5 7,3138 3,5128 15,0379 1,4629 12,8369 0,7731
fla6 7,3138 3,8520 15,2898 1,6012 12,4064 0,7341
fla7 7,3138 3,8520 15,3037 1,6105 12,2990 0,7364
fla8 7,3138 3,6766 15,3275 1,6349 12,6550 0,7331
fla9 8,1029 3,7080 20,4449 2,7803 13,0726 1,2384
fla10 8,2804 3,9037 19,9245 2,8069 13,1594 1,2698
fla11 8,9391 4,1515 20,5388 2,8015 13,1396 0,7720
fla12 8,1029 3,9952 20,6396 2,7521 12,5616 1,2105
fla13 8,2804 4,1952 20,1308 2,7787 13,0557 1,2284
fla14 8,9391 4,4502 20,7357 2,7733 12,6101 0,7618
fla15 8,1029 3,9952 20,6628 2,7539 12,4286 1,2148
fla16 8,2804 4,1952 20,1554 2,7805 13,0715 1,2351
fla17 8,9391 4,4502 20,7607 2,7751 12,4706 0,7625
fla18 8,1029 3,8476 20,6756 2,7514 12,7846 1,2091
fla19 8,2804 4,0455 20,1673 2,7779 13,0530 1,2298
fla20 8,9391 4,2970 20,7719 2,7726 12,8267 0,7614
fla21 8,7502 4,0720 21,3403 1,4906 13,1734 0,8496
fla22 8,9197 4,2855 20,8378 1,5168 13,2725 0,8706
fla23 9,5928 4,5240 21,4499 1,5001 13,2404 0,7740
fla24 8,1029 3,9952 20,6396 2,7521 12,5616 1,2105
fla25 8,9197 4,5997 21,0226 1,6507 13,1688 0,8495
fla26 9,5928 4,8437 21,6253 1,6473 12,6764 0,7638
fla27 8,7502 4,3815 21,5386 1,6554 12,4840 0,8299
fla28 8,9197 4,5997 21,0490 1,6724 13,1846 0,8509
fla29 9,5928 4,8437 21,6521 1,6691 12,5260 0,7645
fla30 8,7502 4,2225 21,5489 1,6576 12,8400 0,8279
fla31 8,9197 4,4384 21,0585 1,6676 13,1661 0,8489
fla32 9,5928 4,6797 21,6609 1,6657 12,8821 0,7634
CYNA 8,7667 4,2537 17,7797 2,8630 12,5338 1,0768
LUTE 4,8846 2,3765 9,3564 2,7601 12,0433 1,4778
KEM1 5,4501 2,4890 9,9728 2,7856 12,4767 0,9032
KAEM2 10,6711 5,5727 19,9921 2,8841 13,5259 0,8773
QUER 5,1089 2,3710 7,8932 2,8701 12,1429 1,5111
DAID 8,3415 3,9613 20,0342 2,7582 12,8115 1,0526
165
Phụ lục 10h. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone
Name Gmin Hmaxpos fw phia knotp knotpv LogP
fla1 -0,2533 2,6945 309,3214 4,4319 -2,0772 -0,4477 3,5667
fla2 -0,1360 2,6663 309,3214 4,4319 -1,8046 -0,4018 3,5771
fla3 -0,1067 2,6681 309,3214 4,4319 -1,8006 -0,4028 3,5789
fla4 -0,0860 2,6655 309,3214 4,4319 -1,9875 -0,4725 3,5527
fla5 -0,2075 1,4629 323,3483 4,9565 -1,9927 -0,4416 3,3597
fla6 -0,1085 1,6012 323,3483 4,9565 -1,7201 -0,3957 3,6291
fla7 -0,0845 1,6105 323,3483 4,9565 -1,7161 -0,3967 3,6037
fla8 -0,0638 1,6349 323,3483 4,9565 -1,9030 -0,4663 3,6386
fla9 -0,2722 2,7803 371,3923 5,2105 -2,5314 -0,6595 4,6313
fla10 -0,4088 2,8069 389,3828 5,3943 -2,6510 -0,6693 4,4724
fla11 -0,2891 2,8015 401,4185 5,9229 -2,8201 -0,7381 4,6684
fla12 -0,1485 2,7521 371,3923 5,2105 -2,2588 -0,6136 4,6181
fla13 -0,3860 2,7787 389,3828 5,3943 -2,3783 -0,6234 4,6932
fla14 -0,1604 2,7733 401,4185 5,9229 -2,5475 -0,6922 4,6413
fla15 -0,1171 2,7539 371,3923 5,2105 -2,2548 -0,6146 4,5401
fla16 -0,3836 2,7805 389,3828 5,3943 -2,3744 -0,6244 4,6469
fla17 -0,1273 2,7751 401,4185 5,9229 -2,5435 -0,6932 4,5471
fla18 -0,0964 2,7514 371,3923 5,2105 -2,4417 -0,6843 4,5021
fla19 -0,3830 2,7779 389,3828 5,3943 -2,5613 -0,6941 4,6616
fla20 -0,1066 2,7726 401,4185 5,9229 -2,7304 -0,7629 4,5404
fla21 -0,2264 1,4906 385,4192 5,7205 -2,4826 -0,6565 3,7509
fla22 -0,3630 1,5168 403,4096 5,9015 -2,6021 -0,6662 3,6648
fla23 -0,2433 1,5001 415,4454 6,4478 -2,7712 -0,7350 3,7660
fla24 -0,1485 2,7521 371,3923 5,2105 -2,2588 -0,6136 4,6181
fla25 -0,3402 1,6507 403,4096 5,9015 -2,3295 -0,6203 4,0615
fla26 -0,1329 1,6473 415,4454 6,4478 -2,4986 -0,6891 4,2235
fla27 -0,0948 1,6554 385,4192 5,7205 -2,2060 -0,6116 4,1496
fla28 -0,3378 1,6724 403,4096 5,9015 -2,3256 -0,6213 4,0111
fla29 -0,1051 1,6691 415,4454 6,4478 -2,4947 -0,6901 4,1865
fla30 -0,0741 1,6576 385,4192 5,7205 -2,3929 -0,6812 4,1772
fla31 -0,3372 1,6676 403,4096 5,9015 -2,5125 -0,6910 4,0687
fla32 -0,0844 1,6657 415,4454 6,4478 -2,6816 -0,7598 4,2308
CYNA -1,6769 2,8630 448,3832 6,2016 -4,1478 -0,9370 0,7696
LUTE -0,4895 2,7601 286,2408 3,1691 -2,2140 -0,4747 2,7887
KEM1 -0,5516 2,7856 300,2677 3,6123 -2,2252 -0,5300 3,4560
KAEM2 -1,5866 2,8841 516,4584 7,7526 -3,3066 -0,9145 1,4743
QUER -0,8877 2,8701 302,2402 3,3773 -2,7852 -0,5417 2,6359
DAID -1,5628 2,7582 416,3844 5,7803 -3,7055 -0,9210 1,0960
166
Phụ lục 11. Định Danh thực vật chiết xuất
167
168
169
170
171
Phụ lục 12. Thử hoạt tính khánh ung thư cô tử cung (HeLa)
172
173
Phụ lục 13. phô 1H-NMR CSL1
Phụ lục 14. phô DEPT CSL1
174
Phụ lục 15. Phô 13C-NMR CSL1
175
Phụ lục 16. Phô HMBC CSL1
176
Phụ lục 17. Phô HSQC CSL1
177
Phụ lục 18. Phô 1H-NMR GML1
178
Phụ lục 19. Phô 13C-NMR GML1
179
Phụ lục 20. Phô DEPT GML1
180
Phụ lục 21. Phô HMBC GML1
181
Phụ lục 22. Phô HSQC GML1
182
Phụ lục 24. Phô 1H-NMR AIL1
183
Phụ lục 25. Phô 13C-NMR AIL1
184
Phụ lục 26. Phô DEPT AIL1
185
Phụ lục 27. Phô HSQC AIL1
186
Phụ lục 28. Phô HMBC của AIL1
187
Phụ lục 29. 1H-NMR của POL1
188
Phụ lục 30. Phô 13C-NMR của POL1
189
Phụ lục. 31 Phô DEPT của POL1
190
Phụ lục 32. Phô HMBC của POL1
191
Phụ lục 33. Phô HSQC của POL1
192
Phụ lục 34. Phô 1H-NMR ZZL1
193
Phụ lục 35. Phô 13C-NMR ZZL1
194
Phụ lục 36. Phô DEPT ZZL1
195
Phụ lục 37. Phô HMBC ZZL1
196
Phụ lục 38. Phô HSQC ZZL1
197
Phụ lục 39. Phô 1H-NMR ZZL2
198
Phụ lục 40. Phô 13C-NMR ZZL2
199
Phụ lục 41. Phô DEPT ZZL2
200
Phụ lục 42. Phô HMBC ZZL2
201
Phụ lục 43. Phô HSQC ZZL2
202
Phụ lục 44. Dữ liệu cấu trúc tinh thể GML1
Tham số Dư liệu
Công thức phân tử C21H15O11
Khối lượng phân tủ 443,33
ToK 100
Hệ tinh thể monoclinic
Nhóm không gian P21
a/Å 14,6876(11)
b/Å 4,3568(3)
c/Å 17,3072(11)
α/° 90
β/° 111,658(3)
γ/° 90
Thể tích/Å3 1029,32(13)
Z 2
Tỉ khối tính toán ρcalcg/cm3 1,43
Hệ số hấp thu μ/mm-1 0,118
F(000) 458
Kích thước tinh thể/mm3 0,1 × 0,05 × 0,05
Bức xạ MoKα (λ = 0,71073)
Phạm vi thu thập dữ liệu 2Θ /° 5,968 to 64,054
Chỉ số index -21 ≤ h ≤ 20, -6 ≤ k ≤ 6, -25 ≤ l ≤ 25
Số phản xạ đo được 25478
Số phản xạ độc lập 6681 [Rint = 0,0399, Rsigma = 0,0506]
Dữ liệu/giới hạn/tham số 6681/1/300
Hệ số phù hợp mô hình F2 1,022
Độ sai lệch [I>=2σ (I)] R1 = 0,0454, wR2 = 0,0962
Độ sai lệch tông cộng R R1 = 0,0675, wR2 = 0,1049
Mật độ đỉnh/lỗ / e Å-3 0,48/-0,39
Tham số Flack -0,1(3)
203
Phụ lục 45. Tọa độ các nguyên tử (Å2×103) trong phân tử GML1
Nguyên
tố x y z U(eq)
C1 6784,2(15) 6651(5) 4394,3(12) 13,4(4)
C2 7530,0(16) 4966(6) 4954,6(13) 19,8(5)
C3 7502,7(16) 4507(6) 5741,4(13) 19,4(5)
O4 8270,0(13) 2864(6) 6278,7(10) 35,5(5)
C5 8308,2(18) 2414(7) 7066,4(14) 29,9(6)
C6 7627,0(16) 3319(6) 7363,0(12) 17,7(5)
C7 6751,4(15) 4914(5) 6808,4(12) 13,2(4)
O8 6054,2(11) 5635(4) 7008,3(9) 16,4(3)
C9 6759,7(15) 5634(5) 5983,0(12) 13,9(4)
C10 6022,1(15) 7390(5) 5395,8(12) 14,3(4)
C11 6030,7(15) 7906(5) 4611,7(12) 14,4(4)
O12 6717,3(11) 7286(4) 3596,4(8) 14,3(3)
C13 7271,2(14) 5460(5) 3257,5(11) 11,4(4)
C14 6882,9(14) 6152(5) 2325,0(11) 11,5(4)
O15 5909,6(10) 5077(4) 1923,3(9) 13,6(3)
C16 7526,6(14) 4733(5) 1899,5(11) 11,3(4)
O17 7287,6(11) 6027(4) 1088,6(8) 15,8(3)
C18 8611,7(14) 5320(5) 2388,4(11) 12,1(4)
O19 9242,9(11) 3547(4) 2110,4(9) 18,8(3)
C20 8858,6(15) 4532(5) 3305,1(12) 11,5(4)
C21 9916,8(14) 5270(5) 3806,3(11) 14,2(4)
O22 10205,1(12) 4548(4) 4667,5(9) 19,7(3)
O23 8259(1) 6383(4) 3617,4(8) 12,0(3)
C24 7796,5(15) 2632(5) 8247,6(12) 14,3(4)
C25 8660,9(16) 3583(6) 8876,5(13) 19,2(5)
C26 8867,4(16) 2729(6) 9696,9(13) 17,5(4)
C27 8215,1(16) 897(5) 9892,4(12) 13,3(4)
O28 8470,0(11) 22(4) 10709,1(8) 17,6(3)
C29 7336,4(15) -16(5) 9277,2(12) 14,7(4)
C30 7135,3(16) 853(5) 8459,1(12) 14,7(4)
O30 4774,0(11) 9985(4) 1799,3(9) 14,6(3)
O29 5530,0(12) 4463(4) -102,8(9) 17,7(3)
204
Phụ lục 46. Các thông số đẳng hướng (Å2×103) trong phân tử GML1
Nguyên tố U11 U22 U33 U23 U13 U12
C1 14,5(10) 17,3(10) 9,5(9) 0,0(8) 5,6(8) -1,7(8)
C2 15,2(10) 34,4(13) 12,4(9) 5,4(10) 8,1(8) 9,1(10)
C3 15,7(10) 30,9(13) 11,4(9) 6,3(9) 4,8(8) 8,2(9)
O4 26,3(9) 69,6(15) 15,9(8) 18,9(9) 14,2(7) 29,2(10)
C5 24,6(12) 54,5(18) 12(1) 14,2(11) 8,3(9) 19,8(13)
C6 16,3(10) 25,7(12) 11,3(9) 4,1(9) 5,5(8) 3,7(9)
C7 15,3(9) 15,3(10) 10,0(8) -1,4(8) 5,9(7) -2,0(8)
O8 14,6(7) 24,6(9) 12,1(7) 1,7(6) 7,7(6) 2,9(6)
C9 13,4(9) 19,4(11) 10,2(8) 0,2(8) 5,8(8) -1,5(8)
C10 12,7(10) 18,5(10) 12,7(9) -0,2(8) 5,9(8) 0,8(8)
C11 14(1) 16,8(11) 13,0(9) 1,9(8) 5,7(8) 3,2(8)
O12 16,9(7) 18,9(8) 8,9(6) 2,2(6) 6,8(6) 3,7(6)
C13 12,1(9) 14,3(10) 9,3(8) 0,9(7) 5,7(7) -0,5(8)
C14 11,4(9) 12,9(9) 9,7(8) 1,0(7) 3,2(8) -1,4(8)
O15 9,9(7) 15,1(7) 14,1(6) -1,1(6) 2,4(5) -1,4(6)
C16 12,5(9) 13,4(9) 7,5(8) 0,6(7) 3,1(7) -1,1(8)
O17 14,3(7) 24,5(8) 7,2(6) 2,5(6) 2,2(5) -4,8(6)
C18 12,1(9) 15,4(10) 8,8(8) -0,5(7) 4,0(7) -1,1(8)
O19 15,0(7) 29,0(9) 12,2(7) -7,1(7) 4,8(6) 0,8(7)
C20 13,3(9) 11,3(9) 10,1(8) 0,2(7) 4,8(7) 1,1(8)
C21 12,7(10) 18,8(11) 9,6(8) 0,7(8) 2,3(7) -0,7(9)
O22 20,0(8) 24,1(9) 11,1(7) 4,2(6) 1,1(6) 0,6(7)
O23 11,2(7) 15,3(7) 9,9(6) -1,2(6) 4,3(6) -0,2(6)
C24 13,8(10) 19,4(11) 10,5(8) 2,7(8) 5,5(8) 5,4(9)
C25 16,3(11) 26,1(12) 16(1) 6,0(9) 6,7(9) -0,6(9)
C26 15,4(10) 21,3(11) 13,5(9) 1,1(9) 2,6(8) -2,7(9)
C27 17,7(10) 13,2(10) 9,5(8) 0,2(7) 5,5(8) 1,6(8)
O28 22,5(8) 20,2(8) 9,4(6) 1,8(6) 4,9(6) -5,4(7)
C29 15,8(10) 16,6(10) 13,1(9) 0,1(8) 6,9(8) -0,8(9)
C30 14,7(10) 16,8(11) 11,4(9) -1,5(8) 3,4(8) 0,8(8)
O30 14,1(7) 16,4(7) 15,7(7) -1,6(6) 8,4(6) -2,2(6)
205
O29 20,2(8) 21,0(8) 11,7(7) -0,7(6) 5,5(6) -3,3(6)
206
Phụ lục 47. Độ dài liên kết trong phân tử GML1
Nguyên tố Độ dài /Å Nguyên tố
Độ dài /Å
C1 C2 1,377(3) C14 O15 1,419(2)
C1 C11 1,405(3) C14 C16 1,527(3)
C1 O12 1,376(2) C16 O17 1,431(2)
C2 C3 1,391(3) C16 C18 1,525(3)
C3 O4 1,369(3) C18 O19 1,420(3)
C3 C9 1,394(3) C18 C20 1,530(3)
O4 C5 1,358(3) C20 C21 1,509(3)
C5 C6 1,341(3) C20 O23 1,439(2)
C6 C7 1,465(3) C21 O22 1,426(2)
C6 C24 1,488(3) C24 C25 1,396(3)
C7 O8 1,237(3) C24 C30 1,393(3)
C7 C9 1,467(3) C25 C26 1,389(3)
C9 C10 1,407(3) C26 C27 1,381(3)
C10 C11 1,380(3) C27 O28 1,376(2)
O12 C13 1,411(2) C27 C29 1,394(3)
C13 C14 1,530(3) C29 C30 1,388(3)
207
Phụ lục 48. Góc liên kết trong phân tử GML1
Góc Góc /˚ Góc Góc/˚
C2 C1 C11 121,31(18) O15 C14 C13 111,58(16)
O12 C1 C2 123,91(18) O15 C14 C16 108,74(16)
O12 C1 C11 114,78(18) C16 C14 C13 111,88(16)
C1 C2 C3 117,59(19) O17 C16 C14 109,99(16)
C2 C3 C9 123,5(2) O17 C16 C18 107,82(15)
O4 C3 C2 115,22(19) C18 C16 C14 111,76(16)
O4 C3 C9 121,31(18) C16 C18 C20 109,69(15)
C5 O4 C3 118,43(18) O19 C18 C16 113,57(16)
C6 C5 O4 125,6(2) O19 C18 C20 107,14(16)
C5 C6 C7 119,15(18) C21 C20 C18 110,37(16)
C5 C6 C24 118,0(2) O23 C20 C18 108,66(15)
C7 C6 C24 122,85(18) O23 C20 C21 107,94(16)
C6 C7 C9 114,74(18) O22 C21 C20 113,55(16)
O8 C7 C6 123,68(17) C13 O23 C20 110,30(15)
O8 C7 C9 121,57(19) C25 C24 C6 120,08(19)
C3 C9 C7 120,37(19) C30 C24 C6 120,94(19)
C3 C9 C10 117,01(18) C30 C24 C25 118,82(19)
C10 C9 C7 122,60(19) C26 C25 C24 120,7(2)
C11 C10 C9 120,98(19) C27 C26 C25 119,7(2)
C10 C11 C1 119,61(19) C26 C27 C29 120,53(18)
C1 O12 C13 117,73(16) O28 C27 C26 117,48(18)
O12 C13 C14 106,25(16) O28 C27 C29 121,99(19)
O23 C13 O12 108,23(16) C30 C29 C27 119,33(19)
O23 C13 C14 109,40(15) C29 C30 C24 120,88(19)
208
Phụ lục 49. Góc xoắn trong phân tử GML1
A B C D Góc/˚ A B C D Góc/˚
C1 C2 C3 O4 -178,9(2) O12 C1 C11 C10 179,5(2)
C1 C2 C3 C9 0,7(4) O12 C13 C14 O15 -67,3(2)
C1 O12 C13 C14 167,23(17) O12 C13 C14 C16 170,61(16)
C1 O12 C13 O23 -75,4(2) O12 C13 O23 C20 178,62(14)
C2 C1 C11 C10 -1,4(3) C13 C14 C16 O17 -165,89(16)
C2 C1 O12 C13 18,1(3) C13 C14 C16 C18 -46,2(2)
C2 C3 O4 C5 177,9(3) C14 C13 O23 C20 -66,02(19)
C2 C3 C9 C7 176,6(2) C14 C16 C18 O19 168,12(16)
C2 C3 C9 C10 -1,8(4) C14 C16 C18 C20 48,3(2)
C3 O4 C5 C6 3,5(5) O15 C14 C16 O17 70,4(2)
C3 C9 C10 C11 1,3(3) O15 C14 C16 C18 -169,87(17)
O4 C3 C9 C7 -3,9(4) C16 C18 C20 C21 -176,79(17)
O4 C3 C9 C10 177,7(2) C16 C18 C20 O23 -58,6(2)
O4 C5 C6 C7 0,6(5) O17 C16 C18 O19 -70,9(2)
O4 C5 C6 C24 -179,8(3) O17 C16 C18 C20 169,27(17)
C5 C6 C7 O8 174,6(3) C18 C20 C21 O22 -179,07(17)
C5 C6 C7 C9 -5,8(3) C18 C20 O23 C13 69,13(19)
C5 C6 C24 C25 54,6(4) O19 C18 C20 C21 59,5(2)
C5 C6 C24 C30 -120,7(3) O19 C18 C20 O23 177,68(16)
C6 C7 C9 C3 7,4(3) C21 C20 O23 C13 -171,17(16)
209
Phụ lục 50. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng
(Å2×103) của phân tử GML1
Atom x y z U(eq)
H2 8045 4146 4809 24
H5 8865 1370 7439 36
H10 5511 8234 5541 17
H11 5530 9102 4221 17
H13 7199 3232 3361 14
H14 6882 8429 2251 14
H15 5515 6527 1874 20
H16 7409 2468 1846 14
H17 6747 5325 769 24
H18 8752 7545 2343 14
H19 8929 2893 1628 28
H20 8730 2306 3364 14
H21A 10338 4115 3574 17
H21B 10028 7485 3749 17
H22 9903 2977 4723 30
H25 9113 4827 8742 23
H26 9455 3401 10122 21
H28 8055 -1231 10749 26
H29 6880 -1220 9416 18
H30 6539 225 8038 18
H30A 5171 11545 1936 22
H30B 4426 9952 2111 22
H29A 5210 2904 -15 27
H29B 5510 4402 -611 27
210
Phụ lục 51. Dữ liệu cấu trúc tinh thể của ZZL1
Tham số Pna21
Công thức phân tử C16H12O6
Khối lượng phân tử 300,26
ToK 100
Hệ tinh thể orthorhombic
Nhóm không gian Pna21
a/Å 7,0060(4)
b/Å 25,9070(14)
c/Å 7,2062(4)
α/° 90
β/° 90
γ/° 90
Thể tích/Å3 1307,96(13)
Z 4
Tỉ khối tính toán ρcalcg/cm3 1,525
Hệ số hấp thu μ/mm-1 0,118
F(000) 624
Kích thước tinh thể /mm3 0,1 × 0,08 × 0,04
Bức xạ MoKα (λ = 0,71073)
Phạm vi thu thập dữ liệu 2Θ /° 5,868 to 61,67
Chỉ số index -10 ≤ h ≤ 10, -37 ≤ k ≤ 37, -10 ≤ l ≤ 10
Số phản xạ đo được 44181
Số phản xạ độc lập 4114 [Rint = 0,0465, Rsigma = 0,0199]
Dữ liệu/giới hạn/tham số 4114/1/203
Hệ số phù hợp mô hình F2 1,092
Độ sai lệch [I>=2σ (I)] R1 = 0,0387, wR2 = 0,0959
Độ sai lệch tông cộng R R1 = 0,0427, wR2 = 0,0987
Mật độ đỉnh/lỗ / e Å-3 0,44/-0,24
Tham số Flack 0,0(2)
211
Phụ lục 52. Tọa độ các nguyên tử trong phân tử ZZL1
Nguyên
tố x y z U(eq)
C1 7729(2) 3675,6(6) 4775(2) 10,9(3)
C2 8443(2) 3485,4(6) 6392(2) 11,1(3)
O3 9062,3(18) 3807,2(5) 7788,2(17) 13,7(2)
C4 7590(3) 3901,3(7) 9151(3) 20,0(4)
C5 8572(2) 2936,4(6) 6728(2) 10,7(3)
O6 9224,5(18) 2758,0(5) 8233,1(18) 14,2(2)
C7 7914(2) 2611,6(6) 5243(2) 10,7(3)
C8 7974(2) 2063,4(6) 5363(2) 11,1(3)
O9 8594(2) 1833,0(5) 6930,0(18) 16,2(3)
C10 7379(2) 1763,2(6) 3882(3) 12,5(3)
C11 6715(2) 2000,8(6) 2255(2) 12,0(3)
O12 6171(2) 1683,8(5) 869,4(19) 16,4(3)
C13 6619(2) 2537,4(6) 2097(2) 11,7(3)
C14 7222(2) 2829,9(6) 3600(2) 10,4(3)
O15 7127,6(18) 3355,0(4) 3393,7(18) 12,4(2)
C16 7513(2) 4222,1(6) 4268(2) 12,9(3)
C17 5993(2) 4377,7(6) 3133(3) 14,7(3)
C18 5805(3) 4890,1(7) 2589(3) 16,8(3)
C19 7136(3) 5253,5(7) 3183(3) 18,3(3)
O20 6892(2) 5746,0(5) 2576(3) 25,7(3)
C21 8635(3) 5105,0(7) 4328(3) 22,0(4)
C22 8829(3) 4592,3(7) 4862(3) 19,1(3)
212
Phụ lục 53. Các thông số đẳng hướng (Å2×103) trong phân tử k ZZL1
Nguyên
tố U11 U22 U33 U23 U13 U12
C1 10,9(7) 10,0(6) 11,9(7) 0,4(5) 1,0(6) -1,1(5)
C2 13,1(7) 9,5(6) 10,9(6) -0,1(5) 0,8(6) -1,1(5)
O3 16,4(6) 13,1(5) 11,7(5) -1,8(4) -0,2(4) -2,0(4)
C4 23,0(9) 21,7(8) 15,3(8) -3,5(7) 3,6(7) 0,3(7)
C5 10,3(7) 11,0(6) 10,7(7) 1,3(5) 0,9(5) -0,2(5)
O6 18,3(6) 13,3(5) 11,0(5) 3,1(4) -2,2(5) -0,1(4)
C7 11,4(7) 10,0(6) 10,8(6) 0,6(5) -0,6(5) -0,2(5)
C8 11,1(7) 10,4(6) 11,7(7) 2,1(5) 0,5(5) 1,0(5)
O9 23,3(7) 11,5(5) 13,7(6) 3,3(4) -3,4(5) 0,7(4)
C10 11,6(7) 11,5(6) 14,5(7) -0,2(5) 1,2(6) 0,0(5)
C11 10,1(7) 12,8(7) 13,0(7) -1,8(5) 0,9(6) -1,1(5)
O12 21,4(6) 12,7(5) 15,2(6) -2,8(4) -5,7(5) 0,1(5)
C13 12,8(7) 11,8(6) 10,5(6) 0,2(5) -0,9(5) 0,4(5)
C14 11,0(7) 9,5(6) 10,5(7) 0,6(5) 0,4(5) -0,1(5)
O15 16,2(6) 9,5(5) 11,5(5) 0,8(4) -2,0(4) -0,3(4)
C16 16,5(8) 9,4(6) 12,8(7) 1,4(5) 2,0(6) -0,4(5)
C17 17,2(8) 12,1(7) 14,9(7) 1,0(6) -0,7(6) 0,4(6)
C18 20,0(8) 12,3(7) 18,1(7) 2,6(6) 0,4(7) 3,1(6)
C19 22,9(8) 10,8(6) 21,2(8) 4,3(6) 5,0(7) 1,2(6)
O20 30,9(8) 10,2(6) 36,1(8) 7,4(5) 2,2(7) -1,0(5)
C21 24,7(9) 14,6(8) 26,8(9) 5,4(7) -2,6(7) -7,8(7)
C22 18,6(8) 14,9(7) 23,7(9) 5,3(7) -4,3(7) -4,6(6)
213
Phụ lục 54. Độ dài liên kết trong phân tử ZZL1
Liên kết Góc/Å Liên kết Góc/Å
C1 C2 1,360(2) C10 C11 1,404(2)
C1 O15 1,3631(19) C11 O12 1,348(2)
C1 C16 1,470(2) C11 C13 1,396(2)
C2 O3 1,3766(19) C13 C14 1,388(2)
C2 C5 1,446(2) C14 O15 1,3701(17)
O3 C4 1,445(2) C16 C17 1,402(2)
C5 O6 1,264(2) C16 C22 1,397(2)
C5 C7 1,437(2) C17 C18 1,390(2)
C7 C8 1,423(2) C18 C19 1,393(3)
C7 C14 1,399(2) C19 O20 1,360(2)
C8 O9 1,3489(19) C19 C21 1,390(3)
C8 C10 1,385(2) C21 C22 1,389(2)
214
Phụ lục 55. Góc liên kết trong phân tử ZZL1
Nguyên tố Góc/˚ Nguyên tố Góc/˚
C2 C1 O15 121,24(14) O12 C11 C13 122,20(15)
C2 C1 C16 126,82(15) C13 C11 C10 121,37(15)
O15 C1 C16 111,93(14) C14 C13 C11 117,74(15)
C1 C2 O3 121,51(14) C13 C14 C7 123,04(14)
C1 C2 C5 121,51(14) O15 C14 C7 120,67(13)
O3 C2 C5 116,98(14) O15 C14 C13 116,28(14)
C2 O3 C4 111,96(13) C1 O15 C14 120,71(13)
O6 C5 C2 121,72(14) C17 C16 C1 119,98(15)
O6 C5 C7 122,74(13) C22 C16 C1 121,14(15)
C7 C5 C2 115,54(14) C22 C16 C17 118,86(15)
C8 C7 C5 121,94(14) C18 C17 C16 120,71(16)
C14 C7 C5 120,32(13) C17 C18 C19 119,69(17)
C14 C7 C8 117,73(14) O20 C19 C18 116,81(17)
O9 C8 C7 120,14(14) O20 C19 C21 123,10(17)
O9 C8 C10 119,56(14) C21 C19 C18 120,09(16)
C10 C8 C7 120,30(14) C22 C21 C19 120,20(17)
C8 C10 C11 119,82(14) C21 C22 C16 120,44(17)
O12 C11 C10 116,43(14)
215
Phụ lục 56. Góc xoắn trong phân tử ZZL1
A B C D Angle/˚ A B C D Angle/˚
C1 C2 O3 C4 94,58(19) C8 C10 C11 C13 -0,7(3)
C1 C2 C5 O6 -179,57(16) O9 C8 C10 C11 179,36(15)
C1 C2 C5 C7 0,5(2) C10 C11 C13 C14 0,6(2)
C1 C16 C17 C18 -177,82(16) C11 C13 C14 C7 0,1(2)
C1 C16 C22 C21 178,18(18) C11 C13 C14 O15 179,36(14)
C2 C1 O15 C14 0,2(2) O12 C11 C13 C14 -179,69(16)
C2 C1 C16 C17 -147,34(18) C13 C14 O15 C1 -178,46(14)
C2 C1 C16 C22 34,2(3) C14 C7 C8 O9 -178,69(15)
C2 C5 C7 C8 179,25(15) C14 C7 C8 C10 0,7(2)
C2 C5 C7 C14 0,5(2) O15 C1 C2 O3 179,63(14)
O3 C2 C5 O6 -0,1(2) O15 C1 C2 C5 -0,9(2)
O3 C2 C5 C7 -179,99(14) O15 C1 C16 C17 33,2(2)
C5 C2 O3 C4 -84,94(18) O15 C1 C16 C22 -145,26(17)
C5 C7 C8 O9 2,5(2) C16 C1 C2 O3 0,2(3)
C5 C7 C8 C10 -178,10(16) C16 C1 C2 C5 179,69(15)
C5 C7 C14 C13 178,05(16) C16 C1 O15 C14 179,73(14)
C5 C7 C14 O15 -1,2(2) C16 C17 C18 C19 -0,2(3)
O6 C5 C7 C8 -0,7(3) C17 C16 C22 C21 -0,3(3)
O6 C5 C7 C14 -179,43(15) C17 C18 C19 O20 178,86(17)
C7 C8 C10 C11 0,0(2) C17 C18 C19 C21 -0,6(3)
C7 C14 O15 C1 0,8(2) C18 C19 C21 C22 1,0(3)
C8 C7 C14 C13 -0,7(2) C19 C21 C22 C16 -0,5(3)
C8 C7 C14 O15 -179,95(15) O20 C19 C21 C22 -178,44(19)
C8 C10 C11 O12 179,61(15) C22 C16 C17 C18 0,7(3)
216
Phụ lục 57. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng
(Å2×103) trong Pna21 của hợp chất ZZL1
Nguyên tố x y z U(eq)
H4A 6661 4147 8650 30
H4B 8166 4044 10279 30
H4C 6944 3576 9449 30
H9 8902 2059 7709 24
H10 7421 1397 3967 15
H12 5665 1858 18 25
H13 6157 2697 998 14
H17 5082 4130 2731 18
H18 4773 4992 1815 20
H20 7770 5933 2997 39
H21 9530 5355 4746 26
H22 9863 4493 5636 23
217
Phụ lục 58. Tính toán các tham số cấu trúc phân tử
1) ABSQ: Tông điện tích của nguyên tử trong phân tử
i
i
ABSQ Q
Trong đó Qi là điện tích của nguyên tử i.
2) ABSQon: Là tông giá trị tuyệt đối điện tích nito (n) và oxy (o) trong phân tử.
ABSQon i i
i
Qn Qo
3) Dipole: là giá trị moment lưỡng cực của phân tử. Giá trị dipole (μ) được tính dựa
trên cấu trúc 3D và điện tích nguyên tử bằng phương pháp Gasteiger-Marsili thực
hiện trong QSARIS. Đơn vị của nó là (1 D = 3.336 E-30 coulomb-meter).
3) Chỉ số hình học alpha Ka3 (Kappa Alpha 3 hay 3); Ka2 (Kappa Alpha 2 hay
(2))
Trường hợp theo số nguyên tử và đường:
1kα = [(A+ α)(A+ α – 1)2]/(1Pi + α)2 với m = 1
2kα = [(A+ α – 1)(A+ α – 2)2]/(2Pi + α)2 với m = 2
3kα = (A + α –1)(A + α – 3)2 / (3Pi + α)2 với m = 3 khi A lẻ
3kα = (A + α –3)(A + α – 2)2 / (3Pi + α)2 với m = 3 khi A chẵn
Trong đó: A là số lượng các nguyên tử trong phân tử được mô tả; là bán kính
cộng hóa trị nguyên tử của các nguyên tử trong hợp chất vòng khác carbon; Pi: số
lượng đường bậc m trong phân tử i; m là bậc đường.
Bán kính cộng hóa trị nguyên tử là bán kính được sắp xếp dạng bảng của mỗi
nguyên tử và được sử dụng để tính giá trị cho chỉ số chỉ số hình học K. Bán kính
cộng hóa trị nguyên tử được định nghĩa như sau:
3sp
1i CR R
Với α là tông Ri và RCsp3; Ri và RCsp3 bán kính nguyên tử thứ i và bán kính Csp3.
218
5) logP là logarithm (cơ số 10) của hệ số phân tán P của octanol - nước [14].
6) MaxNeg là điện tích âm lớn nhất của các các nguyên tử trong một phân tử.
7) MaxQp là điện tích dương lớn nhất của các các nguyên tử trong một phân tử.
8) MolWeight: là phân tử khối của phân tử
9) Polar: là độ phân cực của phân tử, được tính dựa trên phương pháp của Miller,
công thức 1.12.
A
A
( )ahp
Trong đó αA là độ phân cực trung bình nguyên tử cho nguyên tử A. Phương
pháp này sử dụng 400 hợp chất chứa H, C, N, O, S, F, Cl, B, I, và P để xác định sai
số của αA với sai số 2,2-2,8% giữa phép phân cực phân tử thực nghiệm và tính toán.
Đơn vị là Å3 (1Å = 10-10 m).
10) Sp.Pol: là độ phân cực cụ thể của một phân tử: Sp.Pol = Polar/Volume
11) Volume: Thể tích của một phân tử. Thể tích phân tử của một phân tử được tính
bằng phương pháp lưới (grid) của Boder. Nó là một kỹ thuật tích hợp sử dụng một
khối lưới trung tâm trên mỗi nguyên tử có cạnh là đường kính của nguyên tử.
3
t
4( / )
3i iV r n n
Trong đó n là số điểm lưới trong nguyên tử và không tính tính các nguyên tử
khác; nt là tông số điểm lưới trong một nguyên tử và ri là bán kính van der Waals
của nguyên tử thứ i.
Thể tích của nguyên tử V:
i
i
V V đơn vị là Å3(1Å = 10-10 m)
12) WienI (W): Chỉ số W là một tham số topo theo công thức của H. Wiener [36].
Các chỉ số W được dựa trên khung của phân tử (không có hydrogen). W được định
nghĩa là tông của khoảng cách giữa hai nguyên tử cacbon trong phân tử, liên quan
đến các liên kết cacbon và cacbon. Phương pháp tính toán như sau: Nhân số nguyên
tử cacbon vào một mặt của bất kỳ liên kết nào bằng các bên ở phía bên kia; W =
tông của các giá trị này cho tất cả các liên kết. Chỉ số Wiener của một phân tử
219
thường cao hơn đối với các phân tử lớn hơn và cho biết độ phân nhánh của phân tử.
Đặc biệt, W thường lớn cho các phân tử mở phân nhánh và nhỏ cho những phân tử
ít phân nhánh hơn. W tương quan với tham số hình dạng ovality và volume phân tử
và trong một số trường hợp, nó có thể được sử dụng thay cho một hoặc cả hai mô tả
phân tử này. W là một tham số đơn.
13) X1: chỉ số liên kết thứ nhất được tính trên tất cả các liên kết đơn (cạnh) của các
nguyên tử trong phân tử không có hydro. Nó là một trong các tham số mô tả hữu ích
nhất đối với các mô hình QSAR/QSPR. X1 là tông tất cả các liên kết từ nguyên tử i
đến nguyên tử j được tín theo công thức sau:
0.51 ( )i jX
δi = ϭ - h: là tông các liên kết xung quanh nguyên tử i; ϭ là số electron của nguyên
tử i trong orbital ϭ. h là số hydro liên kết với nguyên tử i.
14) X1 là 1 χ trong tính toán của Kier & Hall.
15) X3: là chỉ số liên kết thứ 3.
16) Ovality: là chỉ số hình học oval của phân tử.
2/32
0 VDW
14 3
44
SA SA SAOvality
SA R V
Với O là là tham số mô tả kích thước dựa trên tính chất đối với một thể tích cố định,
hình cầu với bề mặt nhỏ nhất; SA là bề mặt phân tử; SA0 là bề mặt phân tử cực tiểu;
VVDW là thể tích an der Waals; R là bán kính nguyên tử.
17) Sdssc: là số chỉ số E-State của nhóm (=C<) trong phân tử .
18) SdO: là số chỉ số E-State của nhóm (=O) trong phân tử .
19) SaaCH là số chỉ số E-State (chỉ số trạng thái điện tử) của nhóm ( CH )
trong phân tử.
20) SsOH là số chỉ số E-State của nhóm OH trong phân tử.
21) xp6 là chỉ số chi đường 6 (6P).
22) k2 hay Kappa 2 (2k) là chỉ số hình học kappa truyền thống (traditional Kappa
Shape Indices).
220
Trường hợp theo số đường:
mk= C (mPmaxmPmin)/(mPi)2
Trong đó:
Pmax: số lượng đường bậc m trong một phân tử tham chiếu không có nhánh
với cùng một số nguyên tử như phân tử được mô tả.
Pmin: số lượng đường bậc m trong một phân tử tham chiếu có đặc tính cấu trúc
vô cực và cùng một số nguyên tử như phân tử được mô tả.
Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả.
m là bậc đường
C = 2 (m = 1,2); C = 4 (m = 3)
Trường hợp theo số nguyên tử và đường:
1k = A(A-1)2/(1Pi)2 với m = 1
2k = A(A-1)(A-2)2/(2Pi)2 với m = 2
3k = A(A-1)(A-3)2/(3Pi)2 với m = 3 khi A lẻ
3k = A(A-3)(A-2)2/(3Pi)2 với m = 3 khi A chẵn
Trong đó:
A là số đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử
Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả
m là bậc đường
23) knotp: sự khác nhau giữa chi nhóm 3 và chi đường/nhóm 4.
27) xp8: chỉ số chi đường 8 (8P) bậc thấp.
28) Knotpv: Sự khác nhau giữa chi nhóm hóa trị 3 và chi đường/nhóm hóa trị 4.
29) Phia: Kappa linh hoạt (. Các đại lượng Kappa Alpha 1 và Kappa Alpha 2
được kết hợp với một số nguyên tử (bình thường) để tạo thành chỉ số Kappa linh
hoạt (Kappa Flexibility), (phia) . Chỉ số Kappa linh hoạt phia được định nghĩa
như sau:
= (1k)(2k)/A
221
Trong đó: 1k là giá trị của kappa alpha 1; 2k là giá trị của kappa alpha 2; A là số
đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử
Nvx là số đỉnh của khung (số nguyên tử không phải hydro, số các nhóm hydrua; ví
dụ. - CH3, - OH,…).
222
Phụ lục 59. Các phương pháp bán thực nghiệm
1) CNDO
Phương pháp CNDO (complete neglect of differential overlap) phương pháp
NDO (neglect of differential overlap) đơn giản nhất. Phương pháp này mô hình hóa
các giá trị orbitals chỉ sử dụng một bộ cơ sở tối thiểu của các loại orbitals Slater.
Phương pháp CNDO đã chứng minh kết quả hữu ích trên một số hydrocacbon.
CNDO đôi khi vẫn được sử dụng để tạo ra dự đoán đầu tiên về tính toán ab initio
trên các hydrocarbon.Thực tế tất cả các phép tính CNDO thực sự được thực hiện
bằng cách sử dụng phương pháp CNDO/2, đó là một tham số được cải thiện hơn
phương pháp CNDO/1 ban đầu. Có một phương pháp CNDO/S được tham số để
tính toán tính chất điện tử quang phô. Phương pháp CNDO/S mang lại dự đoán cải
thiện các dự đoán trạng thái kích thích năng lượng, nhưng khó khăn trong dự đoán
tính chất hình học phân tử. Cũng có những phần mở rộng của phương pháp
CNDO/2 bao gồm các yếu tố có orbitals d. Những kỹ thuật này không sử dụng phô
biến rộng rãi do tính giới hạn chính xác của kết quả.
2) INDO
Phương pháp INDO (intermediate neglect of diferential overlap) được sử
dụng cho các hợp chất hữu cơ. Ngày nay, nó đã bị thay thế bởi các phương pháp
chính xác hơn. INDO đôi khi vẫn được sử dụng như một phép tính ban đầu trong
các tính toán ab initio.
3) MNDO
Phương pháp MNDO (modified neglect of diatomic overlap) đã được sử
dụng nhiều trong các hợp chất hữu cơ. Nó đã được đưa vào một số chương trình
bán thực nghiệm phô biến cũng như chương trình MNDO. Ngày nay, nó vẫn được
sử dụng, nhưng các phương pháp AM1 và PM3 chính xác và phô biến hơn.
Có một số trường hợp mà phương phá MNDO đưa ra kết quả không chính
xác. Tính toán năng lượng kích thích điện tử thấp. Hàng rào năng lượng kích hoạt
thường có xu hướng cao.
223
Không phải luôn luôn tính được năng lượng tối thiểu bằng phương pháp
MNDO. Hàng rào đối với sự quay liên kết thường được tính là quá nhỏ. Các hợp
chất lớn và các hệ phân tử được tính toán không ôn định. Vòng bốn được dự đoán là
bền. Nhóm hàm bão hòa oxy trên vòng được dự đoán ngoài không gian. Liên kết
peroxide thì nhỏ hơn 0,17 Ao. Liên kết C-O-C lớn hơn 9o. Độ dài liên kết giữa các
electron âm thì quá ngắn. Liên kết hydrogem thì quá mạnh và dài.
Phương pháp biến thể của MNDO là MNDO/d. Đây là hàm tương đương bao
gồm các orbital d. Phương pháp này cải thiện tiên đoán hình học của các phân tử
tăng dần. Phương pháp này đôi khi được sử dụng để mô hình hóa các hệ thống kim
loại chuyển tiếp. Phương pháp MNDO cũng bao gồm các tương quan điện tử với
phương pháp MNDO.
4) AM1
Phương pháp AM1 (Austin Model 1) phô biến trong mô hình hóa các hợp
chất hữu cơ. AM1 thường dùng trong tính toán nhiệt tạo thành ΔHf chính xác hơn
phương pháp MNDO. Tùy thuộc vào cấu trúc phân tử và thông tin cấu trúc tính
toán, một trong hai AM1 hoặc PM3 thường cho kết quả chính xác nhất định.
Có một số ưu điểm và nhược điểm về kết quả thu được từ những phương
pháp này. AM1 đã cải thiện tính toán năng lượng kích hoạt so với phương pháp
MNDO. Phương pháp AM1 có kết quả tính toán đối với nhôm tốt hơn PM3 và tính
toán kém chính xác đối với nitơ, phốt pho hay tính toán nhiệt tạo thành của các
phân tử với có điện tích lớn. Ngoài ra, AM1 thường ứng dụng tính toán cho liên kết
O-Si-O, dự đoán năng lượng nhóm alkyl. Nhìn chung, AM1dự đoán năng lượng và
hình học tốt hơn MNDO, nhưng không bằng như PM3.
5) PM3
Phương pháp PM3 (Parameterization method 3) sử dụng phương trình gần
giống như phương pháp AM1 với bộ tham số được cải thiện. Đây là phương pháp
phô biến đối với hệ thống hữu cơ. PM3 chính xác hơn AM1 đối với tính các góc độ
liên kết hydro, nhưng AM1 chính xác hơn đối với tính năng lượng liên kết hydro.
224
Các phương pháp PM3 và AM1 cũng phô biến hơn các phương pháp bán thực
nghiệm khác do có sẵn các thuật toán tính toán năng lượng solvat hóa.
Ngoài ra còn có một số điểm mạnh và hạn chế của PM3. Nói chung, tính
toán nhiệt tạo thành chính xác hơn so với MNDO hoặc AM1. Các phân tử siêu hóa
trị (Hypervalent) cũng được dự đoán chính xác hơn. PM3 có khuynh hướng tiên
đoán rằng rào xoay xung quanh liên kết CaN trong các peptide quá thấp. Liên kết
giữa Si và các nguyên tử halogenua quá ngắn. PM3 cũng có xu hướng dự đoán
trạng thái điện tử không chính xác đối với các hợp chất gecmani. Dự đoán điện tích
nito không chính xác. Khoảng cách không liên kết thì quá ngắn. Liên kết hydro thì
quá ngắn khoảng 0,1 Ao, nhưng định hướng thường chính xác. Nhìn chung, PM3 dự
đoán năng lượng và độ dài liên kết chính xác hơn AM1 hoặc MNDO.
6) TNDO
Phương pháp TNDO (typed neglect of differential overlap) là phương
pháp bán thực nghiệm tham số hóa đặc biệt để để tính toán độ dịch chuyển
hóa học của phô NMR. Sự tham số hoá này đi cao hơn các phương pháp bán
thực nghiệm khác là phân biệt giữa các nguyên tử của cùng một nguyên tố
nhưng lai hóa khác nhau.Ví dụ, các tham số khác nhau được sử dụng để mô tả
một carbon sp2 và carbon sp3. ó hai phiên bản của phương pháp này: TNDO/1
và TNDO/2.
225
Phụ lục 60. Ma trận dữ liệu trong nghiên cứu QSAR
Phân tử Hoạt
tính
Tính chất /
Tham số/
Phân mảnh 1
Tính chất /
Tham số/
Phân mảnh 2
Tính chất /
Tham số/
Phân mảnh 3
… Tính chất /
Tham số/
Phân mảnh n
Phân tử i Yi X1i X2i X3i … Xni
Phân tử ii Yii X1ii X2ii X3ii … Xnii
Phân tử iii Yiii X1iii X2iii X3iii … Xniii
… … … … … … …
Phân tử n Yn X1n X2n X3n … Xnn
226
Phụ lục 61. Các loại thông tin bao gồm trong các phương pháp mô phỏng silico
Dữ liệu được mô phỏng
Tác dụng dược lý
Tác dụng gây độc
Tính chất hóa lý
Các tính chất dược động học, sinh học khả dụng
Môi trường
Hóa học
Tính chất hóa lý
Thuộc tính cấu trúc 2-D và 3-D
Hiện diện, vắng mặt và đếm các nguyên tử, mảnh, tiểu cấu trúc
Hoá học lượng tử và tính toán
Mô phỏng
Thiết kế các nhóm dẫn xuất có cấu trúc tương tự
Thống kê
3D/4D QSAR
Các lĩnh vực khác
Chất lượng và độ tin cậy của dữ liệu
Mô hình hóa và mô hình dự báo
Phạm vi áp dụng
Chất lượng mô hình và độ tin cậy của dự báo
227
Phụ lục 62. Tóm tắt các phương pháp tiếp cận mô hình chính cho sự xây dựng các
QSAR và trong kỹ thuật silico
Phương pháp (Q)SAR
Phân tích Hansch
Free-Wilson
Các mảnh cấu trúc và nhận diện cấu trúc
Sự hình thành và phân loại của nhóm
Phân tích hồi quy tuyến tính
Bình phương cực tiểu riêng phần
Nhận dạng mẫu
Các phương pháp Robust
Dược phẩm
Mô hình 3-D
CoMFA
228
Phụ lục 63. Phương pháp phô cộng hưởng từ hạt nhân
Phô 1H-NMR
Phô 1H-NMR cho biết có bao nhiêu loại proton trong phân tử, đồng thời cho phép
xác định số proton của từng loại. Trong phô 1H-NMR, phần diện tích vẽ ra bởi mũi
cộng hưởng, tỷ lệ thuận với số lượng proton gây ra tín hiệu cộng hưởng của mũi đó,
được gọi là cường độ tích phân của mũi cộng hưởng. Một tín hiệu cộng hưởng, do
ảnh hưởng của các proton bên cạnh có thể bị chẻ thành nhiều mũi, khi giải phô cần
tính tông diện tích các mũi.
Cách giải phô 1H-NMR
Yêu cầu về mẫu đo phô 1H-NMR đảm bảo khô, độ tinh khiết trên 95%, chất lỏng
cần kiểm tra độ tinh khiết bằng sắc ký lỏng hiệu năng cao (HPLC) hoặc kiểm tra
bằng SKLM với các hệ dung môi khác nhau cho hiện vết tròn, duy nhất ở Rf = 0,7-
0,8; 0,5-0,6; 0,2-0,3 đối với hệ dung môi giải ly từ phân cực mạnh, phân cực trung
bình, phân cực yếu tương ứng.
Đo phô 1H-NMR: với máy 200 MHz cần khoảng 5 mg mẫu, nếu máy hoạt động ở
tần số 500 MHz thì lượng mẫu yêu cầu sẽ giảm. Sau khi đo có thể thu hồi mẫu.
Một số dữ liệu cần lưu ý khi giải phô:
- Đối với proton của cacbon thơm (C=C) có mũi cộng hưởng tại = 7,0 - 8,5 ppm.
- Đỗi với proton của cacbon mạch thẳng (C=C) có mũi cộng hưởng tại = 4,5 - 6,0
ppm, tuy nhiên khoảng = 4,5 - 6,0 cũng có thể do proton gắn vào 2 hay nhiều
nguyên tử có độ âm điện như oxy, halogen.
- Đối với H của nhóm ankin đầu mạch có = 2,5 ppm.
- Đối với H của cacbon bên cạnh nhóm cacbony có = 2,1 – 2,5 ppm.
- Đối với H của cacbon liên kết với oxy, halogen có = 3 – 4 ppm. Nếu proton càng
xa nguyên tử có độ âm điện cao thì = 1 – 3 ppm
- Đối với H của cacbon nhóm vinyl có = 5 – 6 ppm.
- Đối với H thuộc nhóm andehit có = 9 – 10 ppm.
- Đối với H thuộc nhóm axit có >10 ppm.
229
Phô 13C-NMR
Mẫu khảo sát khi đo phô 13C-NMR cần hòa tan trong dung môi đã được deuterium
hóa (0,6 ml) và có thêm chất nội chuẩn TMS (tetrametilsilan) (1µL). Có nhiều loại
dung môi để hòa tan các hợp chất đo phô 13C-NMR.
Lượng mẫu sử dụng đối với máy 200MHz khoảng 30 mg, máy có tần số 500 MHz
cần khoảng 5-10 mg, mẫu sau khi đo có thể thu hồi.
Các tín hiệu trong phô 13C-NMR trong khoảng thang đo rất rộng từ 0 - 240 ppm.
Cách giải phô 13C-NMR:
Phô 13C-NMR kết hợp với phô NMR-DEPT 135 và NMR-DEPT 90:
- Phô 13C-NMR cho biết tông số cacbon trong phân tử.
- Phô NMR-DEPT 135 và NMR-DEPT 90 cho biết tông số Csp3, Csp2.
Sau đây là độ dịch chuyển hóa học của 13C tính bằng ppm (so từ TMS):
+ Đối với C liên kết trực tiếp với nguyên tử có độ âm điện lớn: R-CH3 có = 8 – 30
ppm; R-CH2-R có = 15 – 55 ppm; CHR3, CR4 có có = 20 – 60 ppm
+ Đối với Csp3 liên kết với O có = 40 – 80 ppm; Csp3 liên kết với Cl có = 35 –
80 ppm; Csp3 liên kết với Br = 25 – 65 ppm; Csp3 liên kết với N có = 30 – 65
ppm.
+ Đối với Csp2 và Csp: nhóm C≡C có = 65 – 90 ppm; C≡N có = 110 – 140 ppm;
>C=C< có = 100 – 150 ppm; ->C=C< thơm có = 110 – 175 ppm.
+ Đối với C của nhóm aldehit hoặc xeton, axit có = 155 – 220 ppm.
Phô hai chiều
Phô HSQC (Heteronuclear Single Quantum Correlation) cho biết tương quan giữa
các tín hiệu proton với tín hiệu của cacbon qua 1 liên kết. Phô
HMBC(Heteronuclear Multiple Quantum Correlation) cho biết tương quan giữa các
tin hiệu proton với tín hiệu của cacbon qua 2 hay 3 liên kết. Từ các tín hiệu của
cacbon 13C trên trục tung kẻ các đường song song với trục hoành trong toàn phô đồ,
từ tín hiệu 1H trên trục hoành kẻ các đường song song với trục tung. Tại các vị trí
230
giao nhau của hai đường kẻ trên có tín hiệu giao, nghĩa là proton này liên kết trực
tiếp với cacbon kia.
231
Phụ lục 64. Phương pháp nhiễu xạ tia X đơn tinh thể
Phương pháp lâu đời nhất và chính xác nhất của tinh thể học tia X là nhiễu
xạ tia X đơn tinh thể, trong đó chùm tia X bị bản hồi từ các mặt phẳng có khoảng
cách đều nhau của một đơn tinh thể, tạo ra một mẫu nhiễu xạ gồm các điểm gọi là
nhiễu xạ. Mỗi nhiễu xạ tương ứng với một tập các mặt phẳng có khoảng cách đều
nhau bên trong tinh thể. Mật độ các electron bên trong tinh thể được xác định từ vị
trí và độ sáng của các nhiễu xạ khác nhau quan sát được khi tinh thể từ từ xoay
quanh chùm tia X; mật độ này, cùng với dữ liệu bô sung (về thành phần hóa học),
cho phép ta xác định vị trí của các nguyên tử bên trong tinh thể. Nó có thể xác định
lực liên kết hóa học trung bình giữa các nguyên tử và góc giữa chúng trong khoảng
vài ngàn Ångström và vài chục độ.
Kĩ thuật nhiễu xạ tia X đơn tinh thể có 3 bước chính.
Bước 1: là thu thập một tinh thể tốt. Tinh thể phải đủ lớn (thường là lớn hơn
100 micron ở mọi chiều), không có tạp chất và có cấu trúc ôn định, không bị nứt nẻ.
Bước 2: đặt tinh thể vào trong đường đi của chùm tia X cực mạnh, thường có
bước sóng đơn (monochromatic X-rays), để tạo ra các mẫu nhiễu sắc. Tinh thể từ từ
xoay và dữ liệu được thu thập lại. Mỗi ảnh chứa hàng chục ngàn điểm nhiễu xạ với
các cường độ khác nhau.
Bước 3: dùng kĩ thuật tính toán và dữ liệu hóa học bô sung để đưa ra mô
hình về sự sắp xếp các nguyên tử bên trong tinh thể.