LỜ 0 Đ2$1hueuni.edu.vn/sdh/attachments/article/1251/LuanAn.pdf · 2019-11-18 · i LỜ 0 Đ2$1 Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá

i

LỜI CAM ĐOAN

Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá nhân dưới sự

hướng dẫn của PGS.TS. Phạm Văn Tất, trường Đại học Hoa Sen và PGS. TS. Trần

Dương, trường Đại học Sư Phạm – Đại học Huế.

Luận án được thực hiện tại trường Đại học Khoa Học – Đại học Huế. Chưa từng

có kết quả nghiên cứu tương tự được công bố dưới bất cứ hình thức nào trước khi

thực hiện luận án. Một phần kết quả của công trình này đã được công bố trên: Tạp

chí Hóa học và Ứng dụng, Tạp chí Hóa học, Tạp Chí Khoa học và Công nghệ -

trường Đại học Khoa học – Đại học Huế, Tạp chí Đại học Huế, Tạp chí

Computational Chemistry, Cogent Chemistry, Taylor Francis, Tạp chí Organic &

Medicinal Chemistry International Journal (OMCIJ), Tạp chí Natural products

research.

Ký tên

Bùi Thị Phương Thúy

ii

LỜI CẢM ƠN

Để hoàn thành luận án trước hết em xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS.

Phạm Văn Tất, Trường Đại học Hoa Sen; PGS. TS. Trần Dương, Trường Đại học

Sư Phạm Huế đã giao đề tài, hướng dẫn trực tiếp và truyền đạt những kinh nghiệm

và kiến thức quý báu, tận tình chỉ dẫn, động viên và tạo mọi điều kiện thuận lợi giúp

đỡ em hoàn thành luận án này.

Em xin gửi lời cảm ơn chân thành đến GS.TS. Trần Thái Hòa, TS. Trần Xuân

Mậu, TS. Nguyễn Thị Ái Nhung - Khoa Hóa, Trường Đại học Khoa Học Huế. Các

thầy cô đã giúp đỡ, động viên và chỉ dạy nhiều kiến thức quý báu trong quá trình

em học tập tại trường.

Em xin gửi lời cảm ơn các Thầy Cô trong Khoa Hóa, các Thầy Cô trong Khoa

Sau đại học và toàn thể Ban Giám hiệu Trường Đại học Khoa Học Huế đã cho phép

và tạo mọi thuận lợi cho em hoàn thành luận án này.

Em xin gửi lời cảm ơn đến TS. Phùng Văn Trung, TS. Hoàng Thị Kim Dung

Viện Hoá học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam TP. Hồ Chí Minh

đã giúp đỡ em trong quá trình làm luận án.

Em xin gửi lời cảm ơn đến PGS.TS. Nguyễn Hùng Huy, Khoa Hoá, Trường Đại

học Khoa học Tự Nhiên – ĐHQGHN đã giúp đỡ, tận tình chỉ dẫn em trong quá

trình làm luận án.

Tôi xin gửi lời cảm ơn chân thành gia đình, bạn bè đã động viên, giúp đỡ cho tôi

hoàn thành luận án này.

Ký tên

Bùi Thị Phương Thúy

iii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

ANOVA Phân tích phương sai

ARE, % Giá trị tuyệt đối của sai số tương đối

Bond Liên kết

Cal Tính toán (Calculation)

SKC Sắc kí cột

COSY 1H-1H (Correlation Spectroscopy)

d Đỉnh đôi (doublet)

dd Mũi đôi của mũi đôi (duplet of duplet)

DEPT Phô DEPT (Distortionless Enhancement by Polarisation Transfer)

DMSO Dimethyl sulfoxide (CH3)2S=O

Exp Thực nghiệm (Experiment)

EtOAc Ethyl acetate (CH3COOC2H5)

EtOH Ethanol (C2H5OH)

E-State Trạng thái điện tử (electrotopological state)

GI50 Nồng độ thuốc ức chế 50% sự phát triển của tế bào gây ung thư

(50% Growth Inhibition)

pGI50 pGI50= -log(GI50)

pGI50,exp Giá trị pGI50 thực nghiệm

pGI50,pr Giá trị pGI50 dự đoán

HMBC Phô tương tác đa liên kết hai chiều dị hạt nhân (Heteronuclear

Multiple Bond Vorrelation)

HSQC Phô tương tác hai chiều trực tiếp dị hạt nhân (heteronuclear single

quantum coherence)

HPV Vi rút u nhú ở người (Human Papillomavirus)

IR Phô hồng ngoại (Infrared Spectroscopy)

iv

LV Biến ẩn (Latent Variables)

LogP Giá trị logarit hệ số phân tán

Linear Tuyến tính

m Mũi đa (multiplet)

MM+ Phương pháp cơ học phân tử MM

MARE, % Giá trị trung bình của ARE, %

MSE Sai số trung bình bình phương (Mean Squared Error)

MS Phô khối (mass spectrometry)

MetOH methanol (CH3OH)

Nonlinear Phi tuyến tính

NMR Phô cộng hưởng từ hạt nhân

OD Phương pháp đo mật độ quang (Optical Density)

PCA Phân tích thành phần chính (Principal Components Analysis)

PCR Hồi qui thành phần chính (Principal Components Regression)

PLS Bình phương cực tiểu riêng phần (Partial Least Squares)

QSPR Quan hệ định lượng cấu trúc - tính chất

(Quantitative Structure - Property Relationship)

QSAR Quan hệ định lượng cấu trúc - hoạt tính

(Quantitative Structure - Activity Relationship)

QESAR Quan hệ định lượng giữa cấu trúc điện tử và hoạt tính sinh học

(Quantitative Electronic Structure - Activity Relationship)

QSDAR Quan hệ định lượng giữa cấu trúc phô NMR và hoạt tính sinh học

(Quantitative Spectrum Data - Activity Relationship)

QSSR Quan hệ định lượng cấu trúc - cấu trúc

(Quantitative Structure - Structure Relationship)

Q2 Hệ số tương quan đánh giá chéo (Cross-validation correlation

coefficient)

R2tr Hệ số tương quan R2 luyện

R2pr Hệ số tương quan R2 dự đoán

v

R2ad R2

hiệu chỉnh

Rf Hệ số lưu giữ (Retention Factor)

SAR Quan hệ cấu trúc hoạt tính (Structure - Activity Relationship)

s Đỉnh đơn (singlet)

SRB Sulforhodamine B

SK Sắc ký

SKLM Sắc ký lớp mỏng

t Mũi ba (triplet)

TCA Trichloroacetic acid

UV Phô UV (Ultraviolet Spectroscopy)

J (Hz) Hằng số ghép (Hz) (Coupling constant Hz)

1H-NMR Phô cộng hưởng từ hạt nhân proton (Hydrogen Nuclear Magnetic

Resonance)

13C-NMR Phô cộng hưởng từ hạt nhân cacbon 13 (Carbon Nuclear Magnetic

Resonance)

(ppm) Độ dịch chuyển hóa học (chemical shift) tính bằng ppm

QSARMLR

(3.16)QSARMLR phương trình 3.16

QSARMLR

(3.17) QSARMLR phương trình 3.17

QSARMLR

(3.19) QSARMLR phương trình 3.19

vi

DANH MỤC CÁC BẢNG

Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30) ................................................. 63

Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone ................................................... 65

Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2tr ............................................................................... 67

Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2tr, R2

pr, SE ................................................................... 67

Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2tr ..................................................................................... 68

Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2tr và R2

pr ....................................................................... 68

Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2tr và R2

pr ........................................................................... 69

Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2tr .............................................................................. 69

Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê ................................................ 71

Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7) ........................................................... 72

Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các mô hình QESARMLR (với

k = 5 – 7) .......................................................................................................................................................... 73

Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN ........................................ 75

Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê ........................................................................... 76

Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch chuyển hóa học i trong các mô

hình QSDARMLR .............................................................................................................................................. 77

Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các mô hình QSDARMLR (với

k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1) ....................................................................................... 79

Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử............................................ 81

Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất nghiên cứu bằng mô hình

QSSRMLR và các chất dùng để dự đoán ........................................................................................................... 82

Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE ...................................... 86

Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và GMPmxi,% đối với các tham số mô

tả phân tử 2D và 3D trong các mô hình QSARMLR (với k là 8, 9 và 10) .......................................................... 87

Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.16) và QSARANN(1) ..... 90

Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE ...................................... 91

Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các tham số mô tả phân tử

2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7) ............................................................................... 92

Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN ................................................................................................................................................... 95

Bảng 3.24 Các mô hình QSARMLR với các giá trị R2tr

, SE và R2pr tương ứng .................................................. 97

Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của điện tích nguyên tử trong

các mô hình QSARMLR ..................................................................................................................................... 99

Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và

QSARANN(2) .................................................................................................................................................... 100

Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế bào Hela ở các nồng độ

khác nhau ....................................................................................................................................................... 112

vii

Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực nghiệm in vitro ................ 113

Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô hình QESARMLR và

QESARANN..................................................................................................................................................... 114

Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán từ mô hình QSDARMLR

(M1) và QSDARANN (M2) ............................................................................................................................. 116

Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn xuất flavone và isoflavone

tương tự được nghiên cứu từ mô hình QSSRMLR ........................................................................................... 118

Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR ............................................ 119

Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của các dẫn xuất flavonoid chiết

xuất. ............................................................................................................................................................... 120

Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các mô hình QSARMLR (3.16)

và QSARANN(1) .............................................................................................................................................. 121

Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình QSARANN(1 ............................. 122

Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập luteolin và daidzin từ các mô

hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN ....................................................................................... 123

Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô hình QSARPCA-ANN ) .... 124

Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR (3.19), QSARPLS (3.20) và

QSARANN (2) .................................................................................................................................................. 125

Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn nhóm thế vào vị trí C6,

C3’ của quercetin, dự đoán từ mô hình QSARANN(2) ....................................................................................... 125

viii

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính ................................................ 7

Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93] .................................................... 7

Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66] .............................................................................. 15

Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66] ............................................................................ 18

Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66] ................................................................................................... 19

Hình 1.6 Giải thích F-test [51, 66] .................................................................................................................. 20

Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107] ...................................................................... 24

Hình 1.8 Thành phần chính với p = 2 [51, 106] .............................................................................................. 27

Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106] ........................................................................................... 30

Hình 1.10 Sơ đồ giải thuật di truyền [10] ........................................................................................................ 34

Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76] .................................................. 36

Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76] ..................................... 36

Hình 1.13 Toán tử chéo đơn điểm [76] ........................................................................................................... 37

Hình 1.14 Toán tử chéo hai điểm [76] ............................................................................................................ 37

Hình 1.15 Hệ thống thần kinh sinh học tự nhiên ............................................................................................. 40

Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50] ....................................................................................... 41

Hình 1.17 Cấu trúc mạng nơ ron [101] ........................................................................................................... 42

Hình 1.18 Quá trình học của mạng nơ ron [16] ............................................................................................... 43

Hình 1.19 Mô hình tính toán một nơ ron [69, 77] ............................................................................................ 44

Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74] ............................................................................... 47

Hình 1.21 Một số dẫn xuất flavonoid [20, 74] ................................................................................................. 47

Hình 2.1 Sơ đồ nghiên cứu tông quát .............................................................................................................. 51

Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2] ................................................................................... 54

Hình 2.3 Xây dựng các mô hình hồi quy đa biến ............................................................................................. 56

Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59] ........................................................................... 57

Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient ............................................................................... 64

Hình 3.2 Ảnh hưởng của k đến R2 và SE.......................................................................................................... 67

Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi .................................................................................. 72

Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính chất hóa lý ..................... 81

Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm ........................................................ 85

Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid trong nhóm kiểm tra ... 88

Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50 ............................................. 94

Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11 ................................................................................................. 102

Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7 ................................................................................................... 103

Hình 3.10 Cấu trúc POL1, C15H10O6 ............................................................................................................. 104

Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9 ......................................................................................... 106

Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50% .............................................. 107

ix

Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6 .......................................................................................... 108

Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50% ................................................ 109

Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12) ....................................................................................... 110

Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các flavone, isoflavone mới và

chất mẫu ......................................................................................................................................................... 113

Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2] ................................................. 117

Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2] ......................................... 117

Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2 ..................................... 122

Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) POL1; b) GML1 ............ 123

Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a) AIL1; b) CSL1 .............. 126

x

MỤC LỤC

LỜI CAM ĐOAN ...................................................................................................... i

LỜI CẢM ƠN ........................................................................................................... ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT........................................ iii

DANH MỤC CÁC BẢNG ...................................................................................... vi

DANH MỤC CÁC HÌNH VẼ............................................................................... viii

MỤC LỤC .................................................................................................................. x

MỞ ĐẦU .................................................................................................................... 1

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 4

1.1. BỆNH UNG THƯ CỔ TỬ CUNG........................................................................................... 4

1.1.1. Các nguyên nhân gây ung thư ......................................................................................... 4

1.1.2. Điều trị ............................................................................................................................. 5

1.1.3. Phòng ngừa ...................................................................................................................... 6

1.2. LIÊN HỆ GIƯA CÂU TRUC VA HOẠT TÍNH ....................................................................... 6

1.3. TÍNH TOÁN THÔNG TIN CÂU TRUC .................................................................................. 9

1.3.1. Cơ học phân tử ................................................................................................................ 9

1.3.2. Cơ học lượng tử ............................................................................................................... 9

1.3.3. Phương pháp bán thực nghiệm ...................................................................................... 11

1.4. CÁC MÔ HINH TOÁN HOC ................................................................................................ 12

1.4.1. Hồi quy đa biến ............................................................................................................. 12

1.4.2. Hồi quy thành phần chính.............................................................................................. 22

1.4.3. Bình phương tối thiểu riêng phần .................................................................................. 25

1.4.4. Giải thuật di truyền ........................................................................................................ 31

1.4.5. Mạng thần kinh nhân tạo (ANN) ................................................................................... 39

1.4.5.1. Khái niệm ............................................................................................................................. 39

1.4.5.2. Cấu trúc mạng ....................................................................................................................... 40

1.4.6. Thống kê đánh giá mô hình ........................................................................................... 45

1.4.7. Tính toán đóng góp của các tham số ............................................................................. 46

1.5. HỢP CHÂT FLAVONOID .................................................................................................... 46

1.5.1. Giới thiệu chung ............................................................................................................ 46

1.5.2. Phân loại dẫn xuất flavonoid ......................................................................................... 47

xi

1.5.3. Phân bố flavonoid trong tự nhiên .................................................................................. 48

1.5.4. Hoạt tính sinh học của flavonoid ................................................................................... 48

1.6. PHÂN LẬP VA XÁC ĐỊNH CÂU TRUC FLAVONOID ....................................................... 50

1.6.1. Phân lập flavonoid ......................................................................................................... 50

1.6.2. Xác định cấu trúc flavonoid .......................................................................................... 50

1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên ................................................................ 50

CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ...................... 51

2.1. SƠ ĐỒ NGHIÊN CỨU ......................................................................................................... 51

2.2. CƠ SỞ DƯ LIỆU, NGUYÊN LIỆU VA PHƯƠNG PHÁP .................................................... 52

2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử ..................................................................... 52

2.2.2. Nguyên liệu và phương pháp ......................................................................................... 52

2.2.2.1. Phần mềm ứng dụng ............................................................................................................. 52

2.2.2.2. Hóa chất, thiết bị ................................................................................................................... 52

2.2.2.3. Nguyên liệu .......................................................................................................................... 53

2.3. NGHIÊN CỨU LY THUYÊT ................................................................................................. 54

2.3.1. Phương pháp tính toán thông tin cấu trúc ...................................................................... 54

2.3.1.1. Cơ học phân tử...................................................................................................................... 54

2.3.1.2. Hóa lượng tử ......................................................................................................................... 54

2.3.1.3. Các tham số cấu trúc ............................................................................................................. 55

2.3.2. Xây dựng các mô hình QSAR ....................................................................................... 55

2.4. SANG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN ............................................................. 56

2.4.1. Phân lập các hợp chất flavonoid .................................................................................... 56

2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid ........................................................ 58

2.4.2.1. Phương pháp phô cộng hưởng từ hạt nhân ........................................................................... 58

2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể .............................................................................................. 59

2.4.3. Kỹ thuật thử hoạt tính in vitro ....................................................................................... 59

2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B ........................................................................ 59

2.4.3.2. Nuôi cấy tế bào ..................................................................................................................... 60

2.4.3.3. Nhuộm SRB .......................................................................................................................... 61

2.4.3.4. Xử lý kết quả ........................................................................................................................ 61

2.4.3.5. Xác định GI50 ........................................................................................................................ 61

2.5. THIÊT KÊ VÀ DỰ BÁO HOẠT TÍNH CỦA FLAVONOID .................................................. 62

CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN ............................................................ 63

xii

3.1. NGHIÊN CỨU LY THUYÊT ................................................................................................. 63

3.1.1. Tính toán thông tin cấu trúc........................................................................................... 63

3.1.1.1. Khảo sát phương pháp cơ học phân tử.................................................................................. 63

3.1.1.2. Khảo sát phương pháp hóa lượng tử ..................................................................................... 64

3.1.2. Tham số cấu trúc và tính chất phân tử ........................................................................... 65

3.1.2.1. Điện tích .............................................................................................................................. 65

3.1.2.2. Phô 13C-NMR, 15O-NMR và độ dịch chuyển hóa học .......................................................... 66

3.1.2.3. Tham số hóa lý ..................................................................................................................... 66

3.1.2.4. Tham số hình học 2D, 3D ..................................................................................................... 66

3.2. XÂY DỰNG MÔ HINH QSAR .............................................................................................. 66

3.2.1. Khảo sát các biến số mô hình ........................................................................................ 66

3.2.2. Xây dựng các mô hình QESAR ..................................................................................... 70

3.2.2.1. Mô hình tuyến tính QESARMLR ............................................................................................ 70

3.2.2.2. Mô hình mạng thần kinh QESARANN ................................................................................... 74

3.2.2.3. Kiểm tra khả năng dự đoán ................................................................................................... 75

3.2.3. Xây dựng các mô hình QSDAR .................................................................................... 75

3.2.3.1. Mô hình tuyến tính QSDARMLR ........................................................................................... 75

3.2.3.2. Mô hình mạng thần kinh QSDARANN ................................................................................... 78


3.2.4. Xây dựng mô hình QSSRMLR ........................................................................................ 79

3.2.4.1. Nguyên tắc xây dựng ............................................................................................................ 79

3.2.4.2. Tính toán các tham số hóa lý ................................................................................................ 80

3.2.4.3. Xây dựng mô hình ................................................................................................................ 80


3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1) ..................................................... 85

3.2.5.1. Dữ liệu .................................................................................................................................. 85

3.2.5.2. Xây dựng mô hình QSARMLR (3.16) .................................................................................... 85

3.2.5.3. Xây dựng mô hình QSARANN(1) ............................................................................................ 89

3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1) ........................................ 90

3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN ...................... 91

3.2.6.1. Dữ liệu .................................................................................................................................. 91

3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) ......................................................... 91

3.2.6.3. Xây dựng mô hình QSARPCA-ANN ......................................................................................... 94

3.2.6.4. Khả năng dự đoán của các mô hình ...................................................................................... 95

xiii

3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2) ......................... 96

3.2.7.1. Dữ liệu .................................................................................................................................. 96

3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20) ..................................................... 96

3.2.7.3. Xây dựng mô hình QSARANN(2) ............................................................................................ 99

3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới .............................................................. 100

3.3. SANG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN ........................................................... 101

3.3.1. Phân lập cynaroside từ actiso ...................................................................................... 101

3.3.2. Phân lập quercetin từ xa kê ......................................................................................... 102

3.3.3. Phân lập luteolin từ tía tô ............................................................................................. 103

3.3.4. Phân lập daidzin từ đậu nành ....................................................................................... 105

3.3.4.1. Xác định cấu trúc daidzin bằng phương pháp NMR........................................................... 105

3.3.4.2. Xác định cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X ........................... 106

3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió ..................................................... 107

3.3.5.1. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR ........................ 107

3.3.5.2. Xác định cấu trúc kaempferol-3-O-methylether bằng phương pháp đo nhiễu xạ tia X ...... 109

3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ gừng gió . 110

3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên .......................... 111

3.4. THIÊT KÊ VÀ DỰ BÁO HOẠT TÍNH CÁC FLAVONOID ................................................ 113

3.4.1. Mô hình QESAR ......................................................................................................... 113

3.4.2. Mô Hình QSDAR ........................................................................................................ 115

3.4.3. Mô hình QSSRMLR ....................................................................................................... 116

3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1) ................................................................ 121

3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN ............................................... 123

3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2) ...................................... 124

KẾT LUẬN VÀ KIẾN NGHỊ .............................................................................. 127

DANH MỤC CÔNG TRÌNH ............................................................................... 129

TÀI LIỆU THAM KHẢO .................................................................................... 131

PHỤ LỤC ............................................................................................................... 144

1

MỞ ĐẦU

Các phương pháp phòng và trị bệnh ung thư hiện nay như phẫu thuật, xạ trị,

hóa trị. Tuy nhiên các phương pháp này vẫn có những tác dụng phụ nhất định đối

với bệnh nhân. Nhu cầu về dược chất kháng ung thư có khả năng phòng và trị bệnh

đang rất lớn nhưng khả năng đáp ứng còn hạn chế [70, 71]. Các nhà khoa học, dược

học đã và đang quan tâm nghiên cứu, tìm kiếm các loại dược chất mới. Trong đó

nhóm flavone, isoflavone nói riêng là nhóm dược chất có nhiều trong thực vật với

hoạt tính kháng oxi hóa, kháng ung thư, kháng viêm, … hiệu quả [45, 104]. Các

nghiên cứu thực nghiệm trên thế giới và Việt Nam đã cung cấp một cơ sở dữ liệu

quý giá về nguồn dược chất trong tự nhiên, nhưng các nghiên cứu thực nghiệm

thuần túy còn nhiều hạn chế để tạo ra hợp chất có hoạt tính kháng ung thư hiệu quả,

nhanh chóng, kinh tế [41, 42]. Các nghiên cứu lý thuyết trên thế giới nói chung,

trong nước nói riêng về nhóm flavone và isoflavone có hoạt tính kháng ung thư cô

tử cung còn khá khiêm tốn [90, 103]. Nghiên cứu mối quan hệ cấu trúc - hoạt tính

nhằm thiết kế các dẫn xuất flavone, isoflavone mới có hoạt tính được cải thiện; các

nghiên cứu lý thuyết là rất cần thiết để thúc đẩy và làm tiền đề cho các nghiên cứu

thực nghiệm, nhằm tìm kiếm các dược chất kháng ung thư hiệu quả [80, 90].

Trong nghiên cứu này, chúng tôi sử dụng các thông tin mô tả cấu trúc điện

tích nguyên tử, độ dịch chuyển hóa học, tính chất hóa lý, tham số 2D và 3D của

phân tử kết hợp các kỹ thuật phân tích hồi quy, mạng nơ ron, phân tích thành phần

chính, giải thuật di truyền, bình phương cực tiểu riêng phần để xây dựng các mối

quan hệ định lượng cấu trúc - hoạt tính (QSAR) [89]. Các flavonoid được xây dựng

và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Các tham số mô tả phân

tử 2D, 3D được sử dụng để xây dựng các mô hình đa biến như hồi quy tuyến tính đa

biến (MLR), phân tích thành phần chính (PCR), bình phương cực tiểu riêng phần

(PLS) và mạng nơ ron nhân tạo (ANN) [80, 90]. Xây dựng các mô hình QSAR

nhằm xác định những yếu tố tham số mô tả phân tử ảnh hưởng đến tác dụng kháng

ung thư cô tử cung từ đó xác định hướng thiết kế phân tử mang lại hoạt tính cao hơn

[86, 90, 103]. Trong nghiên này cũng đã tiến hành chiết tách và phân lập flavonoid

2

từ gừng gió, đậu nành, tía tô, xa kê, actiso, một vài kỹ thuật phân tích hóa lý cũng

được sử dụng để xác định cấu trúc phân tử các dẫn xuất flavonoid. Các phân tử

flavonoid đã phân lập sẽ được dự báo hoạt tính, và sử dụng làm chất mẫu để thiết kế

hợp chất mới có hoạt tính cao hơn. Từ các cơ sở trên, chúng tôi nghiên cứu đề tài

“Thiết kế, sàng lọc một số dẫn xuất flavonoid và đánh giá hoạt tính gây độc lên

dòng tế bào Hela dựa vào các tính toán hóa lượng tử”.

Mục tiêu của luận án

Tính toán, sàng lọc các tham số mô tả phân tử gồm: tham số điện tích, độ

dịch chuyển hóa học, tính chất hóa lý, tham số 2D, 3D của các dẫn xuất flavonoid.

Xây dựng các mô hình quan hệ cấu trúc – hoạt tính có khả năng dự đoán hoạt tính

kháng ung thư của các dẫn xuất flavone và isoflavone có cấu trúc tương tự.

Sàng lọc, phân lập, xác định cấu trúc và thử nghiệm in vitro hoạt tính kháng

ung thư 6 hợp chất flavonoid từ actiso, xa kê, đậu nành, tía tô, gừng gió.

Thiết kế, sàng lọc các dẫn xuất flavone và isoflavone và đánh giá hoạt tính

kháng ung thư cô tử cung cũng như các tính chất hóa lý của các dẫn xuất flavonoid

mới thiết kế từ flavonoid mẫu.

Ý nghĩa khoa học của luận án

Nghiên cứu này đã sử dụng các tính toán lý thuyết và xây dựng các mối quan

hệ định lượng cấu trúc - hoạt tính (QSAR). Các flavone và isoflavone được xây

dựng và tối ưu hóa bằng các phương pháp cơ học phân tử MM+. Điện tích nguyên

tử, độ dịch chuyển hóa học, các tính chất hóa lý và các tham số mô tả phân tử 2D,

3D từ các phương pháp lý thuyết được sử dụng để xây dựng các mô hình đa biến

như hồi quy tuyến tính đa biến (MLR), hồi quy thành phần chính (PCR), hồi quy

bình phương cực tiểu riêng phần (PLS) và mạng nơ ron nhân tạo (ANN). Các kỹ

thuật thực nghiệm chụp cộng hưởng từ hạt nhân, phô khối lượng và kỹ thuật đo

nhiễu xạ tia X đơn tinh thể cũng được sử dụng để xác định cấu trúc phân tử các dẫn

xuất flavonoid chiết xuất.

Các mô hình QSAR được xây dựng nhằm xác định được những vị trí nguyên

tử ảnh hưởng đến tác dụng kháng ung thư cô tử cung từ đó xác định vị trí tác dụng

mạnh để xem xét gắn nhóm thế nhằm tạo ra hợp chất mới và chọn lựa được những

3

hợp chất có hoạt tính cao. Ngoài ra với kỹ thuật QSAR có thể xây dựng các mô hình

khác nhau để dự đoán các tính chất hóa lý khác của các hợp chất. Từ công trình này,

có thể ứng dụng phương pháp, kết quả nghiên cứu trong các nghiên cứu thực

nghiệm, lý thuyết với sự hỗ trợ của công nghệ máy tính nhằm giảm thiểu đáng kể

chi phí cho các nghiên cứu thực nghiệm. Kết quả nghiên cứu của luận án mở ra

hướng nghiên cứu mới, phù hợp với định hướng nghiên cứu trên thế giới và Việt

Nam. Đây là cơ sở khoa học để áp dụng trong thiết kế, sàng lọc các hợp chất hữu cơ

có cấu trúc tương tự, đồng thời dự đoán hoạt tính sinh học và các tính chất hóa lý

của hợp chất làm tiền đề cho các quá trình thực nghiệm một cách hiệu quả.

Những đóng góp mới của luận án

Công trình này xác định được cấu trúc và thử hoạt tính pGI50 in vitro đối

với 6 hợp chất flavonoid phân lập từ lá tía tô, lá xa kê, lá actiso, hạt đậu nành và

củ gừng gió. Đã tính toán và sàng lọc các tham số mô tả cấu trúc phân tử như tham

số điện tích, tham số độ dịch chuyển hóa học, tham số 2D, 3D ảnh hưởng chính đến

hoạt tính kháng ung thư của các dẫn xuất flavonoid. Đã xây dựng và đánh giá thành

công khả năng dự báo của các mô hình QSAR. Các mô hình QESAR, QSDAR,

QSSR, QSARNMR, QSARANN, QSARPCA-ANN, QSARPCR, QSARPLS đã dự đoán được

hoạt tính kháng ung thư và tính chất hóa lý của các hợp chất mới được thiết kế từ

các chất mẫu và hợp chất tự nhiên. Hoạt tính kháng ung thư của các hợp chất mới

tốt hơn hoạt tính kháng ung thư của chất mẫu, hợp chất phân lập từ gừng gió, đậu

nành, tía tô, xa kê, actiso. Như vậy, việc tiến hành nghiên cứu xây dựng các mô

hình QSAR trong nghiên cứu này là một định hướng hữu ích trong nghiên cứu tìm

kiếm và tông hợp các flavonoid khác nhau từ tự nhiên.

Cấu trúc của luận án gồm các phần sau

- Mở đầu

- Chương 1: Tông quan tài liệu

- Chương 2: Nội dung và phương pháp nghiên cứu

- Chương 3: Kết quả và thảo luận

- Kết luận và kiến nghị

- Danh mục các công trình liên quan đến luận án

- Tài liệu tham khảo

4

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU

1.1. BỆNH UNG THƯ CỔ TỬ CUNG

1.1.1. Các nguyên nhân gây ung thư

Ung thư là một tập hợp các bệnh liên quan đến sự phân chia tế bào một cách

mất kiểm soát, tiếp theo là quá trình các tế bào đó xâm lấn và di căn đến các mô

khác qua hệ thống bạch huyết và máu [6]. Giai đoạn di căn là nguyên nhân chính

gây tử vong của bệnh nhân ung thư. Hiện nay có trên 100 bệnh ung thư có loại từ

bắp thịt và xương, có loại từ da hoặc lớp lót của các cơ quan, có loại xuất phát từ

máu. Ở nam giới thường gặp ung thư phôi, gan, đại trực tràng, dạ dày, vòm hầu,

thanh quản, thực quản, tuyến tiền liệt, ung thư máu [58, 70]. Ở nữ giới thường gặp

ung thư vú, cô tử cung, đại trực tràng, phôi, tuyến giáp, buồng trứng, gan, dạ dày,

thân tử cung, da [70]. Ung thư làm cho cơ thể bệnh nhân tử vong bằng nhiều cách,

nhưng đa số là làm cho cơ thể suy kiệt với các bệnh cơ hội. Trong đó, bệnh ung thư

cô tử cung hình thành ở biểu mô cô tử cung (cô tử cung là cơ quan nối giữa âm đạo

với buồng trứng) [57, 96].

Ung thư cô tử cung bắt đầu ở niêm mạc cô tử cung, tại đây các tế bào phát

triển bất bình thường và khó kiểm soát dẫn đến hình thành khối u. Phụ nữ trong độ

tuôi từ 30 đến 59 thường dễ mắc bệnh hơn cả. Đây là căn bệnh có thể điều trị và

phòng ngừa nếu phát hiện sớm [96, 112].

Triệu chứng biểu hiện bệnh: âm đạo xuất huyết bất thường, có mùi khó chịu,

cơ thể bệnh nhân gầy gò, da trắng bệch, cơ thể đau nhức [32].

Điều trị bệnh: tuỳ theo giai đoạn phát triển của bệnh mà được điều trị theo

phác đồ khác nhau: giai đoạn 1 ung thư khu trú tại cô tử cung; giai đoạn 2 ung thư

xâm lấn vùng lân cận; giai đoạn 3 ung thư xâm lấn xa hơn; giai đoạn 3 di căn sang

các bộ phận khác của cơ thể [96].

Giai đoạn 1 và 2: chỉ cần mô và chiếu xạ thì khả năng khỏi bệnh sẽ rất cao, tỉ

lệ khỏi bệnh là 80 – 90%. Giai đoạn 3 và 4 chủ yếu là xạ trị, tỉ lệ khỏi bệnh rất thấp

từ 3 – 25 %, tuỳ theo mức độ nặng hay nhẹ của bệnh [96].

5

Các yếu tố bên ngoài gây bệnh ung thư bao gồm: các tia X, chất phóng xạ,

tia cực tím, hóa chất gây hư hại cấu trúc gen di truyền. Các sản phẩm công nghiệp

như: amiăng gây ung thư phôi; polivinylclorua gây ung thư gan; nitrosamin gây ung

thư bao tử; các phẩm màu trong bánh kẹo, hay một số sản phẩm trong thuốc nhuộm

tóc, các hoá chất kích thích trong chăn nuôi nhiễm estrogen cũng gây ung thư; thuốc

ngừa thai và các chất kích thích nội tiết tố như DES (diethylstilbestrol) có khả năng

gây ung thư; thuốc trừ sâu, rầy như DDT cũng có khả năng gây ung thư [23, 99]. Ô

nhiễm không khí: các hoá chất gây ô nhiễm không khí như CO2, hidrocacbon,

benzopiren, bụi amiăng, khói thuốc lá gây ung thư phôi [70]. Ngoài ra còn có độc

tố của nấm mốc chứa aflatoxin có trong nấm Aspergillus gây ung thư [26].

Các yếu tố do lối sống có thể là nguyên nhân gây bệnh ung thư như các hoá

chất trong thuốc lá gây ung thư phôi, rượu gây ung thư thực quản; chế độ ăn gây

ung thư: ăn nhiều mỡ động vật, bơ, ăn nhiều calo, ăn thiếu chất xơ, uống rượu, hay

sử dụng thực phẩm không an toàn là nguyên nhân gây ung thư [23, 62].

Yếu tố sinh học gây ung thư thể hiện ở một số ít căn bệnh ung thư ở người

được cho là do vi rút như ung thư gan, ung thư vòm họng, ung thư cô tử cung [26].

Yếu tố di truyền gây ung thư chiếm tỉ lệ thấp, một số loại như ung thư mắt,

ung thư vú, có khuynh hướng dễ gặp trong cùng một gia đình. Tuy nhiên, yếu tố di

truyền không có tầm quan trọng về mặt thực tiễn [62].

1.1.2. Điều trị

Một số liệu pháp chính trong điều trị ung thư: phẫu trị là dùng lưỡi dao mô

để loại bỏ tận gốc khối u; xạ trị là phương pháp sử dụng dùng tia phóng xạ tàn tiêu

diệt các tế bào ung thư; hoá trị là dùng hoá chất để tiêu diệt tế bào ung thư; liệu

pháp miễn dịch là liệu pháp tăng cường khả năng đề kháng tự nhiên của cơ thể để

kháng lại sự phát triển của tế bào ung thư [23, 58].

Phẫu thuật và xạ trị có ưu điểm là tấn công mạnh các loại ung thư thời kì còn

khu trú, nhưng phương pháp này không hiệu quả khi ung thư di căn trên cơ thể

người bệnh. Đối với phương pháp hoá trị chỉ cho kết quả tạm thời và không hiệu

6

quả. Liệu pháp miễn dịch chưa được nghiên cứu chuyên sâu nên chỉ là phương pháp

bô trợ trong điều trị bệnh [58, 96].

1.1.3. Phòng ngừa

Biện pháp phòng ngừa ung thư bao gồm một số biện pháp như: Giảm thiểu

việc tiếp xúc với thuốc lá, rượu, hoá chất công nghiệp; thực hiện các biện pháp bảo

vệ cơ thể chặt chẽ khi tiếp xúc với tia phóng xạ; ngừa ung thư qua việc chọn lựa chế

độ ăn uống an toàn như không nên ăn một số thức ăn được khuyến cáo có thể gây

ung thư, thức ăn có chứa các hóa chất nguy hiểm và các hormon; khám sức khoẻ

định kỳ, tầm soát ung thư sớm đều đặn; tiêm vacxin ngừa ung thư; lối sống lành

mạnh [47, 99].

1.2. LIÊN HỆ GIỮA CÂU TRUC VÀ HOẠT TÍNH

Liên hệ giữa cấu trúc – hoạt tính là nguyên tắc cơ bản nhất để xây dựng các

mô hình quan hệ cấu trúc – hoạt tính (QSAR) hay mô hình quan hệ cấu trúc – tính

chất (QSPR), mô hình quan hệ cấu trúc - cấu trúc để dự đoán tính chất vì cấu trúc –

tính chất - hoạt tính có mối quan hệ biện chứng với nhau, là các mối liên hệ nhân –

quả có thể được tính toán một cách chính xác và thiết lập theo những mô hình toán

học rõ ràng [17, 93]. Theo Testa và Kier, quan hệ định lượng cấu trúc – tác dụng là

tông hòa các mối quan hệ thể hiện trên Hình 1.1. Trên cơ sở này nhiều kiểu mô

hình được xây dựng với các thông tin về cấu trúc khác nhau. Mô hình tông quát

dạng QSXR: X có thể là A – hoạt tính (Activity); tính chất – P (Property); cấu trúc

– S (Structure) [17, 93].

Cấu trúc – tính chất không phải lúc nào cũng được phân định rõ ràng, nên

mối liên quan giữa chúng được biểu hiện bằng phần giao trên giản đồ Venn, Hình

1.2 [17, 93]. Tính chất – tác dụng có thể là một trong một số trường hợp nên mối

liên quan giữa tính chất và tác dụng cũng được diễn tả bằng giản đồ Venn có phần

giao. Cấu trúc – hoạt tính có sự phân định rõ ràng nên mối liên quan giữa cấu trúc

và tác dụng, điều này được mô tả bởi hai vòng tròn không có phần giao nhau mà

tiếp xúc tại một điểm.

7

Dữ liệu

cấu trúc

Hoạt tính

Tính chất

Mô hình

phân tử

Sàng lọc dữ liệuQSXR

X=aixi + b0

Hình 1.1 Mối liên quan định lượng cấu trúc, tính chất, độ phản ứng, hoạt tính

Hình 1.2 Giản đồ Venn mối liên quan định lượng cấu trúc và tác dụng [93]

Theo quan điểm hóa học, một phân tử có tác dụng sinh học mang hai nhóm

chức: nhóm tác dụng (thường có cấu tạo đặc biệt) và nhóm ảnh hưởng (thường là

các nhóm có khả năng thay đôi tính chất lý hóa của phân tử như hydroxyl, halogen,

carboxyl, nitro, ...) [17, 93].

Theo quan điểm sinh hóa, một phân tử có tác dụng sinh học có 2 thành phần

chính: Khung phân tử đặc trưng cho tính chất lý hóa, còn nhóm chức quyết định

hoạt tính sinh học [17, 93].

Theo quan điểm hiện đại, phân tử hợp chất là một thể thống nhất (gồm các

nguyên tử tạo khung phân tử, nhóm chức...). Tác dụng sinh học không những do

Tác dụng

Tính chất Cấu trúc

8

cấu trúc phân tử trực tiếp quyết định mà còn gián tiếp chịu ảnh hưởng bởi các quá

trình như hấp thụ, vận chuyển, phân bố hay chuyển hóa của phân tử trong cơ thể

sinh vật [17, 93]. Do đó, khi nghiên cứu mô hình liên quan giữa cấu trúc với tác

dụng, cấu trúc với hoạt tính người ta không những phải khảo sát cấu trúc mà còn

xem xét những yếu tố ảnh hưởng.

Mô tả cấu trúc phân tử: cấu trúc hóa học là sự sắp xếp trong không gian của

các nguyên tử trong lượng mô tả hay thông tin cấu trúc [17, 93].

Mức hình học: cấu trúc phân tử có thể được trình bày dưới dạng 2 chiều

(thông tin cấu trúc gồm độ liên kết nguyên tử, cấu hình Z/E) hay 3 chiều (thông tin

cấu trúc gồm cấu hình tương đối cũng như cấu hình tuyệt đối). Các thông tin của

cấu trúc 2 chiều (2D) và 3 chiều (3D) hữu ích cho nghiên cứu mối liên quan định

lượng cấu trúc và tác dụng [17, 93].

Mức lập thể điện tử: đó là vật thể có thể tích và hình thù nhất định như cấu

trúc lập thể có tính chất cơ động hay là cấu trúc lập thể với sự phân bố mật độ điện

tử của các nguyên tử [17, 93]. Các thông tin cấu trúc bao gồm thể tích, diện tích bề

mặt, sự thay đôi cấu dạng, sự phân bố điện tử, thế tĩnh điện phân tử, .... Các thông

tin này có thể có từ tính toán trên máy tính, đặc biệt là sử dụng các phương pháp

hóa lượng tử.

Mức tương tác với môi trường: cấu trúc phân tử thể hiện hoạt tính, độc tính,

điểm chảy, điểm sôi, khả năng solvat hóa, tính chất sắc ký, hệ số phân bố, độ tan, áp

suất tới hạn, v.v, trong môi trường sinh học [17, 93].

Cấu trúc phân tử ảnh hưởng đặc biệt quan trọng đối với hoạt tính sinh học,

đó là chìa khóa quan trọng để thiết lập mối quan hệ giữa cấu trúc và hoạt tính. Sự

phát triển của mối liên hệ này làm nền tảng để xây dựng các mô hình có khả năng

dự đoán. Với một chuỗi các hợp chất có cấu trúc tương tự, có thể xây dựng các mô

hình quan hệ giữa cấu trúc - hoạt tính (QSAR) [17, 93].

9

1.3. TÍNH TOÁN THÔNG TIN CÂU TRÚC

1.3.1. Cơ học phân tử

Trong các phương pháp lý thuyết liên quan đến việc tối ưu hóa hình học của

cấu trúc thì phương pháp cơ học phân tử (Molecular Mechanic - MM) khá thông

dụng. Phương pháp MM có thể tính toán chính xác về cấu trúc hình học và năng

lượng tương đối của các phân tử lớn vượt quá khả năng đối với các phương pháp

hóa lượng tử [25].

Năng lượng của phân tử trong trường được tính theo phương trình 1.1 [25]:

E = Eb + Ea + Et + Ev + Eh + Ee (1.1)

Trong đó: Eb là năng lượng do sự biến dạng liên kết; Ea là năng lượng do sự

khép mở góc liên kết; Et là năng lượng do sự xoay quanh liên kết; Ev là năng lượng

tương tác van der Waals; Eh là năng lượng do liên kết hydrogen; Ee là năng lượng

tương tác tĩnh điện.

Giữa cấu trúc và năng lượng có sự liên quan mật thiết với nhau, do đó tối ưu

hóa hình học của cấu trúc sẽ dẫn đến tối thiểu hóa năng lượng của phân tử [102].

Quá trình này tạo một cấu trúc ứng với trạng thái năng lượng tối thiểu (tối ưu về

hình học hay bền về năng lượng) để từ đó có thể xem xét tọa độ của các nguyên tử

của phân tử. Cấu trúc tối ưu về hình học hay bền về năng lượng có thể sử dụng để

tính toán phương pháp lượng tử: phương pháp nguyên lý ban đầu (ab-initio) hay

phương pháp bán thực nghiệm [60] [100].

1.3.2. Cơ học lượng tử

Cơ học lượng tử (Quantum Mechanic - QM) là mô tả toán học chính xác của

trạng thái điện tử và tính chất hóa học. Về lý thuyết, QM có thể dự đoán chính xác

bất kỳ tính chất nào của từng nguyên tử hoặc phân tử [60, 100]. Trong thực tế,

phương pháp QM chỉ được giải quyết chính xác cho một hệ thống điện tử [60,

100]. Vô số các phương pháp đã được phát triển cách giải gần đúng cho các hệ

thống đa điện tử. Hai phương trình QM được phát triển bởi Schrödinger và

Heisenberg. Phương trình Schrödinger là phương trình cơ bản cho hầu hết các

phương pháp hóa tính toán [60, 100].

10

Ĥ = E (1.2)

Trong phương trình Schrödinger Ĥ là toán tử Hamiltoni, là hàm sóng, E là

năng lượng. Phương trình này được gọi là phương trình riêng. được gọi là hàm trị

riêng, E là trị riêng.

Hàm sóng là hàm xác định vị trí của electron và hạt nhân. Electron được

mô tả như một hàm sóng. Nó mô tả xác suất của trạng thái điện tử. Như vậy, nó có

thể mô tả xác suất tìm thấy các electron ở các vị trí nhất định, nhưng nó không thể

đoán chính xác vị trí điện tử. Hàm sóng cũng được gọi là mật độ xác suất bởi vì

bình phương của hàm sóng là hàm xác suất. Đây là ý nghĩa chính xác của hàm sóng.

Để có được một giải pháp vật lý thích hợp có liên quan của phương trình

Schrödinger, hàm sóng phải liên tục, đơn trị [60, 100].

Toán tử Hamilton Ĥ

2

ij

ˆ2

p pi ji

i i ji

q qH

m r

(1.3)

2 2 22

2 2 2i

i i ix y z

(1.4)

Với 2

i là toán tử Laplac đối với hạt (p) i, các hạt gồm cả điện tử và hạt

nhân, mi và qi là khối lượng và điện tích hạt i, p là tông số hạt, rij là khoảng cách

giữa các hạt. Số hạng đầu tiên biểu thị cho động năng của hạt trong một phương

trình sóng. Các số hạng bô sung có thể xuất hiện trong toán tử Hamiltonion tương

tác với bức xạ điện từ hoặc trường được tính đến. Trong phần mềm QSARIS hiện

có, toán tử Hamiltonion ở trên là gần như chưa từng được sử dụng. Vấn đề có thể

được đơn giản hóa bằng cách tách các chuyển động hạt nhân và electron. Điều này

được gọi là xấp xỉ Born – Oppenheimer. Toán tử Hamilton cho một phân tử với các

hạt nhân tĩnh là:

2

ij ij

1ˆ2

e n e ei i

i i j i j

ZH

r r

(1.5)

11

Ở đây chỉ xét động năng của electron và lực hút giữa electron và hạt nhân và

lực đẩy của các điện tử. Sự chuyển động của hạt nhân có thể được mô tả bằng cách

xem xét toàn bộ tính toán thế năng khi các hạt nhân di chuyển [60, 100].

Khi hàm sóng đã được xác định, bất kỳ thuộc tính nào của phân tử đều có thể

được xác định. Điều này được thực hiện bằng cách tính giá trị mong muốn của toán

tử cho tính chất đó, được biểu thị bằng dấu ngoặc vuông < >. Ví dụ, năng lượng là

giá trị kỳ vọng của toán tử Hamilton được đưa ra bởi:

* ˆE H (1.6)

Đối với một hàm sóng gần đúng, có thể tính xấp xỉ năng lượng, đó là cơ sở

cho nhiều kỹ thuật được mô tả trong các tính toán khác. Bằng cách thay thế các toán

tử khác, có thể có được các tính chất quan sát rõ ràng, chẳng hạn như moment lưỡng

cực hoặc mật độ electron. Một cách khác để có được tính chất phân tử là sử dụng

định lý Hellmann-Feynman. Định lý này khẳng định rằng các thuộc tính năng lượng

với tính chất P mong muốn được cho bởi:

dE H

dP P

(1.7)

Mối quan hệ này thường được sử dụng để tính toán tính chất electron. Không

phải tất cả phương pháp xấp xỉ tuân theo định lý Hellmann-Feynman. Chỉ các

phương pháp biến thể tuân theo định lý Hellmann-Feynman [60, 100].

1.3.3. Phương pháp bán thực nghiệm

Các phương pháp bán thực nghiệm sử dụng trong luận án gồm phương pháp

CNDO, INDO, MNDO, AM1, PM3, TNDO (Phụ lục 60) [60, 100].

Phương pháp QM dùng để tính toán các thông tin cấu trúc phân tử như: điện

tích (Qi), cấu trúc phô NMR (i), tham số hóa lý, …. Phương pháp hóa lượng tử

được chọn phải phù hợp với đối tượng nghiên cứu, mức độ chính xác, thời gian tính

toán cũng như kích thước của hệ [60, 100]. Các tham số cấu trúc phân tử được tính

toán được đưa ra ở Phụ lục 58.

12

1.4. CÁC MÔ HÌNH TOÁN HOC

1.4.1. Hồi quy đa biến

Trong hồi quy, các biến số độc lập x và biến phụ thuộc y là các giá trị quan

sát. Tương ứng với một giá trị của x chỉ có 1 giá trị y duy nhất lúc này y là hàm của

x có dạng (y = f (x)) [51, 66]. Tuy nhiên, chúng ta hay gặp trường hợp cùng một giá

trị x trong các thí nghiệm có thể có các giá trị y khác nhau do ảnh hưởng của các

yếu tố khác. Khi đó sự phụ thuộc được gọi là xác suất và các giá trị y là một hàm

với các giá trị ngẫu nhiên. Nếu chỉ có trường hợp Y là biến ngẫu nhiên rời rạc và X

là giá trị rời rạc, để xác định y bằng cách sử dụng phân phối như ma trận sau:

Y X

x1 x2 … xm

y1 p1(x1) p1(x2) … p1(xm)

y2 p2(x1) p2(x2) … p2(xm)

… … … … …

yN pN (x1) pN (x2) … pN (xm)

Trong đó xk (k = 1, 2, …, m) là các giá trị có thể có của X, yi (i = 1, 2, ..., N)

là các giá trị có thể có Y và pi(xk) là xác suất xuất hiện của yi nếu X = xk , với k bất

kỳ, ta có đẳng thức sau:

1)(1

N

i

ki xp (1.8)

Giả sử Y/(X = xk) là biến ngẫu nhiên tương ứng với giá trị của xk. Phân bố

nằm trong cột thứ k của ma trận. Các giá trị trung bình (M) của biến Y được tính:

N

i

kiik xpyxXYM1

)()]/([ (1.9)

Và các giá trị X khác nhau, được xem như hàm ]/[)( XYMXg . Hàm g(X)

được gọi là hàm hồi quy của Y đối với X.

Như đề cập ở phần trên cho trường hợp phụ thuộc ngẫu nhiên của biến Y với

nhiều biến độc lập X1, X2, …, Xp, sự phân bố của Y trong trường hợp này được mô tả

13

bằng xác suất ),,,(21 pkkki xxxp , với

jkx là các giá trị khác nhau của các biến X1, X2,

…, Xp. Khi X1 = x1, X2 = x2, …, Xp = xp các giá trị trung bình của Y có dạng:

N

i

piipp xxxpyxXxXxXYM1

212211 ),,,()]())(/([ (1.10)

Các biến X1, X2, …, Xp, là hàm g(X1, X2, …, Xp):

],,/[),,( 2121 pp XXXYMXXXg (1.11)

Hàm g(X1, X2, …, Xp) là hàm hồi quy đa biến của Y với các biến độc lập X1, X2,

…, Xp.

Để xây dựng hàm hồi quy của các biến ngẫu nhiên Y phụ thuộc X1, X2, …, Xp,

trên thực tế điều đó là không thể, vì xác suất pi(xk1, xk2, …, xkp) thường không xác

định. Vấn đề đặt ra là xây dựng hàm toán từ hàm g(X1, X2, …, Xp), như

hàm ),,(ˆ21 pXXXg được gọi là mô hình hồi quy tương quan với hàm g cho bởi

phương trình 1.12 [51, 66]:

),,(),,(ˆ),,( 212121 ppp XXXeXXXgXXXg (1.12)

Với e(X1, X2, …, Xp) là sai số của mô hình.

Mô hình hồi quy được xây dựng trên cơ sở dữ liệu thống kê giữa biến phụ

thuộc Y trên X1, X2, …, Xp. Các giá trị quan sát được trình bày theo ma trận sau:

k X1 X2 … Xp Y

1 x11 x12 … x1p y1

2 x21 x22 … x2p y2

… … … … … …

N xN1 xN2 … xNp yN

Mỗi hàng trong ma trận đại diện cho mỗi quan sát cụ thể (thí nghiệm) được

gọi là mẫu hoặc trường hợp. Các biến độc lập đóng vai trò là một phần của biến dự

đoán, phụ thuộc vào giá trị của chúng, giá trị quan sát Y là các giá trị ngẫu nhiên

khác nhau [51, 66]. Vấn đề chọn dạng của hàm ),,(ˆ21 pXXXg (hoặc thuật toán để

tính toán) để xây dựng mô hình hồi quy là khó khăn nhất. Việc chọn mô hính hồi

quy phải thỏa mãn hai yếu tố sau:

14

1. Hàm mô phỏng ),,(ˆ21 pXXXg phải đại diện được cho hàm hồi quy.

2. Việc tính toán các giá trị của hàm phải dựa trên khả năng đáp ứng của nguồn

dữ liệu tính toán có sẵn.

Nếu mô hình ),,(ˆ21 pXXXg được chọn, giá trị của nó trong trường hợp thứ

k bằng ),,(ˆˆ21 kpkkk xxxgy và được xem là giá trị dự đoán của yk. Sự khác biệt giữa

yk và ky là độ lệch (sai số): kkk eyy ˆ .

Các biến độc lập X1, X2, …, Xp ở trên đã được xác định. Khi nhiều thí nghiệm

được thực hiện, các biến độc lập có các giá trị khác nhau (cột trong ma trận). Vì

vậy, có thể xem các biến này là biến ngẫu nhiên và giá trị dự báo Y1, Y2, …, Yp là dựa

trên các biến ngẫu nhiên [51, 66]. Theo quan điểm toán học, điều quan trọng không

phải các giá trị dự đoán là ngẫu nhiên hay không. Trong tất các các tính toán, các

giá trị dự đoán có tính chất tông quát. Nó giải thích các số hạng cụ thể cho các giá

trị ngẫu nhiên được chuyển sang các giá trị dự đoán xác định. Hơn nữa chúng ta

không chú ý đến các giá trị dự đoán sử dụng.

Các giá trị dự đoán và giá trị quan sát ngẫu nhiên Y, các tham số của các mô

hình được tìm thấy là kết quả của kinh nghiệm lấy mẫu ngẫu nhiên. Vì vậy các tham

số của mô hình ),,(ˆ21 pXXXg cũng được coi là biến ngẫu nhiên [51, 66].

Dạng đơn giản và phô biến nhất được sử dụng trong mô hình hồi quy tuyến

tính là:

),,(),,(),,(ˆ21212221110 pqqpp XXXbXXXbXXXbby (1.13)

Ở đây ),,( 21 pi XXX là các hàm cơ bản và bi là các hệ số (hoặc các yếu

tố) tính được sao cho mô hình được xây dựng tốt nhất.

Trong thực tế, nếu có nhiều biến độc lập, mô hình tuyến tính của dạng:

pp XbXbXbby 22110ˆ , (1.14)

Với 0b được gọi là hệ số tự do trong mô hình.

15

Hình 1.3 Mô hình hồi quy tuyến tính với (p = 2) [51, 66]

Việc lựa chọn các hệ số hồi quy bk đảm bảo tính thích hợp lớn nhất cho mô

hình tuyến tính được xây dựng. Để giải quyết vấn đề này, phương pháp tốt sử dụng

phương pháp bình phương cực tiểu. Lúc này hệ số bk được tìm kiếm từ một điều

kiện để giảm thiểu tông bình phương độ chênh lệch giữa các giá trị quan sát được

và dự đoán của biến phụ thuộc:

N

i

iip yyRSS1

2)ˆ( (1.15)

Với ippiii xbxbxbby 22110ˆ (1.16)

Khi p = 2 minh họa hình học đơn giản của phương pháp bình phương cực

tiểu Hình 1.3. Ví dụ, hình ảnh trên cho thấy không gian tiếp cận sự phụ thuộc giữa

hai biến độc lập X1, X2 và biến phụ thuộc Y.

Hồi quy thường là phương pháp đơn giản nhất trong phân tích hồi quy. Nó

được sử dụng để giải quyết các trường hợp với số lượng biến độc lập nhỏ, không

tương quan chặt chẽ [51, 66]. Tuy nhiên, phương pháp này tạo cơ sở để hiểu các

phương pháp hồi quy khác phức tạp hơn. Chúng ta hãy xem xét các ma trận sau đây

đại diện cho các kết quả quan sát:

)( 10

10

222120

111110

YXX p

NNpNN

p

p

yxxx

yxxx

yxxx

XX

16

Với Xj là cột thứ j được xem là vec tơ dự đoán và Y là vec tơ biến phụ thuộc.

Giá trị trung bình được tính cho mỗi biến Xj theo phương trình:

N

i

ijj xN

x1

1 (1.17)

và độ lệch chuẩn có dạng sau:

N

i

jijj xxN

s1

22 )(1

1

(1.18)

Hệ số tương quan được tính cho các cặp biến khác nhau dưới dạng sau:

N

k

jkjiki

ji

ij xxxxsNs

c1

))((1

(1.19)

Các hệ số tương quan này tạo thành một ma trận tương quan mẫu.

Cột thứ nhất X0 được đưa vào trong ma trận nếu một hệ số trong (1.14) khác

không. Giả sử bỏ qua cột X0. Có thể thu được bằng cách căn giữa các dữ liệu theo

cách sau: jijij xxx , với jx là giá trị trung bình của biến jx .

Cách đơn giản nhất để hiểu được bản chất của hồi quy đa biến thường là xem

xét một ví dụ đơn giản với p = 2 và N = 3 với minh họa hình học cụ thể.

Xét ma trận X = (X1 X2) trong đó bao gồm các vec tơ trung tâm dự đoán và

vector Y là một vec tơ trung gian dự đoán. Chúng ta có:

3

2

1

3231

2221

1211

,

y

y

y

xx

xx

xx

YX

Mô hình hồi quy có dạng XbXXy 2211ˆ bb , với )( 21 bbb . Vì vậy, vec

tơ y trong không gian P được biểu thị qua các vec tơ X1, X2 (Hình 1.4). Véc tơ độ

lệch: yYe ˆ . Chiều dài của vec tơ này là:

N

i

ii yy1

2)ˆ( (1.20)

Chiều dài này là cực tiểu nếu véc tơ e trực giao với không gian P, nghĩa là

trực giao với vec tơ X1, X2. Điều kiện trực giao có dạng sau:

17

)2,1()ˆ( j,j 0yYX , hay 0 )( XBYX (1.21)

Với jX là vec tơ chuyển vị của jX (vec tơ hàng) và X là ma trận chuyển vị

của ma trận X.

Từ mối quan hệ thứ hai ta có cách tính các hệ số hồi quy:

YXXbX (1.22)

Với ma trận XXC gồm các yếu tố:

)2,1,(,1

jixxcN

k

kjkiij . (1.23)

Giá trị trung bình của ma trận C tỷ lệ thuận với ma trận hiệp phương sai của

ma trận vec tơ dự báo jX .

Yếu tố ijc của ma trận C là các yếu tố trong của ma trận ji XX , . Vì vậy iic

bằng chiều dài của vec tơ iX . Ta có:

ij

ij

jj

osii

cc

c c với φij là góc giữa hai vec tơ Xi, Xj.

Vì vậy, góc giữa hai vec tơ ji XX , (Hình 1.4) nghĩa là jjiiij ccc / gần 1 (tức

là có tương quan mạnh mẽ giữa các giá trị dự đoán). Ngược lại, nếu ji XX , không

tương quan, thì các vec tơ tương ứng trực giao. Trường hợp này xảy ra khi các vec

tơ )(,,,, Nll XXX 21 nằm trong không gian siêu phẳng (hiện tượng đa cộng

tuyến), hiện tượng đa cộng tuyến dẫn đến sự suy biến của ma trận C và kết quả là

khó khăn trong thiết lập phương trình (1.23).

18

1

2

3

X1

X2

Y yYe ˆ-

P

2211ˆ XXy bb

Hình 1.4 Hồi quy đa biến thường với p = 2, N = 3 [51, 66]

Nếu ma trận C không suy biến, vec tơ b được tính theo phương trình sau:

YXCb 1 (1.24)

Công thức cho hệ số hồi quy (1.24) đúng trong trường hợp số lượng biến

trong mô hình bằng p. Xác định hệ số bk được coi là ước lượng thống kê của các hệ

số ngẫu nhiên của hệ số bk trong mô hình tuyến tính (1.14). Một số trường hợp bk

ước tính với giá trị nhỏ ( 0kb ). Điều đó chỉ ra rằng bk = 0 (biến không phụ thuộc

biến Xk) và giá trị bk khác không, được xác định từ dữ liệu nhiễu ban đầu. Vì vậy,

cần kiểm tra mức độ ý nghĩa của biến Xk (hoặc của hệ số Bk) trong mô hình được

xem xét [51, 66]. Theo quan điểm thống kê, có nghĩa là cần kiểm tra giả thuyết H0:

[ bk = 0]. Cách đơn giản nhất để minh họa cho nguyên tắc chung của việc kiểm tra

một giả thuyết như vậy là đưa ra một ví dụ về một mô hình một chiều 11 XbY , với

X1 và Y là các giá trị trung bình có ý nghĩa [51, 66]. Về mặt hình học các giá trị X1

và Y không tương quan có nghĩa là các vectơ X1 và Y trực giao. Tuy nhiên, vì quan

sát là ngẫu nhiên, các vectơ X1 và Y có thể không hoàn toàn trực giao, sẽ dẫn đến

một hệ số hồi quy khác không b1 (Hình 1.5).

Nếu giả thuyết H0 đúng, góc nhỏ. Độ lớn của góc này có thể được ước

lượng:

)(

)(

)ˆ(

ˆˆ

tan

1

2

1

2

2

2

2

residualSS

regressionSS

yy

y

N

i

ii

N

i

i

e

y (1.25)

19

Hình 1.5 Ý nghĩa của hệ số hồi quy [51, 66]

Tuy nhiên, trong thống kê, xem xét bình phương trung bình sẽ thuận tiện

hơn, có nghĩa là tính tông của bình phương theo bậc tự do được xem xét.

Bậc tự do DF đặc trưng số lượng các tham số độc lập, ảnh hưởng đến độ lớn

của tông bình phương. Với tông bình phương hồi quy SS(hồi quy) độ tự do hồi quy

DF(hồi quy) bằng 1, vì tông

N

i

i

N

i

i xby1

2

1

1

2 )(ˆ được xác định bởi giá trị của tham số

đơn b1. Vì vậy SS(quan sát), bằng

N

i

iy1

2 , độ tự do DF(quan sát) bằng N-1, bởi vì

các giá trị quan sát trung tâm được tính bởi phương trình:

N

i

iy1

0 . Nghĩa là N-1

biến độc lập. Ta có liên hệ sau: SS(quan sát = SS(hồi quy) + SS(dư). Từ đó ta có:

DF(quan sát) = DF(hồi quy) + DF(dư). Vì vậy, SS(dư) có bậc tự do DF(dư) bằng

N-2. Do đó, độ lệch của vector Y trực giao với vector X, (tức là giả thuyết

]0[:0 kBH đúng), theo thống kê sau đây [51, 66]:

( ) / ( ) ( )

( ) / ( ) ( ) / ( 2)

SS hoiquy DF hoiquy SS hoiquyF

SS du DF du SS du N

(1.26)

Thống kê này được gọi là chuẩn F

Chúng ta hãy xem xét các giả định sau liên quan đến các biến ngẫu nhiên

iii yye ˆ :

1. ei độc lập với nhau;

2. ei có phân phối chuẩn giống nhau );0( 2N .

Vì vậy chuẩn F có phân bố F với (1, N-2) bậc tự do.

20

Nếu giả định H0 với b1 bằng 0 là đúng F lớn với xác xuất bé. Chúng ta có thể

chỉ định giới hạn DF(α), có thể vượt quá tiêu chí F chỉ với một xác suất nhỏ. Nếu

giá trị của thống kê F, được tính theo công thức (1.26), lớn hơn DF(α), nó có nghĩa

là giả thuyết H0 sai, các hệ số hồi quy b1 có ý nghĩa [51, 66].

Kiểm tra ý nghĩa biến có thể được khái quát theo các cách khác nhau trong

trường hợp có nhiều biến. Một trong những biến thể của khái quát này đang xem xét

một phần thử nghiệm F-test.

Hình 1.6 Giải thích F-test [51, 66]

Giả sử rằng phương trình hồi quy với hai biến thu được bằng phép chiếu

chính xác của vector Y trong không gian được kéo dài qua các vectơ 21 , XX (Hình

1.5). Phương trình hồi quy này như sau:

2

)1(

21

)1(

1

)1(ˆ XXy bb (1.27)

Trong trường hợp này, tông bình phương các giá trị hồi quy bằng với bình

phương của vector được xác định bởi các hệ số )1(

2

)1(

1 , bb :

2

2

)1(

21

)1(

1

2)1()1(

2

)1(

1ˆ),( XXy bbbbSS (1.28)

Nếu chúng ta xem xét mô hình với biến đã lược bỏ X2, giá trị dự đoán sẽ có

dạng sau: 1

)2(

1

)2(ˆ Xy b , với )2(y thu được bằng phép chiếu của véc tơ Y đến vec tơ

X1 (Hình 1.6). Khi đó, hệ số )2(

1b khác hệ số )1(

1b . Khi vec tơ X1 và X2 trực giao (tức

là 021 XX ), điều đó là ngoại lệ, khi đó )1(

1

)2(

1 bb . Tông bình phương do giá trị dự

21

đoán từ hồi quy trong trường hợp thứ hai bằng với chiều dài bình phương của véc tơ

)2(y được xác định bởi hệ số )2(

1b . Tông bình phương này có dạng sau:

2

1

)2(

1

2)2()2(

1ˆ)( Xy bbSS (1.29)

Số bình phương phần dư bằng hiệu giữa tông bình phương trong trường hợp

thứ nhất và thứ hai (nó là hiệu bình phương )2()1( ˆˆ yy Hình 1.6) [51, 66]. Giá trị

này gọi là ‘tông bình phương b2 và b1’ theo phương trình:

2)2()1()2(

1

)1(

2

)1(

112ˆˆ)(),()|( yy bSSbbSSbbSS (1.30)

Có nghĩa là )|( 12 bbSS mô tả tông dư X2 trong mô hình hồi quy hoặc ý nghĩa

của hệ số hồi quy b2. Kiểm tra ý nghĩa thống kê của hệ số b2 (nghĩa là kiểm tra giả

thuyết ]0[: 20 BH ) với kiểm định F-test trong trường hợp cụ thể này được gọi là

một phần F2/1-test và có dạng sau [51, 66]:

2 1 2 1 2 12/1

( | ) / ( | ) ( | ) / (2 1)

( ) / ( ) ( ) / ( 2)

SS b b DF b b SS b bF

SS du DF du SS du N

(1.31)

Nói chung, hai mô hình được xem xét tương ứng với các biến sau:

pXXX ,,, 21 và qXXX ,,, 21 (q<p). Tông bình phương pq bb ,,1 thu được từ

qbb ,,1 bằng:

),,(),,(),,|,,( )2()2(

1

)1()1(

111 qpqpq bbSSbbSSbbbbSS (1.32)

Giá trị F tương ứng là:

! 1

( 1,..., )/(1,..., )

( ,..., ) | ( ,..., ) / ( )

( ) / ( )

q p q

q p q

SS b b b b p qF

SS du N p

(1.33)

Thống kê ),,1/(),,1( qpqF có phân bố sau đây: F(p-q, N-p), để có thể kiểm tra

giả thuyết ]0[: 10 pq BBH tại α. Giá trị BF(α) có thể được tính toán bởi một

hàm chuẩn trong Microsoft Excel FDISTINV( ; p-q; N-p). F được sử dụng trong

hồi quy từng bước để thăm dò các biến quan trọng [51, 66].

Một phương pháp ước lượng các hệ số hồi quy là tính các khoảng tin cậy.

Lúc này kiểm định t tính đối với hệ số bk theo công thức:

22

)()(

k

k

kbSE

bbt (1.34)

Với SE(bk) là độ lệch chuẩn của hệ số bk, tính toán theo công thức:

( ) . ( ) / ( )k kkSE b a SS du N p (1.35)

Với akk là một phần tử chéo của ma trận A. Ma trận A là ma trận nghịch đảo

của ma trận XXC của đánh giá chéo độ lệch các biến [51, 66].

Hệ số bk là một giá trị mẫu của biến ngẫu nhiên Bk. Khoảng tin cậy cho biến

ngẫu nhiên Bk có thể được tính theo biểu thức sau đây:

Với t là một phần tư của thứ tự )1(2

với t-distribution (phân phối

Student) với độ tự do N-1.

Nếu khoảng tin cậy này chứa a điểm 0, khi đó hệ số bk có nghĩa. Điều

kiện )]();([0 kkkk bSEtbbSEtb tương đương với : tbt k )( . Khi đó hệ số bk

có thể được coi là quan trọng ở một giá trị khá lớn t(bk), cụ thể là, khi chúng ta có

các điều kiện sau:

tbt k )( (1.36)

Điều kiện (1.36) được gọi là hai phía phân bố t. Quan hệ giữa phân bố t và

phân bố F theo (1.37).

),1,1( NFt (1.37)

1.4.2. Hồi quy thành phần chính

Phương pháp tính toán phân tích hồi quy cho một biến phụ thuộc dựa trên

một tập hợp các thành phần chính được tính toán từ các biến độc lập. Phương pháp

thành phần chính hữu ích khi các biến độc lập đa lớp hoặc tương quan cao với nhau.

Điều này thường có thể được biết khi thực hiện một số chương trình hồi quy khác.

Sự đa cộng tuyến giữa các biến độc lập cho thấy sự tương quan giữa chúng. Sự

tương quan này được tính thông qua các điểm riêng của ma trận hiệp phương sai

hoặc ma trận chéo [52, 107].

23

Giả sử X = (X1 X2 … Xp) là ma trận với cột là các vec

tơ )( 21 Nkkkk xxx X . Ma trận chéo XXC đối xứng và không xác định được.

Vì vậy, có các cặp vec tơ song song pzzz ,,, 21 , với p là số biến số z. Các vec tơ

riêng tương ứng với các giá trị dương p ,,, 21 .

kl

pk

lkkk

pkkk

,0,1

,,1,0, 21

zzzz

zzXX . (1.38)

Các giá trị riêng và vec tơ riêng trong ma trận chéo được tính toán theo

phương pháp Jacobi trong QSARIS.

Các vector p, được gọi là các thành phần chính của quan sát:

pkkk ,,1, zXw . (1.39)

Từ phương trình (1.38) và (1.39) và các thành phần chính trực giao và độ dài

của chúng được k :

kllkklklkkkkkkkkkk ,0,2

zzzXXzwwzzzXXzwww .

Nếu các thành phần chính được xem như là các vector của một biến độc lập

mới Wk, các mối quan hệ đã đề cập có nghĩa là các biến này là cặp không tương

quan và chúng có chênh lệch bằng k [52, 107].

Tương quan giữa các biến độc lập gốc Xk (dự báo) và các thành phần chính

Wk có thể được biểu diễn dưới dạng sau:

W=XZ hay X = WZ’ (1.40)

Trong đó W là ma trận với cột )( 21 Nkkkk www w và Z là một ma trận trực

giao với các cột tương đương với các vec tơ riêng

)( 21 pkkkk zzz z , ZZ 1 .

Từ phương trình (1.40) các vec tơ của các biến độc lập Xk là các thành phần

chính theo phương trình sau:

'Wk kX z hay1

w , 1,..., , 1,... ,p

ik ij kj

j

x z i N k p

(1.41)

và các điểm thành phần chính có giá trị:

24

k kw Xz hay 1

, 1,..., , 1,... ,p

ik ij kj

j

w x z i N k p

(1.42)

Ý nghĩa hình học của các thành phần chính của một quan sát khi p = 2 và N

= 3. Các thành phần chính w1 và w2 nằm trong cùng mặt phẳng với các vec tơ của

biến độc lập X1 và X2. Góc giữa X1 và X2 nhỏ. Điều đó có nghĩa là các vec tơ này

tương quan chặt chẽ. Đồng thời, các thành phần chính w1 và w2 trực giao với nhau

(không tương quan) và bình phương của chiều dài của chúng bằng với các giá trị

riêng tương ứng của ma trận C, Hình 1.7 [52, 107]. Hồi quy riêng phần tương quan

với w1 theo phương trình: 11

)1(ˆ wy và tương quan với w2 theo phương

trình22

)2(ˆ wy . Vec tơ dự đoán có dạng:

2211

)2()1( ˆˆˆ wwyyy (1.43)

Bình phương độ dài của vec tơ y ảnh hưởng đến giá trị R2 và trực giao của w1 và w2

được tính toán theo phương trình:

2

2

2

2

2

1

2

1

2

2

2

2

2

1

2

1

2ˆ wwy (1.44)

Vec tơ w1 dài, nó tương ứng với trị riêng lớn hơn 1 . Vec tơ này đóng góp

quan trọng vào giá trị dự đoán.

Hình 1.7 Hồi quy thành phần chính với p = 2, N = 3 [52, 107]

Vì vậy, mô hình hồi quy được xây dựng với các biến tương ứng có giá trị

riêng lớn hơn. Các biến khác được đưa vào mô hình có tông tích lũy của các giá trị

riêng gần với tông của tất cả các giá trị riêng. Rõ ràng không nên xem xét các thành

phần chính tương ứng với các giá trị riêng bằng không. Các điều kiện cần có: các

25

thành phần chính có giá trị riêng thấp thì không đạt yêu cầu. Hệ số hồi quy thành

phần chính được tính toán cho biến Y:

p

j

pjjk

k

p

kkk

k Cz1

1,12

111CzXYz

w

Ywkk

k (1.45)

Với C là ma trận chéo mở rộng và Cp+1 là cột thứ (p+1) của ma trận mục tiêu

của biến phụ thuộc. Tương quan giữa thành phần chính wk với biến phụ thuộc Y =

Xp+1 được tính:

Y

kkk

pks

r

Y

w

Yw

Yw k

k

k

1, (1.46)

Với Ys là sai số của Y.

Ý nghĩa của các thành phần chính trong mô hình được đánh giá thông qua

giá trị F. Nó được thể hiện thông qua giá trị RSS

N

j

j yyRSS1

22

0 )(Y (1.47)

Tông bình phương độ lệch của mô hình với k thành phần chính được tính:

pkRSSRSS kkkk ,,1,2

1 (1.48)

Với tông giá trị hồi quy F với k thành phần chính được tính:

)1/(

)( 0

kNRSS

RSSRSSFTOT

k

k

k (1.49)

Và F của thành phần chính thứ k được tính:

)1/(

)( 1

kNRSS

RSSRSSF

k

kk

k (1.50)

1.4.3. Bình phương tối thiểu riêng phần

Giống như PCR, bình phương tối thiểu riêng phần (PLS) tạo ra một chuỗi

các mô hình và ước tính nào là tốt nhất với các biến ẩn. Tuy nhiên, tập hợp các mô

hình tạo thành trình tự có trật tự, khác với các mô hình được xây dựng bởi PCR. Giả

sử X = (X1 X2 … Xp) là một ma trận có các cột là vectơ của quan sát trung tâm và

quan sát hiệu chỉnh sai lệch )( 21 Nkkkk xxx X . XXC là một ma trận chéo .

26

Ma trận này đối xứng và không xác định [51, 106]. Do đó, các vector riêng của cặp

vector trực giao pppp ,,, 21 với p số vec tơ. Các vec tơ riêng tương ứng với các giá

trị riêng dương p ,,, 21 , …

kl

pk

lkkk

pkkk

,0,1

,,1,0, 21

pppp

ppXX (1.51)

Vec tơ

pkkk ,,2,1, Xpt , (1.52)

Là các thành phần chính tính từ (1.51) và (1.39) sau đó:

' ' ' ' ' ', =

( )( ) ( )0,neu

k

k l k l k l k l l

neu k lt t p X Xp p X X p p p

k l

(1.53)

Từ 1.53 các thành phần chính là N vec tơ trực giao với kk t . Nếu ma trận

pNp )( 21 tttT bao gồm các thành phần chính và ma trận pNp )( 21 tttT gồm

các vec tơ riêng ppp )( 21 pppP , khi đó (1.39) có dạng

XPT (1.54)

Ma trận P là ma trận trực giao, tức là PP 1 . Vì vậy

PTX (1.55)

Theo (1.55) X gọi là thừa số của ma trận có dạng:

p

k

kkp

1

2

1

21 )( pt

p

p

p

tttX

p

.

Nếu hạng của ma trận X bằng r, khi đó giá trị riêng: 021 prr và

021 prr ttt . Trong trường hợp này:

r

k

kk

1

ptX (1.56)

Từ (1.56) là cột của ma trận X (vec tơ Xj) có thể được trình bày dưới dạng kết hợp

tuyến tính của các thành phần chính trực giao song song tk theo:

27

r

k

kjkj p1

tX (1.57)

Ma trận:

r

mk

kkm ptE (1.58)

Được gọi là “phần thừa thứ m của x”. Vec tơ Em trực giao với vec tơ t1, t2, …,tm-1.

Để minh họa cho tk và pk, một trường hợp cho hai biến X1 và X2, trong không

gian hai chiều P được mở rộng từ hai vec tơ này, chỉ ra trong Hình 1.8 Ma trận

tương quan cho vec tơ chuẩn hóa X1 và X2 là ma trận [51, 106]:

1cos

cos1C (1.59)

Với là góc giữa vec tơ X1 và X2. Giá trị riêng của ma trận là

cos1,cos1 21 và giá trị riêng được tính:

)2/12/1(),2/12/1( 21 pp (1.60)

Khi đó các thành phần chính được tính (1.52 và Hình 1.8):

2/)()(,2/)()( 21221222112111 XXpXXXptXXpXXXpt .

Các vec tơ X1 và X2 được tính

2/)(,2/)( 212211 ttXttX (1.61)

Hình 1.8 Thành phần chính với p = 2 [51, 106]

Phương trình (1.61), là phương trình cơ bản trong PLS, có thể tính xấp xỉ các

giá trị riêng với các phần tử không tuyến tính theo phương pháp NIPALS

(Nonlinear Iterative Partial Least Squares).

28

Các tính toán dựa trên các mối quan hệ sau:

,1,0;,,1,/

)1()1(

2)()()1(

jrkj

kk

j

k

j

k

j

kk

j

k

pEt

ttEp (1.62)

Các mối liên hệ từ (1.56), (1.57) và (1.58) áp dụng với ma trận ‘X’ bắt đầu

với )0(

kt :

XEptEE 01 ,kkkk (1.63)

Mối liên hệ (1.62) gọi là liên hệ ngoài (outer relations), và (1.64) gọi là liên

hệ trong (inner relations), liên kết các biến phụ thuộc và độc lập, cũng được xem

xét để xây dựng một mô hình hồi quy. Trong một trường hợp đơn giản, chúng có

dạng sau:

r

k

kkb1

ˆ ty (1.64)

Với 2

/ kk tb kty là phép chiếu của y lên tk, y là giá trị dự đoán của y.

Khi tiến hành PLS, khi biến phụ thuộc bị giới hạn bởi một bước lặp lại trong

(1.62). các giá trị ban đầu của )0(

kt được tính:

(0)

k 1k kt E w Với '

k 1 1 k kw E y ; yk-1 là độ lệch. (1.65)

Sau đó thuật toán PLS (với X và y có ý nghĩa tương quan)

0 0ˆ; ; 0y y E X y là biến độc lập X và giá trị dự đoán.

Cho k = 1 đến r là một chu kỳ thành lập theo nguyên tắc thành phần chính.

'

1 1k k kw E y là các vec tơ trọng số để tính thành phần chính thứ k.

1 1k k kt E y là giá trị gần đúng của thành phần chính.

2'

1 / ; /k k k k k k kp E t t p p p là giá trị gần đúng của vec tơ riêng.

2'

1 /k k k kb y t t là hệ số hồi quy giữa các thành phần.

1k k k ky y b t là độ lệch của giá trị quan sát.

29

1ˆ ˆ

k k k ky y b t là giá trị dự đoán của biến kế tiếp.

'

1k k k kE E t p là độ lệch của biến X.

' 0k kE E là phần sai số X.

Phần quan trọng của hồi quy là dự đoán sự phụ thuộc của biến phụ thuộc từ

các biến độc lập Xnew.

PLS không cho biết rõ ràng về giá trị dự đoán. Thay vào đó, sự phân tích các

biến độc lập X để tính toán giá trị y.

Đối với vec tơ mục tiêu pk, wk và hệ số hồi quy bk được tính cho bước tiếp

theo. Các biến dự đoán mới Xnew với Nnew mẫu thay vì N.

Giá trị dự đoán trong PLS được thực hiện

0 0ˆ; 0newE X y khởi tạo độ lệch X và giá trị dự đoán.

Với k từ 1 đến r

0ˆ wk kt E ; giá trị gần đúng đối với thành phần chính của biến quan sát.

'

1ˆ

k k k kE E t p là độ lệch thực tế của X.

1ˆˆ ˆ

k k k ky y b t là giá trị dự đoán.

Sơ đồ PLS đưa ra trong Hình 1.9. Bước thứ nhất trong thuật toán độ lệch của X:

E0= X= (X1 X2) và độ lệch thứ nhất của giá trị dự đoán y0 = y được tính toán. Sau đó

vec tơ trọng số được tính:

' '

1 1 1' '

1 0 0 ' 1221 2

cosw

cos

X X yE y X y y

X X y

(1.66)

Góc Xk và y, vec tơ t1, được tính

)cosos(ccos

cos)( 2211

2

1

21101 XXXXwEt

(1.67)

30

Trong không gian (P1), dọc theo vec tơ 21 , XX , và nó là thành phần chính thứ

nhất. vec tơ riêng p1 từ thừa số tính theo phương trình 1.62:

2

1

12

11

2

1

1

2

1

2

1

2

1101

1

111/

X

X

tX

tX

tt

X

X

tttEp

t

t

pr

pr (1.68)

Hệ số hồi quy b1 và mối tương quan của y0 với t1:

2

1101 / ttyb (1.69)

2

P1

X1

X2

yy 0

t1

111ˆ ty b

2211ˆ tty bb

P2 t2

222ˆ ty b

1

2

3

)1(

1X

)1(

1X

)1(

2X

)1(

2X

1y

1y

1

)( )1(

2

)1(

11 XXE

)( 210 XXE

Hình 1.9 Hồi quy PLS với p = 2, N = 3 [51, 106]

Hơn nữa, độ lệch 1101 tyy b và giá trị gần đúng cho biến mục tiêu

111101 ˆˆ ttyy bb được tính toán. Véc tơ )1(

2

)1(

1 , XX để tính giá trị E1 thứ nhất của

khối X được tìm ra như là thành phần chính của 21 , XX , nó trực giao với t1. Cuối

cùng, kiểm tra các vec tơ )1(

2

)1(

1 , XX có phải vec tơ 0 hay không.

Bước thứ hai trong hồi quy là tìm không gian P2, trực giao với t1. Vec tơ t2, là

sự tô hợp tuyến tính giữa vec tơ )1(

2

)1(

1 , XX , thì trực giao với t1, và hệ số hồi quy b2 từ

phép chiếu y1 lên t2. Mô hình hồi quy thu được sau hai bước có

dạng: 22112212ˆˆ tttyy bbb . Độ lệch thứ E2 của nhóm X được thành lập từ các

thành phần chính của vec tơ )1(

2

)1(

1 , XX , nó trực giao với t2, nghĩa là vec tơ 0. Hay

đẳng thức '

2 2 0E E là đúng, thuật toán đã hoàn thành. Sử dụng các mô hình với giá

trị dự đoán y với các vec tơ )2,1(, kkk pw .

31

1.4.4. Giải thuật di truyền

Việc lựa chọn các biến độc lập tối ưu để thu được một mô hình tốt là vấn đề

chính trong mô hình hồi quy hay mô hình mạng thần kinh (ANN) có số lượng lớn

các biến số độc lập [10, 77]. Trong những năm gần đây, giải thuật di truyền

(genetic algorithm - GA) được áp dụng trong chọn lựa biến độc lập bằng phương

pháp hóa tính toán [10]. Thuật toán di truyền dựa trên các nguyên tắc sự tiến hóa

của Darwin, đã được sử dụng rộng rãi để tối ưu hoá tô hợp biến [10, 77]. GA sử

dụng các quá trình tiến hóa để mô phỏng tiến trình này nhằm giải quyết vấn đề bằng

máy tính [10]. Các quá trình cơ bản sử dụng ở đây là đột biến ngẫu nhiên. Sự kết

hợp di truyền và việc sử dụng chúng dẫn đến việc tối ưu hóa các các tiêu chí lựa

chọn được xác định trước. Sự khác biệt của các phương pháp này từ các chiến lược

tìm kiếm khác là sử dụng một tập hợp các biện pháp trung gian. Sau đó, các biện

pháp này được sử dụng để xây dựng các biện pháp mới và hy vọng cải thiện được

các vấn đề [69, 110]. Về mặt sinh học, các biện pháp riêng biệt được so sánh với

các cá thể trong một quần thể. Các quá trình khác nhau được sử dụng để tạo ra thế

hệ con cái làm tăng sức mạnh của quần thể. Trong tự nhiên, các cá thể phù hợp nhất

để cạnh tranh với các nguồn tài nguyên hạn chế như thực phẩm, không gian để tồn

tại và duy trì nòi giống [110]. Chúng tạo ra thế hệ con cái, cho phép chuyển đôi di

truyền của chúng bằng các gen có trong nhiễm sắc thể. Điều này cần thiết cho mỗi

loài để thích ứng với điều kiện môi trường thay đôi. Do đó, chọn lọc tự nhiên dẫn

đến sự sống còn của các cá thể phù hợp, nhưng nó cũng tiềm ẩn sự sống còn của các

gen thích hợp nhất. Quá trình sinh sản cho phép đa dạng hóa nguồn gen của một

loài. Sự tiến hoá được bắt đầu khi nhiễm sắc thể từ hai cha mẹ tái kết hợp trong quá

trình sinh sản. Sự kết hợp mới của gen được tạo ra từ những gen trước đó và do đó

gen mới được hình thành. Các phân đoạn của hai nhiễm sắc thể mẹ được trao đôi

trong quá trình cắt ngang, tạo ra khả năng kết hợp các gen tốt cho các cá thể tốt hơn.

Các đột biến đưa ra sự thay đôi ít và ngẫu nhiên trong nhiễm sắc thể. Sự lựa chọn,

lai chéo và đột biến lặp lại gây ra sự tiến hoá liên tục của các gen của một loài và

tạo ra những cá thể tồn tại trong một môi trường cạnh tranh [110]. Thuật toán di

truyền vận hành thông qua một chu kỳ đơn giản bao gồm các giai đoạn cơ bản sau:

32

1. Cơ chế mã hoá;

2. Định nghĩa chức năng thể trạng;

3. Tạo quần thể

4. Thao tác di truyền với quần thể

1) Mã hóa

Các chương trình mã hóa được sử dụng trong QSARIS được dựa trên gen cơ

bản. Các mô hình hồi quy có thể (các giải pháp) khác nhau bằng một tập hợp các

biến đang được sử dụng. Nếu tông số các biến độc lập bằng N, thì một số tương ứng

với bất kỳ giải pháp nào bao gồm một chuỗi các chữ số nhị phân N (bits) được gọi

là các gen [7, 110].

Mỗi giá trị đại diện cho một biến độc lập (0 = vắng mặt, 1 = có mặt).

Ví dụ, nếu một tập tất cả các dự đoán là (X1, X2, X3, X4, X5) thì nhiễm sắc thể của

giải pháp với các dự đoán (X2, X3, X5) sẽ là (0, 1, 1, 0, 1).

Hàm mục tiêu

Mỗi mô hình (giải pháp) có liên quan đến một giá trị mục tiêu phản ánh sự so

sánh tốt với các cá thể khác trong quần thể (các giải pháp khác) [7, 110]. Hai hàm

mục tiêu được sử dụng trong QSARIS. Hàm chức năng thứ nhất hay Fit1 (mô hình)

bằng R2ad được tính bằng SWR cho mô hình được xác định bởi nhiễm sắc thể của mô

hình. Ưu tiên cho cá thể có giá trị Fit1 lớn. Bất lợi của hàm Fit1 là có thể dẫn đến

các mô hình thừa biến (over-fitting). Hàm chức năng thứ hai Fit2 (mô hình) dựa

trên cơ sở của phương trình của Friedman [7, 110].

12( )

( )Fit cathe

LOF cathe (1.70)

Với

2

( ) /( )

( 1)1

pRSS cathe NLOF cathe

d p

N

(1.71)

Trong hàm LOF: p là số biến số độc lập của mô hình; N là số lượng

mẫu trong bộ dữ liệu;

33

RSSp (mô hình) là tông bình phương độ lệch của mô hình hồi quy sử dụng các

biến độc lập p, d là số yếu tố (tham số của hàm LOF, xác định bởi quá trình tính

toán). Nhìn chung nếu kích thước nhỏ hơn LOF (lớn hơn Fit2) thì mô hình tốt hơn

[7, 110]. Tất cả các thuật ngữ trong phương trình (1.7.1) khá rõ ràng ngoại trừ yếu

tố d. Có thể thấy rằng với giá trị cho trước d (mặc định là 2), khi N lớn, LOF gần

với giá trị trung bình của RSSp [7, 110]. Mô hình tốt khi giá trị p nhỏ. Như vậy,

LOF tăng khi giá trị (p+1)/N đủ lớn. Đối với một giá trị d nhất định của mô hình,

khi thêm biến mới vào mô hình, RSSp giảm, nhưng khi tỷ số (p+1)/N tăng, LOF đạt

giá trị nhỏ nhất. Với giá trị d xác định ở giá trị tối thiểu. Tuy nhiên, khi p càng nhỏ

thì d càng lớn. Ví dụ, nếu chúng ta giả sử rằng các hệ số hồi quy bk (dựa trên các

thành phần chính) tỉ lệ nghịch với chỉ số k, thì RSSp được tính gần đúng [7, 110]:

1

1

1

11

1

2

1

2

Npconst

k

k

constRSSN

k

p

k

p (1.72)

và

2))1(()1(

pdNp

pNconstLOF (1.73)

Giá trị LOF nhỏ nhất khi:

dN

p

981175.0

1 (1.74)

Rõ ràng là các mô hình tối ưu với số lượng biến nhỏ tương ứng với giá trị d lớn.

Tham số d thường được lựa chọn bằng cách xem xét các trường hợp thực tế. Các

giá trị ban đầu được đề nghị là từ 1 đến 4. Sơ đồ hoạt động khác của các phương

pháp di truyền được mô tả trong Hình 1.10. Sau đây, chúng tôi sẽ xem xét mô tả

các tùy chọn khác nhau của GA.

Tạo dữ liệu nguồn (quần thể nguồn)

Trong việc tạo ra một tập dữ liệu ban đầu, cần phải có hai quyết định: kích cỡ

dữ liệu và dự đoán ban đầu của giải pháp. Hành động chính trong GA là kết hợp hai

34

nhiễm sắc thể để tạo ra một nhiễm sắc thể mới [10, 110]. Ví dụ, tất cả các nhiễm

sắc thể trong quần thể chứa cùng một bit ở một vị trí đặc biệt của chuỗi gen, không

có sự kết hợp của nhiễm sắc thể có thể đưa một giá trị khác vào vị trí đó.

Hình 1.10 Sơ đồ giải thuật di truyền [10]

Điều này làm giảm đáng kể chiều kích của vấn đề tìm kiếm bằng một, vì giá

trị đó sẽ được cố định mãi mãi. Việc giảm kích thước của vấn đề sẽ được gọi là tập

trung. Nếu tập dữ liệu (số lượng quần thể) đủ lớn sẽ chọn lọc được nhiễm sắc thể

ban đầu có sự tương thích tương đối cao và có nhiều điểm chung với các giải pháp

tối ưu. Nếu tập dữ liệu ban đầu quá nhỏ, một cá thể thể ban đầu tương đối tốt có thể

có nhiều giá trị chung với một giải pháp tối ưu và làm tăng khả năng của giải pháp

này [10, 110]. Ngược lại, nếu tập dữ liệu quá lớn, nhiễm sắc thể ban đầu có nhiều

điểm chung với giải pháp tối ưu có thể bị nhiễu bởi các giải pháp khác và có thể

không có ảnh hưởng đến toàn bộ quần thể (dữ liệu) [10, 110].

Thông thường, giải pháp tốt nhất chọn một tỷ lệ phần trăm nhỏ của tất cả các

biến, và sau đó trong nhiễm sắc thể 0 là cao hơn nhiều so với 1. Sự khởi tạo của tập

dữ liệu, trong đó mỗi bit được cho một giá trị 0 hoặc 1 ngẫu nhiên với cùng một xác

suất, sẽ gần như không thể áp dụng được [10, 110]. Vì quần thể ban đầu sẽ được

35

hình thành bởi các nhiễm sắc thể tương ứng với các tập con có chứa trung bình các

biến của bộ dữ liệu.

Thực tế trong một số trường hợp các nhiễm sắc thể này không thể đánh giá

được. Giải pháp áp dụng cho vấn đề này là: ở giai đoạn tạo ra quần thể ban đầu, xác

suất có '1' thấp hơn nhiều so với việc có '0'. Do đó, quần thể ban đầu được hình

thành bởi các nhiễm sắc thể mục tiêu để tập con chứa số ít biến. Với tư cách là

hướng dẫn, cho mỗi gen xác suất là ‘1’ để thiết lập bộ 5 biến [10, 110]. Sau đó,

trung bình 5 biến sẽ được chọn trong mỗi nhiễm sắc thể. Điều này có nghĩa là ở giai

đoạn đầu tiên một số lượng nhiễm sắc thể cao hơn nhiều và được đánh giá và các

biến "xấu" có thể được loại ra dễ dàng hơn, vì chúng không đủ tin cậy đối với

nhiễm sắc thể mục tiêu, trong đó chỉ một vài biến tốt được lựa chọn. Trong mỗi lần

chạy, sự kết hợp của các khối nhỏ, có tính thông tin cao sẽ dẫn đến sự gia tăng dần

dần số lượng các biến được lựa chọn, cho đến khi nó được 'tối ưu' [10, 110].

Chọn thế hệ cá thể ban đầu

Lựa chọn cá thể ban đầu trong một GA là cung cấp khả năng sinh sản tốt

nhất. Có ba cách để thực hiện trong QSARIS.

36

- Phương pháp thông thường là lựa chọn giải pháp di truyền và tiến hóa. Trong đó,

chọn lựa ngẫu nhiên một tập hợp cá thể sau đó chọn ra cá thể tốt nhất.

- Thuật toán di truyền cô điển cũng sử dụng chương trình lựa chọn bánh xe lăn

(roulette wheel) [10, 76], ở đây xác suất của mỗi thế hệ được lựa chọn tỷ lệ thuận

với khả năng của nó. Để thực hiện loại hình lựa chọn này, các phân đoạn sau bị loại

trên trục [xk-1; xk] (k = 1, 2, …, m). Chiều dài của các đoạn này bằng với số cá thể

(Hình 1.11). Sau đó, một điểm ngẫu nhiên xrand được đưa vào đoạn tông hợp [0; xm]

và nó có sự phân bố đồng đều dọc theo phân đoạn nhất định. Cá thể tương ứng với

đoạn được chọn làm cha mẹ trong đoạn [0; xm] [10, 110].

Hình 1.11 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp bánh xe lăn [76]

Sự lựa chọn thế hệ cha mẹ theo phương pháp xếp hạng tuyến tính tương tự

như lựa chọn theo phương pháp bánh xe lăn.

Hình 1.12 Chọn lựa thế hệ cha mẹ (Pk) theo phương pháp xếp hạng tuyến tính [76]

Sự khác biệt là xác suất của mỗi cá thể được lựa chọn trực tiếp dự kiến đến số thứ

tự của nó trong tập dữ liệu ban đầu. Do đó, đối với tập hợp của m cá thể các đoạn có

chiều dài m, m-1, m-2, …, 1 được rút ra trên trục (Hình 1.12) [10, 110]. Sau đó,

một điểm n gẫu nhiên với tọa độ xrand được đưa vào phân đoạn [0; xm]. Dấu chấm

ngẫu nhiên này được phân bố đồng đều dọc theo phân đoạn nhất định. Mỗi cá thể

mục tiêu tương ứng với phần mà ngẫu nhiên được chọn làm thế hệ cha mẹ [10, 76].

37

2) Tổ hợp

Hình 1.13 Toán tử chéo đơn điểm [76]

Hình 1.14 Toán tử chéo hai điểm [76]

Tô hợp là một hoạt động mà hai cá thể được kết hợp để tạo ra các thế hệ mới.

Trong QSARIS, các toán tử chéo được sử dụng trong tô hợp. Toán tử đơn giản nhất

được gọi là chéo đơn điểm (one-point crossover) [10, 76]. Nó xảy ra khi hai cá thể

cha mẹ (P1, P2) được đôi chỗ sau một điểm cắt được lựa chọn ngẫu nhiên, tạo ra hai

con lai (O1, O2) (Hình 1.13). Trong toán tử chéo hai điểm (Two-point crossover),

hai điểm được chọn ngẫu nhiên và các phân đoạn của nhiễm sắc thể giữa chúng

được trao đôi (Hình 1.14) [10, 76].

Số điểm có thể được tăng liên tục cho đến khi mỗi giá trị cho một con cái

nhất định có thể được lựa chọn độc lập từ cha hoặc mẹ. Thế hệ con lai khác chỉ đơn

giản nhận được giá trị bô sung. Được gọi là chéo đồng nhất (uniform crossover).

Nếu nó nhận được từ cha và mẹ, nó được gọi là chéo đồng nhất cân bằng (unbiased

38

uniform crossover). Loại crossover (số điểm cắt) cần xác định các vấn đề ảnh

hưởng đến việc tìm kiếm. Ví dụ, chúng ta giả định rằng mục tiêu của sự lựa chọn là

một tập gồm 11 mô tả, không có trong bộ số liệu 100, dự đoán chính xác một số

thuộc tính. Đồng thời chúng ta giả sử rằng bộ mô tả tốt nhất, hoặc chiếm ưu thế là:

(g1, g2, g3, g4, g5, g6, g7, g8, g9, g10, g11) [10, 76].

Nếu một điểm chéo một điểm được sử dụng, với xác suất 0,9 cho các bộ mô

tả liền kề (ví dụ: g4 và g5) sẽ được chuyển sang cùng một dạng lai tạo, và xác suất

bằng không là các mô tả đầu tiên và cuối cùng sẽ được chuyển sang cùng một đứa

con của cha mẹ này. Tương tự, nếu g1 và g3 là bộ mô tả "tốt" và g2 không, thì

không thể tạo ra thế hệ con lai g1 và g3 từ cha mẹ. Trong trường hợp này, một chéo

hai điểm hoặc chéo đồng dạng có thể là thích hợp hơn [76].

GA có thể sử dụng toán tử phối giống với một xác suất nhất định Pmate. Nếu

tô hợp không xảy ra, sau đó các bản sao của cha mẹ được thêm vào dân số. Những

dòng vô tính này có thể được thay đôi bởi đột biến [76].

3) Đột biến

Đột biến đơn giản sửa đôi một nhiễm sắc thể đơn với xác suất cho trước.

Trong tiêu chuẩn GA, xác suất đột biến (Pmutate trong Hình 1.10) rất nhỏ và hành

động của nó là cố gắng ngăn ngừa hội tụ đến một giải pháp tối ưu [10, 76]. Một đột

biến trong nhiễm sắc thể có thể bô sung 1 hay nhiều bit. Cũng như lai chéo, có thể

xác định k-đột biến (k = 1 hay 2), khi k gen được chọn ngẫu nhiên 1 hay nhiều lần

với xác suất Pmutate. Hơn nữa, 1 điểm đột biến đồng nhất (uniform mutation) có thể

xảy ra, khi ít nhất 1 gene được thay đôi với xác suất Pmutate. Vì vậy, mỗi bit được

thay đôi với xác suất [10]:

mPq /1)1(1 mutate (1.75)

Với m là số gen trong nhiễm sắc thể.

4) Tiến trình lai

Không nhất thiết yêu cầu số các thể lai phải bằng số cá thể ban đầu, hoặc tất

cả cá thể con phải được đưa vào tập dữ liệu. Có thể định nghĩa số cá thể con từ cặp

cá thể gốc (nghĩa là hoàn thành một số chu kỳ lai với cùng một cặp cá thể ban đầu).

39

Nếu số cá thể con trùng với số lượng cá thể ban đầu hiện có thì nó không được coi

là tiếp cận và thu nhập từ việc lai. Tông số tất cả các cá thể con là riêng biệt. Con số

này nên chia cho số cá thể của cùng một bậc cá thể ban đầu [10].

Cập nhập dữ liệu

Thế hệ cá thể con có thể được thêm vào dữ liệu hiện tại bằng cách chuyển

một thành viên hiện có. Vì các biến thể sau có thể thực hiện được: thay thế một số

thành viên yếu nhất trong tập hợp bằng cá thể con tốt nhất; tăng dữ liệu tiếp theo từ

cá thể lai tốt nhất [76].

Mặc dù lựa chọn thứ hai là phô biến nhất, nó cũng là tập trung nhất. Vì thế

hệ con sẽ có một số gen chung với thế hệ ban đầu, tất cả được đưa chung vào tập dữ

liệu. Khi gia tăng số lượng các biện pháp lai với một cặp cá thể gốc sau khi mỗi con

được sinh ra. Điều này cũng có lợi thế là thông tin di truyền có giá trị có thể chứa

trong thành viên ít nhất trong tập hợp sẽ bị mất trước khi có cơ hội chuyển thông tin

này cho một cá thể con. Cần hạn chế số lượng quần thể sinh ra để thoát khỏi chu

trình cơ bản và để hoàn thành một thuật toán [76, 107].

1.4.5. Mạng thần kinh nhân tạo (ANN)

1.4.5.1. Khái niệm

Mạng thần kinh nhân tạo (nơ ron) là một hệ thống nhận thức dựa trên sự

nhận thức của hệ thống thần kinh sinh học tự nhiên Hình 1.15.

Ba công cụ trí tuệ nhân tạo gồm mạng thần kinh, logic mờ và thuật toán di

truyền được kết hợp hài hòa trong quá trình thiết lập mô hình liên quan nhân quả tối

ưu. Mạng thần kinh: thiết lập mô hình liên quan nhân quả (X, Y) và dự đoán (Y) từ

(X) là các yếu tố đã biết [30]. Thuật toán di truyền: tối ưu hóa dựa trên mô hình liên

quan nhân quả đã được thiết lập bởi mạng thần kinh, dùng khi cần cải thiện (Y)

bằng cách thay đôi (X). Logic mờ: làm cho mạng thần kinh hiệu quả hơn trong việc

thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức tạp, cả định lượng và

không định lượng đồng thời giúp cho thuật toán di truyền được thuận lợi hơn trong

sự tối ưu hóa với các mục tiêu liên quan [101].

40

Hình 1.15 Hệ thống thần kinh sinh học tự nhiên

1.4.5.2. Cấu trúc mạng

Mạng thần kinh nhân tạo (ANN) có cấu trúc giống hệ thần kinh động vật,

tương tự như bộ não có chức năng xử lý thông tin. ANN gồm nhiều nơ ron gắn kết

cấp cao với nhau để giải quyết các vấn đề một cách rõ ràng. ANN giống như bộ não

người, trải qua quá trình học, tích lũy kinh nghiệm để xử lý các vấn đề trong từng

tình huống phù hợp [30, 50].

Năm 1943 nhà thần kinh học Warren McCulloch và nhà logic học Walter

Pits đã nghiên cứu ANN [50]. Tuy nhiên, các nghiên cứu ANN thời bấy giờ còn

hạn chế. Ngày nay ANN khá phô biến, phát triển và ứng dụng rộng rãi trong nhiều

lĩnh vực. Một số lĩnh vực điển hình như các ngành khoa học tự nhiên, y học, kinh

tế, quân sự, điện, điện tử, kỹ thuật chế tạo [77]. Mới nhất là các nghiên cứu ứng

dụng trong lĩnh vực khoa học tự nhiên. Tại Việt Nam việc nghiên cứu ứng dụng

ANN vào hóa học chỉ mới bắt đầu trong vài năm gần đây và cần được phát triển.

Điển hình như các lĩnh vực: Hóa học môi trường; Hóa học hữu cơ (phân tích hữu

cơ, tông hợp hữu cơ…); Hoá học phân tích (phân tích môi trường, giám sát ô

nhiễm…); Công nghệ hóa học ( kỹ thuật nano, kỹ thuật dầu khí, tách chất…); Công

nghệ xử lý môi trường (đánh giá xử lý, mô phỏng xử lý…) [30].

41

Hình 1.16 Hoạt động mạng thần kinh nhân tạo [50]

Mạng thần kinh nhân tạo ngày nay được ứng dụng trong rất nhiều ngành

khoa học. Trong đó Hóa học là một lĩnh vực có nhiều ứng dụng của mạng thần kinh

nhân tạo mà phương pháp truyền thống không thể giải quyết được, quá trình luyện

mạng thần kinh dẫn ra ở Hình 1.16. Mạng thần kinh có thể thiết lập các mô hình

nhân quả thích hợp và mềm dẻo với nhiều loại số liệu đơn giản hay phức tạp tuyến

tính hay không tuyến tính [101].

Đưa dữ liệu đầu vào gồm biến độc lập (X) và biến phụ thuộc (Y) qua lớp ẩn

để mạng thần kinh định lượng mối quan hệ giữa X và Y để dự đoán Y từ X, quá

trình định lượng này có thể tuyến tính hoặc không trên hệ thống các hàm toán,

thông dụng như hàm Sigmoid, Tanh có phương trình của hàm cụ thể [86]. Quá trình

học (luyện mạng) như vậy tạm hiểu là quá trình học của hệ thần kinh tự nhiên, học,

cải tiến, có kế thừa và phát huy và khả năng ghi nhớ, sao chép, rõ ràng đây là mô

hình tối ưu hơn mô hình tuyến tính thuần túy.[77]

Cấu trúc mạng nơ ron

Đầu vào (Qi, i..)

Chỉnh mức quan trọng

Nhóm luyện

Đầu ra (pGI50)

Xử lý đầu ra

Mạng được luyện

Kết quả

42

Mạng nơ ron bao gồm các nút mạng cho chức năng xử lý thông tin. Lớp

nhập (input), lớp xuất (output), trọng số của từng lớp input, trọng số tông của mạng

nơ ron Hình 1.17 [5, 102].

Thông số ảnh hưởng đến

ngưỡng ra của output

Trọng số 1

Hàm toán OutputInput 2

Input 3

Input 1

Trọng số 2

Trọng số 2

Trọng số

Hình 1.17 Cấu trúc mạng nơ ron [101]

Các hàm toán trong mạng nơ ron có các đặc tính sau: Hàm có tính đơn điệu;

Hàm bị chặn trên và chặn dưới; Hàm phải có tính liên tục và trơn. Một số hàm toán

trong mạng nơ ron [50, 77]:

Hàm Threhold

f(u) = 1 nếu u > 0; f(u) = 0 nếu u < 0 (1.76)

Hàm piecewwise – linear

f(u) = 1 nếu u > 1/2; f(u) = u nếu 1/2 > u > -1/2; f(u) = 0 nếu u < -1/2

Hàm sigmoid (logistic)

1( )

1 exp(- )f u

au

(1.77)

Hàm tanh – hyperbol

-

-

-( ) tanh ( )

u u

u u

e ef u u

e e

(1.78)

Quá trình luyện mạng và thử của mạng nơ ron

Trong tiến trình học, mạng nơ ron nhận diện dữ liệu, các thông số tự do được

thay đôi liên tục do dự thay đôi của môi trường và các giá trị này được ghi nhớ lại

[95], Hình 1.18 [16, 21].

43

Input

Input

Input

Trọng số 1

Trọng số 2

Trọng số n

Teach/use

Output

Nơ ron

Teaching input

Hình 1.18 Quá trình học của mạng nơ ron [16]

Trong quá trình luyện, nhập các giá trị lớp input vào hệ thống luyện nhằm

tạo ra các giá trị output. Tiếp theo mạng nơ ron so sánh các trị output từ mạng nơ

ron với các giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì quá trình

luyện mạng đạt yêu cầu. Nếu sai số giữa hai giá trị này quá lớn thì quá trình luyện

mạng được lặp lại, thay đôi các thông số luyện mạng [5, 21, 30].

Quá trình luyện mạng được lặp lại liên tục, cho đến khi tìm ra các giá trị

trọng số phù hợp sao cho giá trị xuất do mạng nơ ron xuất ra đạt yêu cầu. Do đó

trong quá trình luyện mạng, cần thiết lập yêu cầu về sai số, hoặc yêu cầu về số vòng

lặp cần xác định [97, 114].

Khác với chương trình máy tính khác được lập trình sẵn một cách rành mạch,

mạng thần kinh nhân tạo phải được luyện với các nhóm luyện có sẵn. Quá trình

luyện mạng có tính chất lặp lại, cải thiện chất lượng mô hình một cách liên tục

thường sử dụng thuật toán lan truyền ngược gồm các bước [50]: chọn một cặp đầu

vào – đầu ra từ nhóm luyện để làm vector đầu vào cho đầu vào của mạng thần kinh;

tính đầu ra của mạng; tính sự khác biệt giữa đầu ra của mạng và đầu ra mong muốn;

điều chỉnh mức quan trọng để giảm thiểu sai số; lặp lại bước điều chỉnh cho đến khi

sai số luyện mạng được chấp nhận [50].

Khi luyện mạng các mô hình nhân quả có thể được thiết lập riêng rẽ hay một

lượt. Các mức quan trọng được điều chỉnh cho phù hợp với dữ liệu luyện mạng, có

khả năng mạng thần kinh được luyện quá mức. Khi ấy mạng thần kinh có thể chỉ dự

44

đoán tốt cho nhóm luyện mà không chính xác đối với trường hợp thử. Do đó dữ liệu

nghiên cứu thường được chia thành hai nhóm: luyện và thử, dùng nhóm luyện để

luyện mạng và dùng nhóm thử để đánh giá về mạng. Nếu giá trị dự đoán gần với giá

trị quan sát thì khả năng dự đoán là tốt (R2pr và R2

tr cao) [90].

Giải thuật lan truyền ngược (Back – Propagation)

Trọng số các kết nối được điều chỉnh bằng thuật toán lan truyền ngược sao

cho sai số E là nhỏ nhất [7, 22].

1

, –n

i

E

2

i it x w y x (1.79)

Với t (xi, w): giá trị của tập mẫu; y (xi): giá trị output của mạng.

Trên từng nơ ron, đều có lớp input và output, các giá trị này đều có một trọng

số để đánh giá mức độ ảnh hưởng của các giá trị [22]. Thuật toán lan truyền ngược

điều chỉnh các trọng số sao cho ej = Tj – yj là nhỏ nhất. Cần xác định vị trí của từng

nơ ron, nơ ron lớp ẩn, lớp output, [5, 21, 90] Hình 1.19.

x1

x2

xi-1

xi

W1j

W2j

W(i-1)j

Wij

f (.)sum

Nơ ron j

tj

ej

Hình 1.19 Mô hình tính toán một nơ ron [69, 77]

Trong đó: wij: vector trọng số của nơ ron số đầu vào i.

Giá trị sai số ej của nơ ron tại vòng lặp thứ n:

ej (n) = tj (n) – yj (n) (1.80)

Tông bình phương sai số của mạng nơ ron:

2

1

1( )

2

k

j

j

E e n

(1.81)

Tại nơ ron ta có tông trọng số input (uj):

ij

0

( ) W . ( )p

j j

j

u n X n

(1.82)

Giá trị lớp xuất của nơ ron j:

yj (n) = fj (uj(n))

45

Tùy theo hàm hoạt động để tính toán các giá trị điều chỉnh trọng số tương

ứng theo thuật toán lan truyền ngược [22, 69].

Mạng thần kinh nhân tạo không thích hợp với vấn đề đòi hỏi về kí tự và bộ

nhớ. Mạng thần kinh cấu tạo bởi nhiều lớp: I(j) – HL(k) – HL(m) – O(n). Trong đó:

I là lớp vào, j là số nút đi vào, HL là lớp ẩn, k là số nút của lớp ẩn thứ nhất, m là số

nút của lớp ẩn thứ hai, O là lớp đi ra, n là số nút đi ra [90].

1.4.6. Thống kê đánh giá mô hình

Kỹ thuật đánh giá chéo loại bỏ dần từng trường hợp: Một hợp chất trong

nhóm luyện được loại bỏ. Mô hình QSAR sau đó được xây dựng từ các phân tử còn

lại và kết hợp với các biến mô tả ban đầu được lựa chọn và hoạt tính của hợp chất bị

loại bỏ được dự đoán bằng phương trình QSAR [51]. Chu kỳ này được lặp đi lặp lại

cho đến khi tất cả các hợp chất được loại bỏ một lần và hoạt tính của chúng được dự

báo [51]. Cuối cùng, mô hình có được kiểm tra khả năng dự báo dựa vào các tham

số PRESS, R2 (Q2), độ lệch chuẩn SDEP tính từ PRESS [72, 73].

2

tn ddPRESS Y Y (1.83)

PRESSSDEP

n (1.84)

2

tn(luyen) dd(luyen)2

2 2

( ) ( )tn(luyen) tn(luyen)

1 1

luyen luyen

Y Y PRESSQ

Y Y Y Y

(1.85)

Trong phương trình Ytn và Ydd tương ứng với các giá trị thực nghiệm và giá trị

dự đoán, n là số hợp chất, Ytn (luyen), Ydd (luyen) là giá trị thực nghiệm và giá trị dự đoán

của các hợp chất trong nhóm luyện bằng kĩ thuật loại bỏ dần từng trường hợp

(Leave – one – out), giá trị Q2 ≥ 0.5.

Tính R2pr

Giá trị R dự đoán (Rdd) phản ánh mức độ tương quan giữa giá trị thực nghiệm

và giá trị dự đoán của nhóm chất trong nhóm kiểm tra (kt) [51].

46

2

tn(kt) dd(kt)2

dd 2

( )tn(kt)

1

luyen

Y YR

Y Y

(1.85)

Ở đây, Ytn(kt) và Ydd(kt) là giá trị hoạt tính thực nghiệm và giá trị hoạt tính dự

đoán của các hợp chất trong tập kiểm tra. Y luyen chỉ ra các giá trị hoạt tính thực

nghiệm trung bình của các chất trong nhóm luyện. Vì vậy giá trị R2pr cao hơn 0,5

thì mô hình có khả năng dự đoán. Giá trị R2pr càng tiến gần đến 1 càng tốt.

1.4.7. Tính toán đóng góp của các tham số

Các giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% (3) [90] được

tính toán theo công thức:

1

1,%

k

m i m i

i

GMP x MP xn

với1

1,%

k

m i m ii

MP x P xm

;total

,% 100i i

m i

b xP x

C ; total , ,

1

k

m i m i

i

C b x

(1.86)

Trong đó: m là số mô hình kiểm tra tương ứng với số biến số k; k là tông số

biến số trong mỗi mô hình; n là tông số mô hình dùng để kiểm tra; Ctotal là tông

đóng góp của các tham số mô tả trong một hợp chất; Pmx i , % là phần trăm đóng

góp trung bình của mỗi tham số mô tả phân tử đối với m mô hình;

MPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả phân tử đối với

từng mô hình; GMPmxi,% là phần trăm đóng góp trung bình của mỗi tham số mô tả

phân tử đối với từng mô hình.

1.5. HỢP CHÂT FLAVONOID

1.5.1. Giới thiệu chung

Flavonoid là các hợp chất C15, gồm hai nhân phenol liên kết với nhau qua

một đơn vị C3. Quy ước đánh số trên khung phân tử flavonoid như Hình 1.20.

Flavonoid là nhóm chất rất phô biến trong tự nhiên, thường gặp trong dược

liệu có nguồn gốc thực vật, trong đó nhóm chancone anthocyanidin và auronon là

được biết đến là các chất tạo màu sắc cho thực vật [74].

47

Hình 1.20 Cấu khung flavonoid và quy ước đánh số [74]

1.5.2. Phân loại dẫn xuất flavonoid

Có một số loại dẫn xuất flavonoid có thể kể tới như: Euflavonoid là các dẫn

xuất flavonoid có gốc aryl ở vị trí C2: flavone, flavonol, flavanone, flavanol,

chalcone, anthocyanin, anthocyanidin, flavane; Isoflavonoid có gốc aryl ở vị trí C3:

isoflavone, isoflavanone, rotenoid. Neoflavonoid có gốc aryl ở vị trí C4:

calophylloid; Biflavonoid là các dẫn xuất flavonoid dimmer; Triflavonoid cấu tạo

bởi 3 monomer flavonoid; Flavolignan là các dẫn xuất flavonoid mà phân tử có một

phần cấu trúc lignan [20].

Hình 1.21 Một số dẫn xuất flavonoid [20, 74]

Chancon Flavononoid

Anthocyanidin

Isoflavone

flavane

Aurone

48

1.5.3. Phân bố flavonoid trong tự nhiên

Flavonoid là nhóm chất có mặt trong hầu hết các bộ phận của các loài thực

vật bậc thấp và thực vật bậc cao. Hiện nay có trên 10.000 hợp chất được phân lập và

xác định cấu trúc [81]. Các họ thực vật chứa flavonoid như Leguminosae,

Rutaceae, Moraceae, Ericaceae và Anacardiaceae. Đối với isoflavonoid chỉ xuất

hiện giới hạn trong phân họ Papillionoideae của họ Leguminosae [81].

1.5.4. Hoạt tính sinh học của flavonoid

Flavonoid là nhóm chất có phô hoạt tính rất phong phú, rộng rãi đặc biệt

trong lĩnh vực y học, dược phẩm, chúng có một số hoạt tính đặc trưng sau:

Hoạt tính chống oxi hoá: flavonoid có khả năng vô hoạt các tác nhân oxi

hoá như các anion O2-, gốc OH., ROO.. Có nhiều nghiên cứu về khả năng chống oxi

hoá của flavonoid, các nghiên cứu mối quan hệ định lượng giữa cấu trúc – hoạt tính

kháng oxi hoá của chúng được thiết lập [67, 81]. Các công trình nghiên cứu này đã

chỉ ra nhóm >C=O (C-4 cacbonyl) và liên kết đôi C-2 và C-3 là các yếu tố quan

trọng ảnh hưởng đến hoạt tính kháng oxi hoá của các dẫn xuất flavonoid [67].

Một số nghiên cứu chỉ ra rằng, flavone có hoạt tính cao hơn isoflavone;

flavonoid ức chế men sản sinh ra anion O2- như protein kinase, xanthin oxidase.

Bên cạnh đó, một số flavonoid ức chế cyclooxygenase, lipoxygenase, glutathion S-

tranferase, NaDH oxidase là các loại men tham gia tạo gốc oxy hoạt động. Về mặt

nhiệt động học, thế oxi hoá khử của flavonoid thấp nên có thể nhường hidro:

FLA-OH + R. →FLA-O. + RH

Flavonoid trong cơ thể chưa được công bố nhiều, vì việc phân lập khó khăn.

Phần lớn các flavonoid vào cơ thể bị chuyển hoá thành các axit phenolic, các axit

này vẫn có khả năng bắt gốc tự do [12, 81]. Tuy nhiên, các flavonoid đã chuyển

hoá và chưa chuyển hoá đều có tác dụng chống oxi hoá.

Hoạt tính kháng vi sinh vật: Flavonoid và các polyphenol có khả năng bảo

vệ thực vật khỏi sự xâm hại của vi sinh vật. Ngày nay, các nhà khoa học ngày càng

quan tâm đến việc sử dụng flavonoid để phòng, chữa bệnh. Hợp chất baicalin từ cây

Scutelleria baicalensis ức chế trực tiếp virus HIV [54]. Hợp chất biflavone

49

(robustaflavone, hinokiflavone) ức chế các enzym cần thiết cho quá trình phiên mã

của virus IC50 = 65 M. Các nghiên cứu khác cho thấy, flavonol và auron kháng

HIV mạnh, quercetin 5ml ức chế 70% virus HIV [45].

Hoạt tính ức chế emzim: các nghiên cứu chỉ ra rằng, liên kết đôi C-2 và C-

3, nhóm xeton ở C4 và nhóm OH ở vị trí 3’, 4’, 5’ đóng vai trò quan trọng trong hoạt

tính ức chế enzym NADH–oxidase, một số flavonoid ức chế enzym xanthin oxidase

là loại men xúc tác quá trình oxy hoá xanthin, hypoxanthin thành axit uric [42, 56] .

Hoạt tính kháng viêm: flavonoid có hoạt tính ức chế men cyclo-oxygenase,

men 5-lipoxygenase trong quá trình trao đôi chất theo con đường arachinonat. Như

hợp chất 8- hydroxyluteolin ức chế chọn lọc men 5-lipoxygenase với IC50 gần 10

µ[78] Hoặc cyanidin ức chế men prostaglflavonoidin endoperoxid hydrogen

synthase -1 và -2 với IC50 tương ứng là 90 và 60 µApigenin có hoạt tính ức chế

tăng sinh nguyên bào sợi trong khoảng nồng độ từ 0,01 – 100 mg/ml. Ở đây,

nguyên bào sợi đóng vai trò quan trọng trong việc tạo hạt, sẹo và tương tác với hệ

miễn dịch khi cơ thể bị viêm nhiễm. Các nguyên bào sợi làm cho hầu hết các vết

thương lâu lành. Hay như hợp chất quercetin, curcumin có tác dụng làm lành vết

thương trong quá trình thay thận [19].

Hoạt tính kháng u và gây độc tế bào: Chalcone pedicin phân lập từ lá cây

Fissistigma lamguinosum có hoạt tính ức chế sự liên kết của tubulin thành

microtubule với IC50 là 300 µM [74]. Ngoài ra từ lá cây Fissistigma lamguinosum

cũng phân lập được fissistin và isofissistin có hoạt tính gây độc tế bào. Từ lá cây

Baeckea frutescens người ta cũng phân lập được hai hợp chất flavanone có hoạt tính

gây độc tế bào ung thư bạch cầu L210 với IC50 bằng 0,25 µg/ml [105]. Từ rễ cây

Scutellaria baicalensis phân lập được các dẫn xuất flavonone là baicalein và baicalin

có hoạt tính ức chế tế bào ung thư gan, ung thư tụy. Từ cây Wikstroemia indica (L)

C.A. Meyer đã phân lập được kaempferol-3-O-β-D-glucopyranosid và tricin có hoạt

tính ức chế tế bào ung thư máu. Ngoài ra, flavonoid còn có một số hoạt tính khác

như hoạt tính đối với mạch máu, hoạt tính oestrogen và có vai trò quan trọng trong

sự tương tác giữa động vật và thực vật [81].

50

1.6. PHÂN LẬP VÀ XÁC ĐỊNH CÂU TRÚC FLAVONOID

1.6.1. Phân lập flavonoid

Sử dụng phương pháp ngâm ethanol để trích ly các hợp chất ra khỏi nguyên

liệu [105]. Sử dụng phương pháp sắc ký cột với chất nhồi cột là silicagel pha

thường, sephadex LH20, pha đảo Rp18 kết hợp sắc ký lớp mỏng để phân lập các

dẫn xuất flavonoid tinh khiết [3, 59]. Phát hiện dẫn xuất flavonoid bằng đèn tử

ngoại ở hai bước sóng 254 nm và 365 nm và dùng thuốc thử dung dịch

H2SO4/EtOH [37, 94].

1.6.2. Xác định cấu trúc flavonoid

Các phương pháp xác định cấu trúc flavonoid: Phương pháp phô cộng hưởng

từ hạt nhân, Phụ lục 64 gồm phô 1H-NMR, phô 13C-NMR, phô hai chiều HSQC và

Phô HMBC. Phương pháp nhiễu xạ tia X đơn tinh thể, Phụ lục 58 [4].

1.6.3. Thử hoạt tính in vitro của flavonoid tự nhiên

Quá trình thử nghiệm xác định hoạt tính ung thư Hela của các dẫn xuất

flvonoid được thực hiện theo phương pháp so màu (SRB). Tế bào ung thư Hela

được nuôi cấy trong môi trường E'MEM (Sigma), bô sung phenol red 0,4%, L-

glutamine 200 mM, NaHCO3 7,5%, HEPES 1M, Penicillin - Streptomycin 200

IU/mL, Amphotericin - B 0,1% và huyết thanh phôi thai bò 5%, trên đĩa 96 giếng

với mật độ 104 tế bào/giếng, trong điều kiện vô trùng, ở 37 oC, 5% CO2 [91, 98].

Sau 24 giờ, tế bào nuôi cấy được xử lý với dung dịch flavonoid 100 µg/mL. Sau 48

h, tế bào Hela được nhuộm SRB, đo mật độ quang (optical density – OD) ở bước

sóng 490 nm và 620 nm. Chất đối chứng dương sử dụng là Camptothecin

0,01µg/mL, chất đối chứng âm là nước cất vô trùng 10% pha trong môi trường và

DMSO 0,25%. Tỉ lệ ức chế tăng trưởng tế bào tính theo công thức (1.87) [91, 98].

I(%) = (1 – (ODThử nghiệm / OD đối chứng)) x 100% (1.87)

Tất cả các thí nghiệm được lặp lại 3 lần. Số liệu được xử lý bằng phần mềm

Microsoft Office Excel 2007.

51

CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. SƠ ĐỒ NGHIÊN CỨU

Sơ đồ nghiên cứu tông quát được đưa ra ở Hình 2.1. Nghiên cứu lý thuyết

bao gồm: tính các tham số điện tích, tham số độ dịch chuyển hóa học, tham số hóa

lý, tham số 2D, 3D của các dẫn xuất flavonoid; xây dựng các mô hình QSAR: xác

định định lượng các tham số điện tích, tham số độ dịch chuyển hóa học, tham số

hóa lý, tham số 2D, 3D ảnh hưởng quan trọng đến hoạt tính kháng ung thư; kiểm tra

khả năng dự đoán của mô hình.

Cấu trúc phân tửTác dụng kháng

ung thư pGI50

Cấu trúc điện tử

Qi, i, LD50, 2D, 3D

tính chất hóa lý…

Nghiên cứu lý thuyết

Các mô hình QSAR

Hóa lượng tử

Cơ học phân tử

Chuyển dạng

dữ liệuCơ học phân tử

Tập luyệnTập kiểm tra

MLR, PCAANN, GA

LOO,

ARE %,

Kiểm tra khả năng

dự đoán

Hợp chất chiết xuất

Cấu trúc phân tử

NMR X ray

Tác dụng kháng

ung thư pGI50

SRBQSAR

SRB

Hợp chất mới

Tham số cấu trúc

MM+; PM3Cơ học phân tử

Dự báo hoạt tính

Thực vật chiết xuất

SKC SKLM

Hình 2.1 Sơ đồ nghiên cứu tông quát

Thực nghiệm sàng lọc flavonoid: Phân lập và tinh chế một số flavonoid từ

gừng gió, đậu nành, tía tô, xa kê, actiso, sử dụng các phương pháp sắc ký cột và sắc

ký lớp mỏng [3]. Xác định cấu trúc flavonoid chiết xuất sử dụng phương pháp phô

cộng hưởng tử hạt nhân 1H-NMR, 13C-NMR NMR, DEPT, HSQC, HMBC và

phương pháp đo nhiễu xạ tia X đơn tinh thể [1, 109]. Thử in vitro hoạt tính kháng

Hela của các flavonoid chiết xuất sử dụng phương pháp so màu SRB [98]. Thiết kế,

sàng lọc flavone và isoflavone mới từ các hợp chất mẫu. Thiết kế, sàng lọc một số

52

dẫn xuất flavonoid mới từ các dẫn xuất flavonoid chiết xuất. Dự đoán hoạt tính

kháng ung thư cô tử cung của các dẫn xuất flavonoid chiết xuất và hợp chất thiết kế

mới từ hợp chất mẫu chiết xuất ra từ thực vật và hợp chất tông hợp [80], bằng cách

sử dụng các mô hình QSAR.

2.2. CƠ SỞ DỮ LIỆU, NGUYÊN LIỆU VÀ PHƯƠNG PHÁP

2.2.1. Xây dựng cơ sở dữ liệu thông tin phân tử

Dữ liệu sử dụng để xây dựng mô hình QSAR bao gồm các hợp chất flavone

và isoflavone và hoạt tính GI50 (μg/M) (nồng độ ức chế 50 % sự phát triển của tế

bào ung thư) được thu nhận từ nghiên cứu của Wang và cộng sự [80, 103] Phụ lục

1a. Giá trị GI50 được chuyển đôi sang giá trị pGI50 (pGI50 = -log(GI50) nhằm giảm

biên độ biến thiên của tập dữ liệu đồng thời giảm sai số và tăng khả năng dự đoán

của các mô hình QSAR [86, 88].

2.2.2. Nguyên liệu và phương pháp

2.2.2.1. Phần mềm ứng dụng

Các phần mềm được sử dụng trong đề tài này gồm 3 nhóm chính: xây dựng

và tính toán các tham số, xây dựng các mô hình và phân tích, thống kê, vẽ đồ thị.

Phần mềm Ứng dụng

ChemOffice 2008 Tính toán các tính chất hóa lý

HyperChem v8.0 Tính toán điện tích, độ dịch chuyển hóa học

QSARIS Tính toán các tham số cấu trúc 2D, 3D

INForm v2.0 Xây dựng các mô hình mạng nơ ron

Visual Gene Developer v1.7 Xây dựng các mô hình mạng nơ ron

Essential Regression 97 Thiết lập các mô hình tuyến tính

MS-EXCEL 2003 Phân tích thống kê, xây dựng dữ liệu

Origin v7.0 Vẽ đồ thị z

2.2.2.2. Hóa chất, thiết bi

Hóa chất và dụng cụ sử dụng trong luận án bao gồm:

53

Hóa chất Ứng dụng

Silica gel cỡ hạt 40-60 m, 30-50 m hãng

Himedia, Scharlau, Merck.

Dùng trong sắc ký cột pha thường

và pha đảo Rp18

Hexane, chloroform, methanol, ethyl acetate

ethanol, nước cất (merck)

Dung môi sử dụng trong quá trình

phân lập flaovnoid

H2SO4/EtOH (Merck) Thuốc thử nhận biết vết flavonoid

trên bản mỏng

Dụng cụ Ứng dụng

Bản mỏng nhôm tráng sẵn silica gel 60F254

(Merck) 0,2 mm Sắc ký lớp mỏng

Đèn UV tử ngoại cầm tay, hiệu UVITEC hiện màu thuốc thử trên bản mỏng

cột sắc kí đường kính từ 2-5,5 cm máy sắc ký

trung áp Sắc ký cột

Bruker AM500 FT-NMR Spectrometer Đo phô NMR

2.2.2.3. Nguyên liệu

Thu hái nguyên liệu: Các mẫu thực vật được dùng trong nghiên cứu bao

gồm: actiso (Cynara scolymus L.) [2], xa kê (Artocarpus incisa L.) [2], đậu nành

(Glucine max L.) [2], [2], tía tô (Perilla ocymoides L.) [2], gừng gió (Zingiber

zerumbet L.) [2] (Hình 2.2) được thu hái tại Đà Lạt, Việt Nam, tháng 8, 9 năm

2012. Các tiêu bản tươi của nhóm thực vật chiết gồm bộ phận chiết và lá để định

danh thực vật và lưu mẫu [11, 59]. Các mẫu thực vật được định danh thực vật và

lưu tiêu bản tại Viện công nghệ sinh học và môi trường Trường (IBE), Đại học Tây

Nguyên, Phụ lục 11. Nguyên liệu sau khi thu hái được loại bỏ phần đất cát, sâu

bệnh, rửa sạch, để ráo sau đó sấy khô, nghiền hoặc thái nhỏ để sử dụng cho quá

trình chiết và phân lập [59].Tiến hành định lượng nguyên liệu trong từng giai đoạn

để tính toán hiệu quả của quá trình chiết [27, 56, 105].

54

Actiso Xa kê Đậu nành

Tía tô Gừng gió

Hình 2.2. Nguyên liệu sử dụng phân lập flavonoid [2]

2.3. NGHIÊN CỨU LÝ THUYẾT

2.3.1. Phương pháp tính toán thông tin cấu trúc

2.3.1.1. Cơ học phân tử

Dữ liệu về năng lượng phân tử, điện tích nguyên tử và moment lưỡng cực

được tính toán trên phần mềm HyperChem [38]. Dựa trên kết quả khảo sát, mức

gradient và tùy chọn thích hợp sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu

cơ nghiên cứu. Chọn thuật toán phù hợp với nhóm dẫn xuất nghiên cứu. Phương

pháp phân tích phương sai hai yếu tố không lặp được dùng để khảo sát ảnh hưởng

của các thuật toán: Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton -

Raphson theo năng lượng (kcal/mol) [38]. Phương pháp phân tích phương sai hai

yếu tố không lặp được dùng để khảo sát ảnh hưởng của: các mức gradient bằng 10;

1; 0,1; 0,01 đối với năng lượng (kcal/mol) và tùy chọn lưỡng cực liên kết và điện

tích nguyên tử trên các tham số hóa lượng tử. Dựa trên kết quả khảo sát, thuật toán

sẽ được chọn để tối ưu hóa các phân tử hợp chất hữu cơ nghiên cứu.

2.3.1.2. Hóa lượng tử

Phương pháp hóa lượng tử bán thực nghiệm (CNDO, INDO, MNDO, AM1,

RM1, PM3, TNDO) được sử dụng để xác định các tham số điện tích nguyên tử, độ

dịch chuyển hóa học của phô 13C-NMR, 15O-NMR, các tham số hóa lý và các tham

55

số 2D, 3D [38]. Sử dụng phương pháp phân tích phương sai 2 yếu tố không lặp

(yếu tố điện tích nguyên tử và momemt lượng cực để thăm dò các phương pháp hóa

lượng tử. Từ đó, chọn lựa phương pháp hóa lượng tử thích hợp để tính toán điện

tích (Qi), độ dịch chuyển hóa học (i) của phô 13C-NMR, 15O-NMR, tham số hóa lý,

cấu trúc 2D, cấu trúc 3D [38].

2.3.1.3. Các tham số cấu trúc

Sử dụng phương pháp cơ học phân tử MM+ để tối ưu hóa cấu trúc phân tử

flavone và isoflavone. Các tham số mô tả cấu trúc được tính toán bằng các phương

pháp cơ học phân tử [52], phương pháp Grid [28, 48], phương pháp Gasteiger trên

phần mềm QSARIS [28].

2.3.2. Xây dựng các mô hình QSAR

Các mô hình hồi quy đa biến được xây dựng theo các bước như trong Hình

2.3. Tập dữ liệu cấu trúc và hoạt tính kháng ung thư của các dẫn xuất flavone và

isoflavone trong phụ lục 1a được chia thành tập luyện (80 – 85%) và tập kiểm tra

(15-20%) bằng phương pháp chọn lựa ngẫu nhiên hoặc chọn lựa thông minh trên

phần mềm INForm [40, 77]. Khả năng dự đoán của mô hình QSAR (xây dựng từ

tập luyện) được đánh giá chéo bằng kỹ thuật loại bỏ dần từng trường hợp, so sánh

kết quả dự đoán với hoạt tính pGI50 của các hợp chất trong nhóm kiểm tra.

Hồi quy đa biến [51] được sử dụng để xây dựng mô hình quan hệ giữa dữ

liệu điện tích và hoạt tính (QESARMLR); mô hình quan hệ giữa dữ liệu phô và hoạt

tính (QSDARMLR); mô hình quan hệ giữa cấu trúc - cấu trúc (QSSRMLR), mô hình

quan hệ giữa dữ liệu tham số 2D, 3D và hoạt tính (QSARMLR, QSARPLS).

Chất lượng của mô hình hồi quy tuyến tính đa biến được xác định bằng các

giá trị hệ số xác định bởi R2tr, giá trị R2

pr, sai số (SE) [84, 90].

56

Hình 2.3 Xây dựng các mô hình hồi quy đa biến

Mạng nơ ron là một công cụ rất mềm dẻo xây dựng mối liên hệ giữa cấu trúc

và hoạt tính bao gồm tính chất tuyến tính và phi tuyến [89, 92]. Mô hình QSAR

(QESARANN, QSDARANN, QSARANN; QSARPCA-ANN) được xây dựng bằng kỹ thuật

neuro-fuzzy kết hợp với thuật toán di truyền trong phần mềm INForm [51]. Mạng

nơ ron cấu tạo thường ba lớp: I(j) – HL(m) – O(n). Trong đó: I là lớp nhập với j là

số nơ ron bằng số tham số mô tả phân tử trong mô hình tuyến tính QSARMLR; HL là

lớp ẩn, m là số nơ ron của lớp ẩn, O là lớp xuất, n là số nơ ron lớp xuất, tức là hoạt

tính pGI50 [51].

Ảnh hưởng của các tham số cấu trúc đến hoạt tính kháng ung thư tính toán từ

các mô hình QSAR tuyến tính theo mục 1.4.7. Kiểm tra khả năng dự đoán của các

mô hình tuyến tính và mô hình mạng thần kinh bằng các kỹ thuật đánh giá thống kê,

kỹ thuật phân tích phương sai, và các giá trị thống kê sai số ARE, % và MARE, %.

2.4. SÀNG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN

2.4.1. Phân lập các hợp chất flavonoid

Quy trình phân lập và tinh chế các dẫn xuất flavonoid từ actiso, xa kê, tía tô,

đậu nành, gừng gió theo Hình 2.4.

57

Nguyên liệu

Cao EtOH

Cao n hexan

A1 A2 A3

Trích ngâm dầm với EtOH

Lọc, cô quay loại dung môi

Trích lần lượt với các dung môi n-Henxan,

CHCl3, EtOAc và MetOH.

Cô quay loại dung môi.

Cao CHCl3 Cao EtOAc Cao MetOH

A4 A5 A … An

SKC silica gel

CHCl3:MetOH (100:0)

B1 B2 B3 B5 B … BnB4

SKC silica gel

CHCl3:MetOH (100:0)

Kết tinh

Hợp chất chiết xuất

Hình 2.4 Quy trình phân lập các dẫn xuất flavonoid [3, 59]

Nguyên liệu đem ngâm dầm trong dung môi EtOH 96%, lọc bỏ bã, lấy phần

dịch chiết EtOH đem cô loại dung môi dưới áp suất kém thu được cao EtOH [29,

75]. Từ cao EtOH chiết lỏng lỏng với hệ dung môi có độ phân cực tăng dần: n-

hexan, CHCl3, EtOAc, MetOH. Loại bỏ dung môi từ các dịch chiết thu được cao

tương ứng [42, 59]. Cao EtOAc đem SKC silica gel pha thường với hệ dung môi

CHCl3 : MetOH có thể tích CHCl3 thay đôi từ 100%-0%. Dựa vào kết quả SKLM

để gom các phân đoạn (A). Tiếp tục SKC silica gel pha thường lần 2 với hệ dung

môi rửa giải CHCl3 : MetOH theo tỉ lệ thể tích CHCl3 thay đôi từ 100% - 40% thu

được các phân đoạn (B1 - Bn). Tiếp tục SKC silica gel pha thường lần 3 trong hệ

CHCl3 : MetOH với tỉ lệ thể tích CHCl3 giảm dần thu được các phân đoạn. Quá trình

sắc ký được thực hiện liên tục cho đến khi thu được chất kết tinh, đem rửa sạch và

58

kiểm tra bằng SKLM. Quy trình phân lập flavonoid phân lập từ lá actiso, lá xa kê, lá

tía tô, hạt đậu nành, củ gừng gió:

Lá actiso khô (2,2 kg) → cao EtOAc (190 g) → Lấy phân đoạn thứ A7 (17 g)

→ B2 (2,7 g) → C3 ứng với tỉ lệ CHCl3: MetOH là (60 : 40) → 12 mg hợp chất

sạch (CSL1).

Lá xa kê khô 1,7 kg → EtOAc (120 g) → Lấy phân đoạn thứ A5 (10g) → B4

ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 7 mg hợp chất sạch (AIL1).

Lá tía tô khô 2 kg → EtOAc (140g) → Lấy phân đoạn thứ A4 (11,5 g) → B4

(95 mg) → C2 ứng với tỉ lệ CHCl3: MetOH là (95 : 5) → 8 mg hợp chất sạch

(POL1).

Hạt đậu nành khô 2 kg → EtOAc (95 g) → Lấy phân đoạn thứ A3 (8 g) →

B3 (1 g) → C4 (80 mg) ứng với tỉ lệ CHCl3: MetOH là (80 : 20) → 8 mg hợp chất

sạch (GML1).

Củ gừng gió khô 1 kg → EtOAc (30 g) → Lấy phân đoạn thứ A2 (4 g) → B3

(80 mg) ứng với tỉ lệ CHCl3: MetOH (85 : 15) → 7 mg hợp chất sạch (ZZL1); B2

(120 mg) ứng với tỉ lệ CHCl3 – MetOH (90 : 10) → 9 mg tinh thể sạch, (ZZL2) .

2.4.2. Xác định cấu trúc hóa học các hợp chất flavonoid

Dựa vào cấu trúc phô 1H-NMR, 13C-NMR, DEPT 90 và 135, HSQC, HMBC

kết hợp với các phương pháp hoá học và phương pháp đo nhiễu xạ tia X đơn tinh

thể để xác định cấu trúc của các hợp chất flavonoid phân lập từ actiso, xa kê, đậu

nành, tía tô, gừng gió [79]. Hoạt tính sinh học các hợp chất flavonoid phân lập được

thử nghiệm in vitro trên dòng tế bào ung thư Hela bằng phương pháp SRB [98].

Nhiệt độ nóng chảy của hợp chất được đo trên máy Electrothermal IA 9000 series,

dùng mao quản không hiệu chỉnh đo tại phòng hợp chất thiên nhiên, Viện công

nghệ Hóa học, số 1, Mạc Đĩnh Chi, Quận 1, TP. HCM.

2.4.2.1. Phương pháp phổ cộng hưởng từ hạt nhân

Các phương pháp thường sử dụng để xác định cấu trúc hợp chất hữu cơ bao

gồm các phương pháp như: Phô cộng hưởng từ hạt nhân [4]: 1H-NMR (500 MHz),

13C-NMR (125 MHz), DEPT, HSQC, HMBC được ghi trên máy Bruker AM500

59

FT-NMR Spectrometer [1, 4]. Độ dịch chuyển hoá học (ppm), hằng số tương tác J

tính bằng Hz, chất nội chuẩn là TMS (Tetrametyl Silan). Viện Hóa học, Viện Khoa

học và Công nghệ Việt Nam. Dung môi được sử dụng bao gồm các dung môi

DMSO-d6, CD3OD-d4, CDCl3, pyridine-d5. Đây là các dung môi có khả năng hòa

tan các dẫn xuất flavonoid chiết xuất [4].

2.4.2.2. Đo nhiễu xạ tia X đơn tinh thể

Kỹ thuật nhiễu xạ tia X gồm ba bước [8, 34]: 1) thu thập tinh thể tốt, các

chiều lớn hơn 100 micron, không có tạp chất, không sứt mẻ và có cấu trúc ôn định.

2) đặt tinh thể vào tâm hướng chiếu của tia X, thường có bước sóng đơn, nhằm tạo

ra các mẫu nhiễu xạ. Tinh thể xoay từ từ và dữ liệu về ảnh nhiễu xạ được ghi nhận.

3) dùng kỹ thuật tính toán, dữ liệu hoá học bô xung để đưa ra mô hình về sự sắp xếp

các nguyên tử trong đơn tinh thể. Dữ liệu nhiễu xạ đơn tinh thể của các hợp chất

hữu cơ phân lập được đo trên máy Bruker D8 Quest (tại Khoa Hóa học, Trường ĐH

KHTN) ở nhiệt độ 100 K, đối âm cực Mo với bước sóng Kα (λ = 0,71073 Å) [8].

Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi đơn tinh thể được thực

hiện trên phần mềm Apex 2 của máy đo [82, 109]. Cấu trúc được xác định theo

phương pháp trực tiếp. Sử dụng phần mềm XT tích hợp trong Olex2 để tính và tối

ưu hoá cấu trúc [8, 109].

2.4.3. Kỹ thuật thử hoạt tính in vitro

2.4.3.1. Nguyên tắc phương pháp Sulforhodamine B

Xác định khả năng gây độc tế bào: Thực hiện sàng lọc thô, xác định độc tính

tế bào của hợp chất ở nồng độ 100 µg/ml, với dung môi hòa tan là

dimethylsulfoxide (DMSO) trên các dòng tế bào ung thư người bằng phương pháp

Sulforhodamine B (SRB) đã được Viện ung thư Hoa Kỳ (NCI) sử dụng cho chương

trình sàng lọc [33, 65, 98]. Dòng tế bào ung thư HeLa do NCI cung cấp, quá trình

thí nghiệm và kết quả sàng lọc được trình bày dưới dạng tỉ lệ % gây độc tế bào

[98].

Với những chất có khả năng gây độc tế bào cao sẽ tiếp tục xác định nồng độ

của chất có khả năng gây chết 50% trên quần thể tế bào nuôi cấy (GI50). Toàn bộ

60

quá trình thí nghiệm diễn ra trong 3 - 4 tuần. Lượng nguyên liệu cần để xác định

khả năng gây độc tế bào ít nhất là 5 mg/chất [31, 35].

Nguyên tắc: Thử nghiệm Sulforhodamine B (SRB) là một phương pháp so

màu đơn giản và nhạy để xác định độc tính tế bào của một chất. SRB là một thuốc

nhuộm tích điện âm sẽ liên kết tĩnh điện được với các phần điện tích dương của

protein trong tế bào ung thư Hela. Lượng thuốc nhuộm liên kết sẽ phản ánh lượng

protein của tế bào [64]. Trong thử nghiệm, tế bào được cố định trong suốt có màu

hồng. Mật độ quang đo được của dung dịch tương quan với lượng protein tông hay

số lượng tế bào. Sự thay đôi lượng tế bào ung thư so với mẫu đối chứng phản ánh

hoạt tính gây độc tế bào của các dẫn xuất flavonone và isoflavone [46].

2.4.3.2. Nuôi cấy tế bào

Quy trình khảo sát hoạt tính gây độc bằng phương pháp SRB: Giải đông

nguồn tế bào ung thư bảo quản trong nitơ lỏng, nuôi cấy tế bào đến thế hệ thứ 4

(P4): Nuôi cấy tế bào trong bình cấy đạt độ phủ khoảng 70 – 80%; Phủ tế bào vào

các đĩa 96 giếng với mật độ tế bào/giếng ban đầu là 104 tế bào/giếng (đối với dòng

tế bào HeLa và MCF-7) và 7,5. 103 tế bào/giếng (đối với dòng NCl-H460) theo thiết

kế khảo sát sau: một mẫu đối chứng dương là tế bào với camptothecin ở nồng độ 0,

01 (µg/ml); một mẫu chứng âm là tế bào với dung môi hòa tan chất thử (DMSO

0,25%); các dẫn xuất flavone, isoflavone cần thử nghiệm hoạt tính gây độc. Trong

trường hợp xác định GI50 thì mẫu thử nghiệm sẽ được pha loãng ở các nồng độ 0,1;

3; 6; 9; 10; 12; 20; 30; 40; 50; 100 (μg/ml) [31, 68].

Thiết kế thử nghiệm của 1 mẫu gồm: Hai giếng tế bào có môi trường nuôi

cấy chứa chất thử ở nồng độ khảo sát; 2 giếng không có tế bào có môi trường nuôi

cấy chứa chất thử ở nồng độ khảo sát (2 giếng trắng (blank); Ủ ở 37 oC, 5 % CO2,

24 giờ; Bô sung môi trường chứa chất thử với nồng độ gấp đôi nồng độ thuốc muốn

thử (không loại bỏ môi trường cũ đã có ở trong giếng); Ủ ở 37 oC, 5 % CO2, 48 giờ

[31, 68, 91]. Cố định tế bào trong giếng với trichloroacetic acid (TCA): Đối với

dòng tế bào Hela là dòng tế bào có bám dính: sử dụng dung dịch TCA 50% vào mỗi

giếng (cho vào từ từ không quá nhanh) [31]: đặt đĩa vào trong tủ lạnh (4oC), 1 đến 3

61

giờ, loại bỏ chất trong mỗi giếng; rửa nhẹ nhàng với nước (200 μl/giếng) 5 lần; để

khô tự nhiên ở nhiệt độ 25 oC, 12 đến 24 giờ.

2.4.3.3. Nhuộm SRB

Quá trình nhuộm SRB được thực hiện theo các bước sau: Cho dung dịch

SRB 0,2% vào mỗi giếng; Ủ ở nhiệt độ phòng, 5-20 phút; Loại bỏ dung dịch SRB;

Rửa nhẹ bằng dung dịch acetic acid 1 % (5 lần); Để khô tự nhiên ở nhiệt độ phòng

12-24 giờ [24]. Đọc kết quả: Cho 200 µl Tris-base 10mM vào mỗi giếng; Lắc trên

máy lắc khoảng 10-15 phút cho đến khi SRB tan hoàn toàn; Đo mật độ quang ở

bước sóng 492 nm và 620 nm [24].

2.4.3.4. Xử lý kết quả

Sau khi có giá trị mật độ quang ở bước sóng 492 nm (OD492) và 620 nm (OD620):

- Tính giá trị OD = OD492 - OD620 (2.1)

- Tính OD492 (hoặc OD620) = ODtb - ODblank (2.2)

- Tính tỉ lệ (%) gây độc tế bào theo công thức:

% 1 100%TN

C

ODI

OD

(2.3)

Với: ODtb: giá trị OD của giếng chứa tế bào; ODblank: giá trị OD của giếng

trắng; ODTN: giá trị OD của mẫu thử tính từ công thức (2.1) và (2.2); ODC: giá trị

OD của mẫu đối chứng dương tính từ công thức (2.1) và (2.2).

2.4.3.5. Xác đinh GI50

GI50 (µg/ml) được xác định như sau: Xây dựng đồ thị biểu diễn tỷ lệ (%)

gây độc tế bào theo nồng độ khảo sát của chất cần thử nghiệm. Từ đồ thị, nội suy ra

giá trị nồng độ cho tỉ lệ gây độc tế bào 50% bằng cách: Tính phương trình đường

thẳng qua 2 điểm có tỉ lệ gây độc tế bào gần 50% nhất (1 điểm có tỉ lệ gây độc tế

bào nhỏ hơn 50%, điểm còn lại có tỉ lệ gây độc tế bào lớn hơn 50%); Từ phương

trình trên (có dạng y = ax + b), thế y = 50 vào, ta suy ra được giá trị nồng độ x chính

là GI50 [98].

62

2.5. THIẾT KẾ VÀ DỰ BÁO HOẠT TINH CỦA FLAVONOID

Sau khi xây dựng các mô hình QSAR, phân lập các hợp chất tự nhiên, chúng

tôi tiến hành dự báo hoạt tính sinh học nhóm kiểm tra; thiết kế, sàng lọc và dự báo

hoạt tính kháng ung thư từ các chất mẫu và hợp chất tự nhiên trên cơ sở vị trí

nguyên tử cacbon trong phân tử flavonoid còn trống, có thể gắn các nhóm thế mới

khi thiết kế dẫn xuất mới. Các hợp chất mới được thiết kế và các hợp chất chiết xuất

được dự đoán hoạt tính sinh học để xác định hợp chất có hoạt tính sinh học cao.

63

CHƯƠNG 3. KẾT QUẢ & THẢO LUẬN

3.1. NGHIÊN CỨU LÝ THUYẾT

3.1.1. Tính toán thông tin cấu trúc

Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng

chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán

Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được

tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS.

3.1.1.1. Khảo sát phương pháp cơ học phân tử

Chọn lựa gradient

Chọn lựa gradient cũng như thuật toán trong là vô cùng quan trọng, ảnh

hưởng trực tiếp đến các kết quả tính toán thông tin cấu trúc phân tử.

Nhằm tối thiểu hóa năng lượng phân tử bằng phương pháp cơ học phân tử

dựa trên giá trị gradient, thuật toán và tùy chọn phù hợp với cấu trúc phân tử nghiên

cứu. Kết quả thăm dò về ảnh hưởng của mức gradient và thuật toán đối với năng

lượng phân tử của isoflavone (isofla-30) trình bày ở Bảng 3.1.

Bảng 3.1 Năng lượng tối thiểu (kcal/mol) của phân tử isoflavone (isofla-30)

Thuật toán (B) Gradient (A)

10 1 0,1 0,01

Steepest descent 56,750 32,119 29,493 29,388

Fletcher-Reeves 46,823 29,743 29,394 29,386

Polak-Ribiere 47,067 29,698 29,395 29,384

Newton-Raphson 46,000 30,736 29,401 29,385

Bằng phương pháp phân tích phương sai một yếu tố cho thấy mức gradient

có ảnh hưởng đến năng lượng phân tử (F = 63,853 > F0,05 = 3,863) [61, 83].

Sự giảm năng lượng phân tử theo mức gradient thể hiện trên Bảng 3.1, Hình

3.1, cho thấy với gradient ≤ 0,1 năng lượng phân tử thấp nhất và ôn định nhất.

Chính vì vậy trong đề tài này mức gradient ≤ 0,1 được chọn để tối ưu hóa cấu trúc

phân tử cho các dẫn xuất flavonoid.

64

Trong nghiên cứu, này điện tích nguyên tử (Atomic charges) sẽ được chọn vì

phần lớn các tham số hóa lượng tử được dùng để thiết lập mô hình QSAR dựa trên

cấu trúc điện tử của các nguyên tử trên khung phân tử.

25

30

35

40

45

50

55

60

10 1 0,1 0,01

Mức gradient

E(K

cal/

mo

l)Steepest descent

Fletcher-Reeves

Polak-Ribiere

Newton-Raphson

Hình 3.1 Sự giảm năng lượng phân tử theo mức gradient

Chọn lựa thuật toán

Kết quả thăm dò về ảnh hưởng của thuật toán trên năng lượng phân tử của

hợp chất isoflavone (isofla-30) Phụ lục 1a cũng được thể hiện trong Bảng 3.1.

Phương pháp phân tích phương sai một yếu tố cho thấy các thuật toán

Steepest descent, Fletcher-Reeves, Polak-Ribiere và Newton-Raphson không có ảnh

hưởng đến năng lượng phân tử (F = 1,599 < F0,05 = 3,863).

Như vậy, trong đề tài thuật toán có thể được chọn bất kỳ, chọn thuật toán

Polak – Ribiere để tối ưu hóa cấu trúc phân tử cho các dẫn xuất flavonoid.

3.1.1.2. Khảo sát phương pháp hóa lượng tử

Tính toán các thông tin cấu trúc như điện tích nguyên tử, độ dịch chuyển hóa

học, các tham số hóa lý, tham số hình học 3D, 3D của nhóm dẫn xuất flavone và

isoflavone bằng phương pháp hóa lượng tử phù hợp. Tiếp theo, chúng tôi khảo sát

ảnh hưởng của phương pháp hóa lượng tử trên giá trị moment lưỡng cực phân tử.

65

Kết quả thăm dò về ảnh hưởng của các phương pháp hóa lượng tử bán thực

nghiệm đối với các tham số hóa lượng tử, với tham số chọn làm chuẩn là moment

lưỡng cực được trình bày ở Bảng 3.2.

Bảng 3.2 Tham số moment lưỡng cực (µ) của các flavonone và isoflavone

Hợp chất Phương pháp hóa lượng tử

CNDO INDO MNDO AM1 RM1 PM3 TNDO

fla-1 3,372 3,310 3,525 3,680 3,993 3,128 2,949

fla-2 3,132 3,145 2,939 3,063 3,445 2,836 2,617

isofla-3 4,977 5,250 4,661 4,920 5,100 5,186 4,620

fla-4 4,033 4,381 3,419 3,608 3,597 4,209 3,726

fla-5 3,437 3,475 3,332 3,239 3,500 2,889 2,847

fla-6 4,935 5,030 4,348 4,403 4,617 4,166 4,491

isofla-7 4,851 5,058 4,648 5,009 5,208 5,220 4,578

fla-8 3,935 4,199 3,475 3,826 3,857 4,326 3,738

fla-9 2,927 3,189 2,658 2,963 3,003 3,194 2,510

fla-10 4,060 4,420 4,242 4,113 4,345 4,418 3,685

Phân tích phương sai hai yếu tố không lặp cho thấy các phương pháp hóa

lượng tử bán thực nghiệm: CNDO, INDO, MNDO, AM1, RM1, PM3, TNDO [38]

có F = 0,632 < F0,05 = 2,246 cho thấy các phương pháp hóa lượng tử không ảnh

hưởng đến kết quả tính toán của tham số hóa lượng tử, moment lưỡng cực.

Vì vậy, chúng tôi chọn phương pháp PM3 để tính điện tích (Qi) và tham số

hóa lý, chọn phương pháp TNDO để tính toán độ dịch chuyển hóa học (i) của các

dẫn xuất flavonoid. Đây là các phương pháp cho phép sai số thấp nhất trong quá

trình tính toán như trong một số nghiên cứu trước đó [30, 100].

3.1.2. Tham số cấu trúc và tính chất phân tử

3.1.2.1. Điện tích

Các dẫn xuất flavone và isoflavone trong Phụ lục 1a được xây dựng lại cấu

trúc phân tử, tối ưu hóa cấu trúc và tính toán các tham số điện tích nguyên tử trong

khung phân tử, sử dụng phương pháp cơ học phân tử MM+ và hóa học lượng tử bán

66

thực nghiệm SCF PM3 trong HyperChem [38]. Điện tích nguyên tử sử dụng làm dữ

liệu để xây dựng các mô hình quan hệ giữa cấu trúc điện tử và hoạt tính tuyến tính

(QESARMLR) và mạng thần kinh (QESARANN). Kết quả tính toán được đưa ra ở Phụ

lục 1b.

3.1.2.2. Phổ 13C-NMR, 15O-NMR và độ dich chuyển hóa học

Cấu trúc thực nghiệm của flavone và isoflavone được xây dựng lại và tối ưu

bằng phương pháp cơ học phân tử MM+ ở mức gradient 0,05. Dữ liệu độ dịch

chuyển hóa học i của 13C-NMR và 15O-NMR tính bằng phương pháp hóa lượng tử

phiên bản mới TNDO/2 SCF trên module HyperNMR [38, 39]. Các mô hình quan

hệ giữa cấu trúc phô và hoạt tính (QSDARMLR và QSDARANN) được xây dựng dựa

trên giá trị độ dịch chuyển hóa học (i) của các nguyên tử carbon và oxy trong

khung phân tử flavone, isoflavone. Kết quả tính toán giá trị độ dịch chuyển hóa học

cho ở Phụ lục 2.

3.1.2.3. Tham số hóa lý

Tính chất hóa lý của một số dẫn xuất trong Phụ lục 1a và một số dẫn xuất trong

các hợp chất tự nhiên được tính toán từ phương trình bán thực nghiệm [15] mục

2.3. Kết quả tính toán trình bày ở Bảng 3.16 và Bảng 3.28.

3.1.2.4. Tham số hình học 2D, 3D

Cấu trúc thực nghiệm của các dẫn xuất flavonoid được xây dựng bằng

chương trình HyperChem 8.0. Cấu trúc phân tử được tối ưu hoá bằng thuật toán

Polak-Ribiere với gradient là 0,01 kcal.mol-1. Các tham số cấu trúc 2D, 3D được

tính toán bằng phương pháp cơ học phân tử trên phần mềm QSARIS [28, 49].

3.2. XÂY DỰNG MÔ HÌNH QSAR

3.2.1. Khảo sát các biến số mô hình

Chọn loại biến phụ thuộc: Trong quá trình xây dựng mô hình hồi quy tuyến

tính, dạng biến phụ thuộc Y cũng có thể ảnh hưởng đến chất lượng mô hình. Cần

khảo sát các kiểu chuyển dạng của giá trị GI50, 1/GI50 và pGI50 = -log(GI50) kết quả

khảo sát ảnh hưởng của dạng biến phụ thuộc dựa trên giá trị R2tr cho ở Bảng 3.3.

67

Bảng 3.3 Ảnh hưởng của loại biến độc lập đến giá trị R2tr

Biến độc lập (X) Biến phụ thuộc (Y)

GI50exp 1/ GI50exp pGI50exp

Điện tích nguyên tử (QESARMLR) 0,921 0,774 0,938

Độ dịch chuyển hóa học (QSDARMLR) 0,906 0,786 0,906

Từ Bảng 3.3 kết quả phân tích ANOVA một yếu tố không lặp cho thấy: các

dạng biến phụ thuộc không ảnh hưởng đến giá trị R2tr (Ftt = 2,134 < F0,05 = 4,118)

như vậy có thể chọn dạng biến phụ thuộc là pGI50 để xây dựng mô hình [61, 83].

1 2 3 4 5 6 7 8 9 10

0.6

0.8

1.0

1.2

1.4

1.6

1.8

2.0

2.2

2.4

2.6

2.8

3.0

R2

thu

R2

luyen

k

SE

0.6

0.8

1.0

SE

R2

Hình 3.2 Ảnh hưởng của k đến R2 và SE

Chọn số biến số: Sự thay đôi số biến số trong mô hình cũng có thể tác động

đến giá trị hồi quy R2 khi xây dựng các mô hình tuyến tính và mạng thần kinh, kết

quả khảo sát cho ở Hình 3.2, theo đó ta chọn lựa khoảng số biến số (k) từ 5 đến 7 là

phù hợp vì R2tr cao và ôn định.

Bảng 3.4 Ảnh hưởng của số biến độc lập đến giá trị R2tr, R2

pr, SE

k 2 3 4 5 6 7 8 9 10

R2tr 0,327 0,484 0,636 0,802 0,861 0,906 0,909 0,921 0,921

R2pr 0,036 0,204 0,38 0,631 0,673 0,8 0,713 0,678 0,641

SE 0,287 0,257 0,221 0,167 0,143 0,121 0,122 0,118 0,121

Mạng thần kinh nhân tạo

68

Chọn số lớp ẩn: Kết quả thăm dò ảnh hưởng của số nút của lớp ẩn đến giá trị

R2tr, cấu trúc mạng sử dụng I(6) – HL(m) – O(1), I(7) – HL(m) – O(1) giá trị m thay

đôi từ 1 - 6 kết quả ở Bảng 3.5.

Bảng 3.5 Ảnh hưởng của số nơ ron ẩn đến giá trị R2tr

m 1 2 3 4 5 6

QESARANN 95,569 90,480 88,374 89,146 88,928 88,398

QSDARANN 92,423 93,392 93,121 93,417 92,572 92,228

Phân tích ANOVA một yếu tố cho thấy cấu trúc mạng với số nút của lớp ẩn

thay đôi không ảnh hưởng đến giá trị R2tr (Ftt = 0,0335 < F0,05 = 2,7729) [61].

Bảng 3.6 Ảnh hưởng của cấu trúc mạng đến giá trị R2tr và R2

pr

Số lớp ẩn Cấu trúc mạng R2tr R2

pr

1 I(6) - HL(2) - O(1) 0,905 0,837

2 I(6) - HL(2) - HL(2) - O(1) 0,863 0,888

3 I(6) - HL(2) - HL(2) - HL(2)- O(1) -0,23 -0,017

1 I(7) - HL(2) - O(1) 0,924 0,800

2 I(7) - HL(2) - HL(2) - O(1) 0,853 -0,021

3 I(7) - HL(2) - HL(2) - HL(2)- O(1) -0,292 -0,285

Kết quả khảo sát chọn lựa số lớp ẩn là 1 để xây dựng mô hình, hơn nữa các

mạng có hai lớp ẩn có thể hiện các hàm với hình dáng bất kỳ, nên về mặt lý thuyết

không có lý do nào cần sử dụng nhiều hơn hai lớp ẩn. Một số nghiên cứu đã chỉ ra

rằng đối với phần lớn các bài toán cụ thể, chỉ cần sử dụng một lớp ẩn cho quá trình

luyện mạng là đủ.

Chọn số nút trên mỗi lớp ẩn: Kết quả khảo sát ảnh hưởng của sự tăng số lớp

ẩn đến giá trị R2tr cho ở Bảng 3. chọn cấu trúc một lớp ẩn để luyện mạng với R2

tr =

0,905 cao hơn cả.

Chọn hàm truyền: Để xác định loại hàm truyền cho quá trình luyện mạng,

chúng tôi khảo sát ảnh hưởng của loại hàm truyền đến giá trị R2tr và R2

pr kết quả cho

trong Bảng 3.7

69

Bảng 3.7 Ảnh hưởng của hàm truyền đến giá trị R2tr và R2

pr

Biến độc lập (k)

R2tr R2

pr

Hàm truyền (C) Hàm truyền (C)

Linear Sigmoid Tanh Linear Sigmoid Tanh

QESAR (k = 6) -3,443 0,905 0,858 -1,660 0,837 0,885

QSDAR (k = 7) -2,577 0,9242 -0,578 -73,746 0,800 -0,054

Phân tích ANOVA cho thấy loại hàm truyền có (Ftt = 1,104 < F0,05 = 5,050)

không ảnh hưởng đến giá trị R2tr. Hàm truyền Sigmoid cho giá trị R2

tr cao nên sẽ

chọn làm hàm truyền cho quá trình luyện mạng với mục đích làm giảm mức độ

phức tạp của các tính toán.

Chọn moment và mức độ sai số luyện: kết quả khảo sát ảnh hưởng của

moment và sai số luyện mạng đến giá trị R2tr và R2

pr được cho ở Bảng 3.8.

Kết quả phân tích phương sai hai yếu tố không lặp cho thấy các giá trị

moment không ảnh hưởng đến kết quả luyện mạng (Ftt = 0,013 < F0,05 = 3,020), các

mức độ sai số luyện ảnh hưởng đến kết quả luyện mạng (Ftt = 11,736 > F0,05 =

3,084). Chọn sai số luyện 0,0001 ứng với giá trị R2tr = 0,956 và R2

pr = 0,837 vì nếu

chọn mức độ sai số luyện nhỏ hơn cũng không làm tăng R2tr và R2

pr hơn nữa các tính

toán lại tốn quá nhiều thời gian và dung lượng đĩa [61].

Bảng 3.8 Ảnh hưởng của moment và sai số luyện đến R2tr

Giá trị moment của mô hình QESARANN ứng với k = 6

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

R2tr 0,917 0,908 0,909 0,909 0,907 0,956 0,905 0,911 0,870 0,907

R2pr 0,808 0,814 0,819 0,825 0,831 0,837 0,837 0,817 0,884 0,831

Mức độ sai số luyện của mô hình QESARANN ứng với k = 6

0,000001 0,00001 0,0001 0,001 0,01 0,1

R2tr 0,905 0,905 0,956 0,905 0,869 -0,079

R2pr 0,837 0,837 0,837 0,836 0,848 -0,842

70

Chọn số vòng lặp, giải thuật lan truyền và tốc độ học: chọn vòng lặp để cải

thiện mô hình mạng thần kinh, kết quả khảo sát về ảnh hưởng của cấu trúc mạng và

số vòng lặp trên giá trị R2tr, được dẫn ra ở phụ lục 3 với yếu tố A là cấu trúc mạng,

yếu tố B là số vòng luyện.

Phân tích ANOVA cho thấy số vòng luyện ảnh hưởng đến giá trị R2tr (Ftt =

4,144 > F0,05 = 1,l462), như vậy có thể chọn số nút ẩn tùy từng mô hình sao cho các

tính toán nhanh chóng. Chọn số vòng lặp là 10000 cho quá trình luyện mạng, đây là

số vòng lặp có giá trị R2tr cao, ôn định, sai số nhỏ hơn.

Chọn giải thuật lan truyền ngược cho quá trình luyện để tính đạo hàm của

hàm lỗi (tông của tất cả các lỗi tại mỗi mẫu) nhằm giảm thiểu sai số cho quá trình

luyện mạng. Sự thay đôi tham số tốc độ học (learning rate) cũng ảnh hưởng hiệu

suất của mạng đối với số vòng lặp xác định. Giá trị tham số này càng nhỏ thì mạng

hiệu chỉnh trọng số càng chậm. Nhưng muốn đạt đến trạng thái tối ưu thì ta phải

tăng số vòng lặp nhiều hơn ở đây chúng tôi chọn tốc độ học 0,7 do mạng thần kinh

điều chỉnh cho mô hình xây dựng là tốt nhất.

Từ các kết quả thăm dò trên rút ra kết luận: biến phụ thuộc là pGI50; biến độc

lập là điện tích nguyên tử và độ dịch chuyển hóa học; số biến số trong các mô hình

từ 5 đến 7; hàm truyền Sigmoid; số lớp ẩn là 1, số nút trên mỗi lớp ẩn là 2; moment

bằng 0,7; mức độ sai số luyện bằng 0,0001; số vòng lặp bằng 10000; giải thuật lan

truyền ngược; tốc độ học 0,7.

3.2.2. Xây dựng các mô hình QESAR

3.2.2.1. Mô hình tuyến tính QESARMLR

Chọn tập luyện và tập kiểm tra

Chọn tập luyện và tập kiểm tra từ tập dữ liệu về cấu trúc và hoạt tính kháng

ung thư cô tử cung pGI50 của nhóm dẫn xuất flavone và isoflavone (Phụ lục 1a).

Để khách quan trong quá trình phát triển các mô hình, từ tập dữ liệu về hoạt

tính của nhóm dẫn xuất flavone và isoflavone chọn lựa tập luyện (a) và tập kiểm tra

(b) (19%) bằng phương pháp chọn lựa thông minh trong INForm (smart selection)

kết quả cho ở Phụ lục 4.

71

Xây dựng mô hình và tính toán đóng góp của các tham số

Quá trình thực hiện xây dựng và đánh giá mô hình: Mỗi mô hình QESAR

được thành lập từ nhóm luyện (Phụ lục 4), sử dụng hoạt tính kháng ung thư pGI50

và điện tích nguyên tử cacbon và oxy trong khung phân tử các dẫn xuất flavone và

isoflavone, trên phần mềm Regress [13, 85].

Quá trình này được thực hiện bằng cách thay đôi điện tích nguyên tử trong

cấu trúc phân tử. Lựa chọn điện tích nguyên tử đưa vào mô hình QESAR bằng giải

thuật thêm dần và loại bỏ dần từng biến.

Các quá trình được thực hiện liên tục, tuần hoàn cho đến khi xây dựng được

mô hình có giá trị thống kê gồm: R2tr, SE, R2

adj, Ftt, ttt và R2kiemtra. Các mô hình tuyến

tính QESARMLR được trình bày ở Bảng 3.9.

Bảng 3.9 Các mô hình tuyến tính QESARMLR (k = 2 - 10) và giá trị thống kê

k Nguyên tử trong các mô hình R2tr SE R2

test

2 O1, C7 0,816 0,1390 0,765

3 O1, C4, C6 0,860 0,1240 0,800

4 O1, C2, C4, C5 0,901 0,1070 0,829

5 O1, C2, C4, C5, C3' 0,924 0,0957 0,873

6 O1, O11, C3, C4, C6, C7 0,938 0,0887 0,903

7 O11, C4, C6, C8, C9, C2', C6' 0,906 0,0743 0,714

8 O11, C3, C6, C7, C8, C9, C10, C3' 0,970 0,0653 0,696

9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,0574 0,563

10 O1, O11, C3, C6, C7, C8, C9, C2', C3', C6' 0,978 0,0595 0,358

Chúng tôi tiến hành xác định phần trăm đóng góp điện tích các nguyên tử có

mặt trong 3 mô hình tuyến tính QESARMLR (với k = 5, 6, 7).

Giá trị thống kê tương ứng của 3 mô hình QESARMLR (với k = 5 – 7) được

dẫn ra trong Bảng 3.10.

Mô hình QESARMLRứng với k = 5

pGI50 = -0,9332 – 101,2080O1 – 15,4264C2 – 6,8735C4 – 7,9686C5 –

16,1166C3' (3.1)

72

Bảng 3.10 Giá trị thống kê và các mô hình QESARMLR (với k = 5 - 7)

k R2tr R2

adj SE R2pr

5 0,924 0,905 0,096 0,873

6 0,938 0,919 0,089 0,903

7 0,959 0,943 0,074 0,879

Mô hình QESARMLR ứng với k = 6

pGI50 = 6,7116 – 42,3105O1 – 8,1592O11 + +3,0139C3 – 19,0370C4 + 6,6117C6 +

4,6038C7 (3.2)

Mô hình QESARMLR ứng với k = 7

pGI50 = 4,714 – 32,8026O11 – 60,0703C4 + 20,8772C6 + 16,9016C8 +

95,4205C9 – 24,4720C2' – 25,4219C6' (3.4)

C5 C2 C7 C6' C3 C8 C3' C6 C2 C9 O11 O1 C4

0

5

10

15

20

25

30

35

GM

mP

xi,%

Vi tri

Hình 3.3 Giá trị đóng góp trung bình toàn cục GMPmxi

Giá trị phần trăm đóng góp trung bình MPmxk của các biến độc lập trong mỗi

mô hình QESARMLR (với k = 5 – 7) được xác định từ phần trăm đóng góp Pmxk của

biến số. Giá trị này được xác định qua giá trị đóng góp tông cộng của các biến số

73

Ctotal trong một hợp chất. Phần trăm đóng góp trung bình toàn cục GMmPmxk của

mỗi biến được mô tả ở Hình 3.3, Bảng 3.11.

Bảng 3.11 Giá trị thống kê và giá trị đóng góp GMPmxi,% của nguyên tử trong các

mô hình QESARMLR (với k = 5 – 7)

GIÁ TRỊ

GMPmxi,% m = 5, i = 1 - 5 m = 6, i = 1 - 6 m = 7, i = 1 - 7

m = 5,6,7 Hệ số P5xi, % Hệ số P6xi, % Hệ số P7xi, %

R2tr 0,924 0,938 0,959

R2adj 0,905 0,919 0,943

SE 0,09569 0,0887 0,0743

R2pr 0,873 0,903 0,879

hằng số -0,933 6,712 4,714

O1 27,41 -101,21 57,6 -42,31 24,63

C2 4,47 -15,43 13,42

C3 1,41 3,014 4,22

C4 31,98 -6,874 15,12 -19,04 42,45 -60,07 38,39

C5 0,69 -7,969 2,06

C6 4,12 6,612 6,57 20,88 5,78

C7 1,17 4,604 3,51

C8 1,9 16,9 5,7

C9 7,53 95,42 22,6

O11 13,36 -8,159 18,63 -32,8 21,46

C2 0,83 -24,47 2,5

C3' 3,93 -16,12 11,8

C6' 1,19 -25,42 3,58

Sự đóng góp mức độ quan trọng của điện tích nguyên tử trong cấu trúc phân

tử của flavone và isoflavone có mặt trong 3 mô hình QESARMLR được sắp xếp theo

trật tự dựa vào giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3’. Các vị trí C4,

O1 và O11 được xem là vị trí quan trọng trong phân tử vì đó là các nguyên tử thuộc

nhóm carbonyl C4 = O11, nguyên tử O1 có cặp điện tử tự do kết hợp với điện tử

74

của liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11

có các tính chất phản ứng của hệ carbonyl. Các vị trí trung tâm quan trọng nhất đã

được đưa ra ở Hình 3.3 điều này cũng phù hợp với thực nghiệm [18, 103].

Ngoài ra, C6 là vị trí trí quan trọng và đã được thăm dò gắn các nhóm thế vào

vị trí này [80, 103]. Các C9 và C3’ cũng thể hiện vai trò quan trọng, nhưng C9 không

phải là vị trí còn trống, nên không được chọn để gắn nhóm thế. Như vậy có thể chọn

C6 để gắn nhóm thế mới vào trong một số hợp chất flavone và isoflavone. C3’ còn

trống và cũng có thể sử dụng gắn thêm nhóm thế mới và hy vọng tạo ra một hợp

chất có hoạt tính cao và độc tính thấp. Từ định hướng này, chọn hợp chất flavone 1a

và isoflavone 6b trong Phụ lục 4 để làm chất mẫu có hoạt tính đã biết, tiến hành gắn

thử nhóm thế mới vào C6 và C3’.

Chọn mô hình QESARMLR (với k = 6) có các giá trị R2tr = 0,938 và R2

pr =

0,903 trong Bảng 3.11 để dự đoán tính hoạt tính sinh học của nhóm dẫn xuất

flavone và isoflavone vì ở mô hình này phù hợp về thống kê nhất, tất cả các hệ số

hồi quy được đánh giá bằng chuẩn student đều có giá trị P < 0,05 (ttt > t0,05) Phụ lục

5, đánh giá sự tương thích của phương trình hồi quy bằng chuẩn Fisher (Ftt > F0,05

hay P < 0,05). Chọn các vị trí O1, O11, C3, C4, C6, C7 để xây dựng mô hình mạng

thần kinh QESARANN.

3.2.2.2. Mô hình mạng thần kinh QESARANN

Mô hình QESARANN được xây dựng trên phần mềm INForm [40, 87].

Kiến trúc mạng thần kinh I(6)-HL(2)-O(1) gồm: lớp nhập I(6) có 6 yếu tố

đầu vào là điện tích nguyên tử O1, O11, C3, C4, C6 và C7 có mặt trong mô hình

QESARMLR; lớp xuất O(1) gồm 1 yếu tố đi ra là giá trị hoạt tính pGI50; lớp ẩn HL(2)

phía trong gồm 2 nút; thuật toán lan truyền ngược và sai số được chọn để luyện

mạng; hàm truyền sigmoid đặt trên mỗi nút mạng của các lớp; tham số luyện mạng

gồm tốc độ học là 0,7; moment là 0,7; sai số giám sát mục tiêu MSE = 0,005882; số

vòng lặp 10000; sau quá trình luyện mạng, giá trị R2tr = 0,956 và R2

pr = 0,837.

75

3.2.2.3. Kiểm tra khả năng dự đoán

Hoạt tính pGI50 của 6 hợp chất trong nhóm kiểm tra Phụ lục 4 được dự đoán

bằng mô hình QESARMLR và QESARANN, kết quả đưa ra ở Bảng 3.12. Kiểm tra khả

năng dự đoán từ các mô hình QESAR được đánh giá cẩn thận dựa vào các chuẩn

thống kê phù hợp, các giá trị tuyệt đối của các sai số tương đối ARE,%, giá trị trung

bình của các sai số tương đối MARE,%. Giá trị sai số MARE,% của mô hình

QESARANN nhỏ hơn giá trị sai số MARE,% mô hình QESARMLR, cho thấy khả năng

dự đoán của mô hình mạng thần kinh QESARANN tốt hơn mô hình tuyến tính

QESARMLR.

Sau khi sử dụng mô hình tuyến tính QESARMLR và QESARANN để dự đoán

hoạt tính pGI50 của các chất trong nhóm kiểm tra cho thấy mức độ đúng và chính

xác chấp nhận được, sai lệch của dự đoán nằm trong khoảng không chắc chắn của

các phép đo thực nghiệm. Như vậy các mô hình QESARMLR và QESARANN này đáp

ứng yêu cầu dùng để dự đoán các chất mới.

Bảng 3.12 pGI50 của nhóm kiểm tra dự đoán từ mô hình QESARMLR, QESARANN

Hợp chất pGI50,exp pGI50,pr ARE,%

QESARMLR QESARANN QESARMLR QESARMLR

1b 5,921 6,008 5,891 1,468 0,513

2b 5,745 5,692 5,743 0,930 0,033

3b 6,097 5,759 5,788 5,549 5,068

4b 5,699 5,651 5,712 0,840 0,221

5b 5,699 5,651 5,735 0,835 0,623

6b 5,137 5,092 5,109 0,883 0,543

MARE,% 1,751 1,167

3.2.3. Xây dựng các mô hình QSDAR

3.2.3.1. Mô hình tuyến tính QSDARMLR

Chọn tập luyện và tập kiểm tra

Tập dữ liệu về tham số độ dịch chuyển hóa học và hoạt tính kháng ung thư

pGI50 của các dẫn xuất flavone và isoflavone trong Phụ lục 1a được chia thành tập

76

luyện và tập kiểm tra. Tập kiểm tra gồm các hợp chất kí hiệu là a1, a2, a3, a4, a5 và a6

(Phụ lục 6).

Xây dựng mô hình và tính toán đóng góp của các tham số

Các mô hình QSDARMLR (với k = 2 đến 10) Bảng 3.13 bằng cách kết hợp

hoạt tính kháng ung thư pGI50 và độ dịch chuyển hóa học (i) sử dụng phần mềm

Regress. Quá trình thực hiện bằng cách thay đôi độ dịch chuyển hóa học (i) của các

nguyên tử oxy và cacbon. Thêm hoặc loại bỏ một biến độ dịch chuyển hóa học (i)

vào hoặc ra khỏi mô hình QSDARMLR. Khi xây dựng xong mô hình tiến hành đánh

giá mô hình bằng kỹ thuật đánh giá chéo loại và bỏ dần từng trường hợp tương tự

như đối với mô hình QESAR. Kiểm tra khả năng dự đoán của các mô hình

QSDARMLR dựa trên các giá trị R2tr, R2

pr, R2ad (R2 hiệu chỉnh), sai số chuẩn SE và

chuẩn Fisher, Student.

Bảng 3.13 Các mô hình QSDARMLR và các giá trị thống kê

k Nguyên tử trong các mô hình R2tr R2

ad SE R2pr

2 O1, C4 0,327 0,268 0,287 0,036

3 O1, C4, C11 0,484 0,413 0,257 0,204

4 O1, C4, C5, C6 0,636 0,566 0,221 0,38

5 O1, O11, C4, C6, C7 0,802 0,752 0,167 0,631

6 O1, O11, C3, C4, C6, C7 0,861 0,817 0,143 0,673

7 O1, O11, C2, C3, C6, C7, C2’ 0,906 0,869 0,121 0,800

8 O1, O11, C2, C3, C4, C5, C6, C7 0,909 0,867 0,122 0,713

9 O1, O11, C2, C3, C4, C5, C6, C7, C2’ 0,921 0,877 0,118 0,678

1

0

O1, O11, C2, C3, C4, C5, C6, C7, C1’,C2’ 0,921 0,869 0,121 0,641

Bảng 3.13 cho thấy khi R2tr càng tăng, SE càng giảm, giá trị R2

tr và SE tương

ứng với số biến số k = 5 trở đi thay đôi không đáng kể, hơn nữa việc đưa quá nhiều

biến số vào mô hình cũng không làm tăng giá trị R2tr lên bao nhiêu. Chính vì vậy

chúng tôi khảo sát các mô hình ứng với k = 5, 6 và 7 bao gồm các nguyên tử O1,

O11, C2, C3, C4, C6, C7 và C2’, chọn các vị trí này để xác định phần trăm đóng góp

77

của các nguyên tử quan trọng đối với hoạt tính kháng ung thư. Kết quả tính MPmxi,

%, GMPmxi, % và các giá trị thống kê của các mô hình QSDARMLR (với k = 5, 6 và

7) cũng được đưa ra trong Bảng 3.14.

Độ dịch chuyển hóa học quan trọng của các nguyên tử cacbon và oxy trong

phân tử flavone và isoflavone đã thể hiện bằng cách sắp xếp giá trị độ lớn

GMPmxi,% như C4 > C7 > O11 > C6 > C3 > O1 > C2 > C2’.

Bảng 3.14 Giá trị thống kê, các hệ số và phần trăm đóng góp của các độ dịch

chuyển hóa học i trong các mô hình QSDARMLR

Biến số xi QSDARMLR MPxk,%

GMPmxi,% m = 5 m = 6 m = 7 m = 5 m = 6 m = 7

R2tr 0,802 0,861 0,906 - - - -

R2ad 0,752 0,817 0,869 - - - -

SE 0,167 0,143 0,121 - - - -

R2pr 0,631 0,673 0,800 - - - -

Hệ số 14,459 37,055 32,99 - - - -

O1 0 0,014 0,016 0,133 7,649 9,949 5,91

O11 0,004 0,008 0,006 18,599 11,386 9,501 13,162

C2 - - -0,045 - - 16,448 5,483

C3 - -0,058 -0,063 - 14,348 17,603 10,65

C4 -0,068 -0,078 - 71,64 27,471 - 33,037

C6 0,006 -0,059 -0,047 5,169 16,424 14,965 12,186

C7 -0,005 -0,075 -0,059 4,46 22,722 20,312 15,832

C2' - - -0,037 - - 11,222 3,741

Vị trí O1, C2, C3 và C4 như là các vị trí quan trọng trong phân tử. Bởi vì các

nguyên tử này là các nguyên tử cacbon và oxy của nhóm carbonyl C4 = O11 và

nguyên tử O1 với các electron tự do. Trong trường hợp này các electron của các

liên kết C2 = C3 và C4 = O11 tạo thành một hệ liên hợp. Nhóm carbonyl C4 = O11 có

thể thực hiện các phản ứng oxy hóa khử. Điều này phù hợp với các nghiên cứu thực

nghiệm. Hơn nữa, các vị trí C6, C7 và C3 cũng cho thấy rằng các vị trí quan trọng đã

78

khảo sát và nghiên cứu bằng các nhóm thế gắn vào các nguyên tử C3, C6 và C7 để

thiết kế các dẫn xuất mới.

Mô hình QSDARMLR (với k = 7) có giá trị sai số SE thấp nhất, cho giá trị hồi

quy là phù hợp nhất, tất cả các hệ số hồi quy và phương trình hồi quy đều có giá trị

P < 0,05 Phụ lục 7, hơn nữa đây là mô hình có giá trị R2tr = 0,906 và R2

pr = 0,800 cao

nhất, SE = 0,121 thấp nhất cho thấy đây là mô hình tuyến tính QSDARMLR tốt hơn

cả. Mô hình QSDARMLR (với k = 7) có dạng:

pGI50 = 32,99 + 0,016O1 + 0,006O11- 0,045C2 - 0,063C3 - 0,047C6 - 0,059C7 -

0,037C2' (3.5)

3.2.3.2. Mô hình mạng thần kinh QSDARANN

Mô hình mạng thần kinh QSDARANN được xây dựng bằng mạng thần kinh

trên phần mềm INForm [40] đã được khảo sát kiến trúc mạng. Kiến trúc I(7)-

HL(2)-O(1) bao gồm lớp nhập I(7) với yếu tố đầu vào đã được chọn là O1, O11, C2,

C3, C6, C7 và C2’ là các biến số trong mô hình tuyến tính QSDARMLR với k = 7 và

một lớp xuất O(1) với yếu tố đầu ra (pGI50) như là biến mục tiêu, cấu trúc một lớp

ẩn HL(2) với hai nút. Giải thuật lan truyền ngược, sai số 0,001 được sử dụng để

luyện kiểu mạng thần kinh này. Các tham số để luyện mạng nơ ron là tốc độ học

0,7; momen = 0,7; vòng lặp 10000 và sai số MSE = 0,0305764. Hàm truyền

sigmoid được sử dụng cho mỗi nơ ron của lớp nhập và lớp xuất. Sau khi luyện mô

hình thần kinh QSDARANN, R2pr = 0,800; giá trị R2

tr đạt được 0,924 cao hơn giá trị

R2tr = 0,906 đối với mô hình tuyến tính QSDARMLR.


Khả năng dự đoán của các mô hình QSDARANN và QSDARMLR được đánh giá

cẩn thận bằng kỹ thuật đánh giá chéo loại bỏ từng trường hợp. Trong trường hợp

này 6 dẫn xuất flavone và isoflavone trong nhóm kiểm tra được chọn ngẫu nhiên

như trong Phụ lục 6. Các giá trị hoạt tính kháng ung thư pGI50 của 6 dẫn xuất trong

nhóm kiểm tra dẫn ra ở Bảng 3.15 nhận được từ mô hình tuyến tính QSDARMLR

được so sánh với các giá trị nhận được từ mô hình mạng nơ ron sử dụng giá trị tuyệt

đối của các sai số tương đối ARE,%.

79

Khả năng dự đoán của 2 mô hình cũng dựa vào giá trị MARE,%. Giá trị

MARE,% = 1,119 đối với mô hình QSDARANN là nhỏ hơn giá trị MARE,% = 2,391

đối với mô hình QSDARMLR. Như vậy các giá trị dự đoán pGI50 nhận được từ mô

hình QSDARANN là gần với các hoạt tính thực nghiệm [80]. Với pGI50,exp và pGI50,pr

là các hoạt tính thực nghiệm và kiểm tra. Sai số MARE,% được sử dụng để đánh giá

sai số toàn cục của các mô hình QSDARMLR và QSDARANN.

Bảng 3.15 Hoạt tính pGI50,pr của các dẫn xuất kiểm tra và các giá trị ARE,% từ các

mô hình QSDARMLR (với k = 7) và QSDARANN với kiến trúc I(7)-HL(2)-O(1)

Hợp

chất pGI50,exp

pGI50,pr ARE,%

QSADRMLR QSDARANN QSDARMLR QSDARANN

a1 5,745 5,781 5,789 0,636 0,764

a2 5,699 5,758 5,796 1,039 1,697

a3 5,796 5,808 5,708 0,209 1,515

a4 5,921 6,181 5,957 4,389 0,606

a5 5,699 5,394 5,755 5,344 0,975

a6 5,658 5,503 5,723 2,730 1,157

MARE,% 2,391 1,119

Sau khi sử dụng các mô hình QSDARMLR và QSDARANN để dự đoán hoạt

tính kháng ung thư của các dẫn xuất kiểm tra, độ lệch khoảng dự đoán là có thể

chấp nhận. Các mô hình QSDARMLR và QSDARANN thỏa mãn các đòi hỏi thực tế để

dự đoán hoạt tính kháng ung thư pGI50 của các dẫn xuất mới. Một lần nữa chúng tôi

khẳng định khả năng dự đoán của các mô hình quan hệ cấu trúc hoạt tính là hoàn

toàn đáng tin cậy.

3.2.4. Xây dựng mô hình QSSRMLR

3.2.4.1. Nguyên tắc xây dựng

Xây dựng mô hình quan hệ cấu trúc – cấu trúc (QSSRMLR) để dự đoán hoạt tính

cũng như tính chất hóa lý của các hợp chất flavonoid. Mô hình được xây dựng dựa

vào tính chất tương tự của các cấu trúc phân tử dẫn đến các tính chất hóa học hay

những tính chất khác cũng có mối tương quan, vì vậy có thể xây dựng mối quan hệ

80

cấu trúc với cấu trúc để từ đó xác định được tính chất của một hợp chất chưa biết

dựa vào tính chất của các cấu trúc đã biết. Trong nghiên cứu này có hai nhóm chất

có cấu trúc tương tự là nhóm flavone và isoflavone. Sử dụng quan hệ giữa cấu trúc

– cấu trúc để dự đoán tính chất, hoạt tính kháng ung thư cúa các dẫn xuất flavonoid

trong nhóm kiểm tra và flavonoid phân lập.

3.2.4.2. Tính toán các tham số hóa lý

Các hợp chất trong Phụ lục 1a được xây dựng, tối ưu hóa cấu trúc phân tử bằng

phương pháp cơ học phân tử MM+, mức gradient 0,05. Tham số hóa lý tính toán

như mục 2.3.1 [15] Các tham số cấu trúc này được sử dụng làm dữ liệu để kiểm tra

khả năng dự đoán của các mô hình QSSRMLR.

3.2.4.3. Xây dựng mô hình

Mô hình tuyến tính QSSRMLR cũng được nghiên cứu, phát triển từ các kỹ thuật

hồi quy tuyến tính. Mô hình quan hệ cấu trúc - cấu trúc (QSSRMLR) là mối quan hệ

giữa những hợp chất (y) và các hợp chất có cấu trúc tương tự (x). Các mô hình

QSSRMLR được xây dựng bằng phương pháp hồi quy tuyến tính. Sự phù hợp tốt

nhất của mô hình QSSRMLR được thể hiện ở giá trị R2tr và khả năng dự đoán của các

mô hình thể hiện ở giá trị R2pr. Sử dụng các hợp chất trong Phụ lục 1a để xây dựng

các mô hình QSSRMLR.

Mô hình QSSRMLR được xây dựng từ các thay đôi điện tích các nguyên tử

của những hợp chất. Sự xắp xếp dọc theo thứ tự giá trị tương quan của mối quan hệ

tuyến tính giữa những hợp chất sử dụng điện tích nguyên tử và tính chất hóa lý

được chỉ ra ở Hình 3.4.

81

a) b)

Hình 3.4 Mối tương quan giữa các hợp chất: a) sử dụng điện tích; b) sử dụng tính

chất hóa lý

■: fla-A23 và fla-A11; ▲: fla-A15 và isofla-A32; ○: isofla-A32 và isofla-A4.

Những hợp chất trong Phụ lục 1a được lựa chọn ngẫu nhiên để đánh giá mối

tương quan điện tích nguyên tử và tính chất hóa lý giữa các hợp chất. Kết quả tính

toán hệ số tương quan điện tích giữa các hợp chất được cho ở Bảng 3.1 .

Bảng 3.16 Mối tương quan của các hợp chất sử dụng mô tả điện tích nguyên tử

fla-A23 fla-A6 fla-A15 fla-A22 isofla-A32 fla-A28 fla-A5 isofla-A4

fla-A23 1,0000

fla-A6 0,8664 1,0000

fla-A15 0,9220 0,8254 1,0000

fla-A22 0,9984 0,8548 0,9132 1,0000

isofla-A32 0,9247 0,7565 0,9659 0,9254 1,0000

fla-A28 0,9222 0,8259 1,0000 0,9134 0,9656 1,0000

fla-A5 0,9986 0,8696 0,9267 0,9983 0,9261 0,9270 1,0000

isofla-A4 0,9250 0,7560 0,9659 0,9257 1,0000 0,9657 0,9264 1,0000

fla-A11 0,9999 0,8668 0,9225 0,9981 0,9236 0,9227 0,9986 0,9239

Những hợp chất có cấu trúc tương tự có tính chất tương quan tốt với nhau.

Mô hình hồi quy tuyến tính của các hợp chất flavone và isoflavone (Y) được xây

dựng từ điện tích nguyên tử được trình bày ở Bảng 3.17. Mô hình tuyến tính

82

QSSRMLR với các giá trị thống kê rất tốt R2tr = 0,999 và R2

pr = 0,999. Bảng 3.17 đưa

ra 10 mô hình từ 32 hợp chất nghiên cứu trong Phụ lục 1a đại diện cho khả năng dự

đoán dựa trên mối quan hệ cấu trúc – cấu trúc.

Bảng 3.17 Tính chất hóa lý và hoạt tính kháng ung thư pGI50 của các hợp chất

nghiên cứu bằng mô hình QSSRMLR và các chất dùng để dự đoán

Tính chất hóa lý và hoạt tính kháng ung thư pGI50 Phương pháp

ARE% QSSR Tham khảo [15]

Mô hình QSSR của Fla-A1 với R2tr = 0,9999; R2

pr = 0,9999; SE = 0,00020159

Fla-A1 = 0,00015 + 1,018 (Fla-A5) -0,513 (Fla-A21)+ 0,497 (Fla-A22 ) (3.6)

Độ khả phân cực bề mặt lưới 68,453 68,120 0,489

pGI50 5,663 5,699 0,638


pr = 0,9999; SE = 0,00035399

Fla-A2 = -0,00020+1,260 (Fla-A6)+0,871 (Fla-A14)-1,134 (Fla-A24) (3.7)

Nhiệt nóng chảy (Tm) ở 1 atm 741,521 745,496 0,533

Nhiệt độ tới hạn (Tc) 931,125 934,452 0,356

Mol Refractivity 8,711 8,715 0,053

Nhiệt độ sôi, (Tb) ở 1 atm 978,789 980,510 0,176

pGI50 6,473 5,921 9,321


pr = 0,9999; SE = 0,00010411

Fla-A3 = 0,00002+0,935 (Fla-A7) +0,582 (Fla-A16) -0,517 (Fla-A28) (3.8)



Hiệu ứng nhiệt KJ/mol -318,085 -313,160 1,573

Hằng số Henry 7,266 7,240 0,355

pGI50 5,726 5,699 0,469


pr = 0,9999; SE = 0,00013747

isoFla-A4 = -0,000002+0,980 (isoFla-A8)-0,233(isoFla-A18)+ 0,252(isoFla-A19) (3.9)



83

Hằng số Henry 7,237 7,240 0,042

pGI50 5,084 5,009 1,495


pr = 0,9999; SE = 0,00019793

Fla-A5 = -0,00015+0,982 (Fla-A1) +0,499 (Fla-A21) -0,483 (Fla-A22) (3.10)


Chỉ số khúc xạ phân tử 8,731 9,179 4,884


Hằng số Henry 7,034 7,110 1,073

LogP 8,731 9,179 4,884

pGI50 5,734 5,699 0,618


pr = 0,9999; SE = 0,00026038

Fla-A6 = 0,00019+0,682 (Fla-A2)-0,587 (Fla-A14)+0,907 (Fla-A24) (3.11)



Khối lượng mol 324,833 323,343 0,461

pGI50 5,772 6,046 4,533


pr = 0,9999; SE = 0,00013549

Fla-A7 = -0,00003+1,037 (Fla-A3)+-0,041 (Fla-A16)+0,004 (Fla-A27) (3.12)




Hằng số Henry 7,228 7,240 0,171

pGI50 5,700 5,658 0,750


pr = 0,9999; SE = 0,00119054

isoFla-A8 = 0,0000051+ 1,006(isoFla-A4)+ 0,253(isoFla-A18)-0,259(isoFla-A19) (3.13)



Hằng số Henry 7,243 7,240 0,038

pGI50 4,994 5,071 1,503

84


pr = 0,9999; SE = 0,00018592

Fla-A9 = 0,000004+0,047 (Fla-A5) +1,025 (Fla-A11) -0,072 (Fla-A23) (3.14)



Hằng số Henry 7,052 7,050 0,026

LogP 4,663 4,537 2,772

PGI50 5,698 5,745 0,810


pr = 0,9999; SE = 0,00042716

Fla-A10 = 0,00012+0,977 (Fla-A9) -1,055 (Fla-A21) +1,079 (Fla-A22) (3.15)


Áp suất tới hạn (Pc), Bar 18,820 18,692 0,683



Chỉ số khúc xạ phân tử 10,963 10,930 0,305

Log P 3,766 3,740 0,694

Hằng số Henry 7,063 7,050 0,190

PGI50 5,652 5,678 0,448


Mô hình hồi quy tuyến tính nhận được từ các dẫn xuất flavone và isoflavone

này có thể ứng dụng để dự đoán tính chất hóa lý cũng như hoạt tính kháng ung thư

của các flavone và isoflavone có cấu trúc tương tự.

Các mô tả cấu trúc phân tử của các hợp chất để xây dựng mô hình QSSRMLR

được tính toán một cách cẩn trọng, kết quả dự đoán tính chất hóa lý và pGI50 cho ở

Bảng 3.17, Hình 3.5 chỉ ra rằng mô hình hồi quy tuyến tính QSSRMLR của các hợp

chất flavone và isoflavone là hoàn toàn đáng tin cậy.

Phân tích ANOVA một yếu tố cũng chỉ ra rằng kết quả dự đoán tính chất hóa

lý và hoạt tính kháng ung thư của các dẫn xuất flavone và isoflavone từ mô hình

QSSRMLR thì không khác các giá trị tính chất hóa lý tham khảo, giá trị hoạt tính

kháng ung thư xác định từ thực nghiệm [28] với (Ftt = 0,0010 < F0,05 = 3,9423).

85

Các mô hình QSSRMLR đã được xây dựng và dự đoán thành công tính chất

hóa lý, hoạt tính pGI50 của nhóm dẫn xuất kháng ung thư flavone và isoflavone có

cấu trúc tương tự.

Hình 3.5 Quan hệ giữa tính chất hóa lý dự đoán và dữ liệu thực nghiệm

3.2.5. Xây dựng mô hình QSARMLR (3.16) và QSARANN(1)

3.2.5.1. Dữ liệu

Tập dữ liệu sử dụng để xây dựng các mô hình QSAR bao gồm 32 hợp chất

và hoạt tính kháng tế bào ung thư cô tử cung GI50/M trong Phụ lục 1a.

Các tham số cấu trúc 2D, 3D được tính toán bằng phương pháp cơ học phân

tử trên phần mềm QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a

đến Phụ lục 10h.

3.2.5.2. Xây dựng mô hình QSARMLR (3.16)

Trong nghiên cứu này, các mô hình QSARMLR (3.16), phương trình 3.16 và

QSARANN(1) thu được thông qua 2 nhóm: nhóm luyện được chọn lựa ngẫu nhiên và

nhóm kiểm tra. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)

được đánh giá bằng cách so sánh kết quả dự đoán và hoạt tính thực nghiệm của các

hợp chất trong nhóm kiểm tra, là nhóm không được sử để thiết lập mô hình

QSARMLR (3.16) và QSARANN(1) từ nhóm luyện.

Giá

trị

dự đ

oán

Giá trị thực nghiệm

86

Sự biến thiên các giá trị R2, R2pred và SE trong các mô hình QSARMLR với các

tham số mô tả 2D và 3D, tương ứng chỉ ra trong Bảng 3.18.

Bảng 3.18 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE

k Tham số mô tả phân tử 2D, 3D trong các mô hình MSE R² R²pred

2 a1, a2 0,063 0,657 0,630

3 a1, a2, a3 0,034 0,820 0,798

4 a2, a3, a4, a5 0,027 0,866 0,843

5 a2, a5, a6, a7, a8 0,023 0,891 0,867

6 a2, a5, a6, a8, a9, a10 0,019 0,914 0,890

7 a2, a5, a6, a8, a9, a10, a11 0,015 0,933 0,910

8 a5, a8, a10, a12, a13, a14, a15, a16 0,015 0,936 0,909

9 a5, a6, a8, a10, a11, a16, a17, a18, a19 0,012 0,955 0,932

10 a5, a6, a8, a10, a11, a15, a16, a17, a18, a19 0,012 0,955 0,928

Kí hiệu a1 là xvc3, a2 là dipole, a3 là xvpc4, a4 là xvp6, a5 là logP, a6 là xp8,

a7 là volume, a8 là knotpv, a9 là xvp8, a10 là SHBa, a11 là Hmaxpos, a12 là xp6, a13 là

SaaCH, a14 là k2, a15 là nvx, a16 là knotp, a17 là ABSQ, a18 là SsOH, a19 là phia.

Để xây dựng các mô hình QSARMLR, các tham số mô tả 2D và 3D được chọn

lựa bằng kĩ thuật hồi quy từng bước. Các tham số mô tả 2D, 3D được chọn dựa trên

cơ sở các giá trị thống kê R2, SE và F-stat. Các mô hình được đánh giá chéo bằng kĩ

thuật loại bỏ dần từng trường hợp (LOO) để xác định giá trị R2pred. 9 mô hình phù

hợp nhất được chỉ ra trong Bảng 3.18. Các mô hình QSARMLR (với k từ 2 đến 10)

được xắp xếp một cách trật tự với sự thay đôi các giá trị R2, SE và R2pred. Trong

Bảng 3.18, các mô hình QSARMLR (với k từ 8 đến 10) là các mô hình có giá trị

R2pred cao hơn cả. Cụ thể, trong mô hình QSARMLR với k = 9 có R2 cao nhất là 0,955

và R2pred là 0,932. Vì vậy, chúng tôi lựa chọn ba mô hình (với k là 8, 9 và 10) để xác

định giá trị phần trăm đóng góp của các tham số mô tả 2D, 3D đối với hoạt tính

kháng ung thư.

87

Bảng 3.19 Các giá trị thống kê và giá trị phần trăm đóng góp MPmxi,% và

GMPmxi,% đối với các tham số mô tả phân tử 2D và 3D trong các mô hình

QSARMLR (với k là 8, 9 và 10)

QSARMLR MPmxi,%

GMPmxi, % m = 8 M = 9 m = 10 m = 8 m = 9 m = 10

R2tr 0,936 0,955 0,955

R2 pr 0,909 0,932 0,928

SE 0,124 0,107 0,110

Hệ số -13,133 3,044 2,946

k2 -4,926 - - 23,638 7,879

xp6 -2,899 - - 6,399 2,133

xp8 - 4,473 4,282 14,301 12.181 8,827

nvx 3,487 - 0,036 45,229 1,138 15,456

knotp -8,350 -2,673 -2,794 9,072 7,879 7,325 8,092

knotpv 34,40 15,54 15,917 9,681 11,878 10,813 10,790

SHBa -0,225 0,019 0,016 4,398 1,004 0,770 2,057

Hmaxpos - -1,203 -1,201 3,439 3,060 2,166

SaaCH -0,166 - - 1,490 0,497

ABSQ - -5,982 -5,939 33,101 29,255 20,785

SsOH - 0,359 0,358 2,924 2,609 1,844

phia - 3,067 2,999 21,167 18,413 13,193

logP 0,050 0,839 0,793 0,093 4,308 3,624 2,675

Các giá trị phần trăm đóng góp trung bình MPmxi,%, GMPmxi, % và các giá

trị thống kê khác đối với các mô hình (với k là 8, 9 và 10), được đưa ra trong Bảng

3.19. Giá trị phần trăm đóng góp trung bình MPmxi của các biến độc lập trong mỗi

mô hình QSARMLR (với k là 8, 9 và 10), được xác định từ giá trị phần trăm đóng

góp Pxk của mỗi biến độc lập trong từng trường hợp quan sát tương tứng Pmxi được

tính toán từ giá trị đóng [86] góp tông cộng Ctotal của mỗi biến trong từng hợp chất

88

[86]. Kết quả tính toán giá trị phần trăm đóng góp trung bình MPmxi,% và giá trị

phần trăm đóng góp trung bình toàn cục GMPmxi,% được đưa ra trong Bảng 3.19.

Giá trị phần trăm đóng góp trung bình toàn cục GMPmxi,% [86] trong Bảng

3.19 đã mô tả mức độ quan trọng của các tham số mô tả 2D, 3D của các flavone và

isoflavone. Sự xắp xếp mức độ ảnh hưởng quan trọng của các tham số 2D, 3D trong

các mô hình QSARMLR theo thứ tự là GMPmxi,%: SaaCH < SsOH < SHBa < xp6 <

Hmaxpos < logP < k2 < knotp < xp8 < knotpv < phia < nvx < ABSQ. Các tham số

mô tả ABSQ, nvx, phia, knotpv, xp8, knotp, k2 và LogP được xem là các tham số

mô tả quan trọng nhất trong mỗi phân tử. Ngoài ra, các tham số mô tả phân tử đại

diện cho các nhóm carbonyl C4 = O11 và nguyên tố O1. Các nguyên tố này có các

cặp electron tự do với electron của liên kết C2 = C3 và C4 = O11 tạo hệ liên hợp.

Nhóm carbonyl C4 = O11 thể hiện toàn bộ phản ứng tự nhiên của nhóm của nhóm

cacbonyl [80, 103].

Vì vậy, các tham số mô tả phân tử cũng chứng minh được định lượng tông

điện tích trên toàn phân tử bởi giá trị GMPmxi và chúng cũng phù hợp với các giá trị

thực nghiệm [54, 80, 103]. Vì vậy, vị trí các nguyên tử C6 và C3’ còn trống, có thể

gắn các nhóm thế mới trong nghiên cứu dẫn xuất mới [80, 89, 103]. Các vị trí khác

cũng có thể đại điện tác động đến hoạt tính sinh học GI50, nhưng chúng là các vị trí

không thể gắn thêm nhóm thế nên không được sử dụng để thiết kế dẫn xuất mới.

4.0

4.5

5.0

5.5

6.0

6.5

4.0 4.5 5.0 5.5 6.0 6.5

pG

I50

pGI50Pred

a)

5.6

99

5.6

99

5.6

19

8

5.6

38

3

5.6

99

5.0

86

25.7

37

11

6.0

47

81

5.7

66

19

5.6

84

34

5.7

05

77

4.9

36

49

fla1 fla11 fla24 fla25 fla26 fla30

2

3

4

5

6

7

Val

ues

pG

I 50

Test substance flavonoid

pGI50,exp

pGI50,Pred

Hợp chất flavonoid trong nhóm kiểm tra

b)

Hình 3.6 a) Hồi quy tuyến tính đa biến và b) giá trị pGI50 và pGI50,pred của flavonoid

trong nhóm kiểm tra

89

Các vị trí C6 và C3’ được lựa chọn để gắn thêm các nhóm thế mới tạo thành

các flavonoid mới. Tương tự, vị trí C2’ cũng còn trống và có thể sử dụng để gắn các

nhóm mới vào phân tử. Điều này cho phép tạo nên các hợp chất mới có hoạt tính

sinh học cao hơn hợp chất mẫu. Từ đó, các flavonoid chiết xuất có thể chọn lựa làm

hợp chất mẫu để thiết kế thuốc mới có hoạt tính cao hơn. Điều này được chỉ ra trong

phần thảo luận bên dưới.

Các mô tả phân tử được ứng dụng trọng kỹ thuật phân tích hồi quy đa biến để

thiết lập mô hình QSAR với quá trình lựa chọn biến số độc lập bằng cách sử dụng

mô hình MLR [86, 107]. Mô hình QSAR cuối cùng với các tham số mô tả k = 9 là

mô hình tốt nhất [106]. Chín biến số độc lập bao gồm xp8, ABSQ, SsOH,

Hmaxpos, phia, knotp, knotpv, SHBa và LogP được lựa chọn để xây dựng mô hình

QSARMLR. Kết quả dự đoán hoạt tính sinh học được minh chứng qua giá trị R2 dự

đoán (R2Pr) phù hợp với dữ liệu thực nghiệm. Mô hình QSARMLR (3.16) như sau:

pGI50 = 3,044 + 4,473×xp8 -5,982×ABSQ + 0,359×SsOH - 1,203×Hmaxpos

+ 3,067×phia - 2,673×knotp + 15,540×knotpv + 0,019×SHBa + 0,839×LogP

(3.16)

Với n = 34; R2tr = 0,955; R2

Adj= 0,932; R2pr = 0,745; SE = 0,107; F = 42,182

3.2.5.3. Xây dựng mô hình QSARANN(1)

Mô hình QSARANN(1) được xây dựng bằng kỹ thuật neuro-fuzzy với thuật

toán di truyền sử dụng phần mềm INForm [40]. Mô hình mạng thần kinh nhân tạo

có kiến trúc mạng I(9)-HL(5)-O(1) được xây dựng. Kiến trúc mạng này bao gồm

lớp input I(9) với 9 nơ ron tương ứng với 9 biến độc lập xp8, ABSQ, SsOH,

Hmaxpos, phia, knotp, knotpv, SHBa và LogP; lớp ẩn HL(5) với 5 nơ ron và lớp

output O(1) với 1 nơ ron là hoạt tính sinh học pGI50. Thuật toán lan truyền ngược

được ứng dụng để luyện mạng thần kinh. Hàm truyền cho mỗi nơ ron là đường tiếp

tuyến Hypecbol; mỗi tham số luyện mạng khác nhau được sử dụng cho quá trình

luyện mạng với tốc độ huấn luyện (moment) là 0.7 và tốc độc học là 0.01; sai số

tông cộng là 0,0003017, sai số dự đoán là 0,00001 với 300000 vòng lặp. Sau khi

90

luyện mạng mô hình mạng thần kinh thu được có kiến trúc I(9)-HL(5)-O(1), với giá

trị thống kê R2tr là 0,8963 và R2

pr là 0,8883.

3.2.5.4. Khả năng dự đoán của mô hình QSARMLR (3.16) và QSARANN(1)

Khả năng dự đoán của các mô hình QSARMLR (3.16) và QSARANN(1) được đánh

giá cẩn thận bằng kỹ thuật loại bỏ từng trường hợp (LOO) và giá trị R2pr. Sáu hợp

chất trong nhóm kiểm tra được sử dụng để kiểm tra khả năng dự đoán hoạt tính sinh

học của các mô hình QSARMLR (3.16) và QSARANN(1). Hoạt tính dự đoán của các

flavonoid trong nhóm kiểm tra được so sánh với dữ liệu thực nghiệm, cho ở Bảng

3.20. Hoạt tính sinh học dự đoán từ các mô hình QSAR được so sánh với hoạt tính

sinh học thực nghiệm và so sánh giữa các mô hình với nhau bởi giá trị sai số tương

đối trung bình MARE,%. Các giá trị MARE,% cho thấy rằng khả năng dự đoán của

mô hình QSARMLR (3.16) thì thấp hơn của mô hình QSARANN(1) chỉ ra trong Bảng

3.20. Sau khi sử dụng các mô hình QSARMLR (3.16) và QSARANN(1) để dự đoán hoạt

tính sinh học pGI50 của sáu hợp chất trong nhóm kiểm tra chỉ ra khả năng dự đoán

chính xác của các mô hình QSAR với các sai số nằm trong khoảng tin cậy của phép

đo thực nghiệm. Tuy nhiên, các mô hình QSARMLR (3.16) và QSARANN(1) đều có

khả năng dự báo tốt đối với hoạt tính sinh học của các hợp chất mới.

Bảng 3.20 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR

(3.16) và QSARANN(1)

Hợp chất pGI50,exp pGI50,pred ARE,%

M1 M2 M1 M2

Fla-1 5,699 5,3879 5,7371 5,4589 0,6685

Fla-11 5,699 5,9188 6,0478 3,8568 6,1204

Fla-24 5,6198 5,9316 5,7662 5,5482 2,6051

Fla-25 5,6383 5,8627 5,6843 3,9799 0,8158

Fla-26 5,699 5,8841 5,7058 3,2479 0,1193

Fla-30 5,0862 4,8677 4,9365 4,2959 2,9433

MARE,% 4,3979 2,2121

M1: Mô hình QSARMLR (3.16); M2 là mô hình QSARANN (1)

91

3.2.6. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18) và QSARPCA-ANN

3.2.6.1. Dữ liệu


và hoạt tính kháng tế bào ung thư cô tử cung GI50/M (Phụ lục 1a). Các tham số cấu

trúc 2D, 3D được tính toán bằng phương pháp cơ học phân tử trên phần mềm

QSARIS, theo mục 3.1.2.4. Kết quả tính toán cho ở Phụ lục 10a - 10h. Các tham số

này sử dụng để xây dựng hồi quy tuyến tính (QSARMLR) [86], hồi quy thành phần

chính (QSARPCR) [9] và mạng nơ-ron nhân tạo (mô hình QSARPCA-ANN [40].

3.2.6.2. Xây dựng mô hình QSARMLR (3.17), QSARPCR (3.18)

Dữ liệu ban đầu được chia thành tập luyện và tập kiểm tra bằng phương pháp

lấy mẫu ngẫu nhiên. Các mô hình QSAR xây dựng từ nhóm luyện. Sự thay đôi các

giá trị R2, R2pred và SE trong các mô hình QSARMLR với các tham số 2D và 3D được

chỉ ra trong Bảng 3.21. Các mô hình QSARMLR, các mô tả phân tử 2D và 3D được

chọn bằng thuật toán hồi quy bằng thuật toán hồi quy.

Bảng 3.21 Các mô hình QSARMLR (k từ 2 đến 10) với các giá trị R2, R2pred và MSE

k Tham số mô tả phân tử 2D, 3D trong các mô hình R2 R2pred SE

2 a1, a2 0,756 0,731 0,430

3 a1, a2, a3 0,774 0,732 0,417

4 a1, a2, a3, a4 0,805 0,772 0,390

5 a1, a2, a3, a4, a5 0,832 0,756 0,365

6 a1, a4, a5, a6, a7, a8 0,854 0,812 0,342

7 a1, a2, a3, a4, a5, a9, a10 0,836 0,721 0,365

8 a1, a2, a3, a4, a5, a8, a9, a10 0,837 0,693 0,367

9 a1, a2, a3, a4, a5, a8, a9, a10, a11 0,838 0,682 0,369

10 a1, a2, a3, a4, a5, a6, a8, a9, a10, a11 0,841 0,650 0,368

(Với a1 là LogP, a2 là MaxNeg, a3 là ka2, a4 là SdO, a5 là MaxQp, a6 là

Ovality, a7 là SdssC, a8 là ka3, a9 là ABSQ, a10 là ABSQon, a11 là dipole).

92

Quy trình lựa chọn cho mô tả 2D và 3D dựa trên sự thay đôi của các giá trị

thống kê R2, SE và F-stat. Các mô hình QSARMLR đánh giá chéo bằng kỹ thuật

LOO, các giá trị R2pred được xác định. 9 mô hình phù hợp nhất được đưa ra trong

Bảng 3.21.

Các mô hình QSARMLR (với k từ 2 đến 10) được xắp xếp theo trật tự thay đôi

của các giá trị thống kê R2, SE và R2pred. Trong Bảng 3.21, các mô hình QSARMLR

(với k từ 5 đến 7) cho thấy giá trị R2pred lớn hơn.

Bảng 3.22 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của các

tham số mô tả phân tử 2D, 3D trong các mô hình QSARMLR (với k bằng 5, 6, 7)

Biến số QSARMLR MPmxi,% GMPmxi,

% m m = 5 m = 6 m = 7 m = 5 m = 6 m = 7

R2 0,832 0,854 0,836

R2adj 0,820 0,841 0,820

SE 0,365 0,342 0,365

R2pred 0,756 0,812 0,721

Hệ số 3,883 8,509 4,790

ABSQ -0,222 - -0,257 27,945 18,636 19,005 21,862

ABSQon - - 0,0143 - - 0,433 0,144

MaxQp 3,416 2,8540 3,588 24,043 25,862 25,908 25,271

MaxNeg - - 6,122 - 24,203 23,890 16,031

SdO 0,0125 0,0247 0,0126 6,192 3,792 3,665 4,550

ka2 0,133 - 0,143 27,484 17,617 17,426 20,842

LogP 0,156 0,2192 0,163 15,651 9,829 9,672 11,717

Ovality - -3,6969 - 5,292 4,393 2,315 4,000

SdssC - 0,2969 - 4,382 5,613 7,236 5,744

ka3 - 0,3635 - 5,351 9,324 3,473 6,049

Đặc biệt, mô hình QSARMLR (3.17) R với k = 6 với giá trị R2tr là 0,854 và R2

pr

là 0,812 cao hơn các mô hình còn lại. Mô hình QSARMLR (3.17) với k = 6:

pGI50 = 8,509 + 2,8540MaxQp + 0,0247SdO + 0,2192LogP - 3,6969Ovality +

0,2969SdssC + 0,3635ka3 (3.17)

93

Vì vậy, ba mô hình tốt nhất (với k của 5, 6 và 7) được chọn để xác định tỷ lệ

phần trăm đóng góp của mô tả 2D, 3D đến hoạt tính kháng ung thư. Tỷ lệ đóng góp

có giá trị MPmxi, GMPmxi và các giá trị thống kê khác nhau của các mô hình (với k

bằng 5, 6 và 7) tương ứng được trình bày trong Bảng 3.22.

Giá trị phần trăm đóng góp MPmxi của biến số độc lập trong từng mô hình

QSARMLR (với k bằng 5, 6 và 7) được xác định từ phần trăm đóng góp phần trăm

Pmxi của từng biến tương ứng trong mỗi trường hợp quan sát [86]. Giá trị này được

xác định từ tông giá trị đóng góp tông cộng các biến trong một chất [66, 86]. Như

vậy tỷ lệ đóng góp trung bình MPmxi, và GMPmxi [86] của mỗi biến độc lập cho 3

mô hình được xác định, kết quả cho ở trong Bảng 3.22.

Phần trăm đóng góp trung bình toàn cục GMPmxi,% trong Bảng 3.22 mô tả

mức độ ảnh hưởng của mô tả phân tử 2D và 3D của nhóm dẫn xuất flavone và

isoflavone. Đối với các mô hình QSARMLR, mức độ quan trọng của mô tả phân tử

2D và 3D được sắp xếp theo các giá trị GMPmxi,%: MaxQp > ABSQ > ka2 >

MaxNeg > LogP > ka3 > SdssC > SdO > Ovality > ABSQon.

Các tham số mô tả ABSQ, MaxQp, ka2, MaxNeg và LogP được xem như

các bộ tham số mô tả quan trọng nhất trên mỗi phân tử. Bên cạnh những tham số

mô tả phân tử này còn cho thấy theo bản chất của nhóm cacbonyl C4 = O11 và

nguyên tử O1. Các nguyên tử này có cặp electron tự do liên hợp với điện tử C2 = C3

và C4 = O11 để hình thành hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất phản

ứng hoàn toàn của chất carbonyl [80, 103]. Vì vậy, những mô tả này có thể được

chứng minh tông điện tích trên phân tử bằng các giá trị GMPmxi,% và chúng cũng

phù hợp với các đánh giá thực nghiệm [80, 103, 113].

Ngoài ra, các vị trí nguyên tử C6 và C3' cũng là vị trí trống và có thể gắn các

nhóm chức mới. Các vị trí khác cũng có thể có ảnh hưởng quan trọng đối với các

hoạt tính sinh học GI50, nhưng chúng không phải là vị trí trống, vì vậy không thể

gắn những nhóm thế mới. Do đó các vị trí C6 và C3' được chọn để gắn các nhóm thế

mới vào tạo thành flavonoid mới. Tương tự, vị trí C2' cũng còn trống và có thể được

sử dụng để gắn nhóm chức mới. Việc này sẽ tạo thành các hợp chất mới và có thể

94

cải thiện hoạt tính sinh học so với chất mẫu. Từ đó, flavonoid phân lập có thể được

lựa chọn như chất mẫu để thiết kế các loại thuốc mới có hoạt tính cao hơn. Điều này

được thể hiện trong phần thảo luận dưới đây.

Các mô tả phân tử được áp dụng bằng kỹ thuật PCR để xây dựng mô hình

QSAR [106, 111]. Mô hình QSAR với số biến số k = 6 là mô hình tốt nhất được

chọn có các tham số mô tả phân tử MaxQp, SdO, ka3, LogP, Ovality và SdssC

[63].

0

20

40

60

80

100

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

PC1 PC2 PC3 PC4 PC5 PC6

Cu

mu

lati

ve

var

iab

ilit

y (

%)

Eig

env

alue

Principle Component

3

4

5

6

7

8

9

3 4 5 6 7 8 9p

GI 5

0pGI50, pred

Hình 3.7 Tính chất của các thành phần chính và tương quan giữa giá trị pGI50

Kết quả dự đoán hoạt tính sinh học với giá trị R2pred phù hợp với dữ liệu thực

nghiệm. Số lượng các thành phần chính được trích ra bằng kỹ thuật phân tích thành

phần chính và tương quan giữa pGI50 và pGI50pred được chỉ ra trong Hình 3.7. Mô

hình hồi quy thành phần QSARPCR (3.18) có dạng:

pGI50 = 5,48356 + 0,38027×PC1 - 0,11868×PC2 + 0,34789×PC3 +

0,06995×PC4 + 0,21850×PC5 + 0,35057×PC6 (3.18)

với n = 26; R2tr

= 0,833; R2adj= 0,820, R2

pr =0,812, SE = 0,342, MSE =

0,1236; F = 63,172

3.2.6.3. Xây dựng mô hình QSARPCA-ANN

Mô hình QSARPCA-ANN được xây dựng bằng kỹ thuật neurofuzzy với thuật

toán di truyền bằng chương trình INForm [40, 87]. Kiến trúc mạng nơ-ron nhân tạo

I(6) -HL(9) - O(1) đã được xây dựng. Mô hình QSARPCA-ANN bao gồm lớp đầu vào

I(6) với 6 nơ ron là các biến độc lập PC1, PC2, PC3, PC4, PC5 và PC6 tương ứng với

các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC; lớp ẩn HL(9) với 9 nơ ron

thần kinh và lớp đầu ra O (1) với nơ ron là hoạt tính sinh học pGI50. Thuật toán lan

Thành phần chính

Giá

trị

riê

ng

Phần

tr

ăm

tích

lũy, %

95

truyền ngược được sử dụng để luyện mạng nơ ron. Hàm truyền trên mỗi nơ ron

được sử dụng là hàm truyền sigmoid; các thông số khác được sử dụng để huấn

luyện mạng thần kinh này bao gồm tỷ lệ luyện là 0,7 và tốc độ học 0,7; sai số MSE

= 0,003447 với số vòng lặp là 5000. Sau khi luyện mạng nơ ron I(6) - HL(9)- O(1),

giá trị R2tr

là 0,897298 và R2pr là 0,88718.

3.2.6.4. Khả năng dự đoán của các mô hình

Khả năng dự đoán của các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN đã được đánh giá cẩn thận bằng kỹ thuật (LOO) với giá trị tương

quan dự đoán R2pred. Năm hợp chất trong nhóm kiểm tra được sử dụng để đánh giá

khả năng dự đoán của các mô hình QSAR này. Các hoạt tính dự báo cho flavonoid

trong nhóm thử nghiệm được so sánh với dữ liệu thực nghiệm, như được trình bày

trong Bảng 3.23.

Bảng 3.23 Hoạt tính sinh học pGI50 của nhóm kiểm tra từ các mô hình QSARMLR

(3.17), QSARPCR và QSARPCA-ANN


M1 M2 M3 M1 M2 M3

Flav-8

A2

5,921 5,234 5,526 5,471 3,214 8,979 7,890

Flav-22

A9

5,745 5,485 5,699 5,556 3,755 0,001 2,513

Flav-32

A12

6,097 5,423 5,697 5,351 5,567 10,895 4,161

Flav-74

1-3-5-11-15-26

5,699 5,815 5,895 5,736 1,964 3,362 0,585

Flav-80

1-3-5-11-15-26

5,699 6,034 6,288 6,086 0,773 3,399 0,083

MARE,% 3,055 5,327 3,045

Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR (3.18); M3 là

mô hình QSARPCA-ANN.

Các hoạt tính dự báo từ các mô hình QSAR được so sánh với các hoạt tính

thực nghiệm và so sánh với nhau bằng cách sử dụng giá trị trung bình sai số tương

đối MARE%. Các giá trị MARE,% cho thấy rằng khả năng dự báo của mô hình

QSARPCA-ANN thấp hơn mô hình QSARMLR (3.17), QSARPCR. như trong Bảng 3.23.

Do giá trị MARE,% mô hình QSARPCR là cao nhất. Sau khi sử dụng các mô hình

QSARMLR (3.17), QSARPCR và QSARPCA-ANN để dự đoán các hoạt tính sinh học

96

pGI50 của sáu hợp chất trong nhóm thử nghiệm khả năng dự đoán chính xác của một

mô hình QSAR được thể hiện bởi các sai số có thể chấp nhận được trong khoảng tin

cậy của phép đo thực nghiệm. Do đó, các mô hình QSARMLR (3.17), QSARPCR và

QSARPCA-ANN có khả năng dự đoán tính sinh học của các chất mới.

Mối quan hệ giữa các tham số mô tả phân tử 2D, 3D và các hoạt tính kháng

ung thư GI50 (μM) của các dẫn xuất flavonoid. Mô hình QSARMLR (3.18) cho thấy

các tham số MaxQp, SdO, ka3, LogP, Ovality và SdssC ảnh hưởng quan trọng đến

sự thay đôi hoạt tính GI50 thử nghiệm in vitro trên tế bào Hela của các dẫn xuất

flavonoid. Mô hình QSARMLR (3.18) cũng tìm ra các vị trí quan trọng nhất C6 và C3

để gắn các nhóm thế mới nhằm tạo ra các flavonoid mới với hoạt tính cao hơn

flavonoid cô lập. Mô hình QSARPCA-ANN với kiến trúc I(6) - HL(9) - O (1) có thể dự

đoán hoạt tính của flavonoid tốt hơn. Các hoạt tính sinh học dự đoán từ các mô hình

QSAR phù hợp với những kết quả từ dữ liệu thực nghiệm.

Các mô hình QSAR được mô tả trong nghiên cứu này hữu ích cho đánh giá

độc tính in vitro đối với tế bào ung thư Hela của flavonoid. Nghiên cứu này đã xây

dựng các mô hình QSAR khác nhau có thể hữu ích cho việc tìm kiếm các tác nhân

trị liệu mới trong bệnh ung thư.

3.2.7. Xây dựng mô hình QSARMLR (3.19), QSARPLS (3.20) và QSARANN(2)

3.2.7.1. Dữ liệu


và hoạt tính kháng tế bào ung thư cô tử cung GI50/M (GI50 là nồng độ ức chế 50%

sự phát triển của tế bào ung thư) gồm 32 hợp chất trong Phụ lục 1a.

Điện tích nguyên tử sử dụng làm dữ liệu để xây dựng các mô hình QSARMLR.

QSARPLS và QSARANN thể hiện mối quan hệ giữa cấu trúc điện tử và hoạt tính. Dữ

liệu điện tử cho ở phụ lục 1b.

3.2.7.2. Xây dựng mô hình QSARMLR (3.19) và QSARPLS (3.20)

Các mô hình QSARMLR và QSARPLS được xây dựng thể hiện mối quan hệ

của điện tích nguyên tử và các hoạt tính sinh học pGI50 [86]. Các mô hình và các

97

giá trị R2, R2pred và SE với các tham số điện tích nguyên tử được chỉ ra trong Bảng

3.24.

Để xây dựng các mô hình QSARMLR, các tham số điện tử nguyên tử đã được

chọn sử dụng thuật toán hồi quy từng bước. Quá trình lựa chọn mô tả điện tích

nguyên tử dựa trên sự thay đôi của các giá trị thống kê R2, SE, R2pred và F-stat. Các

mô hình QSARMLR đã được đánh giá chéo bằng cách sử dụng kỹ thuật LOO để xác

định R2pred, 9 mô hình được thể hiện trong Bảng 3.24. Các mô hình QSARMLR (với k

từ 2 đến 10) được sắp xếp trong một sự thay đôi có trật tự của các giá trị R2tr

và R2pr.

Trong các mô hình ở Bảng 3.24, các mô hình QSARMLR với k từ 5 đến 7 có các giá

trị lớn hơn R2pred hơn các mô hình khác.

Bảng 3.24 Các mô hình QSARMLR với các giá trị R2tr

, SE và R2pr tương ứng

k Điện tích nguyên tử trong các mô hình R2tr

SE R2pr

2 O1, C7 0,816 0,139 0,765

3 O1, C4, C6 0,86 0,124 0,8

4 O1, C2, C4, C5 0,901 0,107 0,829

5 O1, C2, C4, C5, C3’ 0,924 0,096 0,873

6 O1, O11, C3, C4, C6, C7, 0,938 0,089 0,903

7 O11, C4, C6, C8, C9, C2’, C6’ 0,959 0,074 0,879

8 O11, C3, C6, C7, C8, C9, C10, C3’ 0,97 0,065 0,696

9 O1, O11, C3, C4, C6, C7, C8, C9, C10 0,978 0,057 0,563

10 O1, O11, C3, C6, C7, C8, C9, C2’, C3’, C6’ 0,978 0,059 0,358

Cụ thể, mô hình QSARMLR (3.19) với k = 6 với giá trị R2tr là 0,938 và giá trị

R2pr cao nhất là 0,903.

pGI50 = 6,7116 − 42,3105 O1 − 8,1592O11 + 3,0139 C3 −19,0370 C4 + 6,6117

C6 +4,6038C7 (3.19)

Vì vậy, chúng tôi chọn các mô hình tốt nhất (với k bằng 5, 6 và 7) để xác

định tỷ lệ đóng góp của các điện tích nguyên tử. Giá trị đóng góp MPmxi, GMPmxi và

các giá trị thống kê của các mô hình tương ứng (với k bằng 5, 6 và 7), được trình

bày trong Bảng 3.25.

Giá trị phần trăm đóng góp MPmxi các biến độc lập trong mỗi mô hình

QSARMLR (với k bằng 5, 6 và 7) được xác định từ tỷ lệ đóng góp Pxk tương ứng của

98

các biến trong từng trường hợp. Giá trị Pxk được xác định bởi giá trị đóng góp tông

cộng các biến trong một chất [18]. Vì vậy, tỷ lệ phần trăm đóng góp trung bình

MPmxi và GMPmxi của mỗi biến được xác định, các kết quả được mô tả trong Bảng

3.25. Phần trăm đóng góp trung bình toàn cục của GMPmxi trong Bảng 3.25 thể hiện

mức độ quan trọng của điện tích nguyên tử trong flavone và isoflavone. Đối với 3

mô hình QSARMLR với k = 5 – 7 biến số, vị trí các nguyên tử quan trọng sắp xếp

theo các giá trị GMPmxi,%: C4 > O1 > O11 > C9 > C2 > C6 > C3. Các nguyên tử C4, O1,

O11 là các các vị trí quan trọng nhất trong các phân tử. Ngoài các nguyên tử trong

nhóm carbonyl C4 = O11 và nguyên tử O1 có cặp electron liên kết điện tử π của C2 =

C3 và C4 = O11 để tạo thành một hệ liên hợp. Nhóm cacbonyl C4 = O11 có tính chất

phản ứng hoàn toàn của nhóm carbonyl. Vì vậy, các nguyên tử quan trọng này được

chứng minh bằng cách sử dụng các giá trị GMPmxi, % và cũng phù hợp với các dự

đoán từ nghiên cứu thực nghiệm [18, 54, 103].

Ngoài ra, nguyên tử C6 cũng là một vị trí quan trọng và được khám phá để

gắn các chất thay thế mới [80, 103]. Các vị trí nguyên tử C9 và C3 cũng ảnh hưởng

quan trọng đối với các hoạt tính sinh học GI50, nhưng nguyên tử C9 không phải là vị

trí còn trống nên không chọn để gắn các chất thay thế mới. Vì vậy, C6 là vị trí còn

trống có thể được lựa chọn để gắn thêm các nhóm thế vào hợp chất flavone mẫu

trong Phụ lục 1a hoặc flavonoid chiết xuất. Tương tự, vị trí C3' cũng còn trống và có

thể được sử dụng để gắn các nhóm thế mới. Điều này có thể hy vọng sẽ tạo ra các

hợp chất mới với hoạt tính cao hơn. Từ hướng nghiên cứu này, flavonoid cô lập đã

được lựa chọn như là chất mẫu để thiết kế các dẫn xuất mới có hoạt tính cao hơn.

Mô hình QSARPLS cũng được xây dựng từ các tham số điện tích nguyên tử,

các tham số này được lựa chọn cho mô hình QSARPLS theo. Sáu biến số O1, O11, C3,

C4, C6 và C7 cũng được sử dụng để xây dựng mô hình QSARPLS. Mô hình QSARPLS

được có dạng:

pGI50 = 5,168 − 20,643 × O1 − 0,358 × C3 − 7,892 × C4 + 0,425 × C6 − 0,583

× C7 − 3,465 × O11 (3.20)

Với n = 26; R2pr = 0,943; SE = 0,360; R2

pr = 0,912

99

Bảng 3.25 Các giá trị thống kê và phần trăm đóng góp MPmxi,%, GMPmxi,% của

điện tích nguyên tử trong các mô hình QSARMLR

Biến QSARMLR MPmxi

GMPmxi m = 5 m = 6 m = 7 m = 5 m = 6 m = 7

R2tr 0,924 0,938 0,959

R2ad 0,905 0,919 0,943

SE 0,096 0,089 0,074

R2pr 0,873 0,903 0,879

Hằng số −0,933 6,712 4,714

O1 −101,208 −42,311 − 57,602 24,629 − 27,410

O11 − −8,159 −32,8026 − 18,632 21,462 13,365

C2 −15,426 − − 13,418 − − 4,473

C3 − 3,014 − − 4,216 − 1,405

C4 −6,874 −19,037 −60,070 15,121 42,447 38,387 31,985

C5

− −

− −

C6 − 6,612 20,877 − 6,572 5,779 4,117

C7 − 4,604 − − 3,505 − 1,168

C8 − − 16,902 − − 5,696 1,899

C9 − − 95,421 − − 22,597 7,532

C2' − − −24,472 − − 2,497 0,832

C3' −16,117 − − 11,801 − − 3,934

C6' − − −25,422 − − 3,582 1,194

3.2.7.3. Xây dựng mô hình QSARANN(2)

Mô hình QSARANN(2) được xây dựng bằng kỹ thuật neuro-fuzzy với các thuật

toán di truyền sử dụng chương trình Visual Gene Developer v1,7 [43]. Kiến trúc

mạng nơ ron nhân tạo bao gồm ba lớp I(6)-HL(4)-O(1); Lớp đầu vào I(6) bao gồm

sáu nơ ron là các tham số O1, O11, C3, C4, C6 và C7; Nơ ron lớp đầu ra O(1) là hoạt

tính sinh học pGI50; Lớp ẩn HL(4) bao gồm bốn nơ ron. Mạng thần kinh đa lớp sử

dụng thuật toán lan truyền ngược để luyện mạng. Hàm truyền sigmoid trên mỗi nút

của mạng; Các thông số mạng thần kinh bao gồm tỷ lệ luyện 0,7 và tốc độ học 0,7;

sai số MSE = 0,000816 với 10,000 vòng lặp. Sau khi luyện mạng thần kinh, giá trị

100

R2tr là 0,993 và R2

pr là 0,971 trong khi đối với mô hình QSARMLR (3.19), giá trị R2tr

là 0,938 và R2pr là 0,903.

3.2.7.4. Dự đoán hoạt tính sinh học của các hợp chất mới

Khả năng dự báo của các mô hình QSARMLR (3.19), QSARPLS và

QSARANN(2) được đánh giá cẩn thận bằng cách sử dụng kỹ thuật LOO để xác định

giá trị R2pred; Các flavonoid được chia ngẫu nhiên từ dữ liệu trong Phụ lục 1a thành

nhóm luyện gồm 26 hợp chất và nhóm kiểm tra gồm sáu hợp chất.

Các hoạt tính sinh học của 6 chất flavonoid trong nhóm thử nghiệm trong

Phụ lục 1a được dự đoán từ các mô hình QSARMLR, QSARPLS và QSARANN. Các

giá trị dự đoán của các hoạt tính sinh học của những hợp chất này được so sánh với

các giá trị thực nghiệm, được trình bày trong Bảng 3.2 .

Bảng 3.26 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR

(3.19), QSARPLS (3.20) và QSARANN(2)


M1 M2 M3 M1 M2 M3

Fla 2 5,921 6,008 5,801 5,851 1,472 2,020 1,180

Fla 9 5,745 5,692 5,608 5,741 0,925 2,376 0,070

Fla 12 6,097 5,759 5,842 5,814 5,548 4,188 4,646

Fla 15 5,699 5,651 5,652 5,712 0,840 0,828 0,236

Fla 16 5,699 5,651 5,655 5,719 0,835 0,775 0,347

Isofla 32 5,137 5,092 5,083 5,112 0,877 1,046 0,490

MARE,% 1,749 1,872 1,161

Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS; M3 là

mô hình QSARANN(2).

Khả năng dự báo của mô hình QSARMLR (3.19) thấp hơn các mô hình

QSARPLS và QSARANN (2) tương ứng như trong Bảng 3.2 . Mô hình QSARANN (2)

có sai số có giá trị MARE % là 1,161 nhỏ hơn MARE,% của cả hai mô hình

QSARMLR (3.19) và QSARPLS.Vì vậy, khả năng dự báo của mô hình QSARANN (2)

tốt hơn so với mô hình QSARMLR (3.19) và QSARPLS. Sau khi sử dụng các mô hình

QSARMLR (3.19), QSARPLS và QSARANN(2) để dự đoán các hoạt tính sinh học pGI50

của sáu hợp chất trong nhóm thử nghiệm, sai số dự đoán nằm trong khoảng sai số số

101

không chắc chắn của thực nghiệm. Do đó, các mô hình QSARMLR (3.19), QSARPLS

và QSARANN(2) thích hợp để dự đoán các hoạt tính sinh học của các hợp chất

flavonoid mới.

3.3. SÀNG LOC, PHÂN LẬP FLAVONOID TỰ NHIÊN

3.3.1. Phân lập cynaroside từ actiso

CSL1 phân lập và tinh chế từ actiso (mục 2.4.1.) CSL1 kết tinh dạng bột,

trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy

256 – 257 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (60 : 40). hiện màu

bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,6).

Phô 1H-NMR (500 MHz, DMSO, δ ppm). Các proton trong vòng thơm: Độ

dịch chuyển của H liên kết với Csp2 thơm trung bình là 7,27, tuỳ vào các liên kết với

các nhóm thế khác nhau mà có sự thay đôi từ 6 - 9. Dễ dàng nhận thấy, từ độ dịch

chuyển hoá học của H6 và H8 cho thấy đây là hai mũi proton của nhân thơm, ghép

cặp metha với nhau. Một mũi đôi của proton trong nhân thơm ở H2’ mũi bốn ở H3’ là

hai proton ghép cặp ortho. Một mũi đôi của proton nhân thơm tại δH 6,90 ppm (d, J

= 8,5 Hz) và một mũi bốn của của proton nhân thơm tại δH 7,44 ppm (dd, J = 8,5Hz,

J = 2) chứng tỏ chúng ở vị trí ortho. Mũi đôi proton H6’ và H2’ ghép cặp meta với

nhau. Cụ thể là δ 6.39 (s, H3); 6.44 (d, J = 2 Hz, H6); 6.78 (d, J = 2 Hz, H8); 5.08

(1H, d, J = 7,5Hz , H1"); 7,41 (d, J = 8.5 H6’); 6,90 (d, J = 8,5Hz, H3’); 7,44 (dd, J =

8,5Hz, J = 2, H2’); Các proton của nhóm OH: quan sát trên phô có mũi proton với

độ dịch chuyển ở 12,89 ppm. Các mũi đa proton trong vòng đường gồm có: 3,489

(1H, m, H2’’); 3,476 (1H, m, H4’’); 3,466 (1H, m, H3’’); 3,500 (1H, m, H5’’); 3,725

(1H, dd, J = 12,3; 2,5 HZ, H6’’); 3,702 (1H, dd, J = 12,4; 6,3 HZ, H6’’); Mũi đôi

proton H1’’ (1H, d, J = 7,5Hz) được suy ra từ phô 1H-NMR kết hợp với phô HSQC,

cho thấy đường nối với khung aglycon bằng liên kết β. Mặt khác có tương tác giữa

δH1’’ và C7 trong phô HMBC. Vậy CSL1 có một đơn vị đường gắn vào khung

glycon ở C7 trong phân tử.

Phô 13C-NMR (DMSO, δ ppm, 125 MHz) và DEPT: Phô 13C-NMR (DMSO,

δ ppm,125 MHz) kết hợp phô DEPT và phô phô cộng hưởng từ hạt nhân 2 chiều

102

HSQC VÀ HMBC cho thấy CSL1 là một hợp chất flavonoid có 21 C. Có một nhóm

>C=O: 181,785 (C4). Có một nhóm >CH2: 60,6(C6’’). Có 5 nhóm –CH<: 76,4 (C2’’);

77,2 (C3’’); 69,5 (C4’’); 78 (C5’’); và mũi acetan đặc trưng 99,9 (C1’’) của đường. Có

6 nhóm cacbon bậc ba (–CH=): 105,3(C3); 100,2(C6); 95(C8); 113,6(C2’); 145,7

(C3’); 119,2 (C6’). Có 8 nhóm C bậc 4 (<C=): δ164,5 (C2); 161,2 (C5); 162,9(C7);

156,9(C9); 103,1(C10); 121,4(C1’); 149,9 (C4’); 115,9 (C5’); Tương tác của C và H

trong phô HMBC và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 -

C1’- C3’- C4’ - C6’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.

Phô 1H-NMR của cynaroside (Phụ lục 13), phô 13C-NMR (Phụ lục 15), phô

DEPT (Phụ lục 14), phô HMBC P lục 16), phô HSQC (Phụ lục 17). Tham khảo với

phô của hợp chất CSL1 trong nghiên cứu phân lập hợp chất cynaroside từ hạt

capparis decidua (forsk) của V. K. SAXENA và cs. [78] cho thấy CSL1 là

cynaroside. Cấu trúc Cynaroside được cho ở Hình 3.8.

Hình 3.8 Cấu trúc phân tử CSL1, C12H20O11

Danh pháp khác của cynaroside là luteolin-7-O-β-d-glucopyranoside hay

2-(3,4-dihydroxyphenyl)-5-hydroxy-7-((2S,3R,4S,5S,6R)-3,4,5-trihydroxy-6-

(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one.

3.3.2. Phân lập quercetin từ xa kê

AIL1 phân lập từ xa kê theo mục 2.4.1. AIL1 kết tinh dạng bột, trong hỗn

hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 314 – 316

oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20). Hiện màu bằng dung

dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0.35)

Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 24), phô 13C-NMR

(Phụ lục 25), phô DEPT (Phụ lục 26), kết hợp với phô HSQC (Phụ lục 27), HMBC

(Phụ lục 28): Có 5 proton trong vòng thơm trong đó: 6,26 (1H, d, J = 1,5 Hz, H6)

103

ghép cặp metha với 6,52 (1H, s giống t, H8); 6,98 (1H, d, J=8,5 Hz, H6') ghép

cặp metha với 7,82 (1H, d, J = 1,5 Hz, H2') và ghép cặp ortho với 7,68 (1H, dd, J

= 8,5 và 2 Hz, H5'). Tín hiệu proton ở 12,16 (1H, s); cho thấy hợp chất có nhóm

OH. Phô 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phô DEPT, HSQC, HMBC: hai

cacbon olefin C 146,9 (C2) và C 136,6 (C3). Hai cacbon >C= là: C 146,9 (C2); C

136,6 (C3); 12 cacbon vòng thơm: C 176,5, (C4); 162,2 (C5); 164,9 (C7);

157,7 (C9); 145,7 (C3'); 148,2 (C4'); Trong đó có hai cacbon bậc 4: δC 121,4 (C1')

và 104,0 (C-10); có năm cacbon –CH=: 99,1 (C6); 94,4 (C8); 116,1 (C2');

115,6 (C5'); C 123,7 (C6'); Quan sát tương tác của H và C trong phô HSQC, HMBC

cho thấy phô nghiệm của AIL1 thì phù hợp. H6-C5-C7-C8-C10; H8-C6-C7-C9-C10, H2’-

C1’-C6’-C3’-C4’-C2; H3’-C2’-C1’-C3’- C4’; H6’-C1’-C2-C2’-C4’-C5’.

Phô tham khảo từ nghiên cứu sự phân lập quercertin từ lá hồ lô ba (trigonella

foenum-graecum) của Bharathi Sambflavonoidam và cs. [11] và nghiên cứu phân

lập quercertin từ thân cây Costus igneus rhizome (CiREE) của

PazhanichamyKalailingam và cs. [44] cho thấy AIL1 là quercetin. Cấu trúc

quercetin cho ở Hình 3.9.

Hình 3.9 Cấu trúc phân tử AIL1, C15H10O7

Danh pháp: 2-(3,4-dihydroxyphenyl)-3,5,7-trihydroxy-4H-chromne-4-one.

3.3.3. Phân lập luteolin từ tía tô

POL1 phân lập từ tía tô theo mục 2.4.1. POL1 kết tinh dạng bột, trong hỗn

hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng chảy 327-328

oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (95 : 5) hiện màu bằng dung

104

dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,34), cho phản ứng dương

tính với thuốc thử FeCl3/EtOH cho thấy đây là một dẫn xuất phenolic.

Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 29) kết hợp với phô

HSQC (Phụ lục 33), HMBC (Phụ lục 32): Sáu H trong vòng thơm: δ 6.65 (1H; s,

H3); 6.19 (1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H;

d; J = 8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); bốn H của nhóm OH: 9.4 (1H, s, C4’-

OH ); 9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH), có một H của nhóm OH kiềm nối:

H [12.95 (s; 5-OH)].

Hình 3.10 Cấu trúc POL1, C15H10O6

Danh pháp: 2-(3,4-dihydroxyphenyl)-5,7-dihydroxy-4H-benzopyran-4-one

Phô 13C-NMR (DMSO-d6, 125 Hz) (Phụ lục 30) kết hợp với phô DEPT (Phụ

lục 31), HSQC, HMBC: Có 5 C thơm –CH=: 98.9(C6); 93.8(C8); 113.4(C2’);

116.0(C5’); 118.9(C6’). Có 6 C bậc 3 liên kết với oxy: δ163.1 (C2); 161.4(C5);

164.1(C7); 157.3 (C9); 145.7(C3’); 149.7(C4’); có 3 C bậc 4: 103.7(C10); 121.5(C1’);

có một cacbon cacbonyl 181.6(C4). Tương tác của C và H trong phô HMBC và phô

HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -

C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’. So sánh phô

chuẩn của POL1 với nghiên cứu sự phân lập luteolin [108], cho thấy POL1 là

luteolin. Cấu trúc luteolin cho ở Hình 3.10.

TÓM TẮT PHỔ

Cấu trúc POL1 được xác định bằng cách sử dụng các phô khác nhau: 1H-

NMR (DMSO-d6, 500 MHz, δ ppm) with HSQC, HMBC: δ 6.65 (1H; s, H3); 6.19

(1H; d; J = 2Hz, H6); 6.45 (1H; d; J = 2Hz, H8); 7.4 ( 1H; s H2’); 6.89 (1H; d; J =

8Hz, H5’); 7.41 (1H; d; J = 8Hz, H6’); 12.95 (1H, s; C5-OH); 9.4 (1H, s, C4’-OH );

9.9(1H, s, C3’-OH); 10.84 (1H, s, C7-OH). The 13C-NMR (DMSO-d6, 125 Hz) kết

105

hợp với phô DEPT, HSQC, HMBC: δ163.1 (C2); 102.8(C3); 181.6(C4); 161.4(C5);

98.9(C6); 164.1(C7); 93.8(C8); 157.3 (C9);103.7(C10); 121.5(C1’); 113.4(C2’);

145.7(C3’); 149.7(C4’); 116.0(C5’); 118.9(C6’). Tương tác C – H trong phô HMBC

và HSQC: H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H2’ - C2 - C3’- C4’ - C6’; H3’

-C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 -C1’ - C2’ - C4’ - C5’.

3.3.4. Phân lập daidzin từ đậu nành

3.3.4.1. Xác đinh cấu trúc daidzin bằng phương pháp NMR

GML1 được phân lập từ đậu nành theo mục 2.4.1. GML1 kết tinh dạng tinh

thể trong hỗn hợp CHCl3 và MetOH trong phân đoạn chạy sắc kí cột, điểm nóng

chảy 246 - 248 oC. Sắc ký bản mỏng giải ly bằng CHCl3 : MetOH (80 : 20) hiện

màu bằng dung dịch H2SO4 10% / EtOH cho vết tròn màu vàng (Rf = 0,4).

Phô 1H-NMR (DMSO-d6, 500 MHz, δ ppm) (Phụ lục 18): 6 proton trong

vòng thơm: H6 ghép cặp ortho với H5 và ghép cặp metha với H8: 8,06 (1H, d, J =

8,0Hz, H5); 7,15 (1H, d, J = 1,5 Hz, H6); 7,23 (1H, d, J = 2,0Hz, H8); H3’, H5’

ghép cặp metha 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); H6’, H2’ ghép cặp metha:

7,42 (2H, d, J = 8,0 Hz, H6’, H2’); có một tín hiệu H trong vòng A δ 6.80 (1H; s,

H2); có một tín hiệu H anomeric 5,10 (1H, m, H1’’), phân tử có một gốc đường với

các tín hiệu H đường 3,70-3,73 (6H, m, H2’’, H3’’, H4’’, H5’’ , H6’’, H6’’).


lục 20), HSQC (Phụ lục 22), HMBC (Phụ lục 21): Có 7 cacbon –CH= trong vòng

thơm: δ 126,9 (C5), δ 115,6 (C6), δ 103,4 (C8), δ 130,0 (C2’), δ 115,0 (C3’), δ 115,0

(C5’), δ 130,0 (C6’). Có 3 C bậc ba, thơm, liên kết trực tiếp với oxi: δ 157,0 (C9), δ

157,2 (C4’), ), δ 161,3 (C7). Có 1 cacbon cabonyl: δ 174,7 (C4). Có 1 C thơm có H

liên kết trực tiếp với oxy: δ153,2 (C2). Có 2 C bậc 4 thơm: δ 118,5 (C10), δ 123,7

(C1’). Có 1 cacbon bậc 4 không thơm: δ 122,3 (C3). Có 6 C trong gốc đường: δ

100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ 69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).

So sánh phô chuẩn của GML1 với nghiên cứu sự phân lập daidzin [53, 55],

cho thấy GML1 là daidzin. Cấu trúc daidzin được đưa ra trong Hình 3.11.

106

Hình 3.11 Cấu trúc phân tử của GML1, C21H20O9

Danh pháp daidzin: 3-(4-hydroxyphenyl)-7-((2S,3R,4S,5S,6R)-3,4,5-

trihydroxy-6-(hydroxymethyl)tetrahydro-2H-pyran-2-yloxy)-4H-chromen-4-one

TÓM TẮT PHỔ

Cấu trúc GML1 được xác định bằng phương pháp đo phô 1H-NMR:

δ8,06 (1H, d, J = 8,0Hz, H5); δ 7,15 (1H, D, J = 1,5 Hz, H6); δ 7,23 (1H, d, J =

2,0Hz, H8); δ 6,84 ppm (2H, d, J = 6,5 Hz, H3’, H5’); δ 7,42 (2H, d, J = 8,0 Hz, H6’,

H2’); phô 13C-NMR (DMSO-d6, 125 Hz) kết hợp với phô DEPT, HSQC, HMBC:

δ153,2 (C2), δ 122,3 (C3), δ 174,7 (C4), δ 126,9 (C5), δ 115,6 (C6), δ 161,3 (C7), δ

103,4 (C8), δ 157,0 (C9), δ 118,5 (C10), δ 123,7 (C1’), δ 130,0 (C2’), δ 115,0 (C3’), δ

157,2 (C4’), δ 115,0 (C5’), δ 130,0 (C6’), δ 100,0 (C1’’), δ 73,1 (C2’’), δ 76,5 (C3’’), δ

69,6 (C4’’), δ 77,2 (C5’’), δ 60,6 (C6’’).

3.3.4.2. Xác đinh cấu trúc phân tử daidzin bằng phương pháp đo nhiễu xạ tia X

Cấu trúc daidzin còn được xác định bằng phương pháp đo nhiễu xạ tia X đơn

tinh thể: Dữ liệu nhiễu xạ đơn tinh thể của daidzin được đo trên máy Bruker D8

Quest (tại Khoa Hóa học, Trường Đại học Khoa Học Tự Nhiên, Hà Nội) ở nhiệt độ

100 K, đối âm cực Mo với bước sóng K = 0,71073 Å). Ảnh nhiễu xạ được ghi

trên detector huỳnh quang dạng đĩa trong đường kính 34 cm, khoảng cách từ tinh

thể đến detector là 10 cm. Quá trình xử lí số liệu và hiệu chỉnh sự hấp thụ tia X bởi

đơn tinh thể được thực hiện trên phần mềm chuẩn - Apex 2 của máy đo. Cấu trúc

được xác định theo phương pháp trực tiếp (direct method). Sử dụng phần mềm XT

tích hợp trong Olex2 để tính và tối ưu hoá cấu trúc. Vị trí của nguyên tử hidro được

xác định theo các thông số lý tưởng và được tính bằng phần mềm SHELXL.

Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu xạ

tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.

107

Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được

trình bày trong Phụ lục 44-50.

Hình 3.12 Cấu trúc phân tử của daidzin dưới dạng elipxoit với xác xuất 50%

Kết quả đo về độ dài liên kết, góc liên kết của hợp chất daidzin phù hợp giữa

lý thuyết và thực nghiệm (Ftt= 1,214 < F= 4,734). Kết quả đo độ dài các liên kết

đôi C=C trong daidzin trong khoảng 1,337 – 1,407 Å; liên kết C-C từ 1,509 – 1,530

Å. Các liên kết C=O thực nghiệm đo được đối với C7-O8 là 1,237 Å. Liên kết thực

nghiệm đo được đối với C3-O4 là 1,369 Å; đối với C5-O4 là 1,341 Å. Cấu trúc phân

tử Daidzin dưới dạng elipxoit với xác xuất 50% từ đậu nành (Hình 3.12).

3.3.5. Phân lập kaempferol-3-O-methylether từ gừng gió

3.3.5.1. Xác đinh cấu trúc kaempferol-3-O-methylether bằng phương pháp NMR

ZZL1 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. ZZL1 thu được

dưới dạng tinh thể, màu vàng, điểm nóng chảy 249 – 250 oC; sắc ký lớp mỏng

(TLC) triển khai bằng dung môi CHCl3 – MetOH (85:15) hiện màu bằng dung dịch

H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,3. Phô 1H-MNR (500

MHz, DMSO, δ ppm) (Phụ lục 34): có H trong nhân thơm: H6 và H8 ghép cặp

metha với nhau δ6,20 (1H, d, J = 2, H6) 6,44 (1H, d, J = 2, H8); H6’ ghép cặp metha

với H2’ và ghép cặp ortho với H5’ 7,93 (2H, d, H6’, H2’); H5’ ghép cặp metha với H3’

6,94 (2H, d, J = 9, H5’,H3’). Có một nhóm OH kiềm nối δ12,68 (1H, s, 5-OH), có 3

H của nhóm methyl 3,78 (3H, s, H11). Phô 13C-NMR (125MHz, δ ppm) (Phụ lục

35): có 1 C cacbonyl: 177,9 (C4); có 6 C thơm –CH=: 98,5 (C6); 93,7 (C8); 130,1

108

(C2’); 115,6 (C3’); 115,6 (C5’); 130,1 (C6’). Có 2 C thơm bậc 4: 104,2 (C10); 120,5

(C1’); có 6 C thơm bậc 3, liên kết trực tiếp với oxi: δ155,6 (C2); 137,6 (C3); 161,2

(C5); 164,1 (C7 ); 156,3 (C9); 160,1 (C4’); Tương tác của C và H có trong phô

HMBC (Phụ lục 37) và HSQC (Phụ lục 38): H6 - C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 -

C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ - C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’;

H6’ - C2 - C1’ - C2’ - C4’ - C5’.

Hình 3.13 Cấu trúc phân tử của ZZL1, C16H12O6

Danh pháp 5-hydroxy-2-(4-hydroxyphenyl)-7-methoxy-4H- benzopyran-4-

one. Phô tham khảo từ nghiên cứu sự phân lập kaempferol từ thân cây Costus

igneus rhizome (CiREE) của PazhanichamyKalailingam và cs [44] cho thấy ZZL1

là kaempferol- 3-O-methylether. Cấu trúc ZZL1 được đưa ra trong Hình 3.13.

TÓM TẮT PHỔ

Cấu trúc ZZL1 được xác định từ dữ liệu phô nghiệm: 1H-MNR (500 MHz,

DMSO, δ ppm): δ6,20 (1H, d, J = 2, H6); 6,44 (1H, d, J = 2, H8); 7,93 (2H, d, H6’,

H2’); 6,94 (2H, d, J = 9, H5’,H3’); 12,68 (1H, s, 5-OH); 3,78 (3H, s, H11). 13C-NMR

(125MHz, δ ppm): δ155,6 (C2); 137,6 (C3); 177,9 (C4); 161,2 (C5); 98,5 (C6); 164,1

(C7 ); 93,7 (C8); 156,3 (C9); 104,2 (C10); 120,5 (C1’); 130,1 (C2’); 115,6 (C3’); 160,1

(C4’); 115,6 (C5’); 130,1 (C6’).

Tương tác dị proton giữa C và H qua nhiều liên kết (HMBC) và qua một liên

kết (HSQC) đã giúp xác định được sự có mặt của các nguyên tố chính xác hơn: H6 -

C5 - C7 - C8 - C10; H8 -C6 - C7 - C9 - C10; H11 - C3; H2’ - C2 - C3’- C4’ - C6’; H3’ -C1’ -

C2’ - C4’ - C5’; H5’ - C1’ - C3’ - C4’- C6’; H6’ - C2 - C1’ - C2’ - C4’ - C5’.

109

3.3.5.2. Xác đinh cấu trúc kaempferol-3-O-methylether bằng phương pháp đo

nhiễu xạ tia X

Cấu trúc ZZL1 được xác định bằng phương pháp đo nhiễu xạ tia X đơn tinh

thể. Dữ liệu nhiễu xạ đơn tinh thể ZZL1 được đo tương tự như đối với hợp chất

daidzin. Kết quả nghiên cứu cấu trúc hợp chất chiết xuất bằng phương pháp nhiễu

xạ tia X đơn tinh thể cho phép xác định chính xác cấu trúc của hợp chất chiết xuất.

Thông tin về cấu trúc tinh thể cũng như quá trình tính toán và tối ưu cấu trúc được

trình bày trong phụ lục 51-57.

Liên kết đôi C=C theo lý thuyết có độ dài liên kết 1,33 Å. Kết quả đo nhiễu

xạ tia X đơn tinh thể C1=C2, C8=C10, C7=C14, C11=C13, C16=C22, C17=C18 có độ dài

thực nghiệm từ 1,360 đến 1,399 Å. Liên kết C – C thông thường có độ dài 1,54 Å,

kết quả thực nghiệm độ dài liên kết C1-C16 là 1,47 Å. Liên kết C=O có độ dài lý

thuyết là 1,20 Å. Kết quả thực nghiệm cho thấy độ dài C5-O6 là 1,264 Å. Liên kết

C-O có độ dài lý thuyết là 1,43 Å. Kết quả thực nghiệm cho thấy độ dài liên liên kết

C2-O3 là 1,3766 Å, liên kết O3-C4 là 1,445 Å, liên kết C8-O9 là 1,3489 Å, liên kết

C11-O12 là1,348 Å, liên kết C19-O20 là 1,362 Å.

Hình 3.14 Cấu trúc phân tử của ZZL1 dưới dạng elipxoit với xác xuất 50%

Các góc của Csp2 theo lý thuyết là 120o; ở đây kết quả đo X-ray cho kết quả

phù hợp. Các tham số cấu trúc: độ dài liên kết, góc liên kết của ZZL1 sau khi tối ưu

hóa được tính toán bằng phương pháp hóa lượng tử PM3 bằng Hyperchem phù hợp

110

với độ dài và góc từ phô chụp X-ray đơn tinh thể (Ftt = 1,280 < F4,567).

Điều đó cho thấy các kết quả đo về độ dài, về góc giữa lý thuyết và thực

nghiệm là hoàn toàn phù hợp. Cấu trúc phân tử kaempferol gừng gió dưới dạng

elipxoit với xác xuất 50% được chỉ ra trong Hình 3.14.

3.3.6. Phân lập kaempferol-3-O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) từ

gừng gió

ZZL2 được phân lập và tinh chế từ gừng gió theo mục 2.4.1. Hợp chất ZZL2

thu được dưới dạng bột vô định hình, màu vàng, nhiệt độ nóng chảy: 111-114 oC;

sắc kí lớp mỏng (SKLM) triển khai bằng hệ CHCl3 – MetOH (90 : 10) hiện màu

bằng dung dịch H2SO4 10% trong EtOH, cho vết tròn màu vàng có Rf = 0,42. Phô

Hình 3.15 Cấu trúc phân tử của ZZL2 (C25H24O12)

1H-MNR (500 MHz, DMSO, δ ppm) (Phụ lục 39): Có 6 H trong vòng thơm:

H6 và H8 ghép cặp metha δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2, H8); H3’

và H5’ ghép cặp metha δH 6,94 (2H, d, J = 8,5, H3’, H5’); H2’ và H6’ ghép cặp metha

δH 6,95 (2H, d, J = 8,5, H2’, H6’). Có H trong nhóm OH kiềm nối δH 12,53 (1H, d,

OH). Có 9 H trong nhóm methyl: δH 0,73 (3H, d, J = 6, H6’’); δH 1,98 (3H, s, H10’’);

δH 2,05 (3H, s, H8’’), dựa vào các tương tác C và H cho thấy hợp chất bị acetyl hoá

tại C2’’ và C4’’. Có 1 proton anome δH 5,40 (1H, d, J = 1, H1’’), xác nhận là đường

α. có 3 H trong –CH< trong phần đường kề oxy: δH 4,60(1H, t, J = 9,5, H4’’)’ δH

5,11 (2H, dd, J = 1,5 H3’’ và 3,5, H2’’) cho thấy ZZL2 có một đơn vị đường.

111


lục 41), HSQC (Phụ lục 43), HMBC (Phụ lục 42): Có 6 cacbon –CH= trong vòng

thơm: δC 98,8 (C6), δC 93,8 (C8), δC 129,9 (C2’); δC 114,2 (C3’); δC 130,5 (C2’, C6’); δC

115,4 (C3’, C5’). Có 2 cacbon bậc 4 trong vòng thơm: δC 104,0 (C10); δC 120,1 (C1’).

Có 4 cacbon thơm bậc 3 liên kết trực tiếp với oxy δC 156,5 (C9), δC 161,2 (C5), δC

164,3 (C7), δC 160,2 (C4’). Có 2 cacbon bậc 3 trong vòng A liên kết trực tiếp với oxi:

δC 157,4 (C2), δC 133,2 (C3). Có 1 cacbon cacbonyl δC 177,6 (C4). Có 3 cacbon

(CH3): δC 16,9 (C6’’); δC 20,4 (C8’’); δC 20,7 (C10’’ ); Có 2 cacbon cacbonyl trong

vòng đường: δC 169,7 (C7’’); δC 169,4 (C9’’). Có 5 cacbon trong vòng đường: δC 69,9

(C2’’); δC 67,8 (C3’’, C5’’); trong đó có 1 cacbon acetal δC 97,9 (C1’’).

So sánh dữ liệu phô của ZZL2 với nghiên cứu phân lập kaempferol-3-O-(2,4-

O-diacetyl-alpha-L-rhamnopyranoside cho thấy ZZL2 là kaempferol-3-O-(2,4-O-

diacetyl-alpha-L-rhamnopyranoside (Hình 3.15) [42].

Danh pháp: (3R,4S,6R)-2-(5,7-dihydroxy-2-(4-hydroxyphenyl)-4-oxo-4H-

chromen-3-yloxy)-4-hydroxy-6-methyltetrahydro-2H-pyran-3,5-diyl diacetate

TÓM TẮT PHỔ

Đối với hợp chất ZZL2 được xác định cấu trúc, với dữ liệu phô nghiệm: 1H-

MNR (500 MHz, DMSO, δ ppm): δH 6,22 (1H, d, J = 2, H6); δH 6,42 (1H, d, J = 2,

H8); δH 6,94 (2H, d, J = 8,5, H3’, H5’); δH 4,61(1H, t, J = 9,5, H4’); δH 7,15 (2H, d, J =

8,5, H2’, H6’): δH 12,54 (1H, d, OH). δH 5,40 (1H, d, J = 1, H1’); δH 0,74 (3H, d, J = 6,

H6’’); δH 1,98 (3H, s, H10’’); δH 2,05 (3H, s, H8’’). Tương tự, đối với phô 13C-NMR

(DMSO-d6, 125 Hz) với dữ liệu phô DEPT, HSQC, HMBC: δC 157,4 (C2), δC 133,2

(C3), δC 177,6 (C4); δC 161,2 (C5), δC 98,8 (C6), δC 164,3 (C7), δC 93,8 (C8), δC 156,5

(C9), δC 104,0 (C10); δC 120,1 (C1’); δC 129,9 (C2’); δC 114,2 (C3’); δC 160,2 (C4’); δC

130,5 (C2’, C6’); δC 115,4 (C3’, C5’); δC 97,9 (C1’’); δC 69,9 (C2’’); δC 67,8 (C3’’, C5’’);

δC 16,9 (C6’’); δC 169,7 (C7’’); δC 20,4 (C8’’); δC 169,4 (C9’’); δC 20,7 (C10’’ );

3.3.7. Thử hoạt tính sinh học in vitro của các hợp chất flavonoid tự nhiên

Các hợp chất flavonoid phân lập có tác động gây độc tế bào (GI50) ở nồng độ

cao 100 (µg/ml), tiếp tục khảo sát ở các nồng độ khác nhau Bảng 3.27. Với các hợp

112

chất GML1 POL1, CSL1, AIL1, ZZL1, và ZZL2 được phân lập từ actiso, xa kê,

đậu nành, tía tô và gừng gió.

Bảng 3.27 Phần trăm gây độc tế bào GI50 (µg/ml) của các mẫu khảo sát trên dòng tế

bào Hela ở các nồng độ khác nhau

Mẫu Nồng độ

(µg/ml)

Phần trăm gây độc tế bào (%)

Lần 1 Lần 2 Lần 3 TB ĐLC

CSL1

(cynaroside)

12 68,33 63,45 66,13 65,97 2,443

9 46,18 51,23 48,80 48,74 2,528

6 58,35 58,97 55,19 57,50 2,027

3 42,59 36,77 40,25 39,87 2,928

1 8,58 4,15 3,53 5,42 2,753

AIL1

(Quercetin)

12 70,05 62,22 68,30 66,86 4,109

9 83,00 79,37 82,78 81,72 2,033

6 65,83 61,43 70,35 65,87 4,459

3 36,82 40,25 42,53 39,87 2,876

1 -4,37 1,01 6,27 0,97 5,320

POL1

(luteolin)

9 56,01 50,67 54,28 53,65 2,721

6 57,10 54,82 58,38 56,77 1,803

3 40,09 31,61 34,32 35,34 4,331

1 12,79 10,43 5,70 9,64 3,610

0,1 -3,28 1,35 -4,10 -2,01 2,937

GML1

(daidzin)

9 55,23 56,61 55,99 55,94 0,695

6 38,07 39,13 42,19 39,79 2,141

3 28,08 34,64 34,44 32,39 3,730

1 -2,18 -3,03 10,95 1,91 7,836

0,1 56,01 50,67 54,28 53,65 2,721

ZZL1

(kaempferol-3-O

-methylether)

50 80,03 81,61 79,82 80,49 0,982

40 62,71 63,79 64,31 63,60 0,814

30 58,50 56,50 60,43 58,48 1,966

20 58,03 56,73 57,58 57,45 0,664

10 41,81 42,60 39,45 41,29 1,638

ZZL2

(kaempferol-3-O

-(2,4-O-diacetyl

-alpha-L

-rhamnopyranoside)

50 63,34 70,74 65,45 66,51 3,813

40 50,70 53,48 52,34 52,17 1,394

30 30,58 35,87 31,01 32,49 2,940

20 10,61 7,17 17,10 11,63 5,043

10 -0,87 -1,23 2,39 0,13 1,977

Dựa vào kết quả khảo sát ở Bảng 3.27, xây dựng đồ thị biểu diễn tỷ lệ (%)

gây độc tế bào. Từ đồ thị, nội suy giá trị nồng độ cho tỷ lệ gây độc tế bào 50%. Kết

quả nội suy giá trị GI50 (µg/ml) của các flavonoid phân lập từ actiso, xa kê, đậu

nành, tía tô và gừng gió được trình bày trong Bảng 3.28.

113

Bảng 3.28 Giá trị GI50 (µg/ml) và pGI50 của các mẫu flavonoid khảo sát từ thực

nghiệm in vitro

Flavonoid GI50 (µg/ml) GI50 (µM) pGI50

Lần 1 Lần 2 Lần 3 TB ± ĐLC TB TB

CSL1 4,41 4,79 4,96 4,72 ± 0,280 10,533 4,977

AIL1 4,36 4,38 3,81 4,18 ± 0,327 13,839 4,859

POL1 4,75 5,38 4,95 5,03 ± 0,321 17,584 4,755

GML1 8,09 7,87 7,70 7,88 ± 0,195 18,937 4,723

ZZL1 15,05 15,24 15,82 15,37 ± 0,401 51,223 4,291

ZZL2 39,65 38,03 38,90 38,86 ± 0,814 75,292 4,123 \

3.4. THIẾT KẾ VÀ DỰ BÁO HOẠT TINH CÁC FLAVONOID

3.4.1. Mô hình QESAR

Thiết kế phân tử flavone và isoflavone mới: thử nghiệm gắn các nhóm thế

vào các vị trí C6 và C3' trong khung phân tử của các chất mẫu flavone 1a, isoflavone

6b (phụ lục 4). Các hợp chất mới thiết kế được dự đoán hoạt tính kháng ung thư

pGI50 [115] bằng các mô hình QESARMLR và QESARANN.

5.80

5.85

5.90

5.95

6.00

6.05

6.10

6.15

6.20

fla-1a

(mẫu)

fla-1c fla-2c fla-3c fla-4c fla-5c

Hợp chất flavone

pG

I50

4.80

4.90

5.00

5.10

5.20

5.30

5.40

5.50

5.60

isofla-6b

(mẫu)

isofla-7c isofla-8c isofla-9c isofla-10c isofla-11c

Hợp chất isoflavone

pG

I50

Hình 3.16 Hoạt tính pGI50,pr dự đoán từ mô hình tuyến tính QESARMLR của các

flavone, isoflavone mới và chất mẫu

Chúng tôi chọn ra các chất mới có hoạt tính cao nhất tính toán điện tích của

các nguyên tử cho ở phụ lục 8, kết quả dự đoán thể hiện ở được trình bày ở Bảng

3.29, Hình 3.16. Như vậy, hợp chất mới thiết kế từ vị trí C6 và C3’ cho hoạt tính

sinh học pGI50 mạnh hơn chất mẫu flavone 1a, isoflavone 6b và hợp chất ZZL1,

ZZL2 phân lập.

114

Bảng 3.29 Hoạt tính pGI50 của các flavone và isoflavone mới được dự đoán từ mô

hình QESARMLR và QESARANN

Hợp chất Nhóm thế pGI50,pr

vị trí C6 vị trí C3' QESARMLR QESARANN

fla-1a [103] -H -H 5,954 5,709

fla-1c -OCH2CONHCH3 -OH 5,928 5,795

fla-2c -OCH2CONHCH3 -H 5,954 5,814

fla-3c -OCH2(CH3)C=NOH -OH 5,974 5,816

fla-4c -OH -OCH2CONHCH3 6,128 5,873

fla-5c -OH -OCH2CH3C=NOH 6,172 5,886

isofla-6b [103] -H -H 5,092 5,011

isofla-7c -OCH2CONHCH3 -OH 5,328 5,308

isofla-8c -OCH2CONHCH3 -H 5,367 5,341

isofla-9c -OCH2(CH3)C=NOH -OH 5,369 5,350

isofla-10c -OH -OCH2CONHCH3 5,502 5,452

isofla-11c -OH -OCH2CH3C=NOH 5,543 5,486

ZZL1 (*) -H -H 4,291(*) 4,291(*)

Flav-11(n) -OCH2CONHCH3 -OH 4,345 4,387


Flav-13(n) -OCH2(CH3)C=NOH -OH 4,963 4,960

Flav-14(n) -OH -OCH2CONHCH3 5,528 5,512

Flav-15(n) -OH -OCH2CH3C=NOH 5,530 5,513

ZZL2 (*) -H -H 4,123 (*) 4,123(*)



Flav-18(n) -OCH2(CH3)C=NOH -OH 4,615 4,870

Flav-19(n) -OH -OCH2CONHCH3 4,980 5,103

Flav-20(n) -OH -OCH2CH3C=NOH 5,100 5,231

115

(*) Giá trị thử nghiệm in vitro hoạt tính kháng ung thư trên tế bào Hela trong

nghiên cứu của chúng tôi.

Với ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-

O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.

Bằng các kỹ thuật tính toán cơ học phân tử, hóa lượng tử, hồi quy tuyến tính

và mạng thần kinh nhân tạo đã xây dựng mô hình quan hệ định lượng giữa cấu trúc

điện tử và hoạt tính sinh học kháng ung thư của nhóm flavone và isoflavone thành

công. Mô hình tuyến tính QESARMLR gồm 6 nguyên tử O1, O11, C3, C4, C6 và C7 và

mô hình nơ ron QESARANN có cấu trúc I(6)-HL(2)-O(1). Các mô hình tuyến tính đã

tìm được vị trí quan trọng C6 và C3’ để định hướng gắn thêm nhóm thế tạo ra các

hợp chất mới từ flavone, isoflavone và hợp chất ZZL1, ZZL2 phân lập có hoạt tính

cao hơn chất mẫu (Bảng 3.29).

3.4.2. Mô Hình QSDAR

Thiết kế phân tử flavone và isoflavone mới: Các cấu trúc của 12 flavone và

isoflavone mới được thiết kế từ các dẫn xuất mẫu flavone 22 và isoflavone 26 bằng

cách gắn thử nghiệm nhóm thế vào vị trí C6, C3 còn trống (Bảng 3.30).

Các giá trị hoạt tính pGI50 dự đoán từ các mô hình tuyến tính và mạng thần

kinh của các chất mới có hoạt tính cao hơn chất mẫu.

Tính toán hóa lượng tử, hồi quy tuyến tính và kỹ thuật thần kinh mờ đã được

sử dụng thành lập thành công mối quan hệ định lượng giữa hoạt tính kháng ung thư

pGI50 và độ dịch chuyển hóa học i của các nguyên tử oxy và cacbon từ dữ liệu phô

13C-NMR và 15O-NMR của các flavone và isoflavone. Mô hình tuyến tính

QSDARMLR với 7 biến số O1, O11, C2, C3, C6, C7 và C2’, mô hình mạng nơ ron

QSDARANN với cấu trúc I(7)-HL(2)-O(1) được sử dụng dự đoán chính xác hoạt tính

kháng ung thư của flavone và isoflavone trong nhóm kiểm tra. 18 dẫn xuất mới

được thiết kế từ vị trí C3, C6 và C7 còn trống của flavone 22 và isoflavone 26. Các

hoạt tính kháng ung thư dự đoán pGI50 của các dẫn xuất mới cao hơn flavone 22 và

isoflavone 26, tương ứng. Các mô hình QSDARMLR và QSDARANN đã phát triển là

tin cậy và có thể ứng dụng để dự đoán hoạt tính kháng ung thư pGI50.

116

Bảng 3.30 Hoạt tính pGI50 của flavone và isoflavone mới được thiết kế và dự đoán

từ mô hình QSDARMLR (M1) và QSDARANN (M2)

Cấu trúc phân tử Nhóm thế pGI50,pr

M1 M2

flavone 22 [103] 5,3570 5,2808

1b, R1 = Me 5,4157 5,8444

2b, R1 = C6H5 5,3669 5,7736

3b, R1 = p-F- C6H4 5,3855 5,8263

4b, R1 = Me 6,0412 6,0728

5b, R1 = C6H5 6,0063 6,0622

6b, R1 = p-F- C6H4 5,9579 6,0535

7b, R1 = Me 7,5843 5,9761

8b, R1 = C6H5 7,5843 5,9749

9b, R1 = p-F- C6H4 7,6042 5,9863

isoflavone 26 [103] 5,0698 5,08715

10b, R1 = Me 5,1145 5,1742

11b, R1 = C6H5 5,0957 5,1716

12b, R1 = p-F- C6H4 5,0973 5,1724

13b, R1 = Me 5,8170 5,4754

14b, R1 = C6H5 5,7985 5,4744

15b, R1 = p-F- C6H4 5,8204 5,4704

16b, R1 = Me 7,2093 5,2362

17b, R1 = C6H5 7,1880 5,2312

18b, R1 = p-F- C6H4 7,1716 5,2219

3.4.3. Mô hình QSSRMLR

Các nghiên cứu ở trên các mô hình tuyến tính và mạng thần kinh

(QESARMLR, QSDARMLR, QSSRMLR) đã được đánh giá, kiểm tra về độ tin cậy,

chúng tôi tiến hành dự đoán tính chất hóa lý cũng như hoạt tính của một số hợp chất

có trong tự nhiên chưa biết hoạt tính được đưa ra trong tài liệu của Đỗ Tất Lợi [3].

Các hợp chất bao gồm dữ liệu về cấu trúc được cho ở Hình 3.17 và Hình 3.18.

117

O

O

OH

OH

OH

MeO

OMe

Ramnazin

O

O

OH

OH

OH

OH

OMe

Isoramnetin

;

Hình 3.17 Cấu trúc dược chất trong cây nghể (Polygonum hydropiper) [2]

O

O

OH

OH

OMe

Woogonin (Scutelarin)

O

O

OH

RO

Baicalin (R là gốc acid)

O

O

OH

OH

OH

OMe

Scutelarein

O

O

OH

OH

OH

Baicalein

Hình 3.18 Cấu trúc dược chất trong cây hoàng cầm (Scutellaria baicalensis) [2]

118

Bảng 3.31 Tính chất hóa lý và giá trị hoạt tính kháng ung thư pGI50 của nhóm dẫn

xuất flavone và isoflavone tương tự được nghiên cứu từ mô hình QSSRMLR

Tính chất hóa lý và hoạt tính kháng ung thư pGI50 Phương Pháp

ARE,% QSSRMLR Tham khảo [15]

Mô hình QSSRMLR của fla-baicalein với R2tr = 0,970; R2

pr = 0,945; SE = 0,038

fla-baicalein = 0,01569 + 2,599 (fla-A3) – 1,607 (fla-A27)

Nhiệt chảy (Tm) ở 1 atm 920,448 927,250 0,734


Mô hình QSSRMLR của fla-baicalin với R2tr = 0,954 ; R2

pr = 0,876; SE = 0,042

fla-baicalin = 0,01421+ 0,685 (fla-A14) – 0,338 (fla-A29)



Mô hình QSSRMLR của fla-isoramnetin với R2tr = 0,901; R2

pr = 0,838; SE = 0,079

fla-isoramnetin = 0,02726 + 1,094 (fla-A1) + 0,921 (fla-A16) + -1,019 (fla-A26)



Mô hình QSSRMLR của fla-ramnazin với R2tr = 0,890; R2

pr = 0,840; SE = 0,081

fla-ramnazin = 0,02519+ 0,947 (fla-A10) – 0,884 (fla-A25) + 0,898 (fla-A28)



Mô hình QSSRMLR của fla-scutelarein với R2tr = 0,919; R2

pr = 0,840; SE = 0,055

fla-scutelarein = 0,02209 + 0,343 (fla-A6) + 0,617 (fla-A27)



Mô hình QSSRMLR của fla-woogonin với R2tr = 0,888; R2

pr = 0,859; SE = 0,074

fla-woogonin = 0,015+ 0,989 (fla-A7) -0,00236 (fla-A21)



119

Các hợp chất tự nhiên được xây dựng lại cấu trúc trên phần mềm

HyperChem. Tối ưu hóa cấu trúc phân tử bằng cơ học phân tử MM+ (mức gradient

0,05, thuật toán Polak- Ribiere). Tính toán các tham số điện tích nguyên tử bằng

hóa học lượng tử bán thực nghiệm SCF PM3 trong HyperChem. Tính chất hóa hóa

lý được xác định từ phương trình bán thực nghiệm từ ChemOffice [15].

Mô hình QSSRMLR được xây dựng tương tự như đã trình bày ở mục 3.2.4 kết

quả được cho ở Bảng 3.31, các mô hình hồi quy tuyến tính (QSSRMLR) đều có các

giá trị thống kê phù hợp.

Phân tích ANOVA một yếu tố chỉ ra rằng kết quả dự đoán tính chất hóa lý

của các dẫn xuất flavone và isoflavone từ mô hình QSSRMLR không khác các giá trị

tính chất hóa lý tham khảo (Ftt = 0,004 < F0,05 = 4,149). Giá trị ARE, % nhận được từ

các mô hình QSSRMLR nằm trong khoảng sai số của các phép đo thực nghiệm. Sự khác

nhau giữa các giá trị thực nghiệm và các giá trị dự đoán từ mô hình là không đáng kể. Xây

dựng mô hình QSSRMLR đã dự đoán thành công tính chất hóa lý của các hợp chất tự nhiên

có cấu trúc tương tự. Hoạt tính pGI50 của các hợp chất tự nhiên dự đoán từ mô hình

QSSRMLR, QESARMLR, QSDARMLR được cho ở Bảng 3.32.

Bảng 3.32 Giá trị pGI50,pr từ 3 mô hình QSSRMLR, QSEARMLR và QSDARMLR

Hợp chất QSSRMLR QESARMLR QSDARMLR

fla-baicalein 6,504 6,491 5,129

fla-baicalin 6,018 6,928 4,716

fla-isoramnetin 5,701 5,446 5,078

fla-ramnazin 5,416 5,872 5,175

fla-scutelarein 5,294 6,945 5,829

fla-woogonin 5,594 5,583 6,69

So sánh khả năng dự đoán hoạt tính kháng ung thư pGI50 của 3 mô hình

tuyến tính QSSRMLR, QSDARMLR và QESARMLR bằng phân tích ANOVA một yếu

tố. Sự khác nhau giữa 3 mô hình là không có ý nghĩa (F = 2,374 < F0,05 = 6,359).

Các mô hình QSSRMLR đã dự đoán thành công hoạt tính kháng ung thư của nhóm

hợp chất tự nhiên.

120

Bằng kỹ thuật phân tích hồi quy tuyến tính đa biến số, các mô hình QSSRMLR

(các phương trình từ 3.21 đến 3.26) được xây dựng dựa trên mối quan hệ cấu trúc

3D với nhau. Các tham số cấu trúc 3D bao gồm: LogP, ABSQ, ABSQon, Dipole;

MaxHp, MaxNeg, MaxQp, Ovality, Polarizability, SpcPolarizability, Surface,

Volume. Với các mô hình QSSRMLR xây dựng được, lần lượt thay thế giá trị nhiệt

độ nóng chảy của các hợp chất đã biết (biến độc lập x) ta dự báo được giá trị nhiệt

độ nóng chảy chưa biết của các hợp chất mục tiêu (biến phụ thuộc Y).

Các mô hình QSSRMLR (các phương trình từ 3.21 đến 3.26) của các hợp chất

flavonoid phân lập được sử dụng để dự đoán nhiệt độ nóng chảy của các hợp chất

phân lập Bảng 3.33. Nhiệt độ nóng chảy thực nghiệm được so sánh với giá trị dự

đoán với giá trị sai số trung bình MARE, % là 0,243 % cho thấy khả năng dự báo rất

tốt của các mô hình QSSRMLR.

Bảng 3.33 Nhiệt độ nóng chảy thực nghiệm và dự đoán từ mô hình QSSRMLR của

các dẫn xuất flavonoid chiết xuất.

Hợp chất Tm (oC) ARE, %

Thực nghiệm QSSRMLR QSSRMLR

CSL1 256,500 257,646 0,447

POL1 327,500 327,607 0,033

ZZL1 249,500 248,456 0,418

ZZL2 112,500 112,688 0,167

AIL1 315,000 315,236 0,075

GML1 247,000 247,789 0,319

MARE, % 0,243

Với GML1 là daidzin, POL1 là luteolin, CSL1 là cynaroside, AIL1 là

quercetin, ZZL1 là kaempferol-3-O-methylether và ZZL2 là kaempferol-3-O-(2,4-

O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô

và gừng gió.

Mô hình QSSRMLR của CSL1 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,00081

CSL1 = - 0,019 + 1,681(POL1) - 1,377(ZZL1) + 0,450(ZZL2) (3.21)

121

Mô hình QSSRMLR của AIL1 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,0001030

AIL1 = 0,095 - 0,424(CSL1) + 1,059(POL1) + 0,244(ZZL2) (3.22)

Mô hình QSSRMLR của GML1 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,000906

GML1 = 0,051 + 0,522(CSL1)+0,412(POL1) - 0,187(ZZL2) (3.23)

Mô hình QSSRMLR của POL1 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,00010

POL1 = 0,007 + 0,429(CSL1) + 1,120(ZZL1) - 0,329(ZZL2) (3.24)

Mô hình QSSRMLR của ZZL1 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,00014

ZZL1 = - 0,002 - 0,280(CSL1) + 0,812(POL1) + 0,218(ZZL2) (3.25)

Mô hình QSSRMLR của ZZL2 với R2tr = 0,999; R2

pr = 0,999; MSE = 0,0005345

ZZL2 = - 1,332 - 7,023(CSL1) + 11,524(POL1) - 5,900(AIL1)

3.4.4. Mô hình QSARMLR (3.16) và QSARANN (1)

Hoạt tính pGI50 của hợp chất ZZL1 và ZZL2 được dự đoán từ các mô hình

QSARMLR (3.16), phương trình 3.16 và QSARANN(1), được thể hiện trong Bảng 3.34.

So sánh khả năng dự báo của các mô hình QSARMLR (3.16) và QSARANN (1) qua giá

trị phần trăm sai số ARE,% (Bảng 3.34). Một lần nữa chúng tôi khẳng định rằng các

mô hình QSARMLR (3.16) và QSARANN (1) xây dựng theo mục 3.2.5 có khả năng dự

báo rất tốt hoạt tính kháng ung thư của các hợp chất tự nhiên.

Bảng 3.34 Hoạt tính sinh học pGI50 của hai hợp chất phân lập ZZL1, ZZL2 từ các

mô hình QSARMLR (3.16) và QSARANN(1)

Hợp chất pGI50,exp pGI50,pr ARE,%

QSARMLR (3.16) QSARANN(1) QSARMLR

(3.17)

QSARANN(1)

ZZL1 4,291 4,136 4,251 3,612 0,932

ZZL2 4,123 4,017 4,109 2,571 0,340

Trong công trình này, chúng tôi lựa chọn hợp chất phân lập là ZZL1, ZZL2

với các vị trí còn trống C6, C2’ và C3’ như là một hợp chất mẫu để thiết kế 10 hợp

chất mới, các vị trí C6, C2’ và C3’ được gắn các nhóm thế mới. Hoạt tính sinh học

pGI50 của các hợp chất mới thiết kế được dự đoán bằng mô hình QSARANN(1), được

đưa ra trong Bảng 3.35.

122

Bảng 3.35 Hoạt tính GI50 (µM) của 10 hợp chất mới nhận được từ mô hình

QSARANN(1

Hợp chất mới C6 C2’ C3’ pGI50 Phương ppháp

ZZL1 H H H 4,291 Công trình này

flav-1(n) H CH3 H 5,781 QSARANN(1)

flav-2(n) CH3CO- H OCH3 6,155 QSARANN(1)

flav-3(n) CH3CO- OCH3 H 6,158 QSARANN(1)

flav-4(n) CH3 OCH3 H 6,488 QSARANN(1)

flav-5(n) CH3 H OCH3 6,538 QSARANN(1)

Hợp chất mới C6 C2’ C3’ pGI50 Phương pháp

ZZL2 H H H 4,123 Công trình này

flav-6(n) H CH3 H 4,231 QSARANN(1)

flav-7(n) CH3 OCH3 H 4,634 QSARANN(1)

flav-8(n) CH3CO- H OCH3 4,639 QSARANN(1)

flav-9(n) CH3CO- OCH3 H 5,238 QSARANN(1)

flav-10(n) CH3 H OCH3 5,424 QSARANN(1)

Ký hiệu (n) là chất mới; ZZL1 là kaempferol-3-O-methylether và ZZL2 là

kaempferol-3-O-(2,4-O-diacetyl-alpha-l-rhamnopyranoside) phân lập từ gừng gió.

ZZL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)

2

3

4

5

6

7

pG

I 50

Hop chat flavonoid

ZZL2 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)

2

3

4

5

6

pG

I 50

Hop chat flavonoid

a) b)

Hình 3.19 Các giá trị pGI50 của hợp chất mới với hợp chất mẫu a) ZZL1, b) ZZL2

Kết quả dự đoán giá trị pGI50 của các hợp chất mới được chuyển đôi về giá

trị GI50 (µM) và so sánh với giá trị thực nghiệm của ZZL1, ZZL2 xem Hình 3.19.

Hoạt tính GI50 (µM) của 10 hợp chất mới bằng cách gắn nhóm thế vào các vị trí C6,

123

C2’ và C3’ của ZZL1 và ZZL2 cao hơn hợp chất mẫu tương ứng. Từ đây, các hợp

chất mới thiết kế hứa hẹn trong tông hợp các dược phẩm mới từ hợp chất tự nhiên.

3.4.5. Mô hình QSARMLR (3.17), QSARPCR và QSARPCA-ANN

Sau khi tách hai chất flavonoid luteolin và daidzin, hoạt tính sinh học pGI50

đã được tiến hành để kiểm tra độc tính in vitro đối với tế bào Hela trong phòng thí

nghiệm sinh học phân tử, trường đại học khoa học tự nhiên, TP. HCM.

Bảng 3.36 Hoạt tính sinh học pGI50 của nhóm kiểm tra và hai hợp chất phân lập

luteolin và daidzin từ các mô hình QSARMLR (3.18), QSARPCR và QSARPCA-ANN

Hợp chất pGI50.exp pGI50,pr ARE.%

M1 M2 M3 M1 M2 M3

luteolin 4,755 4,634 4,715 4,739 2,545 0,841 0,336

daidzin 4,723 4,671 4,729 4,692 1,101 0,127 0,656

(Với M1 là mô hình QSARMLR (3.17); M2 là mô hình QSARPCR; M3 là mô

hình QSARPCA-ANN).

POL1 flav-1(n) flav-2(n) flav-3(n) flav-4(n) flav-5(n)

2

3

4

5

6

7

pG

I 50

Hop chat flavonoid

GML1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)

2

3

4

5

6

7

pG

I 50

Hop chat flavonoid

a) b)

Hình 3.20 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu a)

POL1; b) GML1

Các hoạt tính sinh học pGI50 của các chất luteolin và daidzin tính toán từ các

mô hình QSARMLR (3.17) phương trình 3.17, QSARPCR và QSARPCA-ANN được trình

bày trong Bảng 3.3 . Trong nghiên cứu này, chúng tôi chọn luteolin với các vị trí

trống C6, C2' và C3' làm hợp chất mẫu để thiết kế 5 hợp chất mới khác nhau. Các vị

trí C6, C2' và C3' được gắn các nhóm thế mới.

124

Bảng 3.37 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới được dự đoán từ mô

hình QSARPCA-ANN )

Flavonoid C6 C2’ C3’ pGI50 Phương pháp

POL1 H H H 4.755 Công trình này

flav-1(n) H NO2 H 5,781 QSARPCA-ANN

flav-2(n) CH3CO- H NO2 6,155 QSARPCA-ANN

flav-3(n) CH3CO- NO2 H 6,158 QSARPCA-ANN

flav-4(n) NO2 NO2 H 6,488 QSARPCA-ANN

flav-5(n) NO2 H NO2 6,538 QSARPCA-ANN

Flavonoid C6 C2’ C3’ pGI50 Phương pháp

GML1 H H H 4.723 Công trình này

flav-6(n) H NO2 H 5,238 QSARPCA-ANN

flav-7(n) NO2 H H 5,413 QSARPCA-ANN

flav-8(n) CH3CO- H HO- 5,987 QSARPCA-ANN

flav-9(n) NO2 H H 6,176 QSARPCA-ANN

flav-10(n) HO- H NO2 6,376 QSARPCA-ANN

Với (n) là chất mới, GML1 là daidzin, POL1 là luteolin phân lập từ đậu

nành, tía tô.

Hoạt tính sinh học pGI50 của flavonoid mới thiết kế đã được dự đoán bằng

cách sử dụng mô hình QSARPCA-ANN như trong Bảng 3.37, Hình 3.20. Kết quả dự

đoán hoạt tính sinh học pGI50 đối với các chất mới được so sánh với hoạt tính thử

nghiệm của POL1 và GML1, như được mô tả trong Hình 3.20. Hoạt tính kháng ung

thư của năm hợp chất mới được thiết kế bằng cách gắn nhóm thế vào các vị trí C6,

C2' và C3 của luteolin mạnh hơn hoạt tính của POL1 và GML1. Các hợp chất mới

được thiết kế nhằm tạo ra các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên

có hoạt tính sinh học được cải thiện.

3.4.6. Mô hình QSARMLR (3.19 ), QSARPLS (3.20) và QSARANN(2)

Sau khi phân lập hai flavonoid cynarosid và quercetin, chúng tôi tiến hành

kiểm tra độc tính in vitro đối với tế bào Hela của chúng trong phòng thí nghiệm sinh

học phân tử, Trường Đại Học Khoa Học Tự Nhiên, TP. Hồ Chí Minh. Hoạt tính

125

pGI50 của hai flavonoid này cũng được dự đoán từ các mô hình QSARMLR (3.19),

QSARPLS và QSARANN (2), như trình bày trong Bảng 3.38.

Bảng 3.38 Hoạt tính pGI50 trong nhóm kiểm tra dự đoán từ các mô hình QSARMLR

(3.19), QSARPLS (3.20) và QSARANN (2)

Hợp chất pGI50,exp pGI50,pred ARE, %

M1 M2 M3 M1 M2 M3

CSL1 4,977 5,191 4,912 5,017 4,300 1,306 0,804

AIL1 4,859 4,681 4,675 4,740 3,663 3,787 2,449

Ký hiệu M1 là mô hình QSARMLR (3.19); M2 là mô hình QSARPLS (3.20);

M3 là mô hình QSARANN(2).

Trong nghiên cứu này, chúng tôi chọn quercetin flavonoid với các vị trí C6

và C3' còn trống làm hợp chất mẫu để thiết kế năm hợp chất mới. Các nhóm thế

được gắn vào hai vị trí trống C6 và C3’ , như thể hiện trong Bảng 3.38.

Bảng 3.39 Hoạt tính kháng ung thư pGI50 của 5 hợp chất mới thiết kế bằng cách gắn

nhóm thế vào vị trí C6, C3’ của quercetin, dự đoán từ mô hình QSARANN(2)

Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ pGI50 Phương pháp

AIL1 -H -H 4,859 Công trình này

Fla-1(n) -OCH2CONHCH3 -OH 5,382 M3

Fla-2(n) -OCH2CONHC6H4F -H 5,382 M3

Fla-3(n) -OH -OCH2CONHCH3 5,385 M3

Fla-4(n) -OCH2(CH3)C=NOH -OH 5,385 M3

Fla-5(n) -OCH2CONHC6H4OCH3 -H 5,385 M3

Flavonoid Nhóm thế ở C6 Nhóm thế ở C3’ pGI50 Phương pháp

CSL1 H H 4,977 Công trình này

flav-6(n) -OCH2CONHCH3 -OH 5,537 M3

flav-7(n) -OH -OCH2CONHCH3 5,612 M3

flav-8(n) -OCH2CONHC6H4F -H 5,613 M3

flav-9(n) -OCH2CONHC6H4OCH3 -H 5,635 M3

flav-10(n) -OCH2(CH3)C=NOH -OH 5,665 M3

126

Với (n) là chất mới; M3 là mô hình QSARANN(2); CSL1 là cynaroside, AIL1

là quercetin phân lập từ actiso, xa kê.

Các hợp chất được thiết kế mới cũng dự đoán với các hoạt tính sinh học

pGI50 sử dụng mô hình QSARANN (2). Sau đó, các hoạt tính dự báo pGI50 đã được

chuyển về dạng ban đầu GI50 (μM), như Bảng 3.39.

Các kết quả dự đoán pGI50 đối với các chất mới so sánh với hoạt tính thử

nghiệm của hợp chất AIL1 và CSL1 mẫu, trong (Hình 3.21). Do đó, các hợp chất

mới với nhóm thế ở vị trí C6 và C3' trong phân tử quercetin cho thấy hoạt tính mạnh

hơn GI50 (μM) so với mẫu. Ở đây, các hợp chất được thiết kế mới sẽ hứa hẹn đưa ra

một kế hoạch thiết kế cho các sản phẩm dược phẩm mới từ các sản phẩm tự nhiên.

AIL1 Fla-1(n) Fla-2(n) Fla-3(n) Fla-4(n) Fla-5(n)

2

3

4

5

6

7

pG

I 50

Hop chat flavonoid

CSL1 flav-6(n) flav-7(n) flav-8(n) flav-9(n) flav-10(n)

2

3

4

5

6

7

pG

I 50

Hop chat flavonoid

a) b)

Hình 3.21 So sánh giữa các giá trị pGI50 của năm flavonoid mới với chất mẫu

a) AIL1; b) CSL1

127

KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

Luận án đã đạt được các mục tiêu đề ra:

1) tính toán và sàng lọc được các tham số cấu trúc phân tử ảnh hưởng đến

hoạt tính kháng ung thư bao gồm: các tham số điện tích (O1, O11, C3, C4, C6 và C7),

các tham số độ dịch chuyển hóa học (O1, O11, C2, C3, C6, C7 và C2’); các tham số 2D

và 3D (xp8, ABSQ, SsOH, Hmaxpos, phia, knotp, knotpv, SHBa, LogP; MaxQp,

SdO, ka3, LogP, Ovality và SdssC)

2) Đã xây dựng được các mô hình QSAR có khả năng dự báo rất tốt hoạt tính

kháng ung thư gồm: mô hình QESARMLR, QESARANN, QSDARMLR, QSDARANN,

QSSRMLR, QSARMLR (3.16), QSARMLR (3.17), QSARPCA-ANN, QSARMLR (3.19),

QSARPLS (3.20), QSARANN(1), QSARANN(2).

3) Đã phân lập và sàng lọc được các dẫn xuất flavonoid có nguồn gốc tự

nhiên có hoạt tính kháng ung thư gồm 6 hợp chất daidzin, luteolin, cynaroside,

quercetin, kaempferol-3-O-methylether và kaempferol-3-O-(2,4-O-diacetyl-alpha-l-

rhamnopyranoside) phân lập từ actiso, xa kê, đậu nành, tía tô và gừng gió..

4) Đã thử nghiệm in vitro hoạt tính kháng ung thư của các dẫn xuất flavonoid

phân lập.

5) Đã đánh giá hoạt tính kháng ung thư, tính chất hóa lý, của các dẫn xuất

flavonoid của các dẫn flavonoid phân lập.

6) Đã nghiên cứu, thiết kế các dược chất mới bằng cách gắn các nhóm thế

quan trọng vào các vị trí phân tử ảnh hưởng lớn đến hoạt tính ung thư gồm các vị trí

C3, C6 và C7 và C3’ và các nhóm thế -OCH2CONHC6H4F; -

OCH2CONHC6H4OCH3; -OCH2(CH3)C=NOH; -OCH2CONHCH3; -

OCH2CH3C=NOH; CH3CO- ; -CH3 ; -OCH3; -NO2; -OH.

7) Đã sàng lọc được các hợp chất mới có hoạt tính kháng ung thư cao hơn

hợp chất ban đầu.

128

KIẾN NGHỊ

Những kết quả đạt được trong luận án đã mở ra những định hướng nghiên

cứu triển vọng có thể tiếp cận trong thời gian tới: 1) Mở rộng các kỹ thuật xây dựng

mô hình QSAR. 2) Tiến hành tông hợp các dẫn xuất flavonoid mới

129

DANH MỤC CÔNG TRÌNH

1. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van

Trung, Hoang Thi Kim Dung, Pham Van Tat (2015), "Prediction of

anticancer activities of luteolin flavonoid daidzin in leaf of plants Perilla

ocymoides L. flavonoid Glucine max L. using 2D, 3D descriptors", Viet Nam

Journal of Chemistry, 6e4(53), pp, 232-239.

2. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Vo Thanh Cong, Phung Van

Trung, Hoang Thi Kim Dung, Tran Duong, Pham Van Tat (2016),

"Anticancer agents of kaempferol-3-O-methylether flavonoid kaempferol-3-

O-(2,4-O-diacetyl-alpha-L-rhamnopyranoside) in leaf of plants Zingiber

zerumbet Sm. using 2D, 3D descriptors", Viet Nam Journal of Chemistry,

54(6), pp, 710-718.

3. Bui Thi Phuong Thuy, Nguyen Thi Ai Nhung, Tran Duong, Phung Van

Trung, Nguyen Minh Quang, Hoang Thi Kim Dung, Pham Van Tat, (2016),

"Prediction of anticancer activities of cynaroside flavonoid quercetin in leaf

of plants Cynara scolymus L. flavonoid Artocarpus incisa L. using structure–

activity relationship", Cogent Chemistry Taylor & Francis 2(1), pp, 1-12.

4. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần

Dương, Phạm Văn Tất (2017), "Nghiên cứu hoạt tính kháng ung thư của

kaempferol-1, daidzin từ Zingiber zerumbet Sm. và Glucine max L. sử dụng

các tham số mô tả phân tử 2D và 3D", Tạp Chí Khoa học và Công nghệ

Trường Đại học Khoa Học Huế: Khoa học Tự nhiên, pp. 1-10. (Đã có giấy

nhận đăng)

5. Bùi Thị Phương Thúy, Phùng Văn Trung, Hoàng Thị Kim Dung, Trần

Dương, Phạm Văn Tất (2017), " Dự báo hoạt tính kháng ung thư cô tử cung

của các hợp chất flavonoid phân lập từ Cynara scolymus L. Và Artocarpus

incisa L. Sử dụng mô hình QSAR 2D và 3D ", Tạp chí khoa học đại học

Huế, 126 (S 1D), pp. 1-9.

130

6. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,

Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "In silico Modelling of

2D, 3D Molecular Descriptors for Prediction Of Anticancer Activities Of

Luteolin And Daidzin From Plants Perilla ocymoides L and Glucine max L",

Organic & Medicinal Chemistry International Journal (OMCIJ), pp. 1-13.

ISSN: 2474-7610.

7. Pham Van Tat, Bui Thi Phuong Thuy, Tran Duong, Phung Van Trung,

Hoang Thi Kim Dung, Pham Nu Ngoc Han (2017), "Prediction Of

Anticancer Activities Of Kaempferol-3-O-Methylether And Kaempferol-3-

O-(2,4-O-Diacetyl-Alpha-L-Rhamnopyranoside) Isolating From Plant

Rhizome Zingiber Zerumbet Sm using QSDAR Models from 13C-NMR and

15O-NMR Simulation Spectra Data", Organic & Medicinal Chemistry

International Journal (OMCIJ), pp. 1-15. ISSN: 2474-7610.

8. Thuy, B.T.P., Chau, H.V., Dai, T.T., Nhung, N.T.A., Trung, P.V., Dung,

H.T.K., Duong, T., Tat, P.V. (2018), "Appreciation of cytotoxic activity on

hela cell of flavonoid derivatives using multiple linear regression and

artificial neural network", The 4th International Integated (Web & offline)

Conference & Concert on Convergence (IICCC2018) (ISSN 2384-4418), 4,

pp. 323-332.

131

TÀI LIỆU THAM KHẢO

1. Hồng, N.T. (2007), Các phương pháp phổ trong hóa hữu cơ, NXB Khoa học

và kỹ thuật,Hà Nội

2. Lợi, Đ.T. (2009), Những cây thuốc và vị thuốc Việt Nam,Hà Nội, NXB Khoa

học kỹ thuật.

3. Phụng, N.K.P. (2007), Phương pháp cô lập hợp chất hữu cơ ĐHQG-HCM

4. Phụng, N.K.P. (2005), Phổ NMR sử dụng trong phân tích hữu cơ, NXB ĐH

Quốc gia TP. HCM.

5. 6543Wang, D., Zhang, M., Li, Z., Song, C., Fu, M., Li, J., Chen, X. (2017),

"System impairment compensation in coherent optical communications by

using a bio-inspired detector based on artificial neural network and genetic

algorithm", Optics Communications, 399, pp. 1-12.

6. Avendaño, C.,Menéndez, J.C. (2015), Chapter 1 - General Aspects of

Cancer Chemotherapy, in Medicinal Chemistry of Anticancer Drugs (Second

Edition)Elsevier, Boston, pp. 1-22.

7. Balaga, H., Gupta, N.,Vishwakarma, D.N. (2015), "GA trained parallel

hidden layered ANN based differential protection of three phase power

transformer", International Journal of Electrical Power & Energy Systems,

67, pp. 286-297.

8. Barbour, L.J. (2017), 2.03 - Single-Crystal X-ray Diffraction A2 - Atwood,

Jerry L, in Comprehensive Supramolecular Chemistry IIElsevier, Oxford,

pp. 23-43.

9. Bastien, P., Vinzi, V.E.,Tenenhaus, M. (2005), "PLS generalised linear

regression", Computational Statistics & Data Analysis, 48(1), pp. 17-46.

10. Beheshti, A., Pourbasheer, E., Nekoei, M., Vahdani, S. (2016), "QSAR

modeling of antimalarial activity of urea derivatives using genetic algorithm–

multiple linear regressions", Journal of Saudi Chemical Society, 20(3), pp.

282-290.

132

11. Bharathi, S., Devasena, T., Arivarasan, A., Pachaiappan, R. (2016),

"Extraction and isolation of flavonoid quercetin from the leaves of trigonella

foenum-graecum and their anti-oxidant activity", International Journal of

Pharmacy and Pharmaceutical Sciences, 8(6).

12. Birt, D.F., Hendrich, S.,Wang, W. (2001), "Dietary agents in cancer

prevention: flavonoids and isoflavonoids", Pharmacology & Therapeutics,

90(2–3), pp. 157-177.

13. BMDPnewsystem2.0 (2003), Statistical Solutions Ltd.,USA.

14. Bodor, N.,Huang, M.J. (1992), "An extended version of a novel method for

the estimation of partition coefficients", J Pharm Sci, 81(3), pp. 272-281.

15. CambridgeSoftCorporation (2008), CS Chem3D Ultra,USA.

16. Cao, W., Wang, X., Ming, Z., Gao, J. (2017), "A review on neural networks

with random weights", Neurocomputing, pp. 1-50.

17. Chen, B., Zhang, T., Bond, T., Gan, Y. (2015), "Development of quantitative

structure activity relationship (QSAR) model for disinfection byproduct

(DBP) research: A review of methods and resources", Journal of Hazardous

Materials, 299, pp. 260-279.

18. Chen, I.L., Chen, J.Y., Shieh, P.C., Chen, J.J., Lee, C.H., Juang, S.H., Wang,

T.C. (2008), "Synthesis and antiproliferative evaluation of amide-containing

flavone and isoflavone derivatives", Bioorg Med Chem, 16(16), pp. 7639-

7645.

19. Christensen, L.P.,Christensen, K.B. (2014), Chapter 23 - The Role of Direct

and Indirect Polyphenolic Antioxidants in Protection Against Oxidative

Stress, in Polyphenols in Human Health and DiseaseAcademic Press, San

Diego, pp. 289-309.

20. Corcoran, M.P., McKay, D.L.,Blumberg, J.B. (2012), "Flavonoid basics:

chemistry, sources, mechanisms of action, and safety", J Nutr Gerontol

Geriatr, 31(3), pp. 176-189.

133

21. De Gregorio, M.,Giordano, M. (2017), "Background estimation by

weightless neural networks", Pattern Recognition Letters, 96, pp. 55-65.

22. Devillers, J. (1996), 1 - Strengths and Weaknesses of the Backpropagation

Neural Network in QSAR and QSPR Studies, in Neural Networks in QSAR

and Drug DesignAcademic Press, London, pp. 1-46.

23. El Zoghbi, M., Salameh, P., Stücker, I., Paris, C., Pairon, J.C., Gislard, A.,

Siemiatycki, J., Bonneterre, V., Clin, B., Brochard, P., Delva, F., Lacourt, A.

(2017), "Phenotypes of lung cancer and statistical interactions between

tobacco smoking and occupational exposure to asbestos and crystalline silica

from a large case-only study: The CaProMat study", Lung Cancer, 112, pp.

140-155.

24. Farid, M.M., Hussein, S.R., Ibrahim, L.F., El Desouky, M.A., Elsayed, A.M.,

El Oqlah, A.A., Saker, M.M. (2015), "Cytotoxic activity and phytochemical

analysis of Arum palaestinum Boiss", Asian Pacific Journal of Tropical

Biomedicine, 5(11), pp. 944-947.

25. Feliu, M.,Keiji, M. (1995), "IMOMM: A new integrated ab initio +

molecular mechanics geometry optimization scheme of equilibrium

structures and transition states", Journal of Computational Chemistry, 16(9),

pp. 1170–1179.

26. Fucic, A., Guszak, V.,Mantovani, A. (2017), "Transplacental exposure to

environmental carcinogens: Association with childhood cancer risks and the

role of modulating factors", Reproductive Toxicology, 72, pp. 182-190.

27. Galbas, M., Porzucek, F., Wozniak, A., Slomski, R., Selwet, M. (2013),

"Isolation of low-molecular albumins of 2S fraction from soybean (Glycine

max (L.) Merrill)", Acta Biochim Pol, 60(1), pp. 107-110.

28. Gasteiger, J.,Marsili, M. (1980), "Iterative partial equalization of orbital

electronegativity—a rapid access to atomic charges", Tetrahedron, 36(22),

pp. 3219-3228.

134

29. Ghahari, S., Alinezhad, H., Nematzadeh, G.A., Tajbakhsh, M., Baharfar, R.

(2017), "Chemical Composition, Antioxidant and Biological Activities of the

Essential Oil and Extract of the Seeds of Glycine max (Soybean) from North

Iran", Curr Microbiol, 74(4), pp. 522-531.

30. Ghamali, M., Chtita, S., Ousaa, A., Elidrissi, B., Bouachrine, M., Lakhlifi, T.

(2017), "QSAR analysis of the toxicity of phenols and thiophenols using

MLR and ANN", Journal of Taibah University for Science, 11(1), pp. 1-10.

31. Giau, L.H., Nha To, N.N., Thi, N.D.T., Quang That, T.Q., Phung, N.K.P.,

Nguyen, P.T.K., Duus, F. (2015), "Biological test against breast

adenocarcinoma cells (MCF-7) of acylated products of 3-methyl-4-

thiorhodanine", Journal of Science & Technology Development, 8(1), pp.

63-69.

32. Grce, M. (2009), "Primary and secondary prevention of cervical cancer",

Expert Rev Mol Diagn, 9(8), pp. 851-857.

33. Griffon, G., Merlin, J.L.,Marchal, C. (1995), "Comparison of sulforhodamine

B, tetrazolium and clonogenic assays for in vitro radiosensitivity testing in

human ovarian cell lines", Anticancer Drugs, 6(1), pp. 115-123.

34. Gründer, Y.,Lucas, C.A. (2016), "Surface X-ray diffraction studies of single

crystal electrocatalysts", Nano Energy, 29, pp. 378-393.

35. Hanh, N.T.M., Phung, N.K.P.,Phuong, Q.N.D. (2017), "Studying on

Tyrosinase Inhibition Activity of Some Vietnamese Folk Plants Aims to Use

in Skin-Whitening Cosmetics", American Journal of Plant Sciences, 8(6).

36. Harry, W. (1947), "Structural determination of paraffin boiling points",

Journal of the American Chemical Society, 69(1), pp. 17-20.

37. Hossain, M.A.,Mizanur, R.S.M. (2015), "Isolation and characterisation of

flavonoids from the leaves of medicinal plant Orthosiphon stamineus",

Arabian Journal of Chemistry, 8(2), pp. 218-221.

38. Hypercube, I. (2002), HyperChem computational chemistry, Hypercube, Inc.

135

39. Hypercube.Inc. (2008), HyperChem Release 8.03 for Windows, Gainesville,

Florida, USA.

40. INFormv2.0 (2000), Intelligentsys Ltd.,UK. .

41. Jalal, T.K., Ahmed, I.A., Mikail, M., Momand, L., Draman, S., Isa, M.L.,

Abdull Rasad, M.S., Nor Omar, M., Ibrahim, M., Abdul Wahab, R. (2015),

"Evaluation of antioxidant, total phenol and flavonoid content and

antimicrobial activities of Artocarpus altilis (breadfruit) of underutilized

tropical fruit extracts", Appl Biochem Biotechnol, 175(7), pp. 3231-3243.

42. Jang, D.S., Han, A.R., Park, G., Jhon, G.J., Seo, E.K. (2004), "Flavonoids

and aromatic compounds from the rhizomes of Zingiber zerumbet", Arch

Pharm Res, 27(4), pp. 386-389.

43. Jung, S.K.,McDonald, K. (2011), "Visual gene developer: a fully

programmable bioinformatics software for synthetic gene optimization",

BMC Bioinformatics, 12, pp. 340.

44. Kalailingam, P., Balasubramanian, K., Kannaian, B., Mohammed, A.K.N.,

Meenakshisundram, K., Tamilmani, E., R., K. (2013), "Isolation and

quantification of flavonoids from ethanol extract of Costus igneus rhizome

(CiREE) and impact of CiREE on hypoglycaemic, electron microscopic

studies of pancreas in streptozotocin (STZ)-induced diabetic rats",

Biomedicine & Preventive Nutrition, 3(3), pp. 285-297.

45. Kamdem, W.A.F., Coombes, P.H., Mulholland, D.A., Nkengfack, A.E.,

Fomum, Z.T. (2006), "Flavones and isoflavones from the west African

Fabaceae Erythrina vogelii", Phytochemistry, 67(5), pp. 459-463.

46. Keepers, Y.P., Pizao , P.E., Peters, G.J., Van Ark-Otte, J., Winograd, B.,

Pinedo, H.M. (1991), "Comparison of the sulforhodamine B protein and

tetrazolium (MTT) assays for in vitro chemosensitivity testing", European

Journal of Cancer and Clinical Oncology, 27(7), pp. 897-900.

47. Keyser, E.A., Staat, B.C., Fausett, M.B., Shields, A.D. (2012), "Pregnancy-

Associated Breast Cancer", Rev Obstet Gynecol, 5(2), pp. 94-99.

136

48. Kier, L., Hall, H.,Lowell (1991), The Molecular Connectivity Chi Indices

and Kappa Shape Indices in Structure-Property Modeling. Vol. 2. VCH

publishers New York

49. Kier, L., Hall, H.,Lowell (1986), Molecular connectivity in structure-activity

analysis Vol. 10. Wiley & Sons, Inc.

50. Konar,Amit (2005), Computational Intelligence, Springer.

51. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 2 Statistical Methods in

QSAR/QSPR, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in

Molecular Science, pp. 37-59.

52. Kunal, R., Supratik, K.,Rudra, N.D. (2015), Chapter 1 QSAR/QSPR

Methods, in A primer on QSAR/QSPR modeling - 2015SpringerBriefs in

Molecular Science, pp. 61-103.

53. Lapčík, O., Kle dus, B., Kokoška, L., Davidová, M., Afandi, K., Kubáň, V.,

Hampl, R. (2005), "Identification of isoflavones in Acca sellowiana and two

Psidium species (Myrtaceae)", Biochemical Systematics and Ecology,

33(10), pp. 983-992.

54. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line

concentration of flavonoids in Brassica oleracea by capillary electrophoresis

using large volume sample stacking", Food Chemistry, 133(1), pp. 205-211.

55. Li-ping, Q., Guo-rong, F., Jin-yong, P., He-ming, M. (2007), "Isolation of six

isoflavones from Semen sojae praeparatum by preparative HPLC",

Fitoterapia, 78(3), pp. 200-204.

56. López-Molina, D., Heering, H.A., Smulevich, G., Tudela, J., Thorneley,

R.N.F., Garcıa-Cánovas, F., Rodrıguez-López, J.N. (2003), "Purification and

characterization of a new cationic peroxidase from fresh flowers of Cynara

scolymus L", Journal of Inorganic Biochemistry, 94(3), pp. 243-254.

57. Lopez, C.S., Krauskopf, E., Villota, C.E., Burzio, L.O., Villegas, J.E. (2017),

"Cervical cancer, human papillomavirus and vaccines: assessment of the

137

information retrieved from general knowledge websites in Chile", Public

Health, 148, pp. 19-24.

58. Maresso, K.C.,Hawk, E. (2016), "Cancer Prevention Recommendations:

Impact of Adherence", Seminars in Oncology Nursing, 32(3), pp. 306-313.

59. Markham, K.R. (1975), Chapter 1 Isolation Techniques for Flavonoids, in

The FlavonoidsSpringer US, pp. 1-44.

60. Martin, J.F., Paul, A.B.,Martin, K. (1990), "A combined quantum

mechanical and molecular mechanical potential for molecular dynamics

simulations", Journal of Computational Chemistry, 11(6), pp. 700–733.

61. Molugaram, K.,Rao, G.S. (2017), Chapter 11 - ANOVA (Analysis of

Variance), in Statistical Techniques for Transportation

EngineeringButterworth-Heinemann, pp. 451-462.

62. Naik, P.P., Das, D.N., Panda, P.K., Mukhopadhyay, S., Sinha, N., Praharaj,

P.P., Agarwal, R., Bhutia, S.K. (2016), "Implications of cancer stem cells in

developing therapeutic resistance in oral cancer", Oral Oncology, 62, pp.

122-135.

63. P., B., V.V., S.,M., T. (2005), "PLS Generalised Regression. Computational

Statistics and Data Analysis" 48, pp. 17-46.

64. Pauwels, B., Korst, A.E., de Pooter, C.M., Pattyn, G.G., Lambrechts, H.A.,

Baay, M.F., Lardon, F., Vermorken, J.B. (2003), "Comparison of the

sulforhodamine B assay and the clonogenic assay for in vitro chemoradiation

studies", Cancer Chemother Pharmacol, 51(3), pp. 221-226.

65. Perez, R.P., Godwin, A.K., Handel, L.M., Hamilton, T.C. (1993), "A

comparison of clonogenic, microtetrazolium and sulforhodamine B assays

for determination of cisplatin cytotoxicity in human ovarian carcinoma cell

lines", Eur J Cancer, 29A(3), pp. 395-399.

66. QSARIS1.0 (2001), Statistical Solutions Ltd.,USA.

138

67. Raffa, D., Maggio, B., Raimondi, M.V., Plescia, F., Daidone, G. (2017),

"Recent discoveries of anticancer flavonoids", European Journal of

Medicinal Chemistry.

68. Rawat, P., Saroj, L.M., Kumar, A., Singh, T.D., Tewari, S.K., Pal, M.

(2016), "Phytochemicals and Cytotoxicity of Launaea procumbens on

Human Cancer Cell Lines", Pharmacogn Mag, 12(Suppl 4), pp. S431-S435.

69. Raza, A.,Zhong, M. (2017), "Lane-based short-term urban traffic forecasting

with GA designed ANN and LWR models", Transportation Research

Procedia, 25, pp. 1430-1443.

70. Rebecca, L.S., Kimberly, D.M.,Ahmedin, J. (2015), "Cancer Statistic, 2015",

CA: A Cancer journal for Clinicians, 65(1), pp. 5-29.

71. Rebecca, S., Deepa, N.,Ahmedin, J. (2012), "Cancer statistics, 2012", CA: A

Cancer journal for Clinicians, 62(1), pp. 10-29.

72. Roy, K.,Ambure, P. (2016), "The “double cross-validation” software tool for

MLR QSAR model development", Chemometrics and Intelligent Laboratory

Systems, 159, pp. 108-126.

73. Roy, K., Kar, S.,Das, R.N. (2015), Chapter 7 - Validation of QSAR Models,

in Understanding the Basics of QSAR for Applications in Pharmaceutical

Sciences and Risk AssessmentAcademic Press, Boston, pp. 231-289.

74. Sak, K. (2014), "Cytotoxicity of dietary flavonoids on different human

cancer types", Pharmacogn Rev, 8(16), pp. 122-146.

75. Sarawek, S., Feistel, B., Pischel, I., Butterweck, V. (2008), "Flavonoids of

Cynara scolymus possess potent xanthinoxidase inhibitory activity in vitro

but are devoid of hypouricemic effects in rats after oral application", Planta

Med, 74(3), pp. 221-227.

76. Sarkhosh, M., Khorshidi, N., Niazi, A., Leardi, R. (2014), "Application of

genetic algorithms for pixel selection in multivariate image analysis for a

QSAR study of trypanocidal activity for quinone compounds and design new

139

quinone compounds", Chemometrics and Intelligent Laboratory Systems,

139(Supplement C), pp. 168-174.

77. Sarosh, A.,Yun-Feng, D. (2016), "The GA-ANN expert system for mass-

model classification of TSTO surrogates", Aerospace Science and

Technology, 48, pp. 146-157.

78. Saxena, V.K.,Aprajita, G. (2008), "Isolation and study of the flavone

glycoside; luteolin-7- O-β-d-glucopyranoside from the seeds of the capparis

decidua (forsk)", International journal chemical sciences, 6(1), pp. 7-10.

79. Shan, Y. (2016), Chapter 4 - Isolation and Structural Identification of

Flavonoids From Citrus, in Comprehensive Utilization of Citrus By-

ProductsAcademic Press, pp. 59-64.

80. Si, Y.L., Jin, C.C., Li, Q.Y.S., Kang, C.Z. (2008), "QSAR, action mechanism

and molecular design of flavone and isoflavone derivatives with cytotoxicity

against HeLa", European Journal of Medicinal Chemistry, 43, pp. 2159-

2170.

81. Singh, M., Kaur, M.,Silakari, O. (2014), "Flavones: An important scaffold

for medicinal chemistry", European Journal of Medicinal Chemistry, 84, pp.

206-239.

82. Singh, S.K., Srivastava, K., Banerjee, R., Prasad, J. (2017), "Syntheses and

single crystal X-ray diffraction studies of hydroxynicotinic acid based

complexes involving supramolecular interactions", Polyhedron, 133, pp.

222-230.

83. Smalheiser, N.R. (2017), Chapter 11 - ANOVA, in Data LiteracyAcademic

Press, pp. 149-155.

84. Snedecor, G.,Cochran, W. (1967), Statistical methods, Oxford and IBH, New

Delhi.

85. Steppan, D.D., Werner, J.,Yeater, P.R. (2000), Essential Regression and

Experimental Design for Chemists and Engineers, USA.

140

86. Tat, P.V. (2009), Development of Quantitative Structure-Activity

Relationships (QSARs) and Quantitative Structure-Property Relationships

(QSPRs),Hanoi, NXB Natural Science and Technology.

87. Tat, P.V. (2009), "Prediction of thermodynamic properties of similar organic

compounds using artificial neural network", Vietnamese Journal of

Chemistry and Application, 4, pp. 611-616.

88. Tat, P.V. (2009 ), "Models QSAR of the group 6-aminoquinolone: new

anti-HIV agents", Vietnamese Journal of Chemistry and Application, 15, pp.

30-34

89. Tat, P.V. (2009), "QSDAR model: Quantitative Spectrum Data 13C-NMR

and 15O-NMR Activity Relationships (QSDAR) of a set of anti-cancer 3-

aminoflavonoid", Vietnamese Journal of Chemistry and Application, 14, pp.

43-46.

90. Tat, P.V. (2017), Development of new anticancer agents from Leaf of plants

in Viet Nam, LAP Lambert Academic Publishing. 01-80 trang.

91. Thavamani, B.S., Mathew, M.,Dhanabal, S.P. (2013), "In vitro cytotoxic

activity of menispermaceae plants against HeLa cell line", Anc Sci Life,

33(2), pp. 81-84.

92. Thuy, B.T.P.,Tat, P.V. (2012), "Development of QSDAR models for

anticancer flavone and isoflavone analogues Using 13C-NMR and 15O-

NMR", Viet Nam Journal of Chemistry, 50(5A), pp. 203-208.

93. Tomasz, P., Jerzy, L.,Mark, T.D.C. (2010), Recent Advances in QSAR

Studies Methods and Applications, springer.

94. Tong, J., Liu, S., Zhou, P., Wu, B., Li, Z. (2008), "A novel descriptor of

amino acids and its application in peptide QSAR", Journal of Theoretical

Biology, 253(1), pp. 90-97.

95. Torkashvand, A.M., Ahmadi, A.,Nikravesh, N.L. (2017), "Prediction of

kiwifruit firmness using fruit mineral nutrient concentration by artificial

141

neural network (ANN) and multiple linear regressions (MLR)", Journal of

Integrative Agriculture, 16(7), pp. 1634-1644.

96. Ventriglia, J., Paciolla, I., Pisano, C., Cecere, S.C., Di Napoli, M., Tambaro,

R., Califano, D., Losito, S., Scognamiglio, G., Setola, S.V., Arenare, L.,

Pignata, S., Della Pepa, C. (2017), "Immunotherapy in ovarian, endometrial

and cervical cancer: State of the art and future perspectives", Cancer

Treatment Reviews, 59, pp. 109-116.

97. Verma, R.P.,Matthews, E.J. (2015), "Estimation of the chemical-induced eye

injury using a Weight-of-Evidence (WoE) battery of 21 artificial neural

network (ANN) c-QSAR models (QSAR-21): Part II: Corrosion potential",

Regulatory Toxicology and Pharmacology, 71(2), pp. 331-336.

98. Vichai, V.,Kirtikara, K. (2006), "Sulforhodamine B colorimetric assay for

cytotoxicity screening", Nat Protoc, 1(3), pp. 1112-1116.

99. Viens, L.J., Clouston, S.,Messina, C.R. (2016), "Women's autonomy and

cervical cancer screening in the Lesotho Demographic and Health Survey

2009", Social Science & Medicine, 150, pp. 23-30.

100. Vreven, T., Byun, K.S., Komáromi, I., Dapprich, S., Montgomery, J.A.,

Morokuma, K., Frisch, M.J. (2006), "Combining Quantum Mechanics

Methods with Molecular Mechanics Methods in ONIOM", Journal of

Chemical Theory and Computation, 2(3), pp. 815-826.

101. Wang, G., Luo, H.,Peng, K. (2016), "Quality-related fault detection using

linear and nonlinear principal component regression", Journal of the

Franklin Institute, 353(10), pp. 2159-2177.

102. Wang, J., Wang, W., Kollman, P.A., Case, D.A. (2006), "Automatic atom

type and bond type perception in molecular mechanical calculations",

Journal of Molecular Graphics and Modelling, 25(2), pp. 247-260.

103. Wang, T.C., Chen, I.L., Lu, P., Wong, C., Liao, C., Tsiao, K., Chang, K.,

Chen, Y., Tzeng, C. (2005), "Synthesis, antiproliferative, and antiplatelet

142

activities of oxime- and methyloxime-containing flavone and isoflavone

derivatives", Bioorganic & Medicinal Chemistry, 13(21), pp. 6045-6053.

104. Wang, Y., Xu, K., Lin, L., Pan, Y., Zheng, X. (2007), "Geranyl flavonoids

from the leaves of Artocarpus altilis", Phytochemistry, 68(9), pp. 1300-

1306.

105. Weirong, C., Xiaohong, G.,Jian, T. (2010), "Extraction, Purification, and

Characterisation of the Flavonoids from Opuntia milpa alta Skin", Czech

Journal of Food Sciences, 28(2), pp. 108–116.

106. Wold, S. (1995), "PLS for multivariate linear modelling. In: van de

Waterbeemd H. (ed.), QSAR: Chemometric Methods in Molecular Design",

Wiley-VCH, Weinheim, Germany, 2, pp. 195-218.

107. XLSTATversion2014.4.08 (2014), XLSTAT Tutorials, Copyright

Addinsoft,U.S.A.

108. Yang, C., Chen, H., Lu, S., Zhang, M., Tian, W., Wang, M., Zhang, L.,

Song, Y., Shen, A., Zhou, Y., Zhu, J., Zheng, C. (2016), "Structural

modification of luteolin from Flos Chrysanthemi leads to increased tumor

cell growth inhibitory activity", Bioorganic & Medicinal Chemistry Letters,

26(15), pp. 3464-3467.

109. Yoshizawa, T., Hashimoto, H., Shimizu, T., Yamabe, M., Shichijo, N.,

Hanada, K., Hirano, H., Sato, M. (2011), "Purification, crystallization and X-

ray diffraction study of basic 7S globulin from soybean", Acta Crystallogr

Sect F Struct Biol Cryst Commun, 67(Pt 1), pp. 87-89.

110. Zhang, Y. (2014), "An improved QSPR method based on support vector

machine applying rational sample data selection and genetic algorithm-

controlled training parameters optimization", Chemometrics and Intelligent

Laboratory Systems, 134, pp. 34-46.

111. 2014.4.08, X.v. (2014), Copyright Addinsoft 1995-2014,U.S.A.

143

112. Basu, P., Mittal, S., Bhadra Vale, D., Chami Kharaji, Y. "Secondary

Prevention of Cervical Cancer", Best Practice & Research Clinical

Obstetrics & Gynaecology.

113. Lee, I.S.L., Boyce, M.C.,Breadmore, M.C. (2012), "Extraction and on-line

concentration of flavonoids in Brassica oleraceaby capillary electrophoresis

using large volume sample stacking", Food Chemistry, 133, pp. 205-2011.

114. R.P., V.,E.J., M. (2015), "Estimation of the chemical-induced eye injury

using a weight-of-evidence (WoE) battery of 21 artificial neural network

(ANN) c-QSAR models (QSAR-21): Part I: Irritation potential", Regulatory

Toxicology and Pharmacology, 71(2), pp. 318-330.

115. StatisticalSolutionsLtd (2011), TOXSYS 1.3, USA.

144

PHỤ LỤC

Phụ lục 1a. Hoạt tính pGI50 của nhóm dẫn xuất mẫu flavone và isoflavone

a) b)

Khung cấu trúc: a) flavone và b) isoflavone

Hợp chất Khung hợp chất Vị trí thế Nhóm thế R pGI50

FLA1 flavone C3 -OCH2CCH3=NOH 5,6990



ISOFLA4 isoflavone C7 -OCH2CCH3=NOH 5,0088

FLA5 flavone C3 -OCH2CCH3=NOCH3 5,6990



ISOFLA8 isoflavone C7 -OCH2CCH3=NOCH3 5,0706

FLA9 flavone C3 -OCH2C(C6H5)=NOH 5,7447

FLA10 flavone C3 -OCH2C(4-F-C6H4)=NOH 5,6778

FLA11 flavone C3 -OCH2C(4-CH3O-C6H4)=NOH 5,6990







ISOFLA18 isoflavone C7 -OCH2C(C6H5)=NOH 5,0458

ISOFLA19 isoflavone C7 -OCH2C(4-F-C6H4)=NOH 5,1079

ISOFLA20 isoflavone C7 -OCH2C(4-CH3O-C6H4)=NOH 5,1192

FLA21 flavone C3 -OCH2C(C6H5)=NOCH3 5,7959

FLA22 flavone C3 -OCH2C(4-F-C6H4)=NOCH3 5,6990

FLA23 flavone C3 -OCH2C(4-CH3O-C6H4)=NOCH3 5,6990


145






ISOFLA30 isoflavone C7 -OCH2C(C6H5)=NOCH3 5,0862

ISOFLA31 isoflavone C7 -OCH2C(4-F-C6H4)=NOCH3 5,1938

ISOFLA32 isoflavone C7 -OCH2C(4-CH3O-C6H4)=NOCH3 5,1367

Phụ lục 1b. Điện tích nguyên tử trên khung phân tử flavone và isoflavone

Hợp chất O1 C2 C3 C4 C5 C6 C7 C8

Fla-1 -0,093 0,156 -0,117 0,327 0,018 -0,159 -0,029 -0,154

146

Fla-2 -0,096 0,187 -0,331 0,358 -0,088 0,064 -0,078 -0,114

Fla-3 -0,102 0,181 -0,321 0,364 0,051 -0,202 0,179 -0,253

Isofla-4 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251

Fla-5 -0,093 0,155 -0,116 0,326 0,017 -0,159 -0,029 -0,154

Fla-6 -0,097 0,186 -0,330 0,358 -0,038 0,062 -0,125 -0,113

Fla-7 -0,102 0,181 -0,322 0,364 0,051 -0,202 0,179 -0,253

isofla-8 -0,081 0,072 -0,178 0,369 0,054 -0,201 0,180 -0,251

Fla-9 -0,091 0,153 -0,113 0,334 0,018 -0,161 -0,028 -0,155

Fla-10 -0,091 0,154 -0,113 0,334 0,019 -0,161 -0,027 -0,155

Fla-11 -0,091 0,153 -0,112 0,334 0,018 -0,161 -0,028 -0,155

Fla-12 -0,097 0,185 -0,330 0,358 -0,036 0,061 -0,129 -0,113

Fla-13 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113

Fla-14 -0,096 0,187 -0,332 0,360 -0,093 0,064 -0,076 -0,115

Fla-15 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258

Fla-16 -0,103 0,181 -0,321 0,364 0,051 -0,200 0,177 -0,257

Fla-17 -0,103 0,180 -0,321 0,365 0,050 -0,200 0,178 -0,258

isofla-18 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255

isofla-19 -0,082 0,071 -0,177 0,369 0,054 -0,199 0,178 -0,255

isofla-20 -0,082 0,072 -0,178 0,370 0,054 -0,200 0,179 -0,255

Fla-21 -0,094 0,150 -0,088 0,338 0,017 -0,162 -0,030 -0,159

Fla-22 -0,094 0,151 -0,088 0,338 0,017 -0,161 -0,030 -0,159

Fla-23 -0,092 0,153 -0,111 0,334 0,018 -0,161 -0,028 -0,155

Fla-24 -0,097 0,185 -0,330 0,358 -0,037 0,061 -0,129 -0,113

Fla-25 -0,097 0,186 -0,330 0,358 -0,036 0,060 -0,129 -0,113

Fla-26 -0,097 0,185 -0,330 0,358 -0,037 0,062 -0,129 -0,113

Fla-27 -0,099 0,182 -0,323 0,365 0,053 -0,252 0,178 -0,206

Fla-28 -0,103 0,181 -0,321 0,364 0,050 -0,200 0,177 -0,257

Fla-29 -0,103 0,180 -0,320 0,365 0,050 -0,200 0,179 -0,258

isofla-30 -0,082 0,072 -0,179 0,370 0,054 -0,200 0,179 -0,255

isofla-31 -0,082 0,071 -0,178 0,369 0,054 -0,200 0,178 -0,255

isofla-32 -0,082 0,072 -0,179 0,370 0,053 -0,200 0,179 -0,255 a

C9 C10 O11 C1' C2' C3' C4' C5' C6'

Fla-1 0,127 -0,231 -0,344 -0,073 -0,054 -0,122 -0,071 -0,120 -0,070

147

Fla-2 0,092 -0,186 -0,365 -0,078 -0,047 -0,118 -0,070 -0,116 -0,064

Fla-3 0,172 -0,266 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,066

Isofla-4 0,147 -0,271 -0,366 0,003 -0,081 -0,113 -0,097 -0,114 -0,118

Fla-5 0,127 -0,231 -0,343 -0,072 -0,054 -0,122 -0,072 -0,120 -0,071

Fla-6 0,091 -0,187 -0,359 -0,078 -0,048 -0,117 -0,070 -0,116 -0,065

Fla-7 0,172 -0,266 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,066

isofla-8 0,147 -0,272 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118

Fla-9 0,130 -0,235 -0,367 -0,073 -0,030 -0,136 -0,072 -0,126 -0,069

Fla-10 0,130 -0,236 -0,369 -0,073 -0,032 -0,135 -0,072 -0,125 -0,069

Fla-11 0,130 -0,235 -0,368 -0,073 -0,029 -0,136 -0,073 -0,126 -0,070

Fla-12 0,089 -0,188 -0,359 -0,077 -0,048 -0,118 -0,071 -0,116 -0,065

Fla-13 0,091 -0,187 -0,359 -0,078 -0,048 -0,117 -0,070 -0,116 -0,065

Fla-14 0,090 -0,186 -0,368 -0,078 -0,048 -0,118 -0,070 -0,116 -0,064

Fla-15 0,172 -0,268 -0,369 -0,075 -0,049 -0,117 -0,071 -0,116 -0,066

Fla-16 0,172 -0,267 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,067

Fla-17 0,171 -0,268 -0,369 -0,075 -0,066 -0,116 -0,072 -0,117 -0,049

isofla-18 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118

isofla-19 0,147 -0,272 -0,366 0,002 -0,081 -0,113 -0,097 -0,114 -0,118

isofla-20 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118

Fla-21 0,129 -0,230 -0,363 -0,061 -0,050 -0,122 -0,077 -0,121 -0,080

Fla-22 0,128 -0,230 -0,363 -0,062 -0,050 -0,122 -0,076 -0,121 -0,080

Fla-23 0,131 -0,234 -0,367 -0,067 -0,029 -0,133 -0,077 -0,127 -0,073

Fla-24 0,089 -0,188 -0,360 -0,077 -0,048 -0,118 -0,071 -0,116 -0,065

Fla-25 0,090 -0,187 -0,359 -0,077 -0,065 -0,116 -0,071 -0,117 -0,048

Fla-26 0,089 -0,188 -0,360 -0,077 -0,065 -0,116 -0,071 -0,118 -0,048

Fla-27 0,169 -0,268 -0,371 -0,077 -0,049 -0,118 -0,071 -0,116 -0,065

Fla-28 0,172 -0,267 -0,368 -0,076 -0,049 -0,117 -0,071 -0,116 -0,067

Fla-29 0,171 -0,268 -0,369 -0,075 -0,049 -0,116 -0,072 -0,116 -0,067

isofla-30 0,147 -0,273 -0,367 0,003 -0,081 -0,113 -0,098 -0,114 -0,118

isofla-31 0,147 -0,272 -0,367 0,003 -0,081 -0,113 -0,097 -0,114 -0,118

Phụ lục 2. i của 13C-NMR và 15O-NMR trên khung phân tử flavone và isoflavone


Fla-1 302,7 152,3 164,7 180,4 133,5 134,4 134,1 128,7

Fla-2 279,8 157,6 118,4 176,0 130,1 172,5 129,1 130,8

148

Fla-3 276,8 159,2 117,2 174,5 132,6 129,7 170,9 125,2

Isofla-4 285,5 174,4 121,2 183,3 134,2 129,5 171,2 125,5

Fla-5 303,7 152,2 164,6 180,3 133,1 134,6 133,9 129,0

Fla-6 279,1 159,9 115,7 178,0 129,5 172,3 133,1 131,9

Fla-7 277,0 160,2 115,9 175,3 133,1 129,3 171,4 124,8

isofla-8 315,4 176,1 119,4 184,6 131,7 130,3 174,0 126,5

Fla-9 301,6 152,6 163,8 181,1 134,2 134,3 134,4 128,5

Fla-10 306,6 152,4 165,4 180,2 134,2 134,3 134,4 128,4

Fla-11 304,5 152,7 164,2 180,3 134,3 134,1 134,4 128,3

Fla-12 277,3 160,6 114,7 178,6 129,8 171,5 133,5 131,4

Fla-13 275,3 161,3 113,5 179,9 130,2 172,1 134,2 131,4

Fla-14 292,8 159,1 117,1 173,7 128,7 172,3 128,7 131,3

Fla-15 268,5 160,1 114,9 177,7 133,0 129,4 171,8 124,7

Fla-16 281,2 161,4 114,2 175,4 132,5 129,2 171,6 124,8

Fla-17 283,4 161,9 113,3 175,4 132,2 129,3 171,8 124,9

isofla-18 287,5 175,2 120,2 183,7 134,1 128,9 171,4 125,0

isofla-19 289,8 175,6 120,0 184,1 134,1 129,0 171,8 125,1

isofla-20 291,1 176,0 119,1 184,8 134,2 128,9 172,3 124,8

Fla-21 291,0 152,4 161,2 181,7 135,1 132,8 134,9 126,9

Fla-22 291,7 152,2 162,3 181,5 135,3 132,8 135,1 126,9

Fla-23 300,4 154,5 161,5 182,8 134,9 134,0 135,9 128,1

Fla-24 276,5 160,7 114,5 178,9 130,0 171,2 133,7 131,2

Fla-25 274,5 161,5 113,3 180,1 130,4 171,7 134,4 131,2

Fla-26 279,0 163,0 111,4 180,3 130,8 171,2 135,7 130,9

Fla-27 287,3 159,2 117,4 171,6 132,6 132,2 169,6 124,7

Fla-28 279,5 161,8 113,7 176,0 133,0 128,7 171,9 124,3

Fla-29 277,8 162,3 112,4 176,9 133,2 128,6 172,4 124,1

isofla-30 286,8 175,3 120,0 183,8 134,3 128,7 171,4 124,8

isofla-31 298,7 176,5 118,7 185,3 133,6 129,0 173,0 125,1

isofla-32 291,7 175,8 119,4 184,5 133,9 129,0 172,1 125,0 a

C9 C10 O11 C1' C2' C3' C4' C5' C6'

Fla-1 165,7 129,9 828,2 129,8 134,6 132,6 133,5 133,9 135,3

Fla-2 166,1 133,6 768,6 127,1 135,1 130,8 136,0 133,5 137,2

Fla-3 169,1 131,9 736,3 126,3 135,3 129,4 136,8 133,0 138,3

Isofla-4 166,7 132,0 810,1 132,4 135,6 133,7 129,9 137,8 135,8

149

Fla-5 165,5 130,2 829,7 130,1 134,3 132,8 133,4 134,2 135,3

Fla-6 167,3 129,6 759,8 124,4 137,0 127,4 138,3 131,8 140,1

Fla-7 169,8 131,0 734,4 125,1 135,9 127,9 137,8 132,4 139,7

isofla-8 169,4 130,9 768,0 138,7 136,9 132,3 118,4 143,7 135,0

Fla-9 165,7 129,3 829,3 128,4 133,4 130,7 133,1 133,2 134,8

Fla-10 166,0 129,6 806,2 128,4 133,3 130,6 133,2 133,2 135,1

Fla-11 166,1 129,2 805,0 128,2 133,4 130,4 133,2 133,0 135,1

Fla-12 167,8 128,4 759,1 123,4 137,9 126,2 139,1 131,1 141,0

Fla-13 168,0 127,7 777,3 122,3 138,7 124,9 140,2 130,5 142,2

Fla-14 167,2 134,3 697,0 126,2 134,8 128,7 136,9 133,1 139,1

Fla-15 169,6 130,6 804,7 124,6 136,6 127,1 139,0 132,3 140,4

Fla-16 170,1 130,7 734,3 123,9 136,2 125,8 139,5 132,1 141,7

Fla-17 170,5 130,7 730,4 123,3 142,8 132,0 140,2 124,8 136,0

isofla-18 167,8 131,3 789,1 134,8 134,9 134,9 126,7 140,0 134,6

isofla-19 168,0 131,1 791,2 135,5 135,0 135,0 125,7 140,7 134,5

isofla-20 168,8 130,5 786,0 137,2 134,6 135,6 123,3 142,2 133,7

Fla-21 165,4 126,8 838,3 126,7 135,2 130,1 134,0 132,1 135,4

Fla-22 165,5 126,8 836,8 126,5 135,2 130,0 134,2 132,1 135,6

Fla-23 166,9 128,1 829,6 126,2 134,0 128,5 135,3 132,1 137,2

Fla-24 168,0 128,1 759,0 123,1 138,2 125,9 139,3 130,9 141,2

Fla-25 168,2 127,4 776,6 122,1 142,4 130,3 140,3 124,6 139,0

Fla-26 169,4 126,5 754,5 120,4 144,7 129,5 141,9 122,2 139,5

Fla-27 167,2 132,7 680,5 127,0 134,0 129,3 136,3 133,6 138,5

Fla-28 170,6 130,1 734,0 123,3 136,8 125,2 139,9 131,6 142,2

Fla-29 171,0 129,6 746,7 122,3 137,0 123,8 140,9 131,2 143,4

isofla-30 168,0 131,1 787,5 135,2 134,6 135,2 126,4 140,3 134,4

isofla-31 169,3 130,3 781,4 138,5 135,1 135,1 120,8 143,5 133,6

isofla-32 168,6 130,8 784,0 136,8 134,8 135,2 123,7 141,9 134,0

Phụ lục 3. Giá trị R2tr theo sự thay đôi của cấu trúc mạng và số vòng lặp

QESARneural

Vòng luyện(B)

k = 6 R2tr

Cấu trúc mạng(A) 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

I(6) - HL(1) - O(1) 89,96 90,03 90,16 89,31 89,79 89,05 89,97 89,00 90,52 88,95

150

I(6) - HL(2) - O(1) 88,25 88,48 90,97 89,92 90,39 91,19 90,32 89,67 89,65 90,48

I(6) - HL(3) - O(1) 89,89 88,19 88,31 89,52 89,44 91,79 83,70 88,42 89,42 88,37

I(6) - HL(4) - O(1) 86,90 89,35 89,97 91,62 89,87 89,16 85,07 89,62 88,66 89,15

I(6) - HL(5) - O(1) 86,03 89,67 85,36 90,26 83,75 87,47 83,96 87,55 87,90 88,93

I(6) - HL(6) - O(1) 90,04 87,25 86,00 87,23 82,66 86,22 89,83 88,45 89,46 88,40

QESARneural

Vòng luyện(B)

k = 6 R2tr

Cấu trúc mạng(A) 11000 12000 13000 14000 15000 16000 17000 18000 19000 20000

I(6) - HL(1) - O(1) 90,64 90,36 90,32 90,38 90,46 90,27 88,81 90,20 90,66 89,75

I(6) - HL(2) - O(1) 88,75 89,66 83,94 86,97 88,71 90,29 89,45 87,23 91,53 90,72

I(6) - HL(3) - O(1) 89,19 86,99 90,29 86,42 83,44 89,47 82,18 86,14 88,96 85,42

I(6) - HL(4) - O(1) 85,83 87,16 88,78 91,61 90,04 86,37 87,01 90,48 89,52 89,49

I(6) - HL(5) - O(1) 88,22 90,66 84,10 87,47 82,30 88,03 85,63 86,05 85,65 89,83

I(6) - HL(6) - O(1) 83,80 86,60 88,48 88,52 85,37 87,70 81,51 89,58 90,30 89,92

151

Phụ lục 4. Hoạt tính pGI50 ức chế phát triển tế bào của dẫn xuất flavone và

isoflavone

Thứ tự Hợp chất Vị trí thế Nhóm thế pGI50

Nhóm chất luyện (a)

fla-1a flavone C3-R2 -OCH2CCH3=NOH 5,699

fla-2a flavone C7-R1 -OCH2CCH3=NOH 5,699

isofla-3a isoflavone C7-R1 -OCH2CCH3=NOH 5,009

fla-4a flavone C3-R2 -OCH2CCH3=NOCH3 5,699



isofla-7a isoflavone C7-R1 -OCH2CCH3=NOCH3 5,071

fla-8a flavone C3-R2 -OCH2C(4-F-C6H4)=NOH 5,678

fla-9a flavone C3-R2 -OCH2C(4-CH3O-C6H4)=NOH 5,699

fla-10a flavone C6-R1 -OCH2C(4-F-C6H4)=NOH 5,796



isofla-13a isoflavone C7-R1 -OCH2C(C6H5)=NOH 5,046

isofla-14a isoflavone C7-R1 -OCH2C(4-F-C6H4)=NOH 5,108

isofla-15a isoflavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOH 5,119

fla-16a flavone C3-R2 -OCH2C(C6H5)=NOCH3 5,796

fla-17a flavone C3-R2 -OCH2C(4-F-C6H4)=NOCH3 5,699

fla-18a flavone C3-R2 -OCH2C(4-CH3O-C6H4)=NOCH3 5,699







isofla-25a isoflavone C7-R1 -OCH2C(C6H5)=NOCH3 5,086

isofla-26a isoflavone C7-R1 -OCH2C(4-F-C6H4)=NOCH3 5,194

Nhóm chất kiểm tra (b)

fla-1b flavone C6-R1 -OCH2CCH3=NOH 5,921

fla-2b flavone C3-R2 -OCH2CC6H5=NOH 5,745

152



fla-5b flavone C7-R1 -OCH2C(4-F-C6H4)=NOH 5,699

isofla-6b isoflavone C7-R1 -OCH2C(4-CH3O-C6H4)=NOCH3 5,137

153

Phụ lục 5. Giá trị thống kê của mô hình QESARlinear (với k = 5, 6, 7) biến số

GIÁ TRỊ

k = 5 k = 6 k = 7

Hệ số Pvalue Hệ số Pvalue Hệ số P

hằng số -0,933 0,6875 6,712 0,01067 4,714 0,003568

O1 -101,21 0,0002 -42,31 0,0009

C2 -15,43 0,0019

C3 3,014 0,00771

C4 -6,874 0,0088 -19,04 0,00979 -60,07 0,000001

C5 -7,969 0,00002

C6 6,612 0,00004 20,88 0,000002

C7 4,604 0,00067

C8 16,9 0,000499

C9 95,42 0,000017

O11 -8,159 0,03877 -32,8 0,000077

C2 -24,47 0,000396

C3' -16,12 0,0218

C6' -25,42 0,000141

154

Phụ lục 6. Giá trị thực nghiệm pGI50 và cấu trúc của flavone và isoflavone

Cấu trúc phân tử Nhóm thế pGI50

1a: R=OH, R1 = Me 5,699

2(a1): R= OH, R1 = C6H5 5,745

3: R= OH, R1 = p-F- C6H4 5,678

4: R= OH, R1 = p-OMe- C6H4 5,699

5(a2): R= Me, R1 = Me 5,699

6(a3): R= Me, R1 = C6H5 5,796

7: R= Me, R1 = p-F- C6H4 5,699

8: R= Me, R1 = p-OMe- C6H4 5,699

9(a4): R=OH, R2 = Me 5,921

10: R= OH, R2 = C6H5 6,097

11: R= OH, R2 = p-F- C6H4 5,796

12: R= OH, R2 = p-OMe- C6H4 6,000

13: R= Me, R2 = Me 6,046

14: R= Me, R2 = C6H5 5,62

15: R= Me, R2 = p-F- C6H4 5,638

16: R= Me, R2 = p-OMe- C6H4 5,699

17: R=OH, R3 = Me 5,699

18: R= OH, R3 = C6H5 5,699

19: R= OH, R3 = p-F- C6H4 5,699

20(a5): R= OH, R3 = p-OMe- C6H4 5,699

21(a6): R= Me, R3 = Me 5,658

22: R= Me, R3 = C6H5 5,181

23: R= Me, R3 = p-F- C6H4 5,569

24: R= Me, R3 = p-OMe- C6H4 5,602

25: R=OH, R3 = Me 5,009

26: R= OH, R3 = C6H5 5,046

27: R= OH, R3 = p-F- C6H4 5,108

28: R= OH, R3 = p-OMe- C6H4 5,119

29: R= Me, R3 = Me 5,071

30: R= Me, R3 = C6H5 5,086

31: R= Me, R3 = p-F- C6H4 5,194

32: R= Me, R3 = p-OMe- C6H4 5,137

155

Phụ lục 7. Giá trị thống kê của mô hình QSDARlinear (với k = 5, 6, 7) biến số

Biến số

xk

QSDARlinear P

k = 5 k = 6 k = 7 k = 5 k = 6 k = 7

Hệ số 14,4590 37,0550 32,9900 0,0000 0,0002 0,0005

O1 0,0000 0,0140 0,0160 0,9907 0,0858 0,0177

O11 0,0040 0,0080 0,0060 0,2083 0,0204 0,0052

C2 - - -0,0450 - - 0,0002

C3 - -0,0580 -0,0630 - 0,0106 0,0002

C4 -0,0680 -0,0780 - 0,0275 0,0054 -

C6 0,0060 -0,0590 -0,0470 0,4354 0,0235 0,0351

C7 -0,0050 -0,0750 -0,0590 0,5294 0,0086 0,0175

C2' - - -0,0370 - - 0,0306

156

Phụ lục 8. Điện tích nguyên tử của 10 dẫn xuất thiết kế từ mô hình QESAR


fla-1c -0,094 0,184 -0,325 0,358 -0,091 0,055 -0,069 -0,114

fla-2c -0,095 0,189 -0,333 0,360 -0,091 0,056 -0,069 -0,114

fla-3c -0,095 0,181 -0,324 0,358 -0,091 0,062 -0,075 -0,115

fla-4c -0,095 0,185 -0,326 0,357 -0,101 0,084 -0,076 -0,111

fla-5c -0,096 0,180 -0,321 0,356 -0,101 0,084 -0,077 -0,111

isofla-7c -0,073 0,087 -0,193 0,368 -0,090 0,058 -0,068 -0,110

isofla-8c -0,074 0,079 -0,187 0,365 -0,089 0,057 -0,068 -0,111

isofla-9c -0,074 0,086 -0,194 0,367 -0,090 0,064 -0,074 -0,111

isofla-10c -0,074 0,086 -0,192 0,368 -0,099 0,085 -0,074 -0,106

isofla-11c -0,075 0,084 -0,189 0,366 -0,098 0,085 -0,075 -0,107

C9 C10 O11 C1' C2' C3' C4' C5' C6'

fla-1c 0,095 -0,188 -0,367 -0,036 -0,098 0,121 -0,181 -0,069 -0,110

fla-2c 0,095 -0,187 -0,370 -0,080 -0,047 -0,118 -0,069 -0,116 -0,063

fla-3c 0,091 -0,187 -0,365 -0,034 -0,098 0,121 -0,182 -0,069 -0,111

fla-4c 0,089 -0,181 -0,364 -0,039 -0,098 0,100 -0,165 -0,076 -0,107

fla-5c 0,089 -0,181 -0,360 -0,036 -0,092 0,092 -0,170 -0,076 -0,106

isofla-7c 0,069 -0,192 -0,371 0,050 -0,189 0,121 -0,140 -0,071 -0,164

isofla-8c 0,069 -0,192 -0,367 0,005 -0,084 -0,113 -0,098 -0,112 -0,119

isofla-9c 0,065 -0,191 -0,369 0,051 -0,189 0,121 -0,141 -0,072 -0,165

isofla-10c 0,064 -0,187 -0,372 0,043 -0,182 0,094 -0,132 -0,075 -0,159

isofla-11c 0,064 -0,187 -0,367 0,043 -0,182 0,101 -0,138 -0,076 -0,161

157

Phụ lục 9. i của 13C-NMR và 15O-NMR 12 dẫn xuất thiết kế từ mô hình QSDAR

flavone O1 C2 C3 C4 C5 C6 C7 C8

1b 268,4 156,7 119,5 177,1 132,5 170,4 129,3 128,3

2b 268,7 156,9 119,4 177,4 132,7 170,9 129,4 128,5

3b 273,9 157,4 119,4 176,7 132,5 171,3 129,3 128,8

4b 264,7 155,8 120,0 176,7 135,8 132,7 134,9 127,1

5b 265,2 155,8 120,1 176,9 136,0 132,5 135,2 127,1

6b 265,5 155,6 120,1 176,9 136,1 132,4 135,3 127,0

C9 C10 O11 C1' C2' C3' C4' C5' C6'

1b 166,6 131,4 769,4 127,5 135,7 133,1 133,8 133,4 134,7

2b 166,6 131,5 770,8 127,5 136,0 133,0 133,9 133,5 134,8

3b 166,7 131,7 753,5 127,5 136,0 132,8 134,0 133,4 135,0

4b 168,5 129,1 762,4 129,6 131,0 171,9 130,1 136,4 134,1

5b 168,7 129,2 763,2 129,8 131,1 172,5 130,2 136,7 134,2

6b 168,8 129,1 765,0 129,9 131,0 173,0 130,1 136,9 134,4

Isoflavone O1 C2 C3 C4 C5 C6 C7 C8

7b 281,9 173,2 120,9 184,4 133,9 170,4 129,4 128,5

8b 282,2 173,5 120,8 184,6 134,0 170,9 129,5 128,8

9b 286,9 173,7 120,9 184,5 133,8 171,4 129,4 129,0

10b 281,0 172,8 121,0 182,6 136,6 132,7 134,7 127,7

11b 281,3 172,8 121,1 182,6 136,7 132,8 134,7 127,7

12b 282,2 172,9 121,1 182,5 136,7 132,8 134,7 127,7

C9 C10 O11 C1' C2' C3' C4' C5' C6'

7b 164,0 131,9 829,2 130,9 133,7 134,5 132,6 135,6 135,5

8b 164,0 132,0 831,0 131,2 133,6 134,9 132,3 135,9 135,4

9b 164,0 132,1 826,9 131,2 133,5 135,0 132,3 136,0 135,5

10b 165,6 129,4 795,6 134,3 131,0 173,2 127,5 135,7 135,3

11b 165,7 129,5 794,2 134,5 131,1 173,8 127,6 135,9 135,4

12b 165,8 129,5 790,5 134,6 131,0 174,4 127,6 136,0 135,5

158

Phụ lục 10a. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC pGI50 x0 x1 x2 xp3 xp4 xp5 xp6 xp7

fla1 5,6990 16,2338 11,2027 9,6198 8,3885 6,7154 5,6544 3,9683 3,0036

fla2 5,9210 16,2338 11,1690 9,8006 8,2488 6,4631 5,5899 3,7583 2,8146

fla3 5,6990 16,2338 11,1690 9,8006 8,2419 6,5192 5,4483 3,8584 2,8334

fla4 5,0090 16,2338 11,1859 9,6922 8,3913 6,6096 5,4563 3,7446 2,7668

fla5 5,6990 16,9409 11,7027 10,0002 8,4730 7,1484 5,7643 4,0118 3,0428

fla6 6,0460 16,9409 11,6690 10,1811 8,3333 6,8961 5,6998 3,7928 2,9011

fla7 5,6580 16,9409 11,6690 10,1811 8,3265 6,9522 5,5581 3,8929 2,9199

fla8 5,0710 16,9409 11,6859 10,0726 8,4758 7,0426 5,5661 3,7791 2,8533

fla9 5,7450 19,3467 13,7752 11,6728 10,4104 8,8196 7,2239 4,7433 3,6955

fla10 5,6780 20,2170 14,1690 12,2946 10,8211 8,9713 7,4480 5,0651 3,8478

fla11 5,6990 20,9241 14,7070 12,4637 11,2293 9,2819 7,5583 5,2393 4,0901

fla12 6,0970 19,3467 13,7415 11,8536 10,2707 8,5672 7,1412 4,6211 3,4566

fla13 5,7960 20,2170 14,1354 12,4755 10,6814 8,7189 7,3652 4,9428 3,6089

fla14 6,0000 20,9241 14,6734 12,6446 11,0896 9,0295 7,4755 5,1171 3,8512

fla15 5,6990 19,3467 13,7415 11,8536 10,2638 8,6234 6,9995 4,7212 3,4717

fla16 5,6990 20,2170 14,1354 12,4755 10,6745 8,7751 7,2235 5,0429 3,6240

fla17 5,6990 20,9241 14,6734 12,6446 11,0828 9,0857 7,3338 5,2171 3,8663

fla18 5,0460 19,3467 13,7584 11,7452 10,4132 8,7137 7,0075 4,6074 3,4051

fla19 5,1080 20,2170 14,1522 12,3671 10,8239 8,8654 7,2315 4,9291 3,5574

fla20 5,1190 20,9241 14,6902 12,5362 11,2322 9,1760 7,3418 5,1033 3,7997

fla21 5,7960 20,0538 14,2752 12,0532 10,5455 9,0329 7,5004 4,9047 3,8180

fla22 5,6990 20,9241 14,6690 12,6751 10,9562 9,1846 7,7244 5,2354 3,9152

fla23 5,6990 21,6312 15,2070 12,8442 11,3644 9,4952 7,8347 5,4096 4,1691

fla24 5,6200 19,3467 13,7415 11,8536 10,2707 8,5672 7,1412 4,6211 3,4566

fla25 5,6380 20,9241 14,6354 12,8559 10,8165 8,9323 7,6417 5,1042 3,7236

fla26 5,6990 21,6312 15,1734 13,0250 11,2247 9,2429 7,7520 5,2784 3,9775

fla27 5,1800 20,0538 14,2415 12,2341 10,3989 8,8368 7,2760 4,8735 3,6415

fla28 5,5690 20,9241 14,6354 12,8559 10,8096 8,9885 7,5000 5,2042 3,7387

fla29 5,6020 21,6312 15,1734 13,0250 11,2179 9,2991 7,6103 5,3784 3,9926

fla30 5,0860 20,0538 14,2584 12,1256 10,5483 8,9271 7,2840 4,7597 3,5749

fla31 5,1940 20,9241 14,6522 12,7475 10,9590 9,0788 7,5080 5,0904 3,6721

fla32 5,1370 21,6312 15,1902 12,9166 11,3672 9,3894 7,6183 5,2647 3,9260

CYNA 5,3260 23,1540 15,1888 14,3658 12,6969 10,2554 7,9789 6,0359 4,1744

LUTE 5,2980 15,1459 9,9524 9,6278 7,9232 6,8274 5,1656 3,9721 2,4808

KEM1 4,8130 15,8530 10,5072 9,7420 8,2254 7,3578 5,6141 4,2904 2,7435

KAEM2 4,4100 27,0158 17,4553 16,9885 13,1777 11,7282 9,7847 7,0298 5,2259

QUER 5,3790 16,0161 10,3799 10,0368 8,6116 7,1320 5,5473 4,1134 2,8022

DAID 5,1030 21,4135 14,3842 13,2004 11,9491 9,4219 7,6571 5,4352 3,8552

159

Phụ lục 10b. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC xp8 xp9 xp10 xc3 xpc4 xch6 xv0 xv1 xv2

fla1 2,1333 1,4731 0,8540 1,2227 3,2999 0,2308 12,5224 7,1204 5,0756

fla2 2,0930 1,5239 0,9367 1,3646 3,1692 0,2257 12,5224 7,1084 5,1228

fla3 2,0555 1,5682 0,9388 1,3646 3,1652 0,2257 12,5224 7,1084 5,1228

fla4 2,0689 1,4976 0,9326 1,2907 3,2783 0,2257 12,5224 7,1013 5,1264

fla5 2,2318 1,5306 0,9152 1,2227 3,2154 0,2308 13,4835 7,5112 5,2494

fla6 2,1424 1,5491 1,0067 1,3646 3,0846 0,2257 13,4835 7,4992 5,2967

fla7 2,1031 1,6083 0,9683 1,3646 3,0807 0,2257 13,4835 7,4992 5,2967

fla8 2,1166 1,5364 0,9699 1,2907 3,1937 0,2257 13,4835 7,4921 5,3003

fla9 2,6400 1,8728 1,2234 1,2674 3,7987 0,3328 14,9092 8,7810 6,1530

fla10 2,6462 1,8999 1,2792 1,5560 4,2070 0,3141 15,2098 8,8807 6,2939

fla11 2,7942 1,9204 1,2976 1,4715 4,2915 0,3141 16,2401 9,3041 6,5155

fla12 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 8,7691 6,2003

fla13 2,4954 1,9147 1,2585 1,6979 4,0763 0,3090 15,2098 8,8687 6,3412

fla14 2,6434 1,9310 1,2993 1,6134 4,1608 0,3090 16,2401 9,2921 6,5628

fla15 2,4836 1,8432 1,2829 1,4092 3,6640 0,3277 14,9092 8,7691 6,2003

fla16 2,4865 1,8917 1,3063 1,6979 4,0723 0,3090 15,2098 8,8687 6,3412

fla17 2,6345 1,9080 1,3471 1,6134 4,1568 0,3090 16,2401 9,2921 6,5628

fla18 2,4944 1,7872 1,2585 1,3354 3,7771 0,3277 14,9092 8,7620 6,2039

fla19 2,4974 1,8357 1,2819 1,6241 4,1854 0,3090 15,2098 8,8617 6,3448

fla20 2,6454 1,8520 1,3227 1,5395 4,2699 0,3090 16,2401 9,2850 6,5664

fla21 2,7974 1,9892 1,2846 1,2674 3,7499 0,3328 15,8702 9,1719 6,3269

fla22 2,8890 2,0055 1,3404 1,5560 4,1582 0,3141 16,1708 9,2715 6,4677

fla23 2,9807 2,0940 1,3589 1,4715 4,2427 0,3141 17,2011 9,6949 6,6894

fla24 2,4925 1,8663 1,2344 1,4092 3,6680 0,3277 14,9092 8,7691 6,2003

fla25 2,6892 1,9880 1,3286 1,6979 4,0275 0,3090 16,1708 9,2596 6,5150

fla26 2,7809 2,0723 1,3693 1,6134 4,1120 0,3090 17,2011 9,6830 6,7366

fla27 2,5901 1,9422 1,3123 1,4092 3,6152 0,3277 15,8702 9,1599 6,3741

fla28 2,6785 1,9798 1,3358 1,6979 4,0235 0,3090 16,1708 9,2596 6,5150

fla29 2,7701 2,0642 1,3766 1,6134 4,1080 0,3090 17,2011 9,6830 6,7366

fla30 2,6009 1,8849 1,2957 1,3354 3,7283 0,3277 15,8702 9,1528 6,3777

fla31 2,6893 1,9226 1,3192 1,6241 4,1366 0,3090 16,1708 9,2525 6,5186

fla32 2,7809 2,0069 1,3600 1,5395 4,2211 0,3090 17,2011 9,6759 6,7402

CYNA 3,0496 2,3056 1,6305 2,6687 6,8166 0,2245 16,3214 9,4969 7,3091

LUTE 1,8085 1,2382 0,7968 1,8426 4,0566 0,1792 10,5695 5,9769 4,5164

KEM1 2,1192 1,1889 0,8336 1,7221 3,9473 0,1842 11,5305 6,3716 4,6785

KAEM2 3,9464 2,8367 2,0685 3,4056 6,7122 0,2296 19,9057 11,1273 8,4405

QUER 1,8037 1,2351 0,7568 1,9612 4,7464 0,1690 10,9393 6,1231 4,6504

DAID 2,7521 2,0727 1,4683 2,2014 5,9070 0,2523 15,5817 9,2093 6,9985

160

Phụ lục 10c. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC xvp3 xvp4 xvp5 xvp6 xvp7 xvp8 xvp9 xvp10 xvc3

fla1 3,3882 2,2411 1,5731 0,8571 0,5334 0,3141 0,1764 0,0828 0,5256

fla2 3,3753 2,1865 1,5451 0,8145 0,5032 0,3040 0,1775 0,0900 0,5584

fla3 3,3774 2,1865 1,5252 0,8257 0,5048 0,2996 0,1841 0,0878 0,5584

fla4 3,4493 2,2320 1,5444 0,8206 0,5046 0,3045 0,1788 0,0886 0,5638

fla5 3,4647 2,3944 1,5982 0,8690 0,5454 0,3252 0,1845 0,0888 0,5256

fla6 3,4517 2,3398 1,5702 0,8262 0,5177 0,3116 0,1830 0,0955 0,5584

fla7 3,4538 2,3398 1,5503 0,8375 0,5192 0,3072 0,1892 0,0923 0,5584

fla8 3,5257 2,3854 1,5695 0,8323 0,5190 0,3122 0,1840 0,0934 0,5638

fla9 4,3731 2,9766 2,0192 1,0333 0,6496 0,3836 0,2268 0,1220 0,5299

fla10 4,4435 2,9883 2,0390 1,0714 0,6545 0,3831 0,2280 0,1233 0,5929

fla11 4,6893 3,1295 2,1124 1,1493 0,7177 0,4001 0,2333 0,1286 0,5980

fla12 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627

fla13 4,4306 2,9338 2,0054 1,0456 0,6235 0,3611 0,2226 0,1226 0,6257

fla14 4,6764 3,0749 2,0788 1,1235 0,6867 0,3781 0,2280 0,1285 0,6308

fla15 4,3622 2,9220 1,9657 1,0187 0,6211 0,3584 0,2203 0,1236 0,5627

fla16 4,4327 2,9338 1,9854 1,0568 0,6260 0,3576 0,2225 0,1242 0,6257

fla17 4,6785 3,0749 2,0589 1,1347 0,6892 0,3746 0,2278 0,1301 0,6308

fla18 4,4341 2,9676 1,9849 1,0135 0,6209 0,3630 0,2169 0,1220 0,5681

fla19 4,5046 2,9793 2,0047 1,0517 0,6258 0,3622 0,2191 0,1227 0,6311

fla20 4,7504 3,1204 2,0782 1,1296 0,6890 0,3792 0,2244 0,1286 0,6361

fla21 4,4539 3,0793 2,0941 1,0739 0,6782 0,4043 0,2408 0,1280 0,5299

fla22 4,5243 3,0910 2,1138 1,1123 0,6803 0,4083 0,2411 0,1293 0,5929

fla23 4,7701 3,2321 2,1873 1,1902 0,7435 0,4251 0,2526 0,1346 0,5980

fla24 4,3602 2,9220 1,9856 1,0075 0,6186 0,3619 0,2204 0,1220 0,5627

fla25 4,5114 3,0364 2,0803 1,0863 0,6517 0,3828 0,2332 0,1280 0,6257

fla26 4,7572 3,1775 2,1537 1,1642 0,7149 0,3997 0,2447 0,1339 0,6308

fla27 4,4430 3,0247 2,0406 1,0592 0,6521 0,3756 0,2313 0,1282 0,5627

fla28 4,5134 3,0364 2,0603 1,0975 0,6543 0,3793 0,2327 0,1288 0,6257

fla29 4,7592 3,1776 2,1338 1,1754 0,7174 0,3962 0,2443 0,1347 0,6308

fla30 4,5149 3,0702 2,0598 1,0540 0,6519 0,3802 0,2279 0,1268 0,5681

fla31 4,5853 3,0819 2,0796 1,0924 0,6541 0,3839 0,2293 0,1275 0,6311

fla32 4,8311 3,2231 2,1531 1,1703 0,7172 0,4008 0,2409 0,1333 0,6361

CYNA 5,1440 3,4293 2,2712 1,2881 0,7165 0,4256 0,2635 0,1528 0,9943

LUTE 3,0546 2,0729 1,3590 0,7590 0,4060 0,2333 0,1339 0,0658 0,5908

KEM1 3,2513 2,2565 1,5076 0,8475 0,4610 0,2753 0,1388 0,0688 0,5715

KAEM2 5,6381 4,0553 2,8046 1,5742 0,9481 0,5703 0,3428 0,1953 1,1730

QUER 3,1730 2,1355 1,4097 0,7736 0,4248 0,2324 0,1299 0,0627 0,6309

DAID 5,0251 3,3211 2,2474 1,2284 0,6947 0,4105 0,2528 0,1458 0,8902

161

Phụ lục 10d. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC xvpc4 ABSQ ABSQon Dipole MaxHp MaxNeg MaxQp Ovality

fla1 0,9734 3,8385 1,4790 6,1796 0,2193 -0,3921 0,2193 1,5982

fla2 0,9603 3,7043 1,5376 8,0858 0,2193 -0,4050 0,2193 1,7309

fla3 0,9613 3,7278 1,5375 5,9397 0,2193 -0,4050 0,2193 1,6777

fla4 1,0363 3,7314 1,5445 5,6574 0,2193 -0,4043 0,2193 1,7187

fla5 0,9672 3,8088 1,4642 5,2716 0,0717 -0,3921 0,1955 1,6329

fla6 0,9541 3,6745 1,5227 7,1274 0,1094 -0,4050 0,1603 1,7660

fla7 0,9551 3,6981 1,5226 4,4376 0,1094 -0,4050 0,1602 1,7245

fla8 1,0301 3,7016 1,5296 4,3371 0,1023 -0,4043 0,1675 1,7569

fla9 1,1895 4,3686 1,4729 5,4187 0,2194 -0,3921 0,2194 1,6482

fla10 1,2622 4,5444 1,4717 7,2526 0,2194 -0,3921 0,2194 1,6533

fla11 1,3361 4,7856 1,8530 8,0366 0,2194 -0,3921 0,2194 1,7029

fla12 1,1763 4,2340 1,5314 6,0955 0,2194 -0,4050 0,2194 1,7439

fla13 1,2491 4,4099 1,5303 8,0687 0,2194 -0,4050 0,2194 1,7545

fla14 1,3229 4,6508 1,9119 8,3968 0,2194 -0,4050 0,2194 1,7948

fla15 1,1774 4,2576 1,5313 3,1659 0,2194 -0,4050 0,2194 1,7422

fla16 1,2501 4,4335 1,5302 3,9789 0,2194 -0,4050 0,2194 1,7375

fla17 1,3240 4,6744 1,9118 4,8887 0,2194 -0,4050 0,2194 1,7706

fla18 1,2524 4,2611 1,5383 3,2984 0,2194 -0,4043 0,2194 1,7182

fla19 1,3251 4,4370 1,5372 4,5294 0,2194 -0,4043 0,2194 1,7313

fla20 1,3990 4,6779 1,9188 5,3592 0,2194 -0,4043 0,2194 1,7957

fla21 1,1864 4,3389 1,4580 4,1934 0,0717 -0,3921 0,1955 1,6917

fla22 1,2591 4,5147 1,4569 6,2547 0,0717 -0,3921 0,1955 1,7002

fla23 1,3330 4,7559 1,8381 5,9079 0,0727 -0,3921 0,1955 1,6970

fla24 1,1763 4,2340 1,5314 6,0955 0,2194 -0,4050 0,2194 1,7439

fla25 1,2460 4,3802 1,5155 7,6373 0,1094 -0,4050 0,1603 1,7953

fla26 1,3199 4,6210 1,8971 7,9833 0,1094 -0,4050 0,1603 1,8383

fla27 1,1743 4,2279 1,5165 3,0914 0,1094 -0,4050 0,1602 1,7364

fla28 1,2470 4,4038 1,5154 4,5067 0,1094 -0,4050 0,1602 1,7388

fla29 1,3209 4,6446 1,8970 5,0137 0,1094 -0,4050 0,1602 1,8159

fla30 1,2493 4,2314 1,5234 2,5971 0,1023 -0,4043 0,1675 1,7774

fla31 1,3220 4,4073 1,5223 4,6180 0,1023 -0,4043 0,1675 1,7866

fla32 1,3959 4,6482 1,9039 5,0940 0,1023 -0,4043 0,1675 1,8398

CYNA 1,9313 8,2271 4,0815 3,1683 0,2101 -0,4034 0,2101 1,8285

LUTE 1,0655 4,5338 2,2335 1,3426 0,1755 -0,4034 0,1755 1,5373

KEM1 1,1015 4,5913 2,1548 4,3692 0,1776 -0,3933 0,2102 1,5684

KAEM2 2,0875 8,2078 4,1640 12,5381 0,2100 -0,4045 0,2440 1,8540

QUER 1,1726 5,1736 2,5479 5,9484 0,1973 -0,3890 0,2086 1,5559

DAID 1,8112 6,9913 3,3528 1,1196 0,2101 -0,4042 0,2101 1,7843

162

Phụ lục 10e. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC Polarizability SpcPolarizability Surface Volume xvch6 SdsCH SaaCH

fla1 5,8050 0,0205 333,3331 283,2407 0,0726 0,0000 16,2847

fla2 5,8050 0,0193 376,0768 301,1595 0,0709 1,4741 14,4994

fla3 5,8050 0,0204 350,5764 284,0417 0,0709 1,4869 14,4439

fla4 5,8050 0,0195 370,6593 297,7988 0,0709 1,4625 14,4005

fla5 6,5790 0,0221 351,5565 297,0492 0,0726 0,0000 16,5186

fla6 6,5790 0,0206 398,7162 318,9987 0,0709 1,4991 14,7067

fla7 6,5790 0,0218 375,2085 301,7779 0,0709 1,5075 14,6621

fla8 6,5790 0,0209 393,3637 315,0381 0,0709 1,4875 14,6078

fla9 6,5790 0,0208 369,4536 315,5677 0,1047 0,0000 25,4665

fla10 6,4880 0,0203 373,5784 319,3890 0,1004 0,0000 21,4513

fla11 7,3530 0,0223 392,7971 329,4254 0,1004 0,0000 23,2599

fla12 6,5790 0,0215 382,5937 305,5504 0,1029 1,4782 23,7859

fla13 6,4880 0,0209 388,9135 310,3409 0,0986 1,4450 19,8044

fla14 7,3530 0,0223 414,4890 329,9914 0,0986 1,4716 21,5743

fla15 6,5790 0,0195 408,6353 337,7878 0,1029 1,4902 23,7547

fla16 6,4880 0,0196 401,6805 330,5313 0,0986 1,4616 19,7569

fla17 7,3530 0,0234 396,2264 314,7684 0,0986 1,4845 21,5373

fla18 6,5790 0,0214 378,1292 306,9938 0,1029 1,4666 23,7053

fla19 6,4880 0,0208 385,0502 311,8765 0,0986 1,4334 19,7211

fla20 7,3530 0,0223 414,3353 329,5624 0,0986 1,4601 21,4910

fla21 7,3530 0,0211 405,2733 348,6615 0,1047 0,0000 26,0903

fla22 7,2620 0,0206 410,7555 353,1085 0,1004 0,0000 22,0241

fla23 8,1270 0,0246 392,5103 330,7671 0,1004 0,0000 23,8327

fla24 6,5790 0,0215 382,5937 305,5504 0,1029 1,4782 23,7859

fla25 7,2620 0,0220 414,1577 329,4795 0,0986 1,4700 20,3506

fla26 8,1270 0,0233 440,1802 348,4047 0,0986 1,4966 22,1205

fla27 7,3530 0,0240 381,7659 306,5485 0,1029 1,5109 24,3628

fla28 7,2620 0,0212 411,7310 342,6333 0,0986 1,4822 20,3139

fla29 8,1270 0,0244 421,6354 332,6838 0,0986 1,5052 22,0943

fla30 7,3530 0,0225 407,4250 326,3386 0,1029 1,4916 24,3025

fla31 7,2620 0,0219 413,4352 331,0153 0,0986 1,4584 20,2673

fla32 8,1270 0,0233 440,4050 348,2668 0,0986 1,4851 22,0372

CYNA 7,7400 0,0211 453,6429 367,4498 0,0858 1,1032 6,1253

LUTE 3,8700 0,0186 261,0753 208,1012 0,0596 1,1577 6,2125

KEM1 4,6440 0,0202 284,5858 229,8373 0,0614 0,0000 8,2974

KAEM2 9,2880 0,0224 498,6732 414,7864 0,0876 0,0000 7,5773

QUER 3,8700 0,0179 271,2661 216,4776 0,0576 0,0000 5,6409

DAID 7,7400 0,0243 402,8370 318,9727 0,0928 1,3003 10,5331

163

Phụ lục 10f. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC SdssC SaasC SdO k0 k1 k2 k3 ka1

fla1 0,5750 1,6814 12,7361 30,1156 17,8112 8,3927 4,1588 15,3016

fla2 0,8330 2,3045 12,3401 30,1156 17,8112 8,3927 4,5455 15,3016

fla3 0,8497 2,3120 12,2436 30,1156 17,8112 8,3927 4,5455 15,3016

fla4 0,8871 2,2976 12,5996 30,1156 17,8112 8,3927 4,3457 15,3016

fla5 0,9862 1,7789 12,8369 31,9209 18,7811 9,0873 4,6012 16,2646

fla6 1,1359 2,4450 12,4064 31,9209 18,7811 9,0873 5,0193 16,2646

fla7 1,1511 2,4555 12,2990 31,9209 18,7811 9,0873 5,0193 16,2646

fla8 1,1847 2,4381 12,6550 31,9209 18,7811 9,0873 4,8034 16,2646

fla9 0,4675 2,3437 13,0726 38,1122 21,2404 10,3469 5,0238 18,0053

fla10 0,1135 1,5631 13,0677 40,0013 22,2031 10,5434 5,2578 18,8922

fla11 0,3684 2,9209 13,1396 41,9054 23,1680 11,2277 5,5068 19,8774

fla12 0,7661 3,0072 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053

fla13 0,5319 2,1990 12,5580 40,0013 22,2031 10,5434 5,6266 18,8922

fla14 0,7009 3,5928 12,6101 41,9054 23,1680 11,2277 5,8800 19,8774

fla15 0,7832 3,0189 12,4286 38,1122 21,2404 10,3469 5,3890 18,0053

fla16 0,5503 2,2093 12,4255 40,0013 22,2031 10,5434 5,6266 18,8922

fla17 0,7184 3,6058 12,4706 41,9054 23,1680 11,2277 5,8800 19,8774

fla18 0,8222 3,0068 12,7846 38,1122 21,2404 10,3469 5,2016 18,0053

fla19 0,5941 2,2017 12,7815 40,0013 22,2031 10,5434 5,4375 18,8922

fla20 0,7587 3,5954 12,8267 41,9054 23,1680 11,2277 5,6888 19,8774

fla21 0,8787 2,5840 13,1734 40,0013 22,2031 11,0395 5,4375 18,9590

fla22 0,5247 1,8493 13,1685 41,9054 23,1680 11,2277 5,6888 19,8487

fla23 0,7796 3,2070 13,2404 43,8240 24,1349 11,9234 5,9259 20,8367

fla24 0,7661 3,0072 12,5616 38,1122 21,2404 10,3469 5,3890 18,0053

fla25 0,8347 2,5283 12,6243 41,9054 23,1680 11,2277 6,0810 19,8487

fla26 1,0037 3,9221 12,6764 43,8240 24,1349 11,9234 6,3209 20,8367

fla27 1,0847 3,3053 12,4840 40,0013 22,2031 11,0395 5,8258 18,9590

fla28 0,8517 2,5415 12,4809 41,9054 23,1680 11,2277 6,0810 19,8487

fla29 1,0198 3,9380 12,5260 43,8240 24,1349 11,9234 6,3209 20,8367

fla30 1,1198 3,2902 12,8400 40,0013 22,2031 11,0395 5,6266 18,9590

fla31 0,8917 2,5309 12,8369 41,9054 23,1680 11,2277 5,8800 19,8487

fla32 1,0563 3,9247 12,8821 43,8240 24,1349 11,9234 6,1186 20,8367

CYNA -0,5621 -1,3488 12,5338 48,1648 25,1037 10,3180 5,1775 22,6371

LUTE -0,3573 -0,9230 12,0433 27,7666 15,8790 6,2457 3,2000 13,6247

KEM1 -0,4782 -0,0737 12,4767 28,3292 16,8438 6,8571 3,2986 14,5816

KAEM2 -3,0291 -1,2350 36,8317 56,8193 29,9700 12,6688 6,8402 26,8807

QUER -1,9188 -1,9610 12,1429 29,5333 16,8438 6,4815 3,1653 14,5432

DAID 0,0476 1,3775 12,8115 43,1095 23,1680 9,8681 4,8595 20,7887

164

Phụ lục 10g. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

HC ka2 ka3 Hother Hmax Gmax Hmin

fla1 6,6616 3,1183 14,2173 2,6945 12,7361 0,7651

fla2 6,6616 3,4269 14,4907 2,6663 12,3401 0,7261

fla3 6,6616 3,4269 14,5027 2,6681 12,2436 0,7284

fla4 6,6616 3,2671 14,5290 2,6655 12,5996 0,7251

fla5 7,3138 3,5128 15,0379 1,4629 12,8369 0,7731

fla6 7,3138 3,8520 15,2898 1,6012 12,4064 0,7341

fla7 7,3138 3,8520 15,3037 1,6105 12,2990 0,7364

fla8 7,3138 3,6766 15,3275 1,6349 12,6550 0,7331

fla9 8,1029 3,7080 20,4449 2,7803 13,0726 1,2384

fla10 8,2804 3,9037 19,9245 2,8069 13,1594 1,2698

fla11 8,9391 4,1515 20,5388 2,8015 13,1396 0,7720

fla12 8,1029 3,9952 20,6396 2,7521 12,5616 1,2105

fla13 8,2804 4,1952 20,1308 2,7787 13,0557 1,2284

fla14 8,9391 4,4502 20,7357 2,7733 12,6101 0,7618

fla15 8,1029 3,9952 20,6628 2,7539 12,4286 1,2148

fla16 8,2804 4,1952 20,1554 2,7805 13,0715 1,2351

fla17 8,9391 4,4502 20,7607 2,7751 12,4706 0,7625

fla18 8,1029 3,8476 20,6756 2,7514 12,7846 1,2091

fla19 8,2804 4,0455 20,1673 2,7779 13,0530 1,2298

fla20 8,9391 4,2970 20,7719 2,7726 12,8267 0,7614

fla21 8,7502 4,0720 21,3403 1,4906 13,1734 0,8496

fla22 8,9197 4,2855 20,8378 1,5168 13,2725 0,8706

fla23 9,5928 4,5240 21,4499 1,5001 13,2404 0,7740

fla24 8,1029 3,9952 20,6396 2,7521 12,5616 1,2105

fla25 8,9197 4,5997 21,0226 1,6507 13,1688 0,8495

fla26 9,5928 4,8437 21,6253 1,6473 12,6764 0,7638

fla27 8,7502 4,3815 21,5386 1,6554 12,4840 0,8299

fla28 8,9197 4,5997 21,0490 1,6724 13,1846 0,8509

fla29 9,5928 4,8437 21,6521 1,6691 12,5260 0,7645

fla30 8,7502 4,2225 21,5489 1,6576 12,8400 0,8279

fla31 8,9197 4,4384 21,0585 1,6676 13,1661 0,8489

fla32 9,5928 4,6797 21,6609 1,6657 12,8821 0,7634

CYNA 8,7667 4,2537 17,7797 2,8630 12,5338 1,0768

LUTE 4,8846 2,3765 9,3564 2,7601 12,0433 1,4778

KEM1 5,4501 2,4890 9,9728 2,7856 12,4767 0,9032

KAEM2 10,6711 5,5727 19,9921 2,8841 13,5259 0,8773

QUER 5,1089 2,3710 7,8932 2,8701 12,1429 1,5111

DAID 8,3415 3,9613 20,0342 2,7582 12,8115 1,0526

165

Phụ lục 10h. Tham số 2D, 3D của các dẫn xuất flavone và isoflavone

Name Gmin Hmaxpos fw phia knotp knotpv LogP

fla1 -0,2533 2,6945 309,3214 4,4319 -2,0772 -0,4477 3,5667

fla2 -0,1360 2,6663 309,3214 4,4319 -1,8046 -0,4018 3,5771

fla3 -0,1067 2,6681 309,3214 4,4319 -1,8006 -0,4028 3,5789

fla4 -0,0860 2,6655 309,3214 4,4319 -1,9875 -0,4725 3,5527

fla5 -0,2075 1,4629 323,3483 4,9565 -1,9927 -0,4416 3,3597

fla6 -0,1085 1,6012 323,3483 4,9565 -1,7201 -0,3957 3,6291

fla7 -0,0845 1,6105 323,3483 4,9565 -1,7161 -0,3967 3,6037

fla8 -0,0638 1,6349 323,3483 4,9565 -1,9030 -0,4663 3,6386

fla9 -0,2722 2,7803 371,3923 5,2105 -2,5314 -0,6595 4,6313

fla10 -0,4088 2,8069 389,3828 5,3943 -2,6510 -0,6693 4,4724

fla11 -0,2891 2,8015 401,4185 5,9229 -2,8201 -0,7381 4,6684

fla12 -0,1485 2,7521 371,3923 5,2105 -2,2588 -0,6136 4,6181

fla13 -0,3860 2,7787 389,3828 5,3943 -2,3783 -0,6234 4,6932

fla14 -0,1604 2,7733 401,4185 5,9229 -2,5475 -0,6922 4,6413

fla15 -0,1171 2,7539 371,3923 5,2105 -2,2548 -0,6146 4,5401

fla16 -0,3836 2,7805 389,3828 5,3943 -2,3744 -0,6244 4,6469

fla17 -0,1273 2,7751 401,4185 5,9229 -2,5435 -0,6932 4,5471

fla18 -0,0964 2,7514 371,3923 5,2105 -2,4417 -0,6843 4,5021

fla19 -0,3830 2,7779 389,3828 5,3943 -2,5613 -0,6941 4,6616

fla20 -0,1066 2,7726 401,4185 5,9229 -2,7304 -0,7629 4,5404

fla21 -0,2264 1,4906 385,4192 5,7205 -2,4826 -0,6565 3,7509

fla22 -0,3630 1,5168 403,4096 5,9015 -2,6021 -0,6662 3,6648

fla23 -0,2433 1,5001 415,4454 6,4478 -2,7712 -0,7350 3,7660

fla24 -0,1485 2,7521 371,3923 5,2105 -2,2588 -0,6136 4,6181

fla25 -0,3402 1,6507 403,4096 5,9015 -2,3295 -0,6203 4,0615

fla26 -0,1329 1,6473 415,4454 6,4478 -2,4986 -0,6891 4,2235

fla27 -0,0948 1,6554 385,4192 5,7205 -2,2060 -0,6116 4,1496

fla28 -0,3378 1,6724 403,4096 5,9015 -2,3256 -0,6213 4,0111

fla29 -0,1051 1,6691 415,4454 6,4478 -2,4947 -0,6901 4,1865

fla30 -0,0741 1,6576 385,4192 5,7205 -2,3929 -0,6812 4,1772

fla31 -0,3372 1,6676 403,4096 5,9015 -2,5125 -0,6910 4,0687

fla32 -0,0844 1,6657 415,4454 6,4478 -2,6816 -0,7598 4,2308

CYNA -1,6769 2,8630 448,3832 6,2016 -4,1478 -0,9370 0,7696

LUTE -0,4895 2,7601 286,2408 3,1691 -2,2140 -0,4747 2,7887

KEM1 -0,5516 2,7856 300,2677 3,6123 -2,2252 -0,5300 3,4560

KAEM2 -1,5866 2,8841 516,4584 7,7526 -3,3066 -0,9145 1,4743

QUER -0,8877 2,8701 302,2402 3,3773 -2,7852 -0,5417 2,6359

DAID -1,5628 2,7582 416,3844 5,7803 -3,7055 -0,9210 1,0960

166

Phụ lục 11. Định Danh thực vật chiết xuất

167

168

169

170

171

Phụ lục 12. Thử hoạt tính khánh ung thư cô tử cung (HeLa)

172

173

Phụ lục 13. phô 1H-NMR CSL1

Phụ lục 14. phô DEPT CSL1

174

Phụ lục 15. Phô 13C-NMR CSL1

175

Phụ lục 16. Phô HMBC CSL1

176

Phụ lục 17. Phô HSQC CSL1

177

Phụ lục 18. Phô 1H-NMR GML1

178

Phụ lục 19. Phô 13C-NMR GML1

179

Phụ lục 20. Phô DEPT GML1

180

Phụ lục 21. Phô HMBC GML1

181

Phụ lục 22. Phô HSQC GML1

182

Phụ lục 24. Phô 1H-NMR AIL1

183

Phụ lục 25. Phô 13C-NMR AIL1

184

Phụ lục 26. Phô DEPT AIL1

185

Phụ lục 27. Phô HSQC AIL1

186

Phụ lục 28. Phô HMBC của AIL1

187

Phụ lục 29. 1H-NMR của POL1

188

Phụ lục 30. Phô 13C-NMR của POL1

189

Phụ lục. 31 Phô DEPT của POL1

190

Phụ lục 32. Phô HMBC của POL1

191

Phụ lục 33. Phô HSQC của POL1

192

Phụ lục 34. Phô 1H-NMR ZZL1

193

Phụ lục 35. Phô 13C-NMR ZZL1

194

Phụ lục 36. Phô DEPT ZZL1

195

Phụ lục 37. Phô HMBC ZZL1

196

Phụ lục 38. Phô HSQC ZZL1

197

Phụ lục 39. Phô 1H-NMR ZZL2

198

Phụ lục 40. Phô 13C-NMR ZZL2

199

Phụ lục 41. Phô DEPT ZZL2

200

Phụ lục 42. Phô HMBC ZZL2

201

Phụ lục 43. Phô HSQC ZZL2

202

Phụ lục 44. Dữ liệu cấu trúc tinh thể GML1

Tham số Dư liệu

Công thức phân tử C21H15O11

Khối lượng phân tủ 443,33

ToK 100

Hệ tinh thể monoclinic

Nhóm không gian P21

a/Å 14,6876(11)

b/Å 4,3568(3)

c/Å 17,3072(11)

α/° 90

β/° 111,658(3)

γ/° 90

Thể tích/Å3 1029,32(13)

Z 2

Tỉ khối tính toán ρcalcg/cm3 1,43

Hệ số hấp thu μ/mm-1 0,118

F(000) 458

Kích thước tinh thể/mm3 0,1 × 0,05 × 0,05

Bức xạ MoKα (λ = 0,71073)

Phạm vi thu thập dữ liệu 2Θ /° 5,968 to 64,054

Chỉ số index -21 ≤ h ≤ 20, -6 ≤ k ≤ 6, -25 ≤ l ≤ 25

Số phản xạ đo được 25478

Số phản xạ độc lập 6681 [Rint = 0,0399, Rsigma = 0,0506]

Dữ liệu/giới hạn/tham số 6681/1/300

Hệ số phù hợp mô hình F2 1,022

Độ sai lệch [I>=2σ (I)] R1 = 0,0454, wR2 = 0,0962

Độ sai lệch tông cộng R R1 = 0,0675, wR2 = 0,1049

Mật độ đỉnh/lỗ / e Å-3 0,48/-0,39

Tham số Flack -0,1(3)

203

Phụ lục 45. Tọa độ các nguyên tử (Å2×103) trong phân tử GML1

Nguyên

tố x y z U(eq)

C1 6784,2(15) 6651(5) 4394,3(12) 13,4(4)

C2 7530,0(16) 4966(6) 4954,6(13) 19,8(5)

C3 7502,7(16) 4507(6) 5741,4(13) 19,4(5)

O4 8270,0(13) 2864(6) 6278,7(10) 35,5(5)

C5 8308,2(18) 2414(7) 7066,4(14) 29,9(6)

C6 7627,0(16) 3319(6) 7363,0(12) 17,7(5)

C7 6751,4(15) 4914(5) 6808,4(12) 13,2(4)

O8 6054,2(11) 5635(4) 7008,3(9) 16,4(3)

C9 6759,7(15) 5634(5) 5983,0(12) 13,9(4)

C10 6022,1(15) 7390(5) 5395,8(12) 14,3(4)

C11 6030,7(15) 7906(5) 4611,7(12) 14,4(4)

O12 6717,3(11) 7286(4) 3596,4(8) 14,3(3)

C13 7271,2(14) 5460(5) 3257,5(11) 11,4(4)

C14 6882,9(14) 6152(5) 2325,0(11) 11,5(4)

O15 5909,6(10) 5077(4) 1923,3(9) 13,6(3)

C16 7526,6(14) 4733(5) 1899,5(11) 11,3(4)

O17 7287,6(11) 6027(4) 1088,6(8) 15,8(3)

C18 8611,7(14) 5320(5) 2388,4(11) 12,1(4)

O19 9242,9(11) 3547(4) 2110,4(9) 18,8(3)

C20 8858,6(15) 4532(5) 3305,1(12) 11,5(4)

C21 9916,8(14) 5270(5) 3806,3(11) 14,2(4)

O22 10205,1(12) 4548(4) 4667,5(9) 19,7(3)

O23 8259(1) 6383(4) 3617,4(8) 12,0(3)

C24 7796,5(15) 2632(5) 8247,6(12) 14,3(4)

C25 8660,9(16) 3583(6) 8876,5(13) 19,2(5)

C26 8867,4(16) 2729(6) 9696,9(13) 17,5(4)

C27 8215,1(16) 897(5) 9892,4(12) 13,3(4)

O28 8470,0(11) 22(4) 10709,1(8) 17,6(3)

C29 7336,4(15) -16(5) 9277,2(12) 14,7(4)

C30 7135,3(16) 853(5) 8459,1(12) 14,7(4)

O30 4774,0(11) 9985(4) 1799,3(9) 14,6(3)

O29 5530,0(12) 4463(4) -102,8(9) 17,7(3)

204

Phụ lục 46. Các thông số đẳng hướng (Å2×103) trong phân tử GML1

Nguyên tố U11 U22 U33 U23 U13 U12

C1 14,5(10) 17,3(10) 9,5(9) 0,0(8) 5,6(8) -1,7(8)

C2 15,2(10) 34,4(13) 12,4(9) 5,4(10) 8,1(8) 9,1(10)

C3 15,7(10) 30,9(13) 11,4(9) 6,3(9) 4,8(8) 8,2(9)

O4 26,3(9) 69,6(15) 15,9(8) 18,9(9) 14,2(7) 29,2(10)

C5 24,6(12) 54,5(18) 12(1) 14,2(11) 8,3(9) 19,8(13)

C6 16,3(10) 25,7(12) 11,3(9) 4,1(9) 5,5(8) 3,7(9)

C7 15,3(9) 15,3(10) 10,0(8) -1,4(8) 5,9(7) -2,0(8)

O8 14,6(7) 24,6(9) 12,1(7) 1,7(6) 7,7(6) 2,9(6)

C9 13,4(9) 19,4(11) 10,2(8) 0,2(8) 5,8(8) -1,5(8)

C10 12,7(10) 18,5(10) 12,7(9) -0,2(8) 5,9(8) 0,8(8)

C11 14(1) 16,8(11) 13,0(9) 1,9(8) 5,7(8) 3,2(8)

O12 16,9(7) 18,9(8) 8,9(6) 2,2(6) 6,8(6) 3,7(6)

C13 12,1(9) 14,3(10) 9,3(8) 0,9(7) 5,7(7) -0,5(8)

C14 11,4(9) 12,9(9) 9,7(8) 1,0(7) 3,2(8) -1,4(8)

O15 9,9(7) 15,1(7) 14,1(6) -1,1(6) 2,4(5) -1,4(6)

C16 12,5(9) 13,4(9) 7,5(8) 0,6(7) 3,1(7) -1,1(8)

O17 14,3(7) 24,5(8) 7,2(6) 2,5(6) 2,2(5) -4,8(6)

C18 12,1(9) 15,4(10) 8,8(8) -0,5(7) 4,0(7) -1,1(8)

O19 15,0(7) 29,0(9) 12,2(7) -7,1(7) 4,8(6) 0,8(7)

C20 13,3(9) 11,3(9) 10,1(8) 0,2(7) 4,8(7) 1,1(8)

C21 12,7(10) 18,8(11) 9,6(8) 0,7(8) 2,3(7) -0,7(9)

O22 20,0(8) 24,1(9) 11,1(7) 4,2(6) 1,1(6) 0,6(7)

O23 11,2(7) 15,3(7) 9,9(6) -1,2(6) 4,3(6) -0,2(6)

C24 13,8(10) 19,4(11) 10,5(8) 2,7(8) 5,5(8) 5,4(9)

C25 16,3(11) 26,1(12) 16(1) 6,0(9) 6,7(9) -0,6(9)

C26 15,4(10) 21,3(11) 13,5(9) 1,1(9) 2,6(8) -2,7(9)

C27 17,7(10) 13,2(10) 9,5(8) 0,2(7) 5,5(8) 1,6(8)

O28 22,5(8) 20,2(8) 9,4(6) 1,8(6) 4,9(6) -5,4(7)

C29 15,8(10) 16,6(10) 13,1(9) 0,1(8) 6,9(8) -0,8(9)

C30 14,7(10) 16,8(11) 11,4(9) -1,5(8) 3,4(8) 0,8(8)

O30 14,1(7) 16,4(7) 15,7(7) -1,6(6) 8,4(6) -2,2(6)

205

O29 20,2(8) 21,0(8) 11,7(7) -0,7(6) 5,5(6) -3,3(6)

206

Phụ lục 47. Độ dài liên kết trong phân tử GML1

Nguyên tố Độ dài /Å Nguyên tố

Độ dài /Å

C1 C2 1,377(3) C14 O15 1,419(2)

C1 C11 1,405(3) C14 C16 1,527(3)

C1 O12 1,376(2) C16 O17 1,431(2)

C2 C3 1,391(3) C16 C18 1,525(3)

C3 O4 1,369(3) C18 O19 1,420(3)

C3 C9 1,394(3) C18 C20 1,530(3)

O4 C5 1,358(3) C20 C21 1,509(3)

C5 C6 1,341(3) C20 O23 1,439(2)

C6 C7 1,465(3) C21 O22 1,426(2)

C6 C24 1,488(3) C24 C25 1,396(3)

C7 O8 1,237(3) C24 C30 1,393(3)

C7 C9 1,467(3) C25 C26 1,389(3)

C9 C10 1,407(3) C26 C27 1,381(3)

C10 C11 1,380(3) C27 O28 1,376(2)

O12 C13 1,411(2) C27 C29 1,394(3)

C13 C14 1,530(3) C29 C30 1,388(3)

207

Phụ lục 48. Góc liên kết trong phân tử GML1

Góc Góc /˚ Góc Góc/˚

C2 C1 C11 121,31(18) O15 C14 C13 111,58(16)

O12 C1 C2 123,91(18) O15 C14 C16 108,74(16)

O12 C1 C11 114,78(18) C16 C14 C13 111,88(16)

C1 C2 C3 117,59(19) O17 C16 C14 109,99(16)

C2 C3 C9 123,5(2) O17 C16 C18 107,82(15)

O4 C3 C2 115,22(19) C18 C16 C14 111,76(16)

O4 C3 C9 121,31(18) C16 C18 C20 109,69(15)

C5 O4 C3 118,43(18) O19 C18 C16 113,57(16)

C6 C5 O4 125,6(2) O19 C18 C20 107,14(16)

C5 C6 C7 119,15(18) C21 C20 C18 110,37(16)

C5 C6 C24 118,0(2) O23 C20 C18 108,66(15)

C7 C6 C24 122,85(18) O23 C20 C21 107,94(16)

C6 C7 C9 114,74(18) O22 C21 C20 113,55(16)

O8 C7 C6 123,68(17) C13 O23 C20 110,30(15)

O8 C7 C9 121,57(19) C25 C24 C6 120,08(19)

C3 C9 C7 120,37(19) C30 C24 C6 120,94(19)

C3 C9 C10 117,01(18) C30 C24 C25 118,82(19)

C10 C9 C7 122,60(19) C26 C25 C24 120,7(2)

C11 C10 C9 120,98(19) C27 C26 C25 119,7(2)

C10 C11 C1 119,61(19) C26 C27 C29 120,53(18)

C1 O12 C13 117,73(16) O28 C27 C26 117,48(18)

O12 C13 C14 106,25(16) O28 C27 C29 121,99(19)

O23 C13 O12 108,23(16) C30 C29 C27 119,33(19)

O23 C13 C14 109,40(15) C29 C30 C24 120,88(19)

208

Phụ lục 49. Góc xoắn trong phân tử GML1

A B C D Góc/˚ A B C D Góc/˚

C1 C2 C3 O4 -178,9(2) O12 C1 C11 C10 179,5(2)

C1 C2 C3 C9 0,7(4) O12 C13 C14 O15 -67,3(2)

C1 O12 C13 C14 167,23(17) O12 C13 C14 C16 170,61(16)

C1 O12 C13 O23 -75,4(2) O12 C13 O23 C20 178,62(14)

C2 C1 C11 C10 -1,4(3) C13 C14 C16 O17 -165,89(16)

C2 C1 O12 C13 18,1(3) C13 C14 C16 C18 -46,2(2)

C2 C3 O4 C5 177,9(3) C14 C13 O23 C20 -66,02(19)

C2 C3 C9 C7 176,6(2) C14 C16 C18 O19 168,12(16)

C2 C3 C9 C10 -1,8(4) C14 C16 C18 C20 48,3(2)

C3 O4 C5 C6 3,5(5) O15 C14 C16 O17 70,4(2)

C3 C9 C10 C11 1,3(3) O15 C14 C16 C18 -169,87(17)

O4 C3 C9 C7 -3,9(4) C16 C18 C20 C21 -176,79(17)

O4 C3 C9 C10 177,7(2) C16 C18 C20 O23 -58,6(2)

O4 C5 C6 C7 0,6(5) O17 C16 C18 O19 -70,9(2)

O4 C5 C6 C24 -179,8(3) O17 C16 C18 C20 169,27(17)

C5 C6 C7 O8 174,6(3) C18 C20 C21 O22 -179,07(17)

C5 C6 C7 C9 -5,8(3) C18 C20 O23 C13 69,13(19)

C5 C6 C24 C25 54,6(4) O19 C18 C20 C21 59,5(2)

C5 C6 C24 C30 -120,7(3) O19 C18 C20 O23 177,68(16)

C6 C7 C9 C3 7,4(3) C21 C20 O23 C13 -171,17(16)

209

Phụ lục 50. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng

(Å2×103) của phân tử GML1

Atom x y z U(eq)

H2 8045 4146 4809 24

H5 8865 1370 7439 36

H10 5511 8234 5541 17

H11 5530 9102 4221 17

H13 7199 3232 3361 14

H14 6882 8429 2251 14

H15 5515 6527 1874 20

H16 7409 2468 1846 14

H17 6747 5325 769 24

H18 8752 7545 2343 14

H19 8929 2893 1628 28

H20 8730 2306 3364 14

H21A 10338 4115 3574 17

H21B 10028 7485 3749 17

H22 9903 2977 4723 30

H25 9113 4827 8742 23

H26 9455 3401 10122 21

H28 8055 -1231 10749 26

H29 6880 -1220 9416 18

H30 6539 225 8038 18

H30A 5171 11545 1936 22

H30B 4426 9952 2111 22

H29A 5210 2904 -15 27

H29B 5510 4402 -611 27

210

Phụ lục 51. Dữ liệu cấu trúc tinh thể của ZZL1

Tham số Pna21

Công thức phân tử C16H12O6

Khối lượng phân tử 300,26

ToK 100

Hệ tinh thể orthorhombic

Nhóm không gian Pna21

a/Å 7,0060(4)

b/Å 25,9070(14)

c/Å 7,2062(4)

α/° 90

β/° 90

γ/° 90

Thể tích/Å3 1307,96(13)

Z 4

Tỉ khối tính toán ρcalcg/cm3 1,525

Hệ số hấp thu μ/mm-1 0,118

F(000) 624

Kích thước tinh thể /mm3 0,1 × 0,08 × 0,04

Bức xạ MoKα (λ = 0,71073)

Phạm vi thu thập dữ liệu 2Θ /° 5,868 to 61,67

Chỉ số index -10 ≤ h ≤ 10, -37 ≤ k ≤ 37, -10 ≤ l ≤ 10

Số phản xạ đo được 44181

Số phản xạ độc lập 4114 [Rint = 0,0465, Rsigma = 0,0199]

Dữ liệu/giới hạn/tham số 4114/1/203

Hệ số phù hợp mô hình F2 1,092

Độ sai lệch [I>=2σ (I)] R1 = 0,0387, wR2 = 0,0959

Độ sai lệch tông cộng R R1 = 0,0427, wR2 = 0,0987

Mật độ đỉnh/lỗ / e Å-3 0,44/-0,24

Tham số Flack 0,0(2)

211

Phụ lục 52. Tọa độ các nguyên tử trong phân tử ZZL1

Nguyên

tố x y z U(eq)

C1 7729(2) 3675,6(6) 4775(2) 10,9(3)

C2 8443(2) 3485,4(6) 6392(2) 11,1(3)

O3 9062,3(18) 3807,2(5) 7788,2(17) 13,7(2)

C4 7590(3) 3901,3(7) 9151(3) 20,0(4)

C5 8572(2) 2936,4(6) 6728(2) 10,7(3)

O6 9224,5(18) 2758,0(5) 8233,1(18) 14,2(2)

C7 7914(2) 2611,6(6) 5243(2) 10,7(3)

C8 7974(2) 2063,4(6) 5363(2) 11,1(3)

O9 8594(2) 1833,0(5) 6930,0(18) 16,2(3)

C10 7379(2) 1763,2(6) 3882(3) 12,5(3)

C11 6715(2) 2000,8(6) 2255(2) 12,0(3)

O12 6171(2) 1683,8(5) 869,4(19) 16,4(3)

C13 6619(2) 2537,4(6) 2097(2) 11,7(3)

C14 7222(2) 2829,9(6) 3600(2) 10,4(3)

O15 7127,6(18) 3355,0(4) 3393,7(18) 12,4(2)

C16 7513(2) 4222,1(6) 4268(2) 12,9(3)

C17 5993(2) 4377,7(6) 3133(3) 14,7(3)

C18 5805(3) 4890,1(7) 2589(3) 16,8(3)

C19 7136(3) 5253,5(7) 3183(3) 18,3(3)

O20 6892(2) 5746,0(5) 2576(3) 25,7(3)

C21 8635(3) 5105,0(7) 4328(3) 22,0(4)

C22 8829(3) 4592,3(7) 4862(3) 19,1(3)

212

Phụ lục 53. Các thông số đẳng hướng (Å2×103) trong phân tử k ZZL1

Nguyên

tố U11 U22 U33 U23 U13 U12

C1 10,9(7) 10,0(6) 11,9(7) 0,4(5) 1,0(6) -1,1(5)

C2 13,1(7) 9,5(6) 10,9(6) -0,1(5) 0,8(6) -1,1(5)

O3 16,4(6) 13,1(5) 11,7(5) -1,8(4) -0,2(4) -2,0(4)

C4 23,0(9) 21,7(8) 15,3(8) -3,5(7) 3,6(7) 0,3(7)

C5 10,3(7) 11,0(6) 10,7(7) 1,3(5) 0,9(5) -0,2(5)

O6 18,3(6) 13,3(5) 11,0(5) 3,1(4) -2,2(5) -0,1(4)

C7 11,4(7) 10,0(6) 10,8(6) 0,6(5) -0,6(5) -0,2(5)

C8 11,1(7) 10,4(6) 11,7(7) 2,1(5) 0,5(5) 1,0(5)

O9 23,3(7) 11,5(5) 13,7(6) 3,3(4) -3,4(5) 0,7(4)

C10 11,6(7) 11,5(6) 14,5(7) -0,2(5) 1,2(6) 0,0(5)

C11 10,1(7) 12,8(7) 13,0(7) -1,8(5) 0,9(6) -1,1(5)

O12 21,4(6) 12,7(5) 15,2(6) -2,8(4) -5,7(5) 0,1(5)

C13 12,8(7) 11,8(6) 10,5(6) 0,2(5) -0,9(5) 0,4(5)

C14 11,0(7) 9,5(6) 10,5(7) 0,6(5) 0,4(5) -0,1(5)

O15 16,2(6) 9,5(5) 11,5(5) 0,8(4) -2,0(4) -0,3(4)

C16 16,5(8) 9,4(6) 12,8(7) 1,4(5) 2,0(6) -0,4(5)

C17 17,2(8) 12,1(7) 14,9(7) 1,0(6) -0,7(6) 0,4(6)

C18 20,0(8) 12,3(7) 18,1(7) 2,6(6) 0,4(7) 3,1(6)

C19 22,9(8) 10,8(6) 21,2(8) 4,3(6) 5,0(7) 1,2(6)

O20 30,9(8) 10,2(6) 36,1(8) 7,4(5) 2,2(7) -1,0(5)

C21 24,7(9) 14,6(8) 26,8(9) 5,4(7) -2,6(7) -7,8(7)

C22 18,6(8) 14,9(7) 23,7(9) 5,3(7) -4,3(7) -4,6(6)

213

Phụ lục 54. Độ dài liên kết trong phân tử ZZL1

Liên kết Góc/Å Liên kết Góc/Å

C1 C2 1,360(2) C10 C11 1,404(2)

C1 O15 1,3631(19) C11 O12 1,348(2)

C1 C16 1,470(2) C11 C13 1,396(2)

C2 O3 1,3766(19) C13 C14 1,388(2)

C2 C5 1,446(2) C14 O15 1,3701(17)

O3 C4 1,445(2) C16 C17 1,402(2)

C5 O6 1,264(2) C16 C22 1,397(2)

C5 C7 1,437(2) C17 C18 1,390(2)

C7 C8 1,423(2) C18 C19 1,393(3)

C7 C14 1,399(2) C19 O20 1,360(2)

C8 O9 1,3489(19) C19 C21 1,390(3)

C8 C10 1,385(2) C21 C22 1,389(2)

214

Phụ lục 55. Góc liên kết trong phân tử ZZL1

Nguyên tố Góc/˚ Nguyên tố Góc/˚

C2 C1 O15 121,24(14) O12 C11 C13 122,20(15)

C2 C1 C16 126,82(15) C13 C11 C10 121,37(15)

O15 C1 C16 111,93(14) C14 C13 C11 117,74(15)

C1 C2 O3 121,51(14) C13 C14 C7 123,04(14)

C1 C2 C5 121,51(14) O15 C14 C7 120,67(13)

O3 C2 C5 116,98(14) O15 C14 C13 116,28(14)

C2 O3 C4 111,96(13) C1 O15 C14 120,71(13)

O6 C5 C2 121,72(14) C17 C16 C1 119,98(15)

O6 C5 C7 122,74(13) C22 C16 C1 121,14(15)

C7 C5 C2 115,54(14) C22 C16 C17 118,86(15)

C8 C7 C5 121,94(14) C18 C17 C16 120,71(16)

C14 C7 C5 120,32(13) C17 C18 C19 119,69(17)

C14 C7 C8 117,73(14) O20 C19 C18 116,81(17)

O9 C8 C7 120,14(14) O20 C19 C21 123,10(17)

O9 C8 C10 119,56(14) C21 C19 C18 120,09(16)

C10 C8 C7 120,30(14) C22 C21 C19 120,20(17)

C8 C10 C11 119,82(14) C21 C22 C16 120,44(17)

O12 C11 C10 116,43(14)

215

Phụ lục 56. Góc xoắn trong phân tử ZZL1

A B C D Angle/˚ A B C D Angle/˚

C1 C2 O3 C4 94,58(19) C8 C10 C11 C13 -0,7(3)

C1 C2 C5 O6 -179,57(16) O9 C8 C10 C11 179,36(15)

C1 C2 C5 C7 0,5(2) C10 C11 C13 C14 0,6(2)

C1 C16 C17 C18 -177,82(16) C11 C13 C14 C7 0,1(2)

C1 C16 C22 C21 178,18(18) C11 C13 C14 O15 179,36(14)

C2 C1 O15 C14 0,2(2) O12 C11 C13 C14 -179,69(16)

C2 C1 C16 C17 -147,34(18) C13 C14 O15 C1 -178,46(14)

C2 C1 C16 C22 34,2(3) C14 C7 C8 O9 -178,69(15)

C2 C5 C7 C8 179,25(15) C14 C7 C8 C10 0,7(2)

C2 C5 C7 C14 0,5(2) O15 C1 C2 O3 179,63(14)

O3 C2 C5 O6 -0,1(2) O15 C1 C2 C5 -0,9(2)

O3 C2 C5 C7 -179,99(14) O15 C1 C16 C17 33,2(2)

C5 C2 O3 C4 -84,94(18) O15 C1 C16 C22 -145,26(17)

C5 C7 C8 O9 2,5(2) C16 C1 C2 O3 0,2(3)

C5 C7 C8 C10 -178,10(16) C16 C1 C2 C5 179,69(15)

C5 C7 C14 C13 178,05(16) C16 C1 O15 C14 179,73(14)

C5 C7 C14 O15 -1,2(2) C16 C17 C18 C19 -0,2(3)

O6 C5 C7 C8 -0,7(3) C17 C16 C22 C21 -0,3(3)

O6 C5 C7 C14 -179,43(15) C17 C18 C19 O20 178,86(17)

C7 C8 C10 C11 0,0(2) C17 C18 C19 C21 -0,6(3)

C7 C14 O15 C1 0,8(2) C18 C19 C21 C22 1,0(3)

C8 C7 C14 C13 -0,7(2) C19 C21 C22 C16 -0,5(3)

C8 C7 C14 O15 -179,95(15) O20 C19 C21 C22 -178,44(19)

C8 C10 C11 O12 179,61(15) C22 C16 C17 C18 0,7(3)

216

Phụ lục 57. Tọa độ nguyên tố Hydrogen (Å×104) và các tham số đẳng hướng

(Å2×103) trong Pna21 của hợp chất ZZL1

Nguyên tố x y z U(eq)

H4A 6661 4147 8650 30

H4B 8166 4044 10279 30

H4C 6944 3576 9449 30

H9 8902 2059 7709 24

H10 7421 1397 3967 15

H12 5665 1858 18 25

H13 6157 2697 998 14

H17 5082 4130 2731 18

H18 4773 4992 1815 20

H20 7770 5933 2997 39

H21 9530 5355 4746 26

H22 9863 4493 5636 23

217

Phụ lục 58. Tính toán các tham số cấu trúc phân tử

1) ABSQ: Tông điện tích của nguyên tử trong phân tử

i

i

ABSQ Q

Trong đó Qi là điện tích của nguyên tử i.

2) ABSQon: Là tông giá trị tuyệt đối điện tích nito (n) và oxy (o) trong phân tử.

ABSQon i i

i

Qn Qo

3) Dipole: là giá trị moment lưỡng cực của phân tử. Giá trị dipole (μ) được tính dựa

trên cấu trúc 3D và điện tích nguyên tử bằng phương pháp Gasteiger-Marsili thực

hiện trong QSARIS. Đơn vị của nó là (1 D = 3.336 E-30 coulomb-meter).

3) Chỉ số hình học alpha Ka3 (Kappa Alpha 3 hay 3); Ka2 (Kappa Alpha 2 hay

(2))

Trường hợp theo số nguyên tử và đường:

1kα = [(A+ α)(A+ α – 1)2]/(1Pi + α)2 với m = 1

2kα = [(A+ α – 1)(A+ α – 2)2]/(2Pi + α)2 với m = 2

3kα = (A + α –1)(A + α – 3)2 / (3Pi + α)2 với m = 3 khi A lẻ

3kα = (A + α –3)(A + α – 2)2 / (3Pi + α)2 với m = 3 khi A chẵn

Trong đó: A là số lượng các nguyên tử trong phân tử được mô tả; là bán kính

cộng hóa trị nguyên tử của các nguyên tử trong hợp chất vòng khác carbon; Pi: số

lượng đường bậc m trong phân tử i; m là bậc đường.

Bán kính cộng hóa trị nguyên tử là bán kính được sắp xếp dạng bảng của mỗi

nguyên tử và được sử dụng để tính giá trị cho chỉ số chỉ số hình học K. Bán kính

cộng hóa trị nguyên tử được định nghĩa như sau:

3sp

1i CR R

Với α là tông Ri và RCsp3; Ri và RCsp3 bán kính nguyên tử thứ i và bán kính Csp3.

218

5) logP là logarithm (cơ số 10) của hệ số phân tán P của octanol - nước [14].

6) MaxNeg là điện tích âm lớn nhất của các các nguyên tử trong một phân tử.

7) MaxQp là điện tích dương lớn nhất của các các nguyên tử trong một phân tử.

8) MolWeight: là phân tử khối của phân tử

9) Polar: là độ phân cực của phân tử, được tính dựa trên phương pháp của Miller,

công thức 1.12.

A

A

( )ahp

Trong đó αA là độ phân cực trung bình nguyên tử cho nguyên tử A. Phương

pháp này sử dụng 400 hợp chất chứa H, C, N, O, S, F, Cl, B, I, và P để xác định sai

số của αA với sai số 2,2-2,8% giữa phép phân cực phân tử thực nghiệm và tính toán.

Đơn vị là Å3 (1Å = 10-10 m).

10) Sp.Pol: là độ phân cực cụ thể của một phân tử: Sp.Pol = Polar/Volume

11) Volume: Thể tích của một phân tử. Thể tích phân tử của một phân tử được tính

bằng phương pháp lưới (grid) của Boder. Nó là một kỹ thuật tích hợp sử dụng một

khối lưới trung tâm trên mỗi nguyên tử có cạnh là đường kính của nguyên tử.

3

t

4( / )

3i iV r n n

Trong đó n là số điểm lưới trong nguyên tử và không tính tính các nguyên tử

khác; nt là tông số điểm lưới trong một nguyên tử và ri là bán kính van der Waals

của nguyên tử thứ i.

Thể tích của nguyên tử V:

i

i

V V đơn vị là Å3(1Å = 10-10 m)

12) WienI (W): Chỉ số W là một tham số topo theo công thức của H. Wiener [36].

Các chỉ số W được dựa trên khung của phân tử (không có hydrogen). W được định

nghĩa là tông của khoảng cách giữa hai nguyên tử cacbon trong phân tử, liên quan

đến các liên kết cacbon và cacbon. Phương pháp tính toán như sau: Nhân số nguyên

tử cacbon vào một mặt của bất kỳ liên kết nào bằng các bên ở phía bên kia; W =

tông của các giá trị này cho tất cả các liên kết. Chỉ số Wiener của một phân tử

219

thường cao hơn đối với các phân tử lớn hơn và cho biết độ phân nhánh của phân tử.

Đặc biệt, W thường lớn cho các phân tử mở phân nhánh và nhỏ cho những phân tử

ít phân nhánh hơn. W tương quan với tham số hình dạng ovality và volume phân tử

và trong một số trường hợp, nó có thể được sử dụng thay cho một hoặc cả hai mô tả

phân tử này. W là một tham số đơn.

13) X1: chỉ số liên kết thứ nhất được tính trên tất cả các liên kết đơn (cạnh) của các

nguyên tử trong phân tử không có hydro. Nó là một trong các tham số mô tả hữu ích

nhất đối với các mô hình QSAR/QSPR. X1 là tông tất cả các liên kết từ nguyên tử i

đến nguyên tử j được tín theo công thức sau:

0.51 ( )i jX

δi = ϭ - h: là tông các liên kết xung quanh nguyên tử i; ϭ là số electron của nguyên

tử i trong orbital ϭ. h là số hydro liên kết với nguyên tử i.

14) X1 là 1 χ trong tính toán của Kier & Hall.

15) X3: là chỉ số liên kết thứ 3.

16) Ovality: là chỉ số hình học oval của phân tử.

2/32

0 VDW

14 3

44

SA SA SAOvality

SA R V

Với O là là tham số mô tả kích thước dựa trên tính chất đối với một thể tích cố định,

hình cầu với bề mặt nhỏ nhất; SA là bề mặt phân tử; SA0 là bề mặt phân tử cực tiểu;

VVDW là thể tích an der Waals; R là bán kính nguyên tử.

17) Sdssc: là số chỉ số E-State của nhóm (=C<) trong phân tử .

18) SdO: là số chỉ số E-State của nhóm (=O) trong phân tử .

19) SaaCH là số chỉ số E-State (chỉ số trạng thái điện tử) của nhóm ( CH )

trong phân tử.

20) SsOH là số chỉ số E-State của nhóm OH trong phân tử.

21) xp6 là chỉ số chi đường 6 (6P).

22) k2 hay Kappa 2 (2k) là chỉ số hình học kappa truyền thống (traditional Kappa

Shape Indices).

220

Trường hợp theo số đường:

mk= C (mPmaxmPmin)/(mPi)2

Trong đó:

Pmax: số lượng đường bậc m trong một phân tử tham chiếu không có nhánh

với cùng một số nguyên tử như phân tử được mô tả.

Pmin: số lượng đường bậc m trong một phân tử tham chiếu có đặc tính cấu trúc

vô cực và cùng một số nguyên tử như phân tử được mô tả.

Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả.

m là bậc đường

C = 2 (m = 1,2); C = 4 (m = 3)

Trường hợp theo số nguyên tử và đường:

1k = A(A-1)2/(1Pi)2 với m = 1

2k = A(A-1)(A-2)2/(2Pi)2 với m = 2

3k = A(A-1)(A-3)2/(3Pi)2 với m = 3 khi A lẻ

3k = A(A-3)(A-2)2/(3Pi)2 với m = 3 khi A chẵn

Trong đó:

A là số đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử

Pi: số lượng đường bậc m trong phân tử thực tế i được mô tả

m là bậc đường

23) knotp: sự khác nhau giữa chi nhóm 3 và chi đường/nhóm 4.

27) xp8: chỉ số chi đường 8 (8P) bậc thấp.

28) Knotpv: Sự khác nhau giữa chi nhóm hóa trị 3 và chi đường/nhóm hóa trị 4.

29) Phia: Kappa linh hoạt (. Các đại lượng Kappa Alpha 1 và Kappa Alpha 2

được kết hợp với một số nguyên tử (bình thường) để tạo thành chỉ số Kappa linh

hoạt (Kappa Flexibility), (phia) . Chỉ số Kappa linh hoạt phia được định nghĩa

như sau:

= (1k)(2k)/A

221

Trong đó: 1k là giá trị của kappa alpha 1; 2k là giá trị của kappa alpha 2; A là số

đỉnh (các nguyên tử hoặc nhóm hydrua) trong khung phân tử

Nvx là số đỉnh của khung (số nguyên tử không phải hydro, số các nhóm hydrua; ví

dụ. - CH3, - OH,…).

222

Phụ lục 59. Các phương pháp bán thực nghiệm

1) CNDO

Phương pháp CNDO (complete neglect of differential overlap) phương pháp

NDO (neglect of differential overlap) đơn giản nhất. Phương pháp này mô hình hóa

các giá trị orbitals chỉ sử dụng một bộ cơ sở tối thiểu của các loại orbitals Slater.

Phương pháp CNDO đã chứng minh kết quả hữu ích trên một số hydrocacbon.

CNDO đôi khi vẫn được sử dụng để tạo ra dự đoán đầu tiên về tính toán ab initio

trên các hydrocarbon.Thực tế tất cả các phép tính CNDO thực sự được thực hiện

bằng cách sử dụng phương pháp CNDO/2, đó là một tham số được cải thiện hơn

phương pháp CNDO/1 ban đầu. Có một phương pháp CNDO/S được tham số để

tính toán tính chất điện tử quang phô. Phương pháp CNDO/S mang lại dự đoán cải

thiện các dự đoán trạng thái kích thích năng lượng, nhưng khó khăn trong dự đoán

tính chất hình học phân tử. Cũng có những phần mở rộng của phương pháp

CNDO/2 bao gồm các yếu tố có orbitals d. Những kỹ thuật này không sử dụng phô

biến rộng rãi do tính giới hạn chính xác của kết quả.

2) INDO

Phương pháp INDO (intermediate neglect of diferential overlap) được sử

dụng cho các hợp chất hữu cơ. Ngày nay, nó đã bị thay thế bởi các phương pháp

chính xác hơn. INDO đôi khi vẫn được sử dụng như một phép tính ban đầu trong

các tính toán ab initio.

3) MNDO

Phương pháp MNDO (modified neglect of diatomic overlap) đã được sử

dụng nhiều trong các hợp chất hữu cơ. Nó đã được đưa vào một số chương trình

bán thực nghiệm phô biến cũng như chương trình MNDO. Ngày nay, nó vẫn được

sử dụng, nhưng các phương pháp AM1 và PM3 chính xác và phô biến hơn.

Có một số trường hợp mà phương phá MNDO đưa ra kết quả không chính

xác. Tính toán năng lượng kích thích điện tử thấp. Hàng rào năng lượng kích hoạt

thường có xu hướng cao.

223

Không phải luôn luôn tính được năng lượng tối thiểu bằng phương pháp

MNDO. Hàng rào đối với sự quay liên kết thường được tính là quá nhỏ. Các hợp

chất lớn và các hệ phân tử được tính toán không ôn định. Vòng bốn được dự đoán là

bền. Nhóm hàm bão hòa oxy trên vòng được dự đoán ngoài không gian. Liên kết

peroxide thì nhỏ hơn 0,17 Ao. Liên kết C-O-C lớn hơn 9o. Độ dài liên kết giữa các

electron âm thì quá ngắn. Liên kết hydrogem thì quá mạnh và dài.

Phương pháp biến thể của MNDO là MNDO/d. Đây là hàm tương đương bao

gồm các orbital d. Phương pháp này cải thiện tiên đoán hình học của các phân tử

tăng dần. Phương pháp này đôi khi được sử dụng để mô hình hóa các hệ thống kim

loại chuyển tiếp. Phương pháp MNDO cũng bao gồm các tương quan điện tử với

phương pháp MNDO.

4) AM1

Phương pháp AM1 (Austin Model 1) phô biến trong mô hình hóa các hợp

chất hữu cơ. AM1 thường dùng trong tính toán nhiệt tạo thành ΔHf chính xác hơn

phương pháp MNDO. Tùy thuộc vào cấu trúc phân tử và thông tin cấu trúc tính

toán, một trong hai AM1 hoặc PM3 thường cho kết quả chính xác nhất định.

Có một số ưu điểm và nhược điểm về kết quả thu được từ những phương

pháp này. AM1 đã cải thiện tính toán năng lượng kích hoạt so với phương pháp

MNDO. Phương pháp AM1 có kết quả tính toán đối với nhôm tốt hơn PM3 và tính

toán kém chính xác đối với nitơ, phốt pho hay tính toán nhiệt tạo thành của các

phân tử với có điện tích lớn. Ngoài ra, AM1 thường ứng dụng tính toán cho liên kết

O-Si-O, dự đoán năng lượng nhóm alkyl. Nhìn chung, AM1dự đoán năng lượng và

hình học tốt hơn MNDO, nhưng không bằng như PM3.

5) PM3

Phương pháp PM3 (Parameterization method 3) sử dụng phương trình gần

giống như phương pháp AM1 với bộ tham số được cải thiện. Đây là phương pháp

phô biến đối với hệ thống hữu cơ. PM3 chính xác hơn AM1 đối với tính các góc độ

liên kết hydro, nhưng AM1 chính xác hơn đối với tính năng lượng liên kết hydro.

224

Các phương pháp PM3 và AM1 cũng phô biến hơn các phương pháp bán thực

nghiệm khác do có sẵn các thuật toán tính toán năng lượng solvat hóa.

Ngoài ra còn có một số điểm mạnh và hạn chế của PM3. Nói chung, tính

toán nhiệt tạo thành chính xác hơn so với MNDO hoặc AM1. Các phân tử siêu hóa

trị (Hypervalent) cũng được dự đoán chính xác hơn. PM3 có khuynh hướng tiên

đoán rằng rào xoay xung quanh liên kết CaN trong các peptide quá thấp. Liên kết

giữa Si và các nguyên tử halogenua quá ngắn. PM3 cũng có xu hướng dự đoán

trạng thái điện tử không chính xác đối với các hợp chất gecmani. Dự đoán điện tích

nito không chính xác. Khoảng cách không liên kết thì quá ngắn. Liên kết hydro thì

quá ngắn khoảng 0,1 Ao, nhưng định hướng thường chính xác. Nhìn chung, PM3 dự

đoán năng lượng và độ dài liên kết chính xác hơn AM1 hoặc MNDO.

6) TNDO

Phương pháp TNDO (typed neglect of differential overlap) là phương

pháp bán thực nghiệm tham số hóa đặc biệt để để tính toán độ dịch chuyển

hóa học của phô NMR. Sự tham số hoá này đi cao hơn các phương pháp bán

thực nghiệm khác là phân biệt giữa các nguyên tử của cùng một nguyên tố

nhưng lai hóa khác nhau.Ví dụ, các tham số khác nhau được sử dụng để mô tả

một carbon sp2 và carbon sp3. ó hai phiên bản của phương pháp này: TNDO/1

và TNDO/2.

225

Phụ lục 60. Ma trận dữ liệu trong nghiên cứu QSAR

Phân tử Hoạt

tính

Tính chất /

Tham số/

Phân mảnh 1

Tính chất /

Tham số/

Phân mảnh 2

Tính chất /

Tham số/

Phân mảnh 3

… Tính chất /

Tham số/

Phân mảnh n

Phân tử i Yi X1i X2i X3i … Xni

Phân tử ii Yii X1ii X2ii X3ii … Xnii

Phân tử iii Yiii X1iii X2iii X3iii … Xniii

… … … … … … …

Phân tử n Yn X1n X2n X3n … Xnn

226

Phụ lục 61. Các loại thông tin bao gồm trong các phương pháp mô phỏng silico

Dữ liệu được mô phỏng

Tác dụng dược lý

Tác dụng gây độc

Tính chất hóa lý

Các tính chất dược động học, sinh học khả dụng

Môi trường

Hóa học

Tính chất hóa lý

Thuộc tính cấu trúc 2-D và 3-D

Hiện diện, vắng mặt và đếm các nguyên tử, mảnh, tiểu cấu trúc

Hoá học lượng tử và tính toán

Mô phỏng

Thiết kế các nhóm dẫn xuất có cấu trúc tương tự

Thống kê

3D/4D QSAR

Các lĩnh vực khác

Chất lượng và độ tin cậy của dữ liệu

Mô hình hóa và mô hình dự báo

Phạm vi áp dụng

Chất lượng mô hình và độ tin cậy của dự báo

227

Phụ lục 62. Tóm tắt các phương pháp tiếp cận mô hình chính cho sự xây dựng các

QSAR và trong kỹ thuật silico

Phương pháp (Q)SAR

Phân tích Hansch

Free-Wilson

Các mảnh cấu trúc và nhận diện cấu trúc

Sự hình thành và phân loại của nhóm

Phân tích hồi quy tuyến tính

Bình phương cực tiểu riêng phần

Nhận dạng mẫu

Các phương pháp Robust

Dược phẩm

Mô hình 3-D

CoMFA

228

Phụ lục 63. Phương pháp phô cộng hưởng từ hạt nhân

Phô 1H-NMR

Phô 1H-NMR cho biết có bao nhiêu loại proton trong phân tử, đồng thời cho phép

xác định số proton của từng loại. Trong phô 1H-NMR, phần diện tích vẽ ra bởi mũi

cộng hưởng, tỷ lệ thuận với số lượng proton gây ra tín hiệu cộng hưởng của mũi đó,

được gọi là cường độ tích phân của mũi cộng hưởng. Một tín hiệu cộng hưởng, do

ảnh hưởng của các proton bên cạnh có thể bị chẻ thành nhiều mũi, khi giải phô cần

tính tông diện tích các mũi.

Cách giải phô 1H-NMR

Yêu cầu về mẫu đo phô 1H-NMR đảm bảo khô, độ tinh khiết trên 95%, chất lỏng

cần kiểm tra độ tinh khiết bằng sắc ký lỏng hiệu năng cao (HPLC) hoặc kiểm tra

bằng SKLM với các hệ dung môi khác nhau cho hiện vết tròn, duy nhất ở Rf = 0,7-

0,8; 0,5-0,6; 0,2-0,3 đối với hệ dung môi giải ly từ phân cực mạnh, phân cực trung

bình, phân cực yếu tương ứng.

Đo phô 1H-NMR: với máy 200 MHz cần khoảng 5 mg mẫu, nếu máy hoạt động ở

tần số 500 MHz thì lượng mẫu yêu cầu sẽ giảm. Sau khi đo có thể thu hồi mẫu.

Một số dữ liệu cần lưu ý khi giải phô:

- Đối với proton của cacbon thơm (C=C) có mũi cộng hưởng tại = 7,0 - 8,5 ppm.

- Đỗi với proton của cacbon mạch thẳng (C=C) có mũi cộng hưởng tại = 4,5 - 6,0

ppm, tuy nhiên khoảng = 4,5 - 6,0 cũng có thể do proton gắn vào 2 hay nhiều

nguyên tử có độ âm điện như oxy, halogen.

- Đối với H của nhóm ankin đầu mạch có = 2,5 ppm.

- Đối với H của cacbon bên cạnh nhóm cacbony có = 2,1 – 2,5 ppm.

- Đối với H của cacbon liên kết với oxy, halogen có = 3 – 4 ppm. Nếu proton càng

xa nguyên tử có độ âm điện cao thì = 1 – 3 ppm

- Đối với H của cacbon nhóm vinyl có = 5 – 6 ppm.

- Đối với H thuộc nhóm andehit có = 9 – 10 ppm.

- Đối với H thuộc nhóm axit có >10 ppm.

229

Phô 13C-NMR

Mẫu khảo sát khi đo phô 13C-NMR cần hòa tan trong dung môi đã được deuterium

hóa (0,6 ml) và có thêm chất nội chuẩn TMS (tetrametilsilan) (1µL). Có nhiều loại

dung môi để hòa tan các hợp chất đo phô 13C-NMR.

Lượng mẫu sử dụng đối với máy 200MHz khoảng 30 mg, máy có tần số 500 MHz

cần khoảng 5-10 mg, mẫu sau khi đo có thể thu hồi.

Các tín hiệu trong phô 13C-NMR trong khoảng thang đo rất rộng từ 0 - 240 ppm.

Cách giải phô 13C-NMR:

Phô 13C-NMR kết hợp với phô NMR-DEPT 135 và NMR-DEPT 90:

- Phô 13C-NMR cho biết tông số cacbon trong phân tử.

- Phô NMR-DEPT 135 và NMR-DEPT 90 cho biết tông số Csp3, Csp2.

Sau đây là độ dịch chuyển hóa học của 13C tính bằng ppm (so từ TMS):

+ Đối với C liên kết trực tiếp với nguyên tử có độ âm điện lớn: R-CH3 có = 8 – 30

ppm; R-CH2-R có = 15 – 55 ppm; CHR3, CR4 có có = 20 – 60 ppm

+ Đối với Csp3 liên kết với O có = 40 – 80 ppm; Csp3 liên kết với Cl có = 35 –

80 ppm; Csp3 liên kết với Br = 25 – 65 ppm; Csp3 liên kết với N có = 30 – 65

ppm.

+ Đối với Csp2 và Csp: nhóm C≡C có = 65 – 90 ppm; C≡N có = 110 – 140 ppm;

>C=C< có = 100 – 150 ppm; ->C=C< thơm có = 110 – 175 ppm.

+ Đối với C của nhóm aldehit hoặc xeton, axit có = 155 – 220 ppm.

Phô hai chiều

Phô HSQC (Heteronuclear Single Quantum Correlation) cho biết tương quan giữa

các tín hiệu proton với tín hiệu của cacbon qua 1 liên kết. Phô

HMBC(Heteronuclear Multiple Quantum Correlation) cho biết tương quan giữa các

tin hiệu proton với tín hiệu của cacbon qua 2 hay 3 liên kết. Từ các tín hiệu của

cacbon 13C trên trục tung kẻ các đường song song với trục hoành trong toàn phô đồ,

từ tín hiệu 1H trên trục hoành kẻ các đường song song với trục tung. Tại các vị trí

230

giao nhau của hai đường kẻ trên có tín hiệu giao, nghĩa là proton này liên kết trực

tiếp với cacbon kia.

231

Phụ lục 64. Phương pháp nhiễu xạ tia X đơn tinh thể

Phương pháp lâu đời nhất và chính xác nhất của tinh thể học tia X là nhiễu

xạ tia X đơn tinh thể, trong đó chùm tia X bị bản hồi từ các mặt phẳng có khoảng

cách đều nhau của một đơn tinh thể, tạo ra một mẫu nhiễu xạ gồm các điểm gọi là

nhiễu xạ. Mỗi nhiễu xạ tương ứng với một tập các mặt phẳng có khoảng cách đều

nhau bên trong tinh thể. Mật độ các electron bên trong tinh thể được xác định từ vị

trí và độ sáng của các nhiễu xạ khác nhau quan sát được khi tinh thể từ từ xoay

quanh chùm tia X; mật độ này, cùng với dữ liệu bô sung (về thành phần hóa học),

cho phép ta xác định vị trí của các nguyên tử bên trong tinh thể. Nó có thể xác định

lực liên kết hóa học trung bình giữa các nguyên tử và góc giữa chúng trong khoảng

vài ngàn Ångström và vài chục độ.

Kĩ thuật nhiễu xạ tia X đơn tinh thể có 3 bước chính.

Bước 1: là thu thập một tinh thể tốt. Tinh thể phải đủ lớn (thường là lớn hơn

100 micron ở mọi chiều), không có tạp chất và có cấu trúc ôn định, không bị nứt nẻ.

Bước 2: đặt tinh thể vào trong đường đi của chùm tia X cực mạnh, thường có

bước sóng đơn (monochromatic X-rays), để tạo ra các mẫu nhiễu sắc. Tinh thể từ từ

xoay và dữ liệu được thu thập lại. Mỗi ảnh chứa hàng chục ngàn điểm nhiễu xạ với

các cường độ khác nhau.

Bước 3: dùng kĩ thuật tính toán và dữ liệu hóa học bô sung để đưa ra mô

hình về sự sắp xếp các nguyên tử bên trong tinh thể.

Documents

LỜ 0 Đ2$1hueuni.edu.vn/sdh/attachments/article/1251/LuanAn.pdf · 2019-11-18 · i LỜ 0 Đ2$1 Tôi cam đoan luận án này là kết quả nghiên cứu thực sự của cá