View
4
Download
0
Category
Preview:
Citation preview
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẶNG CAO CƢỜNG
MỘT SỐ PHƢƠNG PHÁP PHÂN TÍCH TRONG
MẠNG TRAO ĐỔI CHẤT
LUẬN VĂN THẠC SĨ
Hà Nội – 2008
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẶNG CAO CƢỜNG
MỘT SỐ PHƢƠNG PHÁP PHÂN TÍCH TRONG
MẠNG TRAO ĐỔI CHẤT
Ngành: Công nghệ Thông tin
Chuyên ngành: Khoa học Máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ
NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TS. Hoàng Xuân Huấn
Hà Nội – 2008
1
MỤC LỤC
MỤC LỤC ................................................................................................................... 1
DANH MỤC CÁC KÝ HIỆU, THUẬT NGỮ VIẾT TẮT ........................................... 3
DANH MỤC CÁC BẢNG .......................................................................................... 4
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ....................................................................... 5
MỞ ĐẦU ..................................................................................................................... 7
CHƢƠNG 1 - QUÁ TRÌNH TRAO ĐỔI CHẤT VÀ MẠNG TRAO ĐỔI CHẤT ..... 10
1.1. Giới thiệu ..................................................................................................... 10
1.2. Quá trình trao đổi chất .................................................................................. 11
1.2.1. Sự biến đổi Protein ................................................................................. 12
1.2.2. Sự biến đổi Glucide ................................................................................ 14
1.2.3. Sự biến đổi Lipid ................................................................................... 15
1.2.4. Sự biến đổi của nƣớc và các chất khoáng ............................................... 16
1.2.5. Chuyển hóa năng lƣợng ......................................................................... 16
1.3. Mạng trao đổi chất ........................................................................................ 18
1.3.1. Giới thiệu vể mạng trao đổi chất ............................................................ 18
1.3.2. Mô hình toán học ................................................................................... 19
1.3.3. Trạng thái ổn định .................................................................................. 20
1.3.4. Các ràng buộc đối với giá trị dòng.......................................................... 21
CHƢƠNG 2 - CƠ SỞ TOÁN HỌC ........................................................................... 22
2.1. Quy hoạch tuyến tính .................................................................................... 22
2.2. Quy hoạch bậc hai ........................................................................................ 23
CHƢƠNG 3 - MẠNG TRAO ĐỔI CHẤT CỦA E. COLI ......................................... 26
3.1. Giới thiệu ..................................................................................................... 26
3.2. Phƣơng pháp xây dựng ................................................................................. 26
3.2.1. Xác định chức năng ................................................................................ 26
2
3.2.2. Cơ sở dữ liệu các phản ứng trao đổi chất ................................................ 27
3.2.3. Xây dựng mô hình giả lập mạng trao đổi chất ........................................ 28
3.3. Phân tích mạng trao đổi chất ......................................................................... 30
3.3.1. Phân tich cân bằng dòng (Flux balance analysis - FBA) ......................... 30
3.3.2. Xây dựng các đƣờng phản ứng trao đổi chất........................................... 31
CHƢƠNG 4 - CÁC PHƢƠNG PHÁP PHÂN TÍCH MẠNG TRAO ĐỔI CHẤT ...... 32
4.1. Các phƣơng pháp phân tích với dạng wild-type (dạng tự nhiên) ................... 32
4.1.1. Phân tích cân bằng dòng (Flux Balance Analysis – FBA) ....................... 32
4.1.2. Xác định hàm mục tiêu trong phƣơng pháp FBA.................................... 33
4.2. Các phƣơng pháp phân tích với dạng đột biến (bị xoá bỏ gen) ...................... 34
4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant) ......................... 34
4.2.2. Cực tiểu hoá điều chỉnh trao đổi chất (Minimization Of Metabolic
Adjustment - MOMA) ......................................................................................... 34
4.2.3. Cực tiểu hoá thay đổi điều hoà (Regulatory On/Off Minimization -
ROOM) 39
CHƢƠNG 5 - BÀI TOÁN CỤ THỂ VÀ PHƢƠNG PHÁP TIẾP CẬN ..................... 45
5.1. Phát biểu bài toán ......................................................................................... 45
5.2. Phƣơng pháp FBA/MOMA cải tiến .............................................................. 49
5.3. Tìm kiếm những cặp gen không giao hoán .................................................... 49
CHƢƠNG 6 - KẾT QUẢ VÀ ĐÁNH GIÁ ................................................................ 51
6.1. FLUXOR - một hệ thống phần mềm để nghiên cứu các hệ thống sinh học sử
dụng phƣơng pháp FBA/MOMA ............................................................................ 51
6.2. Phƣơng pháp FBA cải tiến ............................................................................ 52
6.3. Các gen không giao hoán .............................................................................. 53
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .................................................................. 56
TÀI LIỆU THAM KHẢO.......................................................................................... 57
3
DANH MỤC CÁC KÝ HIỆU, THUẬT NGỮ VIẾT TẮT
FBA Flux balance analysis
MOMA Minimization Of Metabolic Adjustment
ROOM Regulatory On/Off Minimization - ROOM
LP Linear Programming
QP Quadratic programming
NP-Hard None Polynomial – Hard
E. COLI Escherichia coli
PEP Phosphoenolpyruvate
PYR Pyruvate
KKT Karush-Kuhn-Tucker
4
DANH MỤC CÁC BẢNG
Bảng 3.1 Danh sách một số phản ứng trao đổi chất của E. coli ......................... 27
Bảng 6.1 Một số chuỗi gen không giao hoán của E. coli. ................................. 54
Bảng 6.2 Một số thống kê về các chuỗi gen của mô hình mạng trao đổi chất E.
coli JR904. ....................................................................................................... 54
5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Mô hình đơn giản của quá trình đồng hoá chất đạm, chất đƣờng và
chất béo [52]. ................................................................................................... 12
Hình 1.2. Vòng tuần hoàn axít citric, một trong những phần quan trọng của quá
trình trao đổi chất [52]. ..................................................................................... 13
Hình 1.3. Mô hình khái quát vòng tuần hoàn axít citric [52]. ............................ 17
Hình 1.4. Minh hoạ một mạng trao đổi chất đơn giản. ...................................... 19
Hình 2.1. Minh hoạ lời giải của một bài toán quy hoạch tuyến tính (John Wiley
& Sons, Inc) ..................................................................................................... 23
Hình 2.2. Minh hoạ lời giải của một bài toán quy hoạch bậc hai [53]. .............. 24
Hình 3.1 Minh hoạ một kiểu gen trao đổi chất [50]. ......................................... 29
Hình 3.2 Minh hoạ một mạng trao đổi chất [50]. .............................................. 29
Hình 3.3 Minh hoạ ma trận stoichiometry [50]. ................................................ 30
Hình 4.1 Không gian dòng của một mạng trao đổi chất có thể biểu diễn nhƣ một
hình nón. .......................................................................................................... 32
Hình 4.2 Minh hoạ hàm mục tiêu của một mạng trao đổi chất: Z=B+D+2E ..... 34
Hình 4.3 Mô hình xoá bỏ gen [8]...................................................................... 34
Hình 4.4 Nguyên lý tối ƣu của FBA và MOMA [4]. ........................................ 35
Hình 4.5 Minh hoạ nghiệm của phƣơng pháp MOMA trên không gian nhiều
chiều................................................................................................................. 36
Hình 4.6 Một minh hoạ cho các đƣờng phản ứng (pathway) của mạng carbon
trung tâm của E. coli, màu sắc đƣợc sử dụng để phân biệt các pathway khác
nhau [4]. ........................................................................................................... 37
Hình 4.7 Một ví dụ về dự đoán dòng của E. coli đột biến [4]............................ 37
Hình 4.8 Kết quả dự đoán phân phối dòng của MOMA và FBA [4] . ............... 38
Hình 4.9 So sánh FBA, MOMA và ROOM [8]. ............................................... 42
Hình 4.10 Giản đồ miêu tả mạng trao đổi chất carbon trung tâm của E. coli [8].
......................................................................................................................... 43
6
Hình 4.11 Danh sách 50 gen MOMA dự đoán nhầm. ....................................... 44
Hình 5.1 Một mô hình của cặp gen không hoán vị A và B................................ 46
Hình 5.2 Một biểu đồ thể hiện tính bất đồng bộ của quá trình xoá các cặp gen
[3]. ................................................................................................................... 47
Hình 5.3 Một minh hoạ trƣờng hợp có nhiều nghiệm tối ƣu tự nhiên và ảnh
hƣởng của chúng tới các nghiệm chiếu vuông góc (dạng đột biến) [3]. ............ 48
Hình 6.1 Hệ thống phần mềm FLUXOR sử dụng phƣơng pháp FBA/MOMA. 51
Hình 6.2 So sánh FBA chuẩn và FBA cải tiến .................................................. 52
Hình 6.3 So sánh FBA chuẩn và FBA cải tiến (phóng to) ................................. 53
7
MỞ ĐẦU
Nghiên cứu mạng trao đổi chất đã thu hút nhiều sự quan tâm trong những
năm gần đây [4-10]. Phần lớn nghiên cứu tập trung vào việc xây dựng các mô
hình toán học của quá trình trao đổi chất trong tế bào.
Ở đây chúng tôi tập trung vào các phƣơng pháp phân tích dòng (flux) sử
dụng mô hình dựa trên các ràng buộc và trạng thái ổn định. Mô hình này sử
dụng các ràng buộc ở nhiều dạng nhƣ ma trận hệ số cân bằng phƣơng trình hoá
học, hệ số cân bằng nhiệt động lực học, công suất dòng, bảo toàn năng lƣợng và
một số ràng buộc khác để hạn chế không gian phân phối dòng có thể của mạng
trao đổi chất.
Dựa trên giả thuyết trong sinh học về các sinh vật không nhân nhƣ
Escherichia coli thƣờng phát triển tối đa trong quá trình tiến hoá, phƣơng pháp
Phân tích cân bằng dòng (Flux Balance Analysis - FBA) dự đoán các phân phối
dòng trao đổi chất ở trạng thái ổn định bằng phƣơng pháp quy hoạch tuyến tính.
Với giả sử hoạt động của mạng đạt trạng thái tối ƣu chúng ta có thể tìm ra một
phân phối dòng tối ƣu của mạng. Ngoài ra hiện có rất nhiều điều kiện tối ƣu
khác có thể đƣợc áp dụng nhƣ tối ƣu sản xuất một hợp chất nhất định, tối ƣu
năng lƣợng sử dụng. Các điều kiện này đều có cùng mục tiêu là để đạt đƣợc ý
nghĩa sinh học khi xác định trạng thái trao đổi chất của cơ thể. FBA là một
phƣơng pháp dựa trên ràng buộc cụ thể đã thành công trong việc dự đoán tốc độ
phát triển, tốc độ hấp thu và bài tiết của tế bào ở dạng nguyên thuỷ. Tuy nhiên
với các dạng đột biến thì phƣơng pháp FBA tỏ ra không hiệu quả và chính xác.
Vì vậy một phƣơng pháp khác đƣợc dùng trong trƣờng hợp này là Tối thiểu hoá
điều chỉnh trao đổi chất (Minimization Of Metabolic Adjustment – MOMA) –
phƣơng pháp này sử dụng quy hoạch bậc hai. Phƣơng pháp MOMA cho thấy ƣu
điểm về tính chính xác so với phƣơng pháp FBA trong dự đoán các trƣờng hợp
đột biến.
Luận văn đƣa ra và kiểm chứng một giả thuyết mới, đó là trƣờng hợp hai
chuỗi gen bị xoá bỏ có thứ tự khác nhau có thể dẫn đến các trạng thái khác nhau
của sinh vật nhƣ tiếp tục tồn tại hoặc bị diệt vong. Giả thuyết của chúng tôi có ý
nghĩa quan trọng trong sinh học vì từ đó giúp chúng ta thay đổi cách nghĩ truyền
thống trong sinh học khi bỏ qua các đặc tính bất đối xứng nảy sinh từ thứ tự của
các đột biến. Để kiểm chứng giả thuyết chúng tôi sử dụng mô hình mạng trao
đổi chất mới nhất JR904 của vi khuẩn Escherichia coli và các phƣơng pháp
FBA, MOMA để tìm kiếm các chuỗi gen có tính không giao hoán nhƣ đã mô tả.
8
Chúng tôi đã tìm ra một số chuỗi gen có tính chất trên chứng tỏ giả thuyết đƣa ra
là có ý nghĩa và cơ sở khoa học.
Ngoài ra trong quá trình sử dụng FBA, chúng tôi phát hiện một nhƣợc điểm
của phƣơng pháp FBA hiện tại là các dòng trao đổi chất có những giá trị quá lớn
(cỡ 10.000) – không mang tính sinh học và có thể dẫn đến các kết quả không
chính xác khi dùng cho MOMA. Vì vậy luận văn đề xuất một cải tiến cho FBA
để tăng cƣờng tính chính xác cũng nhƣ ý nghĩa sinh học của các kết quả dự
đoán. Ƣu điểm của phƣơng pháp đề xuất đƣợc kiểm chứng bằng kết quả thực
nghiệm trên mô hình mạng trao đổi chất mới nhất JR904 của E. coli.
Cuối cùng chúng tôi phát triển một hệ thống phần mềm mã nguồn mở để
phục vụ cho quá trình nghiên cứu này. Hệ thống phân mềm này giúp giải phóng
các nhà sinh học khỏi những tính toán phức tạp để tập trung vào vấn đề thực sự
cần quan tâm, nghiên cứu.
Các kết quả nghiên cứu đƣợc công bố trong hai báo cáo khoa học ở Hội
nghị quốc tế PRICAI 2008 và Hội thảo quốc gia CNTT, Huế 2008 (xem [3],
[1]).
Ngoài phần kết luận, luận văn đƣợc trình bày nhƣ sau :
Chƣơng 1 : Quá trình trao đổi chất và mạng trao đổi chất
Giới thiệu quá trình chuyển hoá chất của sinh vật và mạng trao đổi chất - một
mô hình toán học để nghiên cứu quá trình trao đổi chất.
Chƣơng 2 : Cơ sở toán học
Giới thiệu về quy hoạch tuyến tính và quy hoạch bậc hai, cơ sở toán học chính
cho các phƣơng pháp FBA, MOMA.
Chƣơng 3 : Mạng trao đổi chất của E. coli
Trong chƣơng này , chúng tôi giơi thiêu vê mạng trao đổi chất của vi khuẩn E.
coli, phƣơng phap xây dựng mạng từ các dữ liệu thực nghiệm.
Chƣơng 4 : Các phƣơng pháp phân tích mạng trao đổi chất
Chƣơng này giới thiệu mô hình toán học của các phƣơng pháp FBA, MOMA,
ROOM.
Chƣơng 5 : Bài toán cụ thể và phƣơng pháp tiếp cận
9
Trong chƣơng này, chúng tôi trình bày cụ thể bài toán, các vấn đề phát sinh
trong quá trình thực hiện cũng nhƣ đề xuất các cải tiến để giải quyết các vấn đề
đó.
Chƣơng 6 : Kết quả và đánh giá
Chƣơng nay trình bày và đánh giá các kết quả đạt đƣợc.
10
CHƢƠNG 1 - QUÁ TRÌNH TRAO ĐỔI CHẤT VÀ MẠNG
TRAO ĐỔI CHẤT
1.1. Giới thiệu
Mạng sinh học đang thu hút đƣợc nhiều sự quan tâm của các nhà khoa học
trong và ngoài nƣớc hiện nay [4-10]. Mạng sinh học thể hiện sự điều hoà và
tƣơng tác vật lý giữa các gen và protein, từ đó nó cho phép phân tích hoạt động
của mạng với đầu vào môi trƣờng cho trƣớc. Hiểu một cách đơn giản thì mạng
sinh học bao gồm các bộ phận sinh học kết nối có thứ bậc với nhau, các bộ phận
này gọi là thành phần Cis-Regulatory (CRE) – thành phần điều hoà cùng phía.
Các CRE là thành phần điều khiển logic gắn kết với bộ gen và điều khiển hầu
nhƣ toàn bộ mọi quá trình sinh học chủ yếu qua các protein, cùng với các chất
trao đổi, chúng tạo nên một mạng liên kết phức tạp tự điều khiển để duy trì trạng
thái cân bằng nội môi (homeostasis) của tế bào. Mỗi CRE đƣợc cấu thành từ một
hay nhiều chuỗi DNA motifs (thành phần phiên mã gắn kết vị trí thƣờng nằm ở
phần đầu gen), chúng hoạt động nhƣ một thành phần uỷ nhiệm để nhận các tín
hiệu điều hoà bằng cách gắn kết với các tín hiệu phân tử và thành phần phiên
mã. Mỗi mức hoạt động của motif cùng với sự điều khiển kết hợp tự nhiên giữa
chúng xác định khả năng kích hoạt của một gen. Từ đó chúng ta cần tìm các
motif và các hoạt động cơ bản phụ thuộc ngữ cảnh của chúng để xây dựng mạng
sinh học mức độ gen, từ đó giúp chúng ta hiểu “Bộ gen mã hoá các đặc tính của
cơ thể nhƣ thế nào”.
Ngoài ra, nhƣ chúng ta đã biết, protein còn là sản phẩm của gen và cùng
với hoạt động của các CRE, chúng có trách nhiệm với hầu hết các chức năng
sinh học trong cơ thể sinh vật. Trong đó chức năng đáng kể nhất là sản sinh năng
lƣợng của tế bào, ở đó chúng chuyển các chất từ dạng này sang dạng khác để
sinh ra hoặc hấp thu năng lƣợng. Nghiên cứu các hệ protein và chất trao đổi, làm
rõ các trạng thái tƣơng ứng của chúng cũng nhƣ trạng thái thể hiện của một cơ
thể khi đáp ứng với một tín hiệu của môi trƣờng giúp chúng ta hiểu rõ cơ chế
chủ yếu của sinh học.
Do đó để hiểu rõ cơ chế mã hoá gen cũng nhƣ cơ chế phản ứng với điều
kiện môi trƣờng, chúng ta cần hiểu các đặc tính của quá trình điều hoà gen và
khả năng của hệ protein, hệ trao đổi chất cũng nhƣ mối liên quan phức tạp giữa
chúng để xây dựng đƣợc một nền tảng về các hoạt động của tế bào. Do sự quan
trọng nhƣ vậy, chúng ta cần nghiên cứu thống nhất tập trung với ba mục tiêu: lý
giải quá trình điều hoà gen, phân tích các trạng thái của hệ protein và tìm ra các
11
nguyên lý hoạt động mới của quá trình trao đổi trong các hệ sinh học. Mục tiêu
là làm sáng tỏ các nguyên tắc cơ bản của tế bào hay nói cách khác là ngôn ngữ
của các chức năng sinh học. Luận văn thạc sĩ này tập trung vào một trong ba
mục tiêu trên là mạng trao đổi chất và các phƣơng pháp phân tích chúng.
Nghiên cứu mạng trao đổi chất đã thu hút nhiều sự quan tâm những năm
gần đây. Phần lớn nghiên cứu tập trung vào việc xây dựng các mô hình toán học
của quá trình trao đổi chất tế bào. Ở đây chúng tôi tập trung vào phân tích dòng
(flux) sử dụng mô hình dựa trên ràng buộc trạng thái ổn định. Trong mô hình
này sử dụng các ràng buộc ma trận hệ số cân bằng, nhiệt động lực học, công suất
dòng, bảo toàn năng lƣợng và các ràng buộc khác để hạn chế không gian phân
phối dòng có thể đạt tới của mạng trao đổi chất. Với giả sử hoạt động tối ƣu của
mạng, rất nhiều điều kiện tối ƣu nhƣ phát triển cực đại, năng lƣợng cực đại đƣợc
áp dụng, với mục tiêu đạt đƣợc ý nghĩa sinh học trạng thái trao đổi chất của cơ
thể. FBA là một phƣơng pháp dựa trên ràng buộc cụ thể đã thành công trong
việc dự đoán tốc độ phát triển, tốc độ hấp thu và bài tiết của sinh vật.
1.2. Quá trình trao đổi chất
Để có thể thu nhận đƣợc các chất dinh dƣỡng có nguồn gốc tự nhiên từ môi
trƣờng bên ngoài, cơ thể phải trải qua một quá trình biến đổi sinh lý - sinh hóa
phức tạp với sự tham gia của nhiều cơ quan chức năng khác nhau và xảy ra theo
một trình tự nhất định đƣợc chia thành các phần tƣơng đối độc lập bao gồm: Sự
tiêu hóa thức ăn, Trao đổi chất, Chuyển hóa năng lƣợng, Trao đổi nhiệt và Bài
tiết, tất cả đều chịu sự điều khiển của hệ thần kinh và các tuyến nội tiết có sự
tham gia của các enzyme sinh học.
Các chất dinh dƣỡng sau khi đƣợc tiêu hóa sẽ đi vào máu trong cơ thể, trải
qua quá trình chuyển hóa phức tạp, tổng hợp nên các cấu trúc của tế bào, cung
cấp năng lƣợng cho tế bào thực hiện hoạt động sống.
Sự trao đổi chất, về bản chất, là một chuỗi các phản ứng sinh hóa phức tạp.
Các phản ứng đó chỉ có thể xảy ra trong những điều kiện nhất định nhƣ nhiệt độ,
thành phần các ion, thành phần các chất khí và độ pH … , đồng thời cũng góp
phần quan trọng vào việc ổn định môi trƣờng bên trong cơ thể. Quá trình trao
đổi chất trong cơ thể chủ yếu diễn ra với các chất đạm, đƣờng và béo. Chúng ta
có thể thấy minh hoạ quá trình trao đổi chất nhƣ hình 1.1.
12
Hình 1.1. Mô hình đơn giản của quá trình đồng hoá chất đạm, chất đƣờng
và chất béo [52].
1.2.1. Sự biến đổi Protein
Protein là một loại hợp chất hữu cơ phức tạp đƣợc cấu tạo từ các acid amin.
chiếm 60-80% trọng lƣợng khô của tổ chức tế bào, thành phần của các enzym
xúc tác sinh học, là thành phần của huyết tƣơng đảm bảo áp suất thẩm thấu,
tham gia vào hệ thống đệm góp phần ổn định nội môi, là các kháng thể, tham gia
chức năng bảo vệ cơ thể…và còn có khả năng cung cấp năng lƣợng cho cơ thể
hoạt động. Khi oxi hóa 1g protide sẽ giải phóng 4,1Kcal năng lƣợng.
13
Hình 1.2. Vòng tuần hoàn axít citric, một trong những phần quan trọng của
quá trình trao đổi chất [52].
Protein chứa trong thực phẩm đƣợc hấp thu và biến đổi đi vào ống tiêu hóa,
phân giải thành các acid amin ở ruột non, hấp thụ qua thành ruột đi vào các mao
mạch và theo máu đến gan. Một phần các acid amin này đƣợc sử dụng để tổng
hợp các prôtêin cấu trúc và các men, phần khác đƣợc máu chuyển đến các tổ
chức để tổng hợp các protein của tổ chức và để dự trữ ở tế bào. Quá trình khử
các acid amin này tạo các amoniac, urê, acid uric và creatinin, gọi là nitơ cặn
trong máu, trung bình là khoảng 23-25mg%. Phần acid amin còn lại có thể đƣợc
chuyển thành glucid, lipid, hoặc oxi hóa để cung cấp năng lƣợng, tạo thành CO2
và nƣớc. Sản phẩm phân hủy cuối cùng của protein sẽ đƣợc thải ra ngoài cùng
với nƣớc tiểu và mồ hôi.
14
Chất protein trong thực phẩm từ nguồn gốc động vật là nguồn cung cấp
những acid amin thiết yếu, những thức ăn từ thực vật thƣờng bị thiếu một số
acid amin thiết yếu, do đó, sự phối hợp các thực phẩm từ nguồn gốc động vật và
thực vật sẽ đảm bảo đáp ứng các nhu cầu về các acid amin thiết yếu cũng nhƣ
các chất dinh dƣỡng khác.
Trong cơ thể, protein thƣờng xuyên đƣợc chuyển hoá. Khi thừa, protein sẽ
chuyển thành glucide hoặc lipid. Khi thiếu prôtêin, sự trao đổi chất sẽ bị rối
loạn, cơ thể chậm phát triển và suy yếu.
Trong hoạt động cơ, vai trò cung cấp năng lƣợng của protein không đáng
kể so với glucide và lipid, chỉ chiếm khoảng 5-7% tổng năng lƣợng tiêu hao và
điều này chỉ xảy ra trong các điều kiện đặc biệt.
Chỉ số biểu hiện mức độ phân hủy protein là hàm lƣợng nitơ trong nƣớc
tiểu và urê trong máu. Đây là những chỉ số để đánh giá mức độ hoạt động mạnh
hay yếu của cơ thể.
1.2.2. Sự biến đổi Glucide
Trong cơ thể, hàm lƣợng glucide không quá 2% trọng lƣợng khô. Phần lớn
glucide đó chứa ở gan và cơ dƣới dạng glycogen là nguồn cung cấp năng lƣợng
chủ yếu. Glucide từ thức ăn khi vào cơ thể đƣợc phân giải thành glucoza hấp thụ
từ ruột vào máu rồi cũng đi đến gan, tổng hợp thành glycogen, là kho dự trữ
glucide quan trọng.
Các chất bột đƣờng là nguồn năng lƣợng glucid sẵn có nhất từ thực phẩm.
Mặc dù nguồn năng lƣợng hàng đầu này có trong các loại thực phẩm, nhƣng cơ
thể lại không thể dự trữ các chất bột đƣờng với lƣợng lớn đƣợc và vì thế các
chất bột đƣờng là một phần quan trọng trong chế độ ăn hàng ngày. Các chất tinh
bột và tất cả các chất đƣờng, đƣợc phân nhỏ thành glucose để tiêu hóa.
Quá trình phân giải glucide để cung cấp năng lƣợng có thể chia thành hai
giai đoạn: sự phân giải yếm khí thành acid lactic, và sự phân giải hiếu khí thành
sản phẩm cuối cùng là CO2 và nƣớc đƣợc đào thải qua thở và ra ngoài theo
nƣớc tiểu, mồ hôi.
15
Nồng độ glucoza bình thƣờng trong máu luôn đƣợc duy trì ổn định ở mức
thông thƣờng 80-120mg%. Nếu nhiều hoặc ít hơn sẽ dẫn đến những rối loạn
bệnh lý.
Dự trữ glucide trong cơ thể đƣợc huy động khi bắt đầu hoạt động làm cho
lƣợng glucoza trong máu tăng lên và sẽ đƣợc duy trì ở mức bình thƣờng khi tiếp
tục vận động trong một thời gian dài. Sau đó dần dần giảm khi hàm lƣợng
glycogen ở cơ và tim giảm. Nếu hàm lƣợng đƣờng trong máu giảm thấp hơn
40mg% thì hoạt động của thần kinh trung ƣơng sẽ bị rối loạn sẽ dẫn đến hiện
tƣợng choáng do hạ đƣờng huyết.
1.2.3. Sự biến đổi Lipid
Lƣợng lipid trong cơ thể chủ yếu chứa trong các mô mỡ khoảng 10-20%
trọng lƣợng cơ thể, có thể thay đổi phụ thuộc vào chế độ ăn, giới tính, tuổi, đặc
điểm cấu trúc thể trạng con ngƣời, mức độ vận động…, là những kho dự trữ
năng lƣợng lớn của cơ thể. Khi oxi hóa 1g lipid sẽ cung cấp 9,3 kcal. Ngoài ra,
nó còn là thành phần cấu tạo quan trọng của nguyên sinh chất, nhân và màng tế
bào.
Thực phẩm có chứa chất béo khi vào cơ thể đƣợc phân hủy thành acid béo
và glycerin ở các tế bào của thành ruột, tại đây các acid béo lại đƣợc tổng hợp
thành lipid đặc trƣng cho từng chủng loại. Từ ruột, mỡ đƣợc hấp thu vào máu rồi
đi đến gan. Từ gan các phân tử lipid và các acid béo tự do đƣợc vận chuyển đến
các tế bào, cơ quan khác nhau để tạo năng lƣợng. Chất béo là nguồn cung cấp
năng lƣợng lớn nhất. Với một trọng lƣợng bằng nhau, chất béo chứa năng lƣợng
nhiều gấp hai lần so với chất bột đƣờng hoặc chất đạm.
Ngoài việc cung cấp năng lƣợng, các chất béo là nguồn duy nhất cung cấp
acid linoleic và acid linolenic (là 2 acid béo thiết yếu mà cơ thể không thể tổng
hợp đƣợc). Acid linoleic hiện diện với lƣợng lớn trong các dầu thực vật nhƣ dầu
mè, dầu bắp, dầu đậu nành. Dầu đậu phộng và bơ đậu phộng cũng chứa một ít
acid linoleic, còn acid alpha linolenic có trong cá, hải sản, đậu nành, rau xanh…
Các chất béo còn giúp vận chuyển các vitamin tan trong chất béo. Những
vitamin tan trong chất béo là các vitamin A, D, E và K. Chất béo cũng bổ sung
thêm hƣơng vị cho thực phẩm và làm tăng cảm giác no vì giữ thực phẩm trong
dạ dày lâu hơn. Nhu cầu chất béo khoảng 1-1,5 g/kg (20-25%).
16
Khi oxi hóa lipid, năng lƣợng đƣợc giải phóng lớn hơn khi oxi hóa glucide,
tuy nhiên lại đòi hỏi tiêu hao oxi nhiều hơn. Vì vậy việc sử dụng lipid để cung
cấp năng lƣợng chỉ phù hợp với điều kiện có thể cung cấp oxi đầy đủ. Việc sử
dụng lipid để cung cấp năng lƣợng phụ thuộc vào mức độ oxi hóa glucide.
Lƣợng acid lactic cao và tốc độ phân hủy glucide mạnh sẽ ức chế việc oxi hóa
các acid béo tự do.
1.2.4. Sự biến đổi của nƣớc và các chất khoáng
Nƣớc là thành phần cấu tạo của tất cả các cơ quan và tế bào của cơ thể.
Nƣớc chiếm 60-70% trong cơ thể. Phần lớn các phản ứng sinh hóa trong quá
trình trao đổi chất đều xảy ra với sự tham gia trực tiếp của nƣớc. Nƣớc còn có ý
nghĩa quan trọng trong điều hòa thân nhiệt qua việc bay hơi và bài tiết mồ hôi.
Phần lớn nƣớc trong thức ăn và nƣớc uống đƣợc hấp thụ qua đƣờng tiêu
hóa vào máu. Gan có thể dự trữ một lƣợng nƣớc nhỏ. Số nƣớc còn lại đƣợc phân
bố trong khoảng gian bào và trong tế bào. Sự phân bố nƣớc giữa khoảng gian
bào và máu do áp suất thẩm thấu của các protein trong huyết tƣơng quyết định.
Muối khoáng (K, Ca, P, Na, Cl…) và các nguyên tố vi lƣợng ( Fe, Cu, Co,
Al… ) ở trong cơ thể dƣới dạng hợp chất hữu cơ, muối hoặc dƣới dạng ion,
quyết định áp suất thẩm thấu của các dịch trong cơ thể, hoạt tính của các men,
mức độ hƣng phấn của tế bào cũng nhƣ quá trình phát sinh điện thế trong các cơ
quan tạng. Ý nghĩa sinh học của các chất khoáng rất đa dạng. Thí dụ, canxi là
thành phần cấu tạo của một số tổ chức nhƣ xƣơng, iod là thành phần cấu tạo của
hocmon tuyến giáp trạng, sắt có trong cấu tạo hemoglobin…
Cơ thể nhận các chất khoáng cần thiết từ thức ăn và nƣớc uống. Chúng
đƣợc hấp thụ vào máu qua thành ruột non và đƣợc đào thải ra ngoài chủ yếu
theo nƣớc tiểu, phân và mồ hôi.
1.2.5. Chuyển hóa năng lƣợng
Chuyển hóa năng lƣợng là sự biến đổi năng lƣợng bên trong cơ thể. Để bù
đắp cho phần năng lƣợng đã tiêu hao, cơ thể phải thƣờng xuyên thu nhận đƣợc
năng lƣợng từ môi trƣờng bên ngoài theo thức ăn dƣới dạng duy nhất là năng
lƣợng hóa học giữ cho các nguyên tử, các nhóm hoá chất có vị trí không gian
nhất định đối với nhau trong một phân tử. Năng lƣợng sẽ đƣợc giải phóng khi có
các phản ứng sinh học diễn ra trong cơ thể .
17
Nhƣ đã nói ở trên, năng lƣợng này từ các nguồn protein, glucide và lipid là
chất thông qua quá trình trao đổi chất cung cấp năng lƣợng cho cơ thể. Giá trị
năng lƣợng của mỗi loại thức ăn phụ thuộc vào hàm lƣợng các chất tạo ra năng
lƣợng trong đó.
Các chất dinh dƣỡng cung cấp từ thực phẩm đƣợc máu hấp thụ và vận
chuyển đến tế bào. Tại đây, các chất này tham gia vào các phản ứng chuyển hoá
phức tạp và hoá năng của các chất đƣợc chuyển thành các hợp chất giàu năng
lƣợng là ATP ( Adenozin triphosphat) . ATP trong quá trình phân giải sẽ cung
cấp năng lƣợng cho mọi hoạt động của cơ thể. Lƣợng ATP luôn đƣợc tái tổng
hợp tuỳ theo mức độ tiêu hao. Các chất creatin photphat (CP), glucoza và
glycogen có thể phân giải để tạo năng lƣợng cho quá trình tái tổng hợp ATP
trong điều kiện yếm khí. Quá trình tái tạo năng lƣợng còn có thể là sự oxi hoá
các chất glucoza, glycogen, acid béo tự do, glycerol và những sản phẩm không
chứa nitơ của acid amin trong điều kiện hiếu khí.
Hình 1.3. Mô hình khái quát vòng tuần hoàn axít citric [52].
18
Một câu hỏi đƣợc đặt ra là vấn đề tiêu hao năng lƣợng là do đâu? Đó chính
là sự chuyển hoá cơ sở và tiêu hao năng lƣợng bổ sung.
Chuyển hoá cơ sở là mức chuyển hoá năng lƣợng của cơ thể trong điều
kiên cơ sở, bao gồm việc sử dụng năng lƣợng cần thiết cho sự sống của tế bào ở
mức các quá trình oxi hoá đảm bảo trƣơng lực cơ và hoạt động của các hệ thống
(hô hấp, tim-mạch, gan, thận, não) ở mức tối thiểu, còn tiêu hao năng lƣợng bổ
sung là số năng lƣợng cơ thể phải sử dụng thêm (so với mức cơ sở) để hoàn
thành bất kì một hoạt động sống nào nhƣ tiêu hoá thức ăn, duy trì tƣ thế và điều
nhiệt, vận động cơ bắp.
Tất cả các hoạt động chức năng của cơ thể trong quá trình trao đổi chất và
chuyển hoá năng lƣợng bao giờ cũng sinh ra nhiệt. Nhiệt đó có thể tích lại trong
cơ thể hoặc tỏa ra môi trƣờng xung quanh, tạo nên thân nhiệt của cơ thể và thân
nhiệt có thể duy trì đƣợc ở múc ổn định là nhờ sự cân bằng của 2 quá trình
ngƣợc chiều nhau: sinh nhiệt và thải nhiệt.
1.3. Mạng trao đổi chất
1.3.1. Giới thiệu vể mạng trao đổi chất
Chúng ta thƣờng muốn có cái nhìn tƣơng đối chính xác về mạng trao đổi
chất để có thể hiểu rõ hơn quá trình trao đổi chất. Tuy nhiên mạng trao đổi chất
tự nhiên có tính động, các phản ứng theo các chiều luôn xảy ra và xảy ra với tốc
độ rất nhanh gây khó khăn cho việc nghiên cứu một cách chính xác. Do đó
chúng ta tiếp cận bằng cách nghiên cứu topo của mạng trao đổi chất và từ đó có
thể xây dựng các mô hình dựa trên các tính chất bất biến của mạng trao đổi chất.
Hình 1.4 minh hoạ một mạng trao đổi chất đơn giản nhƣ là một đồ thị có hƣớng.
Trong đó các đỉnh (ký hiệu A, B, C) là nồng độ chất nền (substrate) hay chất
trao đổi (metabolite), các cạnh (ký hiệu v1, v2, v3) (flux) là các dòng trao đổi từ
chất này sang chất khác với xúc tác của các enzyme.
19
Hình 1.4. Minh hoạ một mạng trao đổi chất đơn giản.
1.3.2. Mô hình toán học
Giả sử x là một đỉnh, tại x có các phƣơng trình vi phân tƣơng ứng thể hiện
sự biến thiên nồng độ chất tại đỉnh đó theo thời gian:
dx/dt = S.v (1.1)
trong đó S là ma trận Stoichiometry thể hiện hệ số cân bằng cho các
phƣơng trình trao đổi chất và v là vector dòng tƣơng ứng của mạng.
Với mô hình mạng trao đổi chất nhƣ hình 1.4 ta có các phƣơng trình vi
phân tại mỗi đỉnh (chất nền) A, B, C tƣơng ứng nhƣ sau:
3432
241
1321
bvvvdt
dC
bvvdt
dB
bvvvdt
dA
(1.2)
Kết hợp các phƣơng trình vi phân trên ta có hệ phƣơng trình biểu diễn nhƣ
dƣới đây:
20
3
2
1
4
3
2
1
1001110
0101001
0010111
b
b
b
v
v
v
v
dt
dC
dt
dB
dt
dA
(1.3)
1.3.3. Trạng thái ổn định
Để xác định giá trị các thành phần của vector v bằng thực nghiệm là rất khó
khăn. Vì vậy ta có thể giả sử một trạng thái ổn định (steady state) của mạng.
Trạng thái ổn định là trạng thái mà ở đó các phản ứng ổn định, khối lƣợng các
chất tham gia các phản ứng là ổn định, không thay đổi. Do các phản ứng xảy ra
trong thời gian ngắn hơn nhiều so với thời gian điều hoà nên giả sử này là hoàn
toàn có thể chấp nhận. Từ giả sử về trạng thái ổn định ta sẽ có:
dx/dt = 0 (1.4)
Kết hợp với (1.1) ở trên ta có hệ phƣơng trình vi phân dạng:
0 = S.v (1.5)
Hệ phƣơng trình (1.3) có thể viết lại nhƣ sau:
3
2
1
4
3
2
1
1001110
0101001
0010111
0
0
0
b
b
b
v
v
v
v
(1.6)
Khi ta kết hợp với các điều kiện ràng buộc của các giá trị dòng ta có hệ
phƣơng trình tuyến tính biểu diễn cho một mạng trao đổi chất nhƣ sau:
21
0
low high
S v
v v v
(1.7)
1.3.4. Các ràng buộc đối với giá trị dòng
Ràng buộc với các dòng bên trong:
i 0,iv
Ràng buộc với các dòng bên ngoài:
Dòng đi vào i 0,jb i 0,jb
Dòng đi ra i 0,jb
Dòng đi vào và ra không xác định ràng buộc
Nói cách khác các dòng đi vào mạng là xác định âm còn các dòng đi ra
khỏi mạng sẽ là xác định dƣơng. Ngoài ra còn có các ràng buộc chi tiết hơn dựa
vào thực nghiệm.
Nghiệm của hệ phƣơng trình tuyến tính (1.7) trên sẽ cho ta tất các giá trị
dòng của mạng trao đổi chất, từ đó giúp chúng ta có các tính toán để đạt đƣợc
các kết quả mong muốn.
22
CHƢƠNG 2 - CƠ SỞ TOÁN HỌC
2.1. Quy hoạch tuyến tính
Quy hoạch tuyến tính (Linear Programming - LP) là một lĩnh vực quan
trọng của nghiên cứu tối ƣu vì một số lý do. Rất nhiều bài toán thực tế trong
nghiên cứu vận trù học có thể phát biểu nhƣ bài toán quy hoạch tuyến tính. Các
trƣờng hợp đặc biệt của quy hoạch tuyến tính, nhƣ lƣu lƣợng mạng có thể đƣợc
xem nhƣ đủ quan trọng để nghiên cứu và tìm ra các giải thuật. Có nhiều giải
thuật đã đƣợc tìm ra để giải bài toán này. Trong lịch sử, nhiều ý tƣởng từ quy
hoạch tuyến tính đã làm nảy sinh các khái niệm của lý thuyết tối ƣu nhƣ tính đối
ngẫu, phân rã và đặc biệt là tính lồi. Tƣơng tự, quy hoạch tuyến tính cũng đƣợc
ứng dụng rộng rãi trong kinh tế vi mô và quản trị kinh doanh và bây giờ là trong
tin sinh học.
Dạng chuẩn là dạng thông thƣờng và trực quan nhất. Nó bao gồm 3 phần
sau:
Một hàm tuyến tính cần cực đại
Ví dụ 2211 xcxc
Các điều kiện ràng buộc
Ví dụ 1212111 bxaxa
2222121 bxaxa
3232131 bxaxa
Các biến là không âm
Ví dụ 01 x
02 x
23
Hình 2.1. Minh hoạ lời giải của một bài toán quy hoạch tuyến tính (John
Wiley & Sons, Inc)
Bài toán thƣờng đƣợc phát biểu dƣới dạng ma trận:
Cực đại xcT
Với điều kiện 0 , xbAx
Các bài toán dạng khác nhƣ là bài toán cực tiểu, bài toán với ràng buộc ở
dạng khác hay với biến âm đều có thể chuyển về dạng chuẩn.
Các giải thuật đơn hình đƣợc phát triển đầu tiên và đƣợc áp dụng trong
thực tế tuy nhiên giải thuật này không đảm bảo thời gian chạy luôn là đa thức.
Với giải thuật của N. Karmarkar [14] thời gian chạy trong trƣờng hợp xấu nhất
luôn là đa thức.
2.2. Quy hoạch bậc hai
Quy hoạch bậc hai (Quadratic programming - QP) là một dạng đặc biệt của
bài toán tối ƣu toán học. Bài toán quy hoạch bậc hai có thể đƣợc phát biểu nhƣ
sau:
Giả sử x thuộc không gian Rn. Ma trận đối xứng Q có kích thƣớc n×n, và c
là một vector kích thƣớc n×1.
Cực tiểu hoá (theo x)
xcQxf 'x'2
1(x)
24
Với một hoặc các điều kiện sau:
bAx
Ex = d
Với v’ là vector chuyển vị của .
Nếu Q có dạng nửa xác định dƣơng thì f(x) là một hàm lồi. Trong trƣờng
hợp này bài toán có một cực tiểu toàn cục nếu tồn tại ít nhất một vector 'x' thoả
mãn điều kiện và f(x) đƣợc giới hạn dƣới trong miền khả thi. Nếu ma trận Q là
xác định dƣơng thì cực tiểu toàn cục là duy nhất. Nếu Q bằng không thì bài toán
trở thành quy hoạch tuyến tính. Theo lý thuyết tối ƣu, một điều kiện cần để một
điểm x trở thành cực tiểu toàn cục là nó phải thoả mãn điều kiện Karush-Kuhn-
Tucker (KKT). KKT cũng là điều kiện đủ khi f(x) lồi.
Nếu chỉ có một điều kiện đẳng thức thì QP có thể giải bằng hệ thống tuyến
tính. Quy hoạch tuyến tính lồi là một trƣờng hợp đặc biệt của một lĩnh vực tổng
quát là tối ƣu lồi.
Hình 2.2. Minh hoạ lời giải của một bài toán quy hoạch bậc hai [53].
Dạng đối ngẫu
Dạng đối ngẫu của bài toán quy hoạch bậc hai cũng là quy hoạch bậc hai.
Để thấy rõ hơn hãy tập trung vào trƣờng hợp c = 0 và Q là dạng PSD. Chúng ta
viết dƣới dạng Lagrang
L(x,λ) = xTQx + λ
T(Ax − b)
Để tính hàm đối ngẫu g(λ), đặt ),(inf)( xLgx
chúng ta tìm cực tiểu của L,
sử dụng 0),( xLx
25
x * = − (1 / 2)P − 1
ATλ, do đó hàm đối ngẫu là:
g(λ) = − (1 / 4)λTAP
− 1A
Tλ − b
Tλ
từ đó ta có dạng đối ngẫu của bài toán là
Cực đại: − (1 / 4)λTAP
− 1A
Tλ − b
Tλ
Với : 0
Độ phức tạp
Với Q là xác định dƣơng, phƣong pháp ellipsoid giải bài toán trong thời
gian đa thức. Ngƣợc lại nếu Q là xác định âm thì bài toán là NP-khó. Thực tế
ngay cả nếu Q chỉ có duy nhất một giá trị âm thì bài toán cũng là NP-khó.
26
CHƢƠNG 3 - MẠNG TRAO ĐỔI CHẤT CỦA E. COLI
3.1. Giới thiệu
Các phân tích của chuỗi gen giúp chúng ta tìm ra tập hợp đầy đủ các phân
tử có liên quan đến các hoạt động của tế bào. Tuy nhiên, các chức năng của tế
bào rất phức tạp và các chức năng tổng hợp có liên quan đến rất nhiều các thành
phần khác trong tế bào. Do đó để có thể hiểu đƣợc sự phức tạp này cần có các
các phƣơng pháp phân tích tập trung vào các thuộc tính hệ thống của tế bào. Các
nghiên cứu nhƣ vậy giúp chúng ta hiểu rõ mối tƣơng quan giữa các chức năng
của gen và vai trò của mỗi gen trong chức năng của cả tế bào.
Với mục tiêu phân tích và thiết kế mạng trao đổi chất, chúng ta cần có các
mô hình toán học (ví dụ nhƣ mô hình mô phỏng động lực học) của các quá trình
diễn ra trong tế bào dựa trên các nguyên lý cơ bản của hoá học và vật lý học.
Mặc dù mục đích cuối cùng là xây dựng mô hình để giả lập hoạt động của
toàn bộ tế bào, nhƣng chúng ta gặp phải rất nhiều trở ngại do sự thiếu hụt các
thông tin về động lực học, sự điều hoà của các phản ứng trao đổi chất. Tuy
nhiên, chúng ta vẫn có thể đánh giá chính xác khả năng và các trạng thái của hệ
trao đổi chất sử dụng phƣơng pháp FBA. FBA chỉ cần có các thông tin về ma
trận Stoichiometry và các chất trao đổi; ngoài ra FBA có thể sử dụng các thông
tin khác khi chúng sẵn sàng.
3.2. Phƣơng pháp xây dựng
3.2.1. Xác định chức năng
Bộ gen hoàn chỉnh của các sinh vật với kích thƣớc hàng triệu cặp có thể
nhanh chóng đƣợc phân tích. Các chuỗi gen hoàn chỉnh này có thể dùng để xây
dựng mạng trao đổi chất, tuy nhiên chúng ta vẫn cần phải tiến hành nhiều bƣớc
trƣớc khi có đƣợc kết quả mong muốn[19-21].
Bƣớc đầu tiên để xây dựng mạng trao đổi chất là xác định chức năng của
từng đoạn gen. Khi chúng ta xem xét bộ gen, có thể có nhiều gen cùng đƣợc gán
cho một chức năng. Hy vọng trong thời gian tới sẽ có những phƣơng pháp giúp
chúng ta nhanh chóng xác định chức năng tƣơng ứng của một gen.
27
3.2.2. Cơ sở dữ liệu các phản ứng trao đổi chất
Các nhà khoa học đã xây dựng một cơ sở dữ liệu về các phản ứng trao đổi
chất đã biết của E. coli [22-24]. Cơ sở dữ liệu này chứa các thông tin nhƣ: các
chất nền, các chất sinh ra, ma trận stoichiometry của mỗi phản ứng trao đổi
chất, tên của các enzyme xúc tác cho các phản ứng, các gen mã hoá cho các
enzyme đó và số EC của mỗi phản ứng. Bảng 3.1 minh hoạ một phần của cơ sở
dữ liệu này.
Bảng 3.1 Danh sách một số phản ứng trao đổi chất của E. coli [50].
EMP Pathway 2.7.1.56
Tagatose-6-phosphate
kinase
agaZ TAG6P + ATP TAG16P
+ ADP
2.7.1.-
Tagatose-bisphosphate
aldolase 2
gatY TAG16P T3P2 + T3P1 4.1.2.-
Tagatose-bisphosphate
aldolase 1
agaY TAG16P T3P2 + T3P1 4.1.2.-
Glycerol
Glycerol kinase glpK GL + ATP GL3P + ADP 2.7.1.30
Glycerol-3-phosphate-
dehydrogenase-
[NAD(P)+]
gpsA GL3P + NADP T3P2 +
NADPH
1.1.1.94
Nucleosides and
Deoxynucleosides
Phosphopentomutase deoB DR1P DR5P 5.4.2.7
Phosphopentomutase deoB R1P R5P 5.4.2.7
Deoxyribose-phosphate
aldolase
deoC DR5P ACAL + T3P1 4.1.2.4
Aspartate & Asparagine
28
Biosynthesis
Asparate transaminase aspC OA + GLU ASP + AKG 2.6.1.1
Asparagine synthetase
(Glutamate dependent)
asnB ASP + ATP + GLN GLU
+ ASN + AMP + PPI
6.3.5.4
Aspartate-ammonia
ligase
asnA ASP + ATP + NH3 ASN
+ AMP + PPI
6.3.1.1
Glutamate and Glutamine
Biosynthesis
Glutamate
dehydrogenase
gdhA AKG + NH3 + NADPH
GLU + NADP
1.4.1.4
Glutamate-ammonia
ligase
glnA GLU + NH3 + ATP GLN
+ ADP + PI
6.3.1.2
Glutamate synthase gltBD AKG + GLN + NADPH
NADP + 2 GLU
1.4.1.13
3.2.3. Xây dựng mô hình giả lập mạng trao đổi chất
Tất cả các gen trao đổi chất trong tế bào là một tập con của bộ gen. Tập con
này đƣợc gọi là là kiểu gen trao đổi chất của một sinh vật, và mô hinh giả lập
của kiểu gen trao đổi chất đƣợc gọi là kiểu gen trao đổi chất giả lập. Sản phẩm
của gen trao đổi chất là xúc tác của toàn bộ các phản ứng và quá trình vận
chuyển bên trong tế bào. Ví dụ, kiểu gen trao đổi chất giả lập của E. coli bao
gồm các gen liên quan đến quá trinh trao đổi chất trung tâm, quá trinh trao đổi
amino acid, nucleotide, axid béo, lipid, carbohydrate, tổng hợp vitamin, sản sinh
năng lƣợng và các đại phân tử (ví dụ nhƣ peptidoglycan, glycogen, RNA, DNA).
Hình 3.1 minh hoạ một kiểu gen trao đổi chất. Hình 3.2, 3.3 minh hoạ một mạng
trao đổi chất và ma trận stoichiometry tƣơng ứng.
29
Hình 3.1 Minh hoạ một kiểu gen trao đổi chất [50].
Hình 3.2 Minh hoạ một mạng trao đổi chất [50].
30
Hình 3.3 Minh hoạ ma trận stoichiometry [50].
Phƣơng pháp đơn giản để xây dựng kiểu gen trao đổi chất của E. coli nhƣ
sau. Đầu tiên, tìm trong cơ sở dữ liệu những chuỗi gen đã đƣợc chú giải của E.
coli. Quá trình này chọn ra tất cả các phản ứng trao đổi chất từ cơ sở dữ liệu.
Tuy nhiên vẫn còn các gen trao đổi chất không tìm thấy trong cơ sở dữ liệu hiện
tại và sẽ đƣợc đánh dấu để tìm kiếm tiếp ở các cơ sở dữ liệu khác.
Tại thời điểm hiện tại, vẫn còn một số gen/phản ứng của E. coli chƣa đƣợc
đƣa vào kiểu gen trao đổi chất, một nguyên nhân là do chƣa xác định đƣợc gen
thực hiện các phản ứng đó.
3.3. Phân tích mạng trao đổi chất
Tất cả các thông tin về ma trận Stoichiometry của các phản ứng trao đổi
chất có thể sử dụng để mô phỏng mạng. Và chúng ta cũng biết rằng vấn đề mô
hình hoá các chức năng của tế bào vẫn là rất khó. Tuy nhiên, với một danh sách
hoàn chỉnh các phân tử trong tế bào, chúng ta có thể giới hạn các hoạt động của
tế bào và xác định khả năng của mạng. Năng lực của mạng có thể đƣợc phân
tích và các đặc tính tối ƣu có thể đƣợc xác định. Tiếp theo chúng ta sẽ nghiên
cứu qua về các phƣơng pháp phân tích mạng trao đổi chất.
3.3.1. Phân tich cân bằng dòng (Flux balance analysis - FBA)
Phƣơng pháp cơ bản và hiệu quả để phân tích mạng trao đổi chất. Chi tiết
về phƣơng pháp sẽ đƣợc trình bày ở chƣơng tiếp theo.
31
3.3.2. Xây dựng các đƣờng phản ứng trao đổi chất
Quá trình xác định các chức năng gen dựa hoàn toàn trên việc so sánh
chuỗi thƣờng đƣa ra các tập đƣờng phản ứng (pathway) không hoàn chỉnh. Tuy
nhiên, việc xây dựng một đƣờng phản ứng giúp chúng ta có cái nhìn toàn diện
về mạng [19, 20. 25, 26].
Các đƣờng phản ứng tìm đƣợc sẽ đƣợc kiểm tra bằng cách so sánh với các
hành động và yêu cầu dinh dƣỡng của E. coli đã xác định từ thực nghiệm.
32
CHƢƠNG 4 - CÁC PHƢƠNG PHÁP PHÂN TÍCH MẠNG
TRAO ĐỔI CHẤT
4.1. Các phƣơng pháp phân tích với dạng wild-type (dạng tự nhiên)
4.1.1. Phân tích cân bằng dòng (Flux Balance Analysis – FBA)
Với các giả thiết nhƣ đã trình bày ở chƣơng 1 ta có mô hình toán học để
nghiên cứu mạng trao đổi chất là hệ phƣơng trình sau:
0
low high
S v
v v v
(4.1)
Do hệ phƣơng trình (4.1) có số ẩn nhiều hơn số phƣơng trình (ma trận S có
số cột nhiều hơn số dòng) nên sẽ có vô số nghiệm. Tập các nghiệm của hệ
phƣơng trình (4.1) đƣợc gọi là không gian khả thi Φ. Minh hoạ cho Φ có thể
thấy trong hình 4.1 nhƣ là một hình nón. Tuy nhiên chỉ có rất ít nghiệm trong Φ
là có ý nghĩa sinh học. Một cách đơn giản để giới hạn số nghiệm của hệ phƣơng
trình (4.1) là đƣa thêm các điều kiện ràng buộc cho các giá trị dòng. Các dòng
bên trong đã có ràng buộc từ thực nghiệm, vì vậy ngƣời ta hay đƣa thêm các
ràng buộc cho các dòng bên ngoài. Các ràng buộc này thƣờng phụ thuộc vào cấu
tạo của tế bào, môi trƣờng, các chất nền hay tốc độ truyền dẫn các chất nển.
Hình 4.1 Không gian dòng của một mạng trao đổi chất có thể biểu diễn nhƣ
một hình nón.
33
Nhƣ đã trình bày ở trên, do thiếu các tham số đƣợc xác định qua thực
nghiệm để mô tả quá trình cân bằng động của mạng trao đổi chất, nên cần có
một cách tiếp cận khác để nghiên cứu về khả năng của nó. Phƣơng pháp Phân
tích cân bằng dòng (Flux Balance Analysis - FBA) đã đƣợc phát triển cho mục
đích này [41]. Nó đã đƣợc chứng minh là có hiệu quả để xác định khả năng của
mạng cũng nhƣ có thể dự đoán tốc độ tăng trƣởng của các sinh vật nhƣ E. Coli,
nấm men, ... Phƣơng pháp FBA đạt đƣợc điều này bằng cách thêm một giả sử:
các mạng trao đổi chất luôn tối ƣu theo một hàm mục tiêu xác định Z. Hàm mục
tiêu là một hàm tuyến tính mà ta sẽ nghiên cứu ở phần tiếp theo. Tuỳ thuộc vào
từng hàm mục tiêu, một tập các lời giải tối ƣu sẽ tìm đƣợc trong Φ. Khi áp dụng
FBA vào E. coli, hàm mục tiêu chính là hàm tăng trƣởng tuyến tính mà ở đó tốc
độ phát triển của vi khuẩn là tối đa. Từ đó chúng ta có công thức cho phƣơng
pháp FBA nhƣ sau:
highlow
T
vvv
vS
vc
0 :Subject to
: Maximize
(4.2)
trong đó cT là chuyển vị của hàm mục tiêu tuyến tính và các ký hiệu khác nhƣ đã
định nghĩa.
4.1.2. Xác định hàm mục tiêu trong phƣơng pháp FBA
Chúng ta muốn chọn hàm mục tiêu Z có ý nghĩa sinh học, một số hàm mục
tiêu có thể là: Tối đa tốc độ phát triển, Tối đa nồng độ một chất, Tối thiểu năng
lƣợng sử dụng. Hình 4.2 minh hoạ một mạng trao đổi chất và hàm mục tiêu của
nó:
34
Hình 4.2 Minh hoạ hàm mục tiêu của một mạng trao đổi chất: Z=B+D+2E
Các nghiên cứu gần đây của Edwards [39], Schilling và Segre [4] cho thấy
rằng chúng ta nên sử dụng hàm Z là hàm tối đa tăng trƣởng. Nghiên cứu chi tiết
về hàm mục tiêu có thể xem trong tài liệu tham khảo về phƣơng pháp BOSS
[27].
4.2. Các phƣơng pháp phân tích với dạng đột biến (bị xoá bỏ gen)
4.2.1. Khái quát về xoá bỏ gen (Gene Knockouts hay Mutant)
Các hiệu ứng xảy ra khi một gen bị xoá bỏ là: Gen bị xoá -> Enzyme tƣơng
ứng bị xoá -> Các phản ứng cần có enzyme xúc tác sẽ bị xoá -> Các cạnh tƣơng
ứng trong mạng bị xoá -> Các dòng tƣơng ứng bị xoá (các vi tƣơng ứng bằng 0).
Hình 4.3 cho ta thấy một ví dụ về việc gen bị xoá bỏ -> thay đổi mạng trao đổi
chất.
Hình 4.3 Mô hình xoá bỏ gen [8].
4.2.2. Cực tiểu hoá điều chỉnh trao đổi chất (Minimization Of Metabolic
Adjustment - MOMA)
4.2.2.1. Giới thiệu phƣơng pháp MOMA
Những công trình nghiên cứu gần đây của Segre [4] và cộng sự đã giới
thiệu ý tƣởng về phƣơng pháp điều chỉnh trao đổi tối thiểu (MOMA) cho một
mạng trao đổi chất với gen bị xoá bỏ dựa trên giả thuyết rằng: khi không có quá
trình tiến hoá và thích nghi lâu dài, một cơ thể đột biến có thể không phát triển
tối ƣu, nhƣng có thể điều chỉnh các dòng phân phối càng gần với dạng tự nhiên
35
càng tốt. Nói cách khác phân phối dòng sau khi gen bị xoá bỏ tiến gần tới dạng
tự nhiên theo khoảng cách Euclid. Hình 4.4 minh hoạ cho ý tƣởng này:
Hình 4.4 Nguyên lý tối ƣu của FBA và MOMA [4].
Một lƣợc đồ 2 chiều thể hiện không gian khả thi của dạng tự nhiên (ΦWT
)
và dạng đột biến dòng j (Φ j) đƣợc thể hiện bởi các đa giác màu xanh và vàng.
Nghiệm của FBA là điểm tối đa hàm mục tiêu (đƣờng màu đỏ). Một dự đoán tối
ƣu của FBA có thể dùng cho cả dạng tự nhiên (a) và dạng đột biến (b). Nghiệm
đột biến của MOMA (c) tính bằng QP có thể xem nhƣ là phép chiếu vuông góc
nghiệm FBA xuống không gian khả thi của dạng đột biến (Φ j). Nghiệm đột biến
của FBA và MOMA nói chung là khác nhau.
36
Hình 4.5 Minh hoạ nghiệm của phƣơng pháp MOMA trên không gian
nhiều chiều.
Nền tảng toán học cần thiết để đạt đƣợc mục tiêu là phép chiếu vuông góc
nghiệm tự nhiên w xuống không gian khả thi Φm của dạng đột biến, biến đổi
toán học đƣợc trình bày dƣới đây:
Giả sử:
w – vector giá trị dòng tối ƣu của dạng tự nhiên.
v – vector giá trị dòng trong không gian đột biến.
Ta cần tìm v thoả mãn khoảng cách Euclidian giữa v và w là tối thiểu:
Min f(v) = (v-w)T *( v-w)
<=> Min v2-2vw+w
2
<=> Min v2-2vw vì w là hằng số
<=> Min 0.5v 2- wv
<=> Min 0.5vT*I*v+L*v với I là ma trận dơn vị và L = -w,
Bài toán đƣợc biến đổi về dạng quy hoạch bậc hai, kết hợp với các ràng
buộc nhƣ đã trinh bày chúng ta có công thức cho phƣơng pháp MOMA nhƣ sau:
0
0
:Subject to
2
1 : Minimize
i
highlow
TT
v
vvv
vS
vwvIv
(4.3)
trong đó I là ma trận đơn vị, là chuyển vị của lời giải nguyên thuỷ tính đƣợc
bằng FBA (hệ phƣơng trình 4.2) và “i” là chỉ số của gen bị loại bỏ. Các kết quả
thực nghiệm đã chứng minh rằng với cơ thể đột biến thì MOMA cho kết quả dự
đoán tốc độ phát triển của E. coli tốt hơn FBA.
37
Hình 4.6 Một minh hoạ cho các đƣờng phản ứng (pathway) của mạng
carbon trung tâm của E. coli, màu sắc đƣợc sử dụng để phân biệt các
pathway khác nhau [4].
Hình 4.7 Một ví dụ về dự đoán dòng của E. coli đột biến [4].
38
Gen đột biến là tpiA, một trong 3 gen đƣợc dự đoán chính xác bởi MOMA
(FBA không dự đoán đƣợc). Mỗi điểm là một giá trị dòng trong mạng đột biến
tpiA, màu sắc khác nhau tƣơng ứng với các pathway khác nhau. Giá trị trên mỗi
trục toạ độ tƣơng ứng với sự thay đổi của giá trị dự đoán khi đột biến bởi hai
phƣơng pháp so với giá trị khi ở dạng tự nhiên. Chúng ta có thể thấy các điểm
xanh lục tăng đáng kể với FBA trong khi không thay đổi với MOMA.
4.2.2.2. So sánh FBA và MOMA
Kết quả dự đoán phân phối dòng của MOMA và FBA của cùng một dạng
đột biến cho thấy các kết quả nhƣ hình 4.8.
Hình 4.8 Kết quả dự đoán phân phối dòng của MOMA và FBA [4] .
Hình 4.8 cho thấy sự so sánh dự đoán đột biến gen pyk giữa FBA và
MOMA. Các giá trị dòng thể hiện tỷ lệ phần trăm dòng glucose hấp thụ. A–C;
D–F; G–I là kết quả với các điều kiện khác nhau. Với mỗi điều kiện, dự đoán
39
dạng tự nhiên của FBA (A, D, G) đƣợc so sánh với kết quả thực nghiệm tại đoạn
JM101. Dự đoán dạng đột biến gen pyk của FBA (B, E, H) và MOMA (C, F, I)
cũng đƣợc so sánh với thực nghiệm đột biến đoạn PB25. Màu sắc khác nhau
tƣơng ứng với các pathways khác nhau
4.2.3. Cực tiểu hoá thay đổi điều hoà (Regulatory On/Off Minimization -
ROOM)
4.2.3.1. Giới thiệu về ROOM
Tối thiểu hoá thay đổi điều hoà (ROOM) là một mô hình dùng để dự đoán
hành động của mạng trao đổi chất khi gen bị loại bỏ. Nó dựa vào việc tối thiểu
hoá số lƣợng của các thay đổi dòng đáng kể so với dạng nguyên thuỷ. ROOM có
cùng ý tƣởng nhƣ MOMA nhƣng sử dụng một độ đo khoảng cách khác so với
MOMA dùng khoảng cách Euclid. Ngoài ra ROOM còn có khả năng xác định
chính xác các đƣờng dẫn khác cho các phản ứng liên kết với các gen bị loại bỏ,
điều này càng làm tăng tính tin cậy sinh học của ROOM. ROOM cũng tốt hơn
MOMA trong việc dự đoán các dòng trong tế bào và khả năng sát thân của E.
coli khi bị đột biến loại bỏ gen.
Một thách thức khác là việc dự đoán tính sát thân và kiểu hình của sinh vật
sau khi xóa bỏ gen. Nhƣ đã trình bày trong nghiên cứu của Segre (2002) [4], giả
thiết hành động tối ƣu của sinh vật bị xoá bỏ gen có thể không phản ánh chính
xác các hành động trong thực tế. Thay vào đó, Segre gợi ý rằng các sinh vật đó
điều chỉnh bằng cách tối thiểu hoá các thay đổi phân phối dòng của nó nhƣ cách
tiếp cận của MOMA. Phƣơng pháp này cực tiểu theo tiêu chuẩn Euclid của sai
khác dòng giữa các mạng trao đổi chất của sinh vật nguyên thuỷ và các dạng đột
biến. MOMA đƣợc ghi nhận dự đoán thành công tính sát thân và giá trị dòng
trao đổi chất của mạng đột biến của E. coli.
FBA giả thiết về tốc độ phát triển tối ƣu còn MOMA sử dụng độ đo Euclid
nhƣng đều không phản ánh chính xác các điều chỉnh của mạng trao đổi chất sau
đột biến. Nhƣợc điểm này là do độ đo Euclid có thể ngăn cản các thay đổi lớn
của các dòng đơn. Các thay đổi lớn có thể cần để chuyển hƣớng dòng sang các
đƣờng phản ứng khác và có thể thấy đƣợc trong thực nghiệm.
Chúng tôi đề nghị thay thế độ đo khoảng cách trong MOMA bằng cực tiểu
hoá trạng thái lân cận. Phƣơng pháp mới của chúng tôi, ROOM đơn giản cực
tiểu hoá số lƣợng các thay đổi dòng đáng kể. Đặc biệt, ROOM tìm kiếm phân
phối dòng cho một giống đột biến mà thoả mãn các ràng buộc ma trận hệ số cân
bằng, nhiệt động lực học và hiệu suất dòng, trong khi cực tiểu số lƣợng thay đổi
dòng đáng kể so với dạng nguyên thuỷ. ROOM cải tiến dự đoán dòng trao đổi
40
chất tế bào của E. coli so với MOMA. ROOM cũng dự đoán tốt hơn MOMA về
tính sát thân của men bia khi bị xoá bỏ gen ở mức độ lớn.
Kinh nghiệm tăng cƣờng của khoảng cách ROOM dựa trên ý tƣởng:
Các thay đổi điều hoà gen để thay đổi dòng sau khi gen bị xoá bỏ đƣợc
cực tiểu hoá bởi tế bào khi cố gắng cực tiểu hoá chi phí thích nghi.
Những thay đổi điều hoà này có thể miêu tả bởi các giá trị on/off. ROOM
hoàn toàn mô tả các thay đổi dòng bằng cách xác định các thay đổi dòng
đáng kể.
4.2.3.2. Phƣơng pháp ROOM
ROOM tìm kiếm một phân phối dòng thoả mãn cùng ràng buộc nhƣ FBA
trong khi cực tiểu hoá số lƣợng thay đổi dòng đáng kể. Chúng ta chỉ tính các
thay đổi dòng đáng kể vì luôn tồn tại các nhiễu cố hữu trong các hệ thống sinh
học và cũng là để giảm thời gian xử lý. Chúng ta dùng MILP nhƣ sau:
Minimize y ii1
m
subject to
S v = 0
vmin v vmax
v j 0, j A
v i y i(vmax,i wiu) wi
u (*)
v i y i(vmin,i wil ) wi
l (**)
y i {0,1} (***)
wiu wi wi
wil wi wi
với mỗi dòng i, 1<= i <= m, yi = 1 nếu vi có thay đổi dòng đáng kể và yi = 0
trong trƣờng hợp còn lại, wu and w
l là các ngƣỡng để xác định thay đổi dòng, với
δ, ε là các khoảng dung sai tƣơng đối và tuyệt đối tƣơng ứng với w và A trong
MOMA.
Thật vậy, với yi = 1, bất đẳng thức (*) và (**) không tạo ra ràng buộc mới
với vi, trong khi nếu yi = 0 thì đó là các ràng buộc mới. Kích thƣớc của δ, ε ảnh
hƣởng đến thời gian chạy của thuật toán MILP; chúng tôi chọn các giá trị nhỏ
nhất mà vẫn có kết quả trong thời gian có thể chấp nhận. (Đặc biệt, chúng tôi
41
chọn δ = 0.03, ε =0.001 để dự đoán dòng và δ = 0.1, ε =0.01 để dự đoán tính sát
thân). Sự lựa chọn các tham số ảnh hƣởng đến kết quả phân phối dòng của giải
thuật bởi nó cho phép cộng (δ) và nhân (ε) một lƣợng nhỏ dòng để điều chỉnh
các đƣờng thay thế mà không mất chi phí. Thời gian chạy với bài toán MILP chỉ
là vài giây.
Khi bỏ qua các ràng buộc số nguyên trong (***) thành 0<=yi <=1 thì bài
toán trở thành biến thể của quy hoạch tuyến tính. Với biến thể này, các tham số
δ, ε đƣợc cho bằng 0. Dự đoán dựa trên biến thể LP của ROOM cũng khá chính
xác dù kém hơn so với ROOM ban đầu. Công thức MILP dùng để dự đoán dòng
của E. coli và dự đoán tính sát thân của men, trong khi LP dùng để dự đoán tính
sát thân và tốc độ phát triển của E. coli. Điều thú vị là công thức LP của ROOM
đôi khi tƣơng tự với một biến thể của MOMA.
4.2.3.3. So sánh MOMA và ROOM
Dự đoán dòng
Các số liệu dòng trao đổi chất của E. coli bị xoá gen có trong báo cáo của
Emmerling [17]. Bộ sƣu tập 17 dòng nội bào trong mạng trao đổi chất carbon
trung tâm của E. coli đƣợc xác định theo kinh nghiệm bằng cách kết hợp quang
phổ NMR trong các thí nghiệm đánh dấu bằng 13
C (đồng vị carbon) và các số
liệu sinh lý học (xem thêm ở tài liệu tham khảo). Các dòng của cả dạng nguyên
thuỷ (JM101) và dạng đột biến pyk (PB25) đều đƣợc đo với 3 điều kiện phát
triển khác nhau để cho ra sáu tập kết quả. Hai điều kiện hạn chế glucose đƣợc
dùng (nồng độ thấp / cao) và một điều kiện hạn chế nitrogen (nitơ).
Để mô hình hoá dạng đột biến pyk (PB25, pykA::kan pykF::cat), hai phản
ứng từ Phosphoenolpyruvate (PEP) tới Pyruvate (PYR) đƣợc đặt bằng không.
Trong báo cáo của Segre (2002) [4] đã so sánh dự đoán của FBA và
MOMA với tập hợp các dòng thực nghiệm này. Với dạng hoang dã FBA dự
đoán tốt trong cả 3 trƣờng hợp, trong khi với dạng đột biến pyk kết quả dự đoán
tồi cho cả 2 trƣờng hợp môi trƣờng glucose thấp và nitrogen thấp. MOMA dự
đoán cho dạng đột biến tốt hơn nhiều so với FBA.
Dự đoán của ROOM cho dạng đột biến pyk chính xác hơn đáng kể so với
FBA và MOMA. Với cả 2 thí nghiệm glucose thấp và nitrogen hạn chế, độ
tƣơng quan của ROOM với dữ liệu dòng thực nghiệm cao hơn 12% so với
MOMA (Hình 4.10A). Hình 4.10 B,C so sánh độ chính xác dự đoán của MOMA
và ROOM.
42
Hình 4.9 So sánh FBA, MOMA và ROOM [8].
Hình (A) là độ tƣơng quan giữa dự đoán của FBA, MOMA và ROOM với
các dữ liệu thực nghiệm cho một dòng không nhân trong 3 điều kiện phát triển
khác nhau. Hình (B,C) thể hiện so sánh MOMA và ROOM trong điều kiện
glucose thấp. Các dòng đƣợc thể hiện bằng phần trăm glucose sử dụng.
Ngoài ra, với điều kiện glucose cao, ROOM tìm thấy một nghiệm khả thi
mà chỉ các dòng trên đƣờng thay thế của các phản ứng bị bỏ là thay đổi đáng kể
(đƣờng v16-v14v15 trong hình 4.11). Thật vậy, trong môi trƣờng glucose cao,
dữ liệu thực nghiệm cho thấy hơn 3 dòng có chênh lệch lớn nhất giữa dạng
hoang dã và dạng đột biến (Emmerling [17]). MOMA dự đoán thay đổi dòng
nhỏ hơn trên đƣờng này, từ đó cho thấy phƣơng pháp cực tiểu hóa khoảng cách
Euclid có thể không cho phép các thay đổi lớn.
43
Hình 4.10 Giản đồ miêu tả mạng trao đổi chất carbon trung tâm của E. coli
[8].
Các dòng thực nghiệm gán nhãn từ v1–v24 và đƣợc đo theo hƣớng mũi tên.
Chú ý rằng trong một số trƣờng hợp các dòng theo hƣớng ngƣợc lại đƣợc thể
hiện bằng các giá trị âm. Mũi tên đậm thể hiện các đƣờng thay thế ngắn (v19–
v18–v21) đƣợc dự đoán bởi ROOM với gen pyk bị loại bỏ (đánh dấu X) trong
điều kiện glucose trung bình. Các thay đổi lớn của flux trên đƣờng này đƣợc xác
định qua thực nghiệm.
Dự đoán tính sát thân
44
Một đánh giá rộng bằng mô phỏng việc xoá bỏ gen của Saccharomyces
cerevisiae đã đƣợc trình bày bởi Forster et al. (2003). FBA đƣợc dùng để tính
tốc độ phát triển tối đa cho 555 gen xoá bỏ. Một gen đƣợc cho là sát thân nếu tốc
độ phát triển tối đa của dạng đột biến tƣơng ứng nhỏ hơn 5% dạng hoang dã.
FBA dự đoán chính xác tính sát thân của 89.6% số gen. Chúng tôi kiểm tra cả
MOMA và ROOM trên mô hình này để nghiên cứu một tập hợp các gen có liên
quan với nhau.
Các gen đƣợc dự đoán là sát thân bởi FBA cũng đƣợc dự đoán bởi MOMA
và ROOM vì tốc độ phát triển tối đa tính đƣợc bởi FBA chỉ có thể giảm với
MOMA và ROOM. Cùng chạy MOMA với các gen có thể dự đoán bởi FBA cho
kết quả tồi hơn đáng kể hơn FBA. Đặc biệt, ngoài các gen đó thì MOMA dự
đoán nhầm 50 gen là sát thân (hình 4.12). Ngƣợc lại, kết quả của ROOM trên
các gen đó tƣơng đƣơng hoàn toàn với FBA.
Hình 4.11 Danh sách 50 gen MOMA dự đoán nhầm.
Chúng tôi chuyển sang kiểm tra 50 gen mà ROOM và FBA đều dự đoán
đúng còn MOMA dự đoán sai. Nhƣ thực nghiệm E.coli trong môi trƣờng
glucose cao, ROOM tìm ra một đƣờng thay thế ngắn nhất cho các phản ứng bị
loại bỏ. Dự đoán sai của MOMA khiến nó đƣa ra một lời giải sai.
4.2.3.4. Mở rộng của ROOM
Như đã trình bày ở trên, các con đường khác đôi được sử dụng bởi các
giống đột biến để chuyển hướng dòng. Do đó các mô hình dựa trên ràng buộc
cần phải chứa cả các đường thay thế hay các đặc tính cấu trúc mạng như là
khoảng cách từ phản ứng bị xoá bỏ. Để làm điều này, một biến thể của
ROOM có thể gắn các giá trị chi phí khác nhau cho các thay đổi dòng đáng kể
của các phản ứng khác nhau. Đặc biệt, hàm mục tiêu có thể được thay đổi để
cực tiểu
m
iii yc
1 , với ci là chi phí để thay đổi dòng i. Ví dụ, để tính cho các
đường thay thế, mỗi phản ứng trên một đường thay thế được gán một chi phí
tỷ lệ với độ dài đường. Các phản ứng còn lại sẽ được gán chi phí cao hơn.
Thực tế, chúng tôi thấy rằng khi gắn các chi phí lớn hơn cho các thay đổi dòng
đáng kể không sử dụng biến thể của ROOM, các kết quả dự đoán có tốt hơn
một chút. Dự đoán này cho thấy để điều hoà một gen không phải nguyên thuỷ
phải cần một chi phí thích nghi lớn hơn.
45
CHƢƠNG 5 - BÀI TOÁN CỤ THỂ VÀ PHƢƠNG PHÁP TIẾP
CẬN
5.1. Phát biểu bài toán
Bài toán cần tìm các cặp chuỗi gen có tính không giao hoán thể hiện khi
thứ tự đột biến gen là AB thì sinh vật vẫn tồn tại và thứ tự đột biến gen là BA
dẫn đến sinh vật bị tiêu diệt hay ngƣợc lại. Các khả năng có thể xảy ra với hai
gen đột biến A, B là:
1. Đột biến gen A: sinh vật vẫn tồn tại
2. Đột biến gen B: sinh vật vẫn tồn tại
3. Đột biến gen A và B cùng lúc: sinh vật chết
4. Đột biến gen A trƣớc, khi đó sinh vật tiến hoá và thích nghi; sau đó đột
biến gen B: sinh vật chết
5. Đột biến gen B trƣớc, khi đó sinh vật tiến hoá và thích nghi; sau đó đột
biến gen A: sinh vật vẫn tồn tại
46
Hình 5.1 Một mô hình của cặp gen không hoán vị A và B.
Một cách giải thích cho quá trình này:
• Trƣờng hợp (1)-(3) là hiển nhiên
• Trƣờng hợp (4), không có quá trình tiến hoá và thích nghi sinh vật
chết. Nguyên nhân có thể là do đột biến gen A không thay đổi đáng kể
phân phối dòng trao đổi chất và cơ thể đột biến có khả năng sản sinh đủ
nguyên liệu sống. Sau đó việc đột biến gen B dẫn đến diệt vong vì phân
phối dòng bị thay đổi quá lớn, vƣợt quá khả năng tiến hoá và thích nghi
của sinh vật.
• Trƣờng hợp (5), khi đột biến gen B tạo ra thay đổi lớn. Kết quả là, (a) các
quá trình điều hoà trong cơ thể tạo ra một pathway mới cho quá trình tổng
47
hợp các nguyên liệu sống, hoặc (2) sinh vật tự tiến hóa để tăng cƣờng
tổng hợp nguyên liệu sống. Do đó khi tiếp tục đột biến gen A sau đó, sinh
vật vẫn tồn tại.
Lý thuyết toán học để xác định mục tiêu này là phép chiếu liên tiếp lời giải
nguyên thuỷ vào không gian nghiệm khả thi Φx của mạng trao đổi chất bị đột
biến xoá bỏ gen X, tiếp theo chiếu vuông góc xuống không gian khả thi của đột
biến kép ΦAB nhƣ trên hình 5.2 dƣới đây.
Hình 5.2 Một biểu đồ thể hiện tính bất đồng bộ của quá trình xoá các cặp
gen [3].
Điểm đỏ là nghiệm của FBA. Nghiệm màu xanh da trời là nghiệm của
MOMA với thứ tự xoá bỏ gen AB. Điểm màu xanh lá cây là các nghiệm của
MOMA với thứ tự xóa bỏ gen BA.
48
Với thứ tự xoá bỏ gen AB, x là A; trong khi với thứ tự xoá bỏ gen BA thì x
là B. Khi một tập các gen trao đổi chất đƣợc xác định là không giao hoán, chúng
sẽ đƣợc kiểm tra bằng thực nghiệm. Tuy nhiên thách thức kỹ thuật ở đây là có
nhiều (hơn một) lời giải tối ƣu cho vi khuẩn nguyên thuỷ và nhiều nghiệm giá trị
quá lớn (cỡ 104), không có ý nghĩa sinh học.
Hình 5.3 Một minh hoạ trƣờng hợp có nhiều nghiệm tối ƣu tự nhiên và ảnh
hƣởng của chúng tới các nghiệm chiếu vuông góc (dạng đột biến) [3].
Các đỉểm đỏ là các nghiệm tối ƣu dạng tự nhiên của FBA, trong khi các
điểm xanh da trời và xanh lá cây là nghiệm dạng đột biến của MOMA.
Nếu một trong chúng là kết quả của phƣơng pháp quy hoạch tuyến tính và
sau đó đƣợc sử dụng trong phép chiếu chuỗi đột biến kép, các hiệu ứng số học
không mong muốn (ví dụ nhƣ tính không khả thi hay vấn đề hội tụ) có xảy ra.
Để giải quyết vấn đề này, chúng tôi đã phát triển phƣơng pháp FBA/MOMA kết
hợp với việc chọn một lời giải với giá trị dòng có thể là nhỏ nhất mà vẫn không
ảnh hƣởng tới đầu ra của tốc độ phát triển tối ƣu, từ đó làm cho lời giải là có ý
nghĩa sinh học.
49
5.2. Phƣơng pháp FBA/MOMA cải tiến
Phƣơng pháp FBA/MOMA cải tiến đƣợc sửa lại dựa trên phƣơng pháp
FBA và MOMA nhƣ sau:
a. Tính lời giải cho dạng nguyên thuỷ w
bằng quy hoạch bậc hai nhƣ sau:
highlow
TT
www
wS
wcwIw
0 :Subject to
1- : Minimize
(5.1)
b. Sử dụng w
có đƣợc từ (5.1) tính lời giải cho dạng đột biến sử dụng hệ
phƣơng trình sau:
0
0
:Subject to
2
1 : Minimize
i
highlow
TT
v
vvv
vS
vwvIv
(5.2)
Trong hệ phƣơng trình (5.1), λ đƣợc chọn để không làm ảnh hƣởng đến tốc
độ tăng trƣởng tối ƣu. Chúng tôi đã áp dụng hệ phƣơng trình (5.1) vào mô hình
trao đổi chất mới công bố JR904 của E. coli với λ=106
và so sánh với kết quả có
đƣợc từ hệ phƣơng trình 4.2 (phƣơng pháp FBA gốc).
5.3. Tìm kiếm những cặp gen không giao hoán
Chúng tôi sử dụng dữ liệu về mạng trao đổi chất của E. coli từ mô hình
JR904 để tạo ra một danh sách các siêu gen. Mỗi siêu gen sẽ bao gồm một hoặc
một số gen có 3 hay 4 ký tự đầu tiên khớp với các flux trong mô hình JR904.
Tiếp theo chúng tôi tạo ra danh sách tất cả các cặp siêu gen có thể và sử dụng
FLUXOR để tìm ra các cặp siêu gen có tính không giao hoán. Dƣới đây là mã
nguồn hàm chính của chƣơng trình
Code:
program SearchNonCommutativityGenes()
{Khai báo các biến cần dùng};
begin
//Xây dựng mạng từ các tham số
50
BuildModelFromFile(filename);
//Khởi tạo bộ quy hoạch tuyến tính và bậc hai
InitOOQP();
//Khởi tạo sanh sách các siêu gen
GenerateSuperGeneList();
//Thực hiện việc tìm kiếm trong toàn bộ danh sách
DoFullBNCSearch();
end.
51
CHƢƠNG 6 - KẾT QUẢ VÀ ĐÁNH GIÁ
6.1. FLUXOR - một hệ thống phần mềm để nghiên cứu các hệ thống sinh
học sử dụng phƣơng pháp FBA/MOMA
Hầu hết các phần mềm giải bài toán quy hoạch tuyến tính/bậc hai đều đƣợc
thiết kế với dữ liệu đầu vào dạng file MPS đã có cách đây hàng thập kỷ hay các
dạng khác không phù hợp với các thao tác sinh học nhƣ xoá bỏ gen, chiếu, v..v;
các dạng phù hợp thì lại là dạng thƣơng mại hay không phải mã nguồn mở. Do
đó để đáp ứng dữ liệu đầu vào cho bài toán của tôi nhƣ đã trình bày ở phần trên,
thật là một thách thức nếu không có phần mềm cho phép các thao tác toán học
để tính toán các lời giải liên quan tới một câu hỏi sinh học cụ thể. Với tình hình
nhƣ vậy cùng với việc ứng dụng rộng rãi của phƣơng pháp FBA/MOMA vào
nghiên cứu các bài toán trong sinh học, chúng tôi đã phát triển hệ thống phần
mềm FLUXOR. Đây là một hệ thống phần mềm mã nguồn mở viết bằng ngôn
ngữ hƣớng đối tƣợng C++ sử dụng quy hoạch tuyến tính (Linear Programming -
LP) và quy hoạch bậc hai (Quadratic Programming - QP) với phƣơng pháp
Interior Point của Karmarkar, kiến trúc của hệ thống FLUXOR đƣợc minh hoạ
nhƣ hình 5. Nguyên tắc thiết kế của FLUXOR là giải phóng ngƣời dùng khỏi
các chi tiết kỹ thuật của toán học và cài đặt phần mềm mà tập trung vào các vấn
đề sinh học (ví dụ nhƣ ảnh hƣởng của việc loại bỏ tất cả các gen vận chuyển tới
tốc độ phát triển của men với điều kiện có oxy?). Với mỗi câu hỏi sinh học, tất
cả công việc mà ngƣời sử dụng cần làm chỉ là cài đặt hàm mục tiêu nhƣ trong
hình 5, những phần tính toán còn lại sẽ do FLUXOR tự động đảm nhiệm.
Hình 6.1 Hệ thống phần mềm FLUXOR sử dụng phƣơng pháp
FBA/MOMA.
52
Module QP solver đƣợc phát triển bởi Gertz và Wright. Hàm mục tiêu “Goal” là
giao tiếp cho ngƣời dùng cài đặt các mục tiêu tính toán.
Hiện tại FLUXOR có thể lấy dữ liệu đầu vào dạng MPS, SBML hay ma
trận. Ở lõi của FLUXOR là bộ phần mềm QP do Gertz và Wright phát triển, đây
là bộ phần mềm có thể giải rất hiệu quả các bài toán dạng quy hoạch tuyến tính
và quy hoạch bậc hai. Cuối cùng chúng tôi cho rằng trong tƣơng lai FLUXOR sẽ
là một phần của hệ thống các phần mềm trợ giúp cho quá trình nghiên cứu sinh
học.
6.2. Phƣơng pháp FBA cải tiến
Hình 6.2 là kết quả của FLUXOR cho ta thấy sự so sánh, rõ ràng có nhiều
giá trị dòng với các giá trị không hợp lý là kết quả của phƣơng pháp FBA chuẩn,
trong khi phƣơng pháp FBA đƣợc sửa đổi (hệ phƣơng trình 5.1) đã thu gọn lại
thành các giá trị hợp lý hơn. Với những giá trị còn lại, cả hai phuơng pháp FBA
cũ và mới đều cho các giá trị gần giống nhau nhƣ thể hiện trên hình 6.3.
Hình 6.2 So sánh FBA chuẩn và FBA cải tiến
53
Nghiệm tính bởi phƣơng pháp FBA chuẩn - hệ phƣơng trình 4.2 (điểm
xanh da trời) và phƣơng pháp FBA cải tiến - phƣơng trình 5.1 (điểm đỏ) của
FLUXOR. Có nhiều điểm xanh mà giá trị quá lớn gần nhƣ không thể sử dụng
cũng nhƣ không có ý nghĩa sinh học.
Hình 6.3 So sánh FBA chuẩn và FBA cải tiến (phóng to)
Nghiệm tính bởi phƣơng pháp FBA chuẩn - hệ phƣơng trình 4.2 (điểm
xanh da trời) và phƣơng pháp FBA cải tiến - phƣơng trình 5.1 (điểm đỏ) của
FLUXOR. Các nghiệm gần nhƣ giống nhau với cả 2 phƣơng pháp cũ và mới.
6.3. Các gen không giao hoán
Với dữ liệu từ mô hình mạng trao đổi chất của vi khuẩn E. coli JR904,
chúng tôi đã tạo ra đƣợc các siêu gen. Với từng đôi siêu gen (gọi là siêu gen A
và siêu gen B) , chúng tôi sử dụng FLUXOR để tính toán các giá trị dòng của
mạng trao đổi chất bị xoá siêu gen tƣơng ứng. Nếu hai tập giá trị dòng tính toán
đƣợc khác nhau một lƣợng đáng kể thì ta gọi đôi đó là một cặp ứng cử.
Dƣới đây là một số cặp siêu gen đã tìm đƣợc:
54
Bảng 6.1 Một số chuỗi gen không giao hoán của E. coli.
Siêu gen A Siêu gen B Khác biệt giữa
thứ tự xoá bỏ
gen AB và BA Tên Protein Tên Flux Tên Protein Tên Flux
RIBDEC RIBD1; RIBD2 CYDA CYDA 0.923959
RIBDEC RIBD1; RIBD2 FADB FADB 0.923961
RIBDEC RIBD1; RIBD2 MAE MAEB 0.923962
RIBEEC RIBE PTA PTAR 0.863463
PTA PTAR RIBBEC RIBB 0.863463
PPC PPC RIBA RIBA 0.65882
CYDA CYDA RIBFEC RIBF1; RIBF2 0.92396
FADB FADB RIBFEC RIBF1; RIBF2 0.923961
RIBFEC RIBF1; RIBF2 MAE MAEB 0.921468
Bảng 6.2 Một số thống kê về các siêu gen của mô hình mạng trao đổi chất
E. coli JR904.
Số lƣợng flux 953
Số lƣợng siêu gen 380
Số lƣợng cặp phải tìm kiếm 72010
Số lƣợng cặp có khác biệt > 0.5 17
Số lƣợng cặp có khác biệt > 0.1 298
Số lƣợng cặp có khác biệt (> 0) 71468
Số lƣợng cặp không tính toán đƣợc 542
Giá trị khác biệt lớn nhất 0.923962
55
Ta thấy trên bảng 6.2, số lƣợng flux lớn hơn nhiều so với số lƣợng siêu gen
(953 so với 380), đó là do mỗi siêu gen đã bao gồm nhiều gen tƣơng ứng với
nhiều protein, mỗi protein lại có thể tƣơng ứng với nhiều flux. Do đó số lƣợng
siêu gen đã giảm chỉ còn gần một nửa so với số flux. Ta cũng thấy số lƣợng cặp
là khá lớn (72010 cặp), thời gian chạy cũng khá lâu, trung bình mất khoảng 24
giờ cho một lần tìm kiếm. Ngoài ra, chúng ta cũng thấy có một số lƣợng nhỏ các
cặp không thể tính toán đƣợc do giới hạn về công cụ toán học, tỷ lệ này chiếm
khoảng 0.75% (542 cặp). Cuối cùng để các kết quả này có giá trị sinh học thực
sự, các siêu gen tìm thấy cần đƣợc kiểm tra bằng thực nghiệm để đánh giá cụ thể
và chi tiết hơn cũng nhƣ tìm ra các pathway tƣơng ứng với chúng giúp cho ta
hiểu rõ hơn các cơ chế sinh học phân tử trong tế bào.
56
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN
Nghiên cứu mạng trao đổi chất là một lĩnh vực có nhiều sự quan tâm hiện
nay. Đầu tiên, luận văn trình bày về mạng trao đổi chất và các phƣơng pháp
phân tích, cùng một cải tiến để tăng độ chính xác các dự đoán của phƣơng pháp
FBA.
Tiếp theo, mục tiêu chính của luận văn là kiểm chứng một giả thuyết mới
trong sinh học về tính chất không giao hoán của hai gen đột biến, từ đó tìm ra
một mô hình hoạt động mới của cơ chế tiến hoá và thích nghi sinh học của sinh
vật đột biến. Giả thuyết bên dƣới công trình này là trong điều kiện không có quá
trình tiến hoá và thích nghi lâu dài, các cặp gen không giao hoán là có tồn tại,
khi mà các đột biến kép của các cặp gen có thể bắt gặp tại các vùng khác nhau
của không gian dòng nếu nhƣ thứ tự đột biến là khác nhau. Nếu giả thuyết này là
đúng thì chúng ta sẽ hiểu rõ hơn nguồn gốc của tính đa dạng trong quá trình tiến
hoá và thích nghi sinh học, từ đó thay đổi cách nghĩ truyền thống trong sinh học
khi bỏ qua các đặc tính bất đối xứng nảy sinh từ thứ tự của các đột biến.
Một số mục tiêu cần hoàn thành trong tƣơng lai là:
Kiểm tra xem các kết quả dự đoán bởi FBA cải tiến ảnh hƣởng đến kết
quả dự đoán của MOMA nhƣ thế nào?
Áp dụng phƣơng pháp ROOM cho bài toán này.
Đánh giá trong phòng thí nghiệm các siêu gen không giao hoán. Phân tích
cụ thể các đặc trƣng của các siêu gen đó để có các thông tin chi tiết hơn
phục vụ cho các nghiên cứu sinh học tiếp theo.
57
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Đặng Cao Cƣờng, Nguyễn Trung Thông, Hoàng Xuân Huấn (2008), “Một
số phƣơng pháp phân tích mạng trao đổi chất sinh học”, Hội thảo quốc
gia CNTT, Huế 2008.
2. PGS.TS. Trần Minh Tâm, “Trao đổi chất và sự chuyển hóa năng lƣợng”,
Báo Thực phẩm & Đời sống.
Tiếng Anh
3. Dat H. Nguyen, Cuong Cao Dang (2008), “Biological Non-
Commutativity Operating Paradigm In E. coli Metabolic Network”,
Proceeding of The 2008 Pacific Rim International Conferences on
Artificial Intelligence (PRICAI 2008).
4. Daniel Segre, Dennis Vitkup, and George M. Church (2002), “Analysis of
optimality in natural and perturbed metabolic networks”, PNAS, vol. 99.
5. Karthik Raman, Preethi Rajagopalan, Nagasuma Chandra (2005), “Flux
Balance Analysis of Mycolic Acid Pathway: Targets for Anti-Tubercular
Drugs”, PLoS Computational Biology, Vol. 1, No. 5.
6. Kenethh et al (2003), “Advances in flux balance analysis”, Current
Opinion in Biotechnology, pp. 14(5):491-6.
7. Tomer Shlomi, Omer Berkman and Eytan Ruppin (2004), “Constraint-
Based Modeling of Perturbed Organisms A ROOM for improvement”,
ISMB.
8. Tomer Shlomi, Omer Berkman, and Eytan Ruppin (2005), “Regulatory on
off minimization of metabolic flux changes after genetic perturbations”,
PNAS, vol. 102 no. 21, pp. 7695-7700.
9. Edwards, J. S. & Palsson, B. O (1998). “How will bioinformatics
influence metabolic engineering?”, Biotechnol Bioeng vol. 58, pp. 162-9.
10. Bailey, J. E (2001). “Complex biology with no parameters”, Nat
Biotechnol, Vol. 19, pp. 503-4.
58
11. Varma, A., Boesch, B. W. & Palsson, B. O (1993), “Stoichiometric
interpretation of Escherichia coli glucose”, Appl Environ Microbiol, Vol.
59, No. 8, pp. 2465-2473.
12. Reed, J., Vo, T., Schilling, C. & Palsson, B (2003),” An expanded
genome-scale model of Escherichia coli K-12 (iJR904 GSM/GPR)”,
Genome Biology, Vol. 4, R54.
13. Gertz, E. M. & Wright, S. J (2003), “Object-Oriented Software for
Quadratic Programming”, ACM Transactions on Mathematical Software,
vol. 29, pp. 58-81.
14. Karmarkar, N (1984), “A New Polynomial-Time Algorithm for Linear
Programming”, Combinatorica, vol. 4, pp. 373-395.
15. Hucka, M. et al. (2003), ”The systems biology markup language (SBML):
a medium for representation and exchange of biochemical network
models”, Bioinformatics, Vol. 19, pp. 524-531.
16. Daniel Segrè, Jeremy Zucker, Jeremy Katz, Xiaoxia Lin, Patrik
D’haeseleer, Wayne P. Rindone, Peter Kharchenko, Dat H. Nguyen,
Matthew A. Wright and George M. Church (2003), “From annotated
genomes to metabolic flux models and kinetic parameter fitting”, Omics,
Vol. 7, pp. 301.
17. Emmerling, M., Dauner, M., Ponti, A., Fiaux, J., Hochuli, M., Szyperski,
T., Wuthrich, K., Bailey, J. E. & Sauer , U. (2002), “Metabolic flux
responses to pyruvate kinase knockout in Escherichia coli”, J. Bacteriol,
Vol. 184, pp. 152–164.
18. Neidhardt, F. C. (1996), Escherichia coli and Salmonella: cellular and
molecular biology, ASM Press, Washington, D.C.
19. Bono, H., Ogata, H., Goto, S. & Kanehisa, M. (1998), “Reconstruction of
amino acid biosynthesis pathways from the complete genome sequence”,
Genome Research, Vol. 8, 203.
20. Selkov, E., Maltsev, N., Olsen, G. J., Overbeek, R. & Whitman, W. B.
(1997), “A reconstruction of the metabolism of Methanococcus jannaschii
from sequence data”, Gene, Vol. 197, GC11-26.
21. Covert, M. W. et al. (2001), “Metabolic Modeling of Microbial Strains in
silico”, Trends in Biochemical Sciences.
22. Karp, P. D., Riley, M., Paley, S. M., Pellegrini-Toole, A. &
Krummenacker, M. (1998), “EcoCyc: Encyclopedia of Escherichia coli
genes and metabolism”, Nucleic Acids Research, Vol. 26, pp. 50.
59
23. Selkov, E., Jr., Grechkin, Y., Mikhailova, N. & Selkov, E. (1998),
“MPW: the Metabolic Pathways Database”, Nucleic Acids Research, Vol.
26, pp. 43.
24. Kanehisa, M (1997), “A database for post-genome analysis”, Trends in
Genetics, Vol. 13, pp. 375-381.
25. Overbeek, R., Larsen, N., Smith, W., Maltsev, N. & Selkov, E. (1997),
“Representation of function: the next step”, Gene, Vol. 191, GC1-GC9.
26. Selkov, E. et al. (1996), “The metabolic pathway collection from EMP:
the enzymes and metabolic pathways database”, Nucleic Acids Re, Vol.
24, pp. 26-34.
27. EP Gianchandani, MA Oberhardt, AP Burgard, CD Maranas, JA Papin,
(2008), “Predicting biological system objectives de novo from internal
state measurements”, BMC bioinformatics, Vol. 9.
28. Weng, G., Bhalla, U. S. & Iyengar, R. (1999), “Complexity in biological
signaling systems”, Science, Vol. 284, pp. 92-98.
29. Kanehisa, M. (1998), “Databases of biological information”, Trends
Guide to Bioinformatics, Vol. 24-26.
30. Palsson, B. O. (1997), “What lies beyond bioinformatics?”, Nature
Biotechnology, Vol. 15, pp. 3-4.
31. Hess, B. & Boiteux, A. (1968), “Oscillatory organization in cells, a
dynamic theory of cellular control processes”, Hoppe-Seylers Zeitschrift
fur Physiologische Chemie, Vol. 349, pp. 1567 - 1574.
32. Tyson, J. J. & Othmer, H. G. (1978), “The dynamics of feedback control
circuits in biochemical pathways”, Progress in Theoretical Biology, Vol.
5, pp. 1 - 62.
33. Goodwin, B. C. (1963), “Oscillatory organization in cells, a dynamic
theory of cellular control processes”, Academic Press, New York.
34. Savageau, M. A (1969), “Biochemical systems analysis. Some
mathematical properties of the rate law for the component enzymatic
reactions”, J Theor Biol, Vol. 25, pp. 365-374.
35. Heinrich, R., Rapaport, S. M. & Rapaport, T. A. (1977), “Metabolic
regulation and mathematical models”, Progress in Biophysics and
Molecular Biology, Vol. 32, pp. 1 - 82.
36. Kacser, H. & Burns, J. A. (1973), “The control of flux”, Symposium for
the Society of Experimental Biology, Vol. 27, pp. 65 - 104.
37. Tomita, M. et al. (1999), “E-CELL: software environment for whole-cell
simulation”, Bioinformatics, Vol. 15, pp. 72-84.
60
38. Bonarius, H. P. J., Schmid, G. & Tramper, J. (1997), “Flux analysis of
underdetermined metabolic networks: The quest for the missing
constraints”, Trends in Biotechnology, Vol. 15, pp. 308-314.
39. Edwards, J. S., Ramakrishna, R., Schilling, C. H. & Palsson, B. O. (1999),
“Metabolic Flux Balance Analysis in Metabolic Engineering”, Marcel
Deker, pp. pp. 13-57.
40. Edwards, J. S. & Palsson, B. O. (1999), “Systems Properties of the
Haemophilus influenzae Rd Metabolic Genotype”, Journal of Biological
Chemistry, Vol. 274, pp. 17410-17416.
41. Varma, A. & Palsson, B. O. (1994), “Metabolic Flux Balancing: Basic
concepts”, Scientific and Practical Use, Bio/Technology, Vol. 12, pp.
994-998.
42. Sauer, U., Cameron, D. C. & Bailey, J. E. (1998), “Metabolic capacity of
Bacillus subtilis for the production of purine nucleosides, riboflavin, and
folic acid”, Biotechnology and Bioengineering, Vol. 59, pp. 227-238.
43. Blattner, F. R. et al. (1997), “The complete genome sequence of
Escherichia coli K-12”, Science, Vol. 277, pp. 1453.
44. Pramanik, J. & Keasling, J. D. (1997), “Stoichiometric model of
Escherichia coli metabolism: Incorporation of growth-rate dependent
biomass composition and mechanistic energy requirements”,
Biotechnology and Bioengineering, Vol. 56, pp. 398-421.
45. Varma, A. & Palsson, B. O. (1994), “Stoichiometric flux balance models
quantitatively predict growth and metabolic by-product secretion in wild-
type Escherichia coli W3110”, Applied and Environmental Microbiology,
Vol. 60, pp. 3724-3731.
46. Neidhardt, F. C., Ingraham, J. L. & Schaechter, M. (1990), Physiology of
the bacterial cell, Sinauer Associates, Inc., Sunderland, MA.
47. Ingraham, J. L., Maalce, O. & Neidhardt, F. C. (1983), Growth of the
bacterial cell, Sinauer associates Inc., Sutherland, Massachusetts.
48. Varma, A. & Palsson, B. O, (1993), “Metabolic capabilities of
Escherichia coli: I. Optimal growth patterns”, Journal of Theoretical
Biolog, Vol. 165, pp. 503-522.
49. Vallino, J. & Stephanopoulos, G. (1993), “Metabolic Flux Distributions in
Corynebacterium glutamicum During Growth and Lysine
Overproduction”, Biotechnology and Bioengineering, Vol. 41, 633-646.
61
50. Jeremy S. Edwards, Rafael U. Ibarra & Bernhard O. Palsson. (2001), “In
silico predictions of Escherichia coli metabolic capabilities are consistent
with experimental data”, Nature Biotechnology, Vol. 19, pp. 125 - 130.
51. Edwards, J. S., Ramakrishna, R. & Palsson, B. O. (1999), “Characterizing
phenotypic plasticity: A phase plane analysis”, Engineering in Medicine
and Biology, 1999, 21st Annual Conf. and the 1999 Annual Fall Meeting
of the Biomedical Engineering Soc. BMES/EMBS Conference.
52. http://en.wikipedia.org
53. http://www.cgal.org
Recommended