23
Problem terminologii, nomenklatury i definicji w naukach biologicznych Jacek Leluk Uniwersytet Zielonogórski Instytut Biotechnologii i Ochrony Środowiska Jak to jest, że mamy w 98% taki sam genom co szympans, a tylko w 50% taki jak nasz własny ojciec?

Problem terminologii, nomenklatury i definicji w naukach biologicznych Jacek Leluk

  • Upload
    foster

  • View
    31

  • Download
    0

Embed Size (px)

DESCRIPTION

Problem terminologii, nomenklatury i definicji w naukach biologicznych Jacek Leluk Uniwersytet Zielonogórski Instytut Biotechnologii i Ochrony Środowiska. Jak to jest, że mamy w 98% taki sam genom co szympans, a tylko w 50% taki jak nasz własny ojciec?. "O składności członów człowieczych" - PowerPoint PPT Presentation

Citation preview

Page 1: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Problem terminologii, nomenklatury i definicji

w naukach biologicznych

Jacek LelukUniwersytet Zielonogórski

Instytut Biotechnologii i Ochrony Środowiska

Jak to jest, że mamy w 98% taki sam genom co szympans,

a tylko w 50% taki jak nasz własny ojciec?

Page 2: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

"O składności członów człowieczych" 

Dlaczego ptacy mleka nie dają?

Bo musiałyby mieć cyce, które by im wadziły ku lataniu.

  Andrzej z Kobylina (XVI w.)

Page 3: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Czy biologia jest logiczna?Bałagan terminologiczny:

• Mitochondria czy chondriosomy?• Co to jest papaina, ficyna,

czynnik Hageman?• Czy inhibitor Kazala hamuje aktywność

Kazala?

Page 4: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Czy biologia jest logiczna?Bałagan terminologiczny, cd.

Tłumaczenie podstawowych terminów z różnych dziedzin nauk biologicznych

• Double helix - podwójna spirala• alignment - przyrównywanie, uliniowienie,

zestawianie, uzgadnianie, dopasowanie• Czy Christmas factor to czynnik

bożonarodzeniowy?• dot matrix - dot macierz, macierz punktowa• Inhibitor Bowmana-Birka, czy Bowmana-Birk?• równanie Michalisa-Mentena, czy Michaelisa-

Menten

Page 5: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Czy biologia jest logiczna?Bałagan terminologiczny, cd.

Tłumaczenie skrótów z różnych dziedzin nauk biologicznych

• BPTI - Basic Pancreatic Trypsin Inhibitor - Bovine Pancreatic Trypsin Inhibitor - Basic Protein Trypsin Inhibitor

• PAM- Point Accepted Mutations- Percent Accepted Mutations

• Inhibitor (trypsyny) Kunitza- BPTI - organy zwierzęce, ssaki- STI - soybean trypsin inhibitor

Page 6: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Czy biologia jest logiczna?Misinterpretacje:

• Sekwencja aminokwasowa genu?• Czy inhibitory z roślin dyniowatych są inhibitorami?• Do czego służy aglutynina z ziarniaków pszenicy?• Co właściwie robią sojowe inhibitory proteinaz?• Dlaczego w biologicznych bazach danych występuje

tyle inhibitorów kinaz bez żadnej dokumentacji, że hamują one aktywność kinazową?

• Interpretacja pojęć – homologia, identyczność, podobieństwo, pokrewieństwo

Page 7: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Czy biologia jest logiczna?

Tworzenie teorii w oparciu o wyrywkową wiedzę i fragmentaryczne dane

• Stochastyczne macierze substytucji aminokwasowych

• Statystyczny opis procesów biologicznych• Symulacje Monte Carlo w analizie struktur

białkowych• Struktura trzeciorzędowa a wiarygodność

badań rentgenografii strukturalnej kryształów

Page 8: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Statistical approaches vs. accuracyHow far may they be improved?

Protein secondary structure prediction – accuracy 70-72%(not much changed since 1978)

100% accuracy requires the complete database for all possible structures.

For 30 AA polypeptides – 2030 sequences/secondary structures

Searching the database for appropriate sequence/structure with the rate 1012 sequences/sec. would proceed 1.8 bilion times longer than the age

of the Universe.

Page 9: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Analiza Monte Carlo w analizie i przewidywaniu struktur biomolekularnych - – jaki konkretnie stan jest przewidywany?

Modelowanie matematyczne procesów biologicznych – - łańcuchy Markowa, a różnicowanie ewolucyjne białek- problem prawidłowego oszacowania istotności obserwowanego podobieństwa sekwencji nukleotydowych i aminokwasowych

Deformowanie rzeczywistości przez błędne stosowanie dobrych narzędzi

Page 10: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

MetAUG

MetAUG

ArgAGG

ArgAGG

LysAAG

LysAAG

ProCCC

ProCCC

AsnAAC

AsnAAC

ArgAGG

ArgAGG

GlnCAG

GlnCAG

HisCAC

HisCAC

SerAGC

SerAGC

ArgCGG

ArgCGG

ArgCGC

ArgCGC

LysAAG

LysAAG

?

Arginine-to-lysine mutational conversion pathways for arginines of different origin

Page 11: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Błędy interpretacyjne biologów

Aminokwasy i białka – - czy białka zbudowane są z aminokwasów?

Definicje i teorie –- definicja gatunku a teoria ewolucji

„Biologiczne” definicje, a ich potwierdzenie- Mutacje sprzężone (klastry rozproszone)

Page 12: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Pojęcia „prosty, wyspecjalizowany, pierwotny, prymitywny- (Cyanophyta, Archaebacteria, relacje małpa-człowiek)

Globalne i lokalne minima energii cząsteczek –- czy można opisać konkretną konformację dla konkretnego czasu jej trwania?

Procesy mikroskopowe mezoskopowe i makroskopowe, a narzędzia ich badania

- opis kwantowy cząsteczki wody, a przewidywanie wystapienia tsunami

Błędy interpretacyjne teoretyków

Page 13: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Problem prawdziwych założeń i właściwych wniosków

Czy sekwencja aminokwasowa białek, to tylko eklektyczny łańcuch znaków?

Błędy interpretacyjne teoretyków

Ile jest podstawowych aminokwasów budujących łańcuchy białkowe?

- 64 jeśli chodzi o ich relacje genetyczne (presja zmienności mutacyjnej)

- 20 na poziomie wyłącznie fenotypowym (podlegającym presji selekcyjnej)

Page 14: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Sequence multiple alignment

Problem of gap manipulation

Any protein can be aligned with each other as homologous/similar

anybiologicalstring anybilogicalstrip

anybiologicalstri-ng anybi-logicalstrip

anyproteincanbealigned

-an-yprote--i-ncanb-----ealigned

Page 15: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Mutacje sprzężone

Zjawisko jednoczesnego wystąpienia dwóch lub więcej mutacji warunkującego ich utrzymanie się w sposób wzajemnie zależny.

Zgodnie z aktualnie przyjetą hipotezą pozytywnej selekcji darwinowskiej na poziomie molekularnym, mutacje sprzężone odnoszą

się do kontaktujących się pozycji w białkach, związane są ze specyficznym oddziaływaniem białko-białko, lub partycypują w

zachowaniu aktywności biologicznej i/lub stabilizacji cech strukturalnych cząsteczki.

Page 16: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The current explanation of correlated mutations occurrence (example)

CH2

HN

CH2

CHCH3H3C

Trp

Leu

CH

CH3H3C

CH3

Ala

Val

CH

CH3H3C

CH2

CHCH3H3C

Val

Leu

CH2

HN

CH3

Ala

Trp

Page 17: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The three types of distribution of correlated positions present in myoglobins

The residue location and relative distribution is shown on tertiary structure of human myoglobin (P0244, pdb1bzp)

The spot correlation cluster

Position no. and occurring residues

Correlation versus position 127

127 [AMSTV] A (58) S (7)

27 [ADEFLNT] ADEFNT E

31 [GKRS] GKRS R

78 [AKLQ] K ALQ

109 [DEGNT] DEGT E

116 [AEHKQST] AEHKQS A

117 [AEKNQS] AEKQS E

122 [BDEN] BDEN D

Page 18: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The three types of distribution of correlated positions present in Bowman-Birk inhibitor family

The residue location and relative distribution is shown on tertiary structure of Bowman-Birk inhibitor from soybean (P01055)

The narrow correlation cluster

Position no. and occurring residues

Correlation versus position 13

13 [–ADFIKLMPRSTV] L (11) M (10)

A (8)

4 [–RSTVY] V –S S

5 [–KPST] K –S S

7 [AEGKP] A P P

11 [EFHIKLQRST] T EHQ S

21 [EFIKMQT] T Q EQ

Page 19: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The three types of distribution of correlated positions present in eglin-like proteins.

The residue location and relative distribution is shown on tertiary structure of eglin C (P01051)

 

Position no. and occurring residues

Correlation versus position 67

67 [–DGNT] D (8) G (9)

10 [–ELNQRST] ET LNQRS

The dispersed correlation

Page 20: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The three types of distribution of correlated positions present in lysozymes

The residue location and relative distribution is shown on tertiary structure of lysozyme from rat (P00697, pdb5lyz)

The dispersed correlation

Position no. and occurring residues

Correlation versus position 80

80 [GHKNR] G (7) H (31) N (16)

30 [ILMV] MV ILMV V

40 [DFKNR] DN N FKNR

Page 21: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

The observed number and contribution of three correlation types in four different protein families

The correlation sets consist of 2 to over 20 residues

 The protein

family (number of correlated

positions/set)

The correlation statistics

Total number of correlation

sets observed

Number of dispersed

sets

Number of narrow clusters

Number of undirected

clusters

Number of sets

related to active center

Eglin-like proteins (2-13) 20 7 7 6 1

Bowman-Birk proteinase

inhibitors (2-28)23 4 13 6 9

Myoglobins (2-29)

41 23 9 9 n.a.

Lysozymes (2-15) 41 25 9 7 9

All families 125 (100%) 59 (47.2%) 38 (30.4%) 28 (22.4%) -

Page 22: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

Miski są wklęsłe

Miski są wypukłe

Dialog informatyk – biologProblem wspólnego języka

Page 23: Problem terminologii, nomenklatury i definicji  w naukach biologicznych Jacek Leluk

...nie zawsze pierwszy nasuwający się wniosek jest zgodny z rzeczywistością

W całym bogactwie zjawisk przyrodniczych...