23
Профили экспрессии (паттерны) различаются у нормальных и раковых клеток или при различных типах рака. Излечимые и неизлечимые виды лейкозов дают разные паттерны. По виду паттернов можно с большой вероятностью предсказать течение болезни на самой ранней стадии.

[PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Профили экспрессии (паттерны) различаются у нормальных и раковых клеток или при различных типах рака. Излечимые и неизлечимые виды лейкозов дают разные паттерны. По виду паттернов можно с большой вероятностью предсказать течение болезни на самой ранней стадии.

Page 2: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Конструкция чипа Affymetrix

PM = perfect matchMM = mismatch

Page 3: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Этапы обработки для чипов Affymetrix (фирма Affymetrix)

1. Привязка к сетке (gridding)

2. Вычисление значений интенсивности зондов

3. Поправка на глобальный фон

4. Поправка на неспецифическую гибридизацию

5. Вычисление устойчивого среднего логарифмов поправленных значений в зондах.

6. Масштабирование сигналов чтобы подрезанное среднее имело фиксированное значение

Page 4: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Проблемы первоначального подхода:1. MM>PM (60-85% генов, где это

выполняется хотя бы для одного зонда) Решения

А) Заплатка Affymetrix: идеальный mismatch

Б) А MM вообще не нужен. Вероятностная поправка на фон в методе RMA.

В) Нет, все-таки будем использовать MM, но с учетом теоретически вычисленного сродства данной олигонуклеотидной последовательности. GC-RMA

Page 5: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Проблемы первоначального подхода:2. Эффект зонда – вариация интенсивности одного гена, померянная разными зондами

не случайна.

Модель Ли-Вонга. Eg – истинная экспрессия гена g, fi – чувствительность i-ой пары PM-MM.

PMgi –MMgi =fi Eg + Шум

Произвольное требование, необходимое для идентификации

(f12 +…+fk

2)/k =1

Page 6: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Визуальная проверка на присутствие нелинейной зависимости от интенсивности. М-А график.

Mg=log(Ig(1)/Ig(2))

Ag=(1/2)log(Ig(1)*Ig(2))

A

M

0

Page 7: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Проблемы первоначального подхода:3. Нелинейная зависимость от

интенсивности.

Mg=log(Ig(1)/Ig(2))

Ag=(1/2)log(Ig(1)*Ig(2))

Page 8: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Линейная регрессия 1

-20

0

20

40

60

80

100

0 10 20 30 40 50 60 70 80 90 100

MINa,b((y1-(a+bx1))2+(y2-(a+bx2))2+…+(yk-(a+bxk))2)

y = a+bx

Page 9: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

-60

-40

-20

0

20

40

60

-60 -40 -20 0 20 40 60

Часто бывает полезно выбрать в качестве начальной точки отсчета средние значения измеряемых величин.

Малиновой и желтой точкой показаны величины стандартного отклонения х и у.

Линейная регрессия 2

Page 10: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

• Здесь в качестве единиц измерения выбраны среднеквадратичные отклонения для х и у.

• Тогда уравнение прямой, лучше всего приближающей наше облако точек имеет очень простой вид:

• y= R*x• R – коэффициент корреляции х

и у. При нашем выборе единиц измерения и начал отсчета

• R=(x1y1+x2y2+…+xnyn)/n

Линейная регрессия 3

R=0.0995, y= 0.995x

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

-2 -1 0 1 2

X

Y

Page 11: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Локально-линейная регрессия (loess)

-3

-2

-1

0

1

2

3

4

3 4 5 6 7

Page 12: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

МА график после нормализации

Mn =M – Mloess(A)

Page 13: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Квантильная нормализация

00.10.20.30.40.50.60.70.80.91

2 3 4 5 6 7

00.10.20.30.40.50.60.70.80.91

2 3 4 5 6 7

Page 14: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Квантильная нормализация

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1 2 3 4 5 6 7

Series2Series1Series3

Page 15: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

МА графики для различных иголок принтеракДНК микрочип

Page 16: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Поиск генов с одинаковым уровнем экспрессии в разных образцах

1. Housekeeping гены

К сожалению, не все housekeeping гены имеют посстоянный уровень экспрессии. Примеры: актин, GAPDH,

2. Гены инвариантного ранга

3. Контрольные гены

Контроли гибридизации bioB, bioC, bioD и cre Гены E. coli и б/ф P1, биотинилированные сRNA транскрипты которых вводят в смесь для гибридизации в разных концентрациях (1,5, 5, 25, 100 pM для bioB, bioC, bioD и cre, соотв.). BioB – на пороге чувствительности (1:100000).

Page 17: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Возможная последовательность этапов обработки для чипов Affymetrix

1 Вычисление “сырых” значений интенсивности зондов (Affymetrix MicroArray Suit)

2. Поправка на глобальный фон (Affymetrix MAS5)

3. Loess нормализация на уровне зондов (и PM и MM зонды)

4. Вычисление модельного индекса экспрессии (Ли и Вонг, dChip)

6. Квантильная нормализация индексов экспрессии

Page 18: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Чего с чем нормализуем?1. И квантильная и лоесс нормализация применяется к паре

чипов. Для нормализации совокупности чипов чаще всего выбирают (строят) базовый чип и нормализуют все к нему.

а) Базовый чип – это реально существующий чип, нравящийся автору.

б) Базовый чип конструируется. Как правило, это чип, где значение каждого гена равно медиане множества значений этого гена по всем чипам, которые хочется нормализовать.

2. Для квантильной нормализации можно сводить распределение каждого чипа к множеству средних квантилей или к множеству квантилей распределения, построенного по всем чипам сразу.

3. Для лоесс нормализации существует алгоритм “циклический лоесс”.

Page 19: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Что может измерить ДНК чип Choe et al. Genome Biology 2005, 6:R16

183

87

141

85

18090

88

186

90

180

114000геновна чипе

3

2.0

1.2

 2551

2

14000геновна чипе

1.2

1

2

1.5

2.5

1.5

41.7

 

1

1

11

1

11

1

1

1

1

Page 20: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Что может измерить ДНК-чип?

А) Choe et al. Genome Biology 2005, 6:R16Насколько хорошо ДНК чип выясняет, какие

вообще гены экспрессированы?• очень плохо на уровне пары зондов – из зондов,

прошедших через порог, 10% принадлежат отсутствующим генам, а остальные включают только 60% присутствующих генов

• Лучше на уровне генов – из генов, прошедших через порог, 10% принадлежат отсутствующим генам, а остальные включают 85% присутствующих генов.

Page 21: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Что может измерить ДНК-чип? А) Choe et al. Genome Biology 2005, 6:R16 Насколько хорошо ДНК чип выясняет, какие

гены дифференциально экспрессированы?• Плохо, если считать, что дифференциально

экспрессированные означает увеличившиеся более чем на 20% (из 1309 генов 380 не находятся (29%), а ошибочно находятся 105(10% от всех найденных). На самом деле ни один из генов, увеличивших экспрессию на 20% не был найден, и лишь половина изменившихся на 50% была найдена.

• Хорошо, если рассматривать лишь гены, изменившие экспрессию более чем на 100% (не находится лишь 7% от так изменившихся при 10% ошибочно найденных )

Page 22: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Возможно ли сравнение результатов различных экспериментов?

В работе Multiple Lab Comparison of Microarray Platforms,Rafael A. Irizarry et al., 2004рассматриваются результаты измерения одних и

тех же образцов разными лабораториями на разных платформах. Эффект лаборатории очень велик и превосходит эффект платформы.

Заметим, что эффект нормализации, особенно такой, где все образцы нормализуются к одному экспериментальному образцу, уменьшая вариабельность результатов отдельного эксперимента, затрудняет сравнивание различных экспериментов.

Page 23: [PPT] msu.rukodomo.fbb.msu.ru/FBB/lectures/Losev_1.ppt · Web viewПрофили экспрессии (паттерны) различаются у нормальных и раковых

Литература

• Exploration and analysis of DNA microarray and protein array data. D. Amaratunga, J. Cabrera, Wiley 2004.

• Statistical analysis of gene expression microarray data. Edited by T. Speed. Chapman and Hall, 2003.

• Statistics for microarrays. E. Wit, J. McClure, Wiley, 2004• Analyzing microarray gene expressing data.

G. McLachlan, Kim-Anh Do, C. Ambroise, Wiley, 2004• Bioinformatics and computational biology solutions using

R and Bioconductor. R. Gentleman, V. Carey, W. Huber, R. Irizzary, S. Dudoit, Springer, 2005.