23
Alcune applicazioni della Matematica all’analisi dell’elettrocardiogramma Camillo Cammarota * Enrico Rogora 31 agosto 2006 Introduzione Tra le applicazioni della Matematica alle altre scienze rivestono una importan- za crescente quelle alla Biologia e alla Medicina. Esse vengono stimolate dalla grande massa di informazione quantitativa prodotta per esempio dall’acquisizione di segnali e di immagini biomediche. Un settore nel quale l’interazione con la Matematica si ` e rivelata fruttuosa e continua a stimolare importanti ricerche ` e quello dell’analisi dei segnali cardiaci, in particolare l’elettrocardiogramma (ECG). L’attivit` a elettrica generata dal cuore fu misurata per la prima volta da Waller nel 1887 con un elettrometro capillare [30]. Successivamente Einthoven mise a punto un sistema che permetteva la registrazione di tale attivit` a e gett` o le basi della moderna elettrocardiografia [16]. L’importanza cruciale delle sue scoperte fu riconosciuta con l’attribuzione del premio Nobel per la medicina nel 1925. Questo lavoro si propone di far conoscere due applicazioni significative della Matematica all’analisi dell’ECG. La prima applicazione, ormai diffusa e consolidata, ` e quella del riconosci- mento delle principali caratteristiche dell’ECG normale, mentre il riconoscimento delle patologie offre ancora problemi aperti. L’introduzione di tecniche matem- atiche quali l’analisi multiscala basata sulle ondine, pu ` o svolgere un ruolo decisivo per aumentare l’efficacia della diagnosi [1]. L’importanza dei progressi in questo campo ` e facilmente comprensibile se si considera che l’ECG ` e uno strumento diagnostico non invasivo, di basso costo e di grande diffusione. La seconda applicazione riguarda l’analisi delle serie temporali estratte dal tracciato elettrocardiografico delle ventiquattro ore. Tale tracciato ` e ottenuto con * Dipartimento di Matematica, Universit` a di Roma ”La Sapienza”, [email protected] Dipartimento di Matematica, Universit` a di Roma ”La Sapienza”, [email protected] 1

Alcune applicazioni della Matematica all’analisi dell ... · mo cardiaco. Gia˚ Erolo in epoca ... Le unita˚ sull’asse verticale sono in bit. ... Un problema fondamentale e˚

Embed Size (px)

Citation preview

Alcune applicazioni della Matematicaall’analisi dell’elettrocardiogramma

Camillo Cammarota ∗ Enrico Rogora †

31 agosto 2006

Introduzione

Tra le applicazioni della Matematica alle altre scienze rivestono una importan-za crescente quelle alla Biologia e alla Medicina. Esse vengono stimolate dallagrande massa di informazione quantitativa prodotta per esempio dall’acquisizionedi segnali e di immagini biomediche. Un settore nel quale l’interazione con laMatematica si e rivelata fruttuosa e continua a stimolare importanti ricerche equello dell’analisi dei segnali cardiaci, in particolare l’elettrocardiogramma (ECG).

L’attivita elettrica generata dal cuore fu misurata per la prima volta da Wallernel 1887 con un elettrometro capillare [30]. Successivamente Einthoven mise apunto un sistema che permetteva la registrazione di tale attivita e getto le basidella moderna elettrocardiografia [16]. L’importanza cruciale delle sue scopertefu riconosciuta con l’attribuzione del premio Nobel per la medicina nel 1925.

Questo lavoro si propone di far conoscere due applicazioni significative dellaMatematica all’analisi dell’ECG.

La prima applicazione, ormai diffusa e consolidata, e quella del riconosci-mento delle principali caratteristiche dell’ECG normale, mentre il riconoscimentodelle patologie offre ancora problemi aperti. L’introduzione di tecniche matem-atiche quali l’analisi multiscala basata sulle ondine, puo svolgere un ruolo decisivoper aumentare l’efficacia della diagnosi [1]. L’importanza dei progressi in questocampo e facilmente comprensibile se si considera che l’ECG e uno strumentodiagnostico non invasivo, di basso costo e di grande diffusione.

La seconda applicazione riguarda l’analisi delle serie temporali estratte daltracciato elettrocardiografico delle ventiquattro ore. Tale tracciato e ottenuto con

∗Dipartimento di Matematica, Universita di Roma ”La Sapienza”, [email protected]†Dipartimento di Matematica, Universita di Roma ”La Sapienza”, [email protected]

1

l’impiego dell’elettrocardiografo portatile Holter, inventato dal biofisico ameri-cano Norman Holter nel 1949. Queste ricerche hanno lo scopo di aprire nuoveprospettive ad una delle pratiche mediche piu antiche: l’auscultazione del rit-mo cardiaco. Gia Erofilo in epoca alessandrina aveva notato sia la correlazionetra frequenza del battito e temperatura corporea sia la variazione della frequenzamedia con l’eta [26]. Egli osservo anche che il ritmo cardiaco contiene elemen-ti di regolarita nell’irregolarita. Quantificare questa intuizione e lo scopo dellerecenti ricerche sulla variabilita della frequenza cardiaca (HRV, da Heart RateVariability).

Il lavoro e strutturato nel modo seguente. Nel primo paragrafo vengono for-nite le informazioni basilari sull’elettrocardiogramma. Nel secondo paragrafo sidiscute il problema del riconoscimento automatico delle forme d’onda dell’ECG.Nel terzo paragrafo si discute il problema dell’analisi dell’HRV. Questo paragrafoe diviso in due parti: la prima tratta dell’analisi spettrale, la seconda dell’analisisimbolica. Nel quarto paragrafo si presenta, come esempio dei metodi dell’anal-isi simbolica, un risultato sull’universalita della distribuzione di parole binarie.Poiche il presente lavoro si limita a trattare solo poche tra le applicazioni dellaMatematica alla cardiologia, abbiamo riservato l’ultimo paragrafo ad una breverassegna bibliografica delle altre.

1 Elettrocardiogramma

L’attivita elettrica del cuore viene rilevata attraverso elettrodi posizionati sul toracee sugli arti. Per ogni coppia di elettrodi viene misurata una differenza di potenzialein funzione del tempo, il cui valore e dell’ordine di alcuni millivolt. Usualmentesi effettuano dodici misure che vengono chiamate derivazioni e l’ECG ne e larappresentazione grafica. In Figura 1 e riportato il tracciato di una derivazioneproveniente da un ECG ambulatoriale.

Il segnale viene convertito in una sequenza numerica con una scheda analogi-co/digitale (A/D), caratterizzata da due parametri: la risoluzione e la frequenza dicampionamento. La risoluzione rappresenta il numero di intervalli in cui vienesuddiviso il range in cui si vuole osservare il segnale e si esprime in bit. Un valoretipico per il range e 10 millivolt e la risoluzione e tipicamente di 1012 o di 1016 bit.La frequenza di campionamento e il numero di misure acquisite per ogni secondoe si misura in cicli al secondo o Hertz (Hz). Gli elettrocardiografi ambulatorialihanno frequenze che vanno da 180 Hz fino a 1000 Hz.

L’attivita meccanica del cuore viene indotta dall’attivita elettrica. La primafase di ogni ciclo cardiaco ha inizio con la depolarizzazione degli atri, visualiz-zata dall’onda P (vedi Figura 2) che induce la contrazione atriale. Successiva-mente l’impulso elettrico si trasferisce ai ventricoli che si depolarizzano (onda R)

2

e conseguentemente si contraggono. L’ultima fase visibile sull’ECG e la ripolariz-zazione dei ventricoli (onda T). Si noti che la ripolarizzazione degli atri non vienevisualizzata nell’ECG.

0 2000 4000 6000 8000

−20

00

200

400

Figura 1: Alcuni cicli cardiaci registrati in una delle derivazioni dell’elettrocardiogramma confrequenza di campionamento di 1000 Hz. Si noti che il fenomeno ha caratteristiche qualitativeperiodiche ma esistono piccole differenze tra cicli anche consecutivi. Le unita sull’asse verticalesono in bit.

0 200 400 600 800 1000

050

0010

000

1500

0

P

Q

R

S

T

Figura 2: Localizzazione delle onde P, Q, R, S, T in un ciclo registrato con frequenza di 1000Hz.

3

Sono sufficienti pochi minuti di monitoraggio per avere informazioni impor-tanti sullo stato del cuore attraverso l’analisi visuale dell’elettrocardiogramma.Esistono pero fenomeni che sfuggono all’analisi visiva o perche di piccola entitao perche si manifestano in tempi di monitoraggio piu lunghi. Per analizzare questifenomeni e necessario sostituire l’occhio del medico con un’analisi fatta dal calco-latore. Un metodo ormai consolidato, chiamato Holter, e la registrazione dell’elet-trocardiogramma nell’arco di 24 ore, ottenuta con un elettrocardiografo portatile,che ha una frequenza tipica di campionamento di 180 Hz. La successione numer-ica registrata da un ECG Holter e costituita quindi da circa 180×3600×24 ∼ 107

valori.

2 Riconoscimento

La forma delle onde principali (P,Q,R,S,T) e molto variabile, sia nell’ambito dellanormalita che nelle diverse patologie.

Un problema fondamentale e la determinazione automatica dell’inizio e dellafine del complesso QRS, che ha la morfologia piu riconoscibile. Il riconoscimen-to delle altre onde si basa anche sulla posizione relativa al complesso QRS. Glialgoritmi utilizzati nel riconoscimento delle onde sono contenuti nel software as-sociato ad ogni elettrocardiografo e che viene installato su un normale PC. L’affid-abilita degli algoritmi per il riconoscimento dei complessi QRS di soggetti normaliraggiunge il 99% .

Un altro problema importante e quello di caratterizzare i battiti non normalie classificarli, per esempio riconoscere extrasistoli atriali e ventricolari. L’af-fidabilita degli algoritmi di riconoscimento in questo caso e molto inferiore ein genere il software permette al cardiologo di verificare la classificazione pro-posta dalla macchina e di giungere in maniera interattiva ad una classificazionesoddisfacente.

Osserviamo che nel segnale ECG esistono alcune componenti ben caratter-izzate in frequenza. Per esempio, sono presenti le interferenze dovute alla cor-rente elettrica di rete che hanno una frequenza di 50 Hz. Inoltre il segnale con-tiene contributi dovuti ai tremori muscolari che sono originati da fenomeni os-cillatori molto rapidi con frequenze maggiori di 100 Hz. Un modo generale etradizionale per ridurre disturbi localizzati in frequenza e l’analisi spettrale basatasulla trasformata di Fourier discreta, di cui parleremo nel paragrafo 3.

Attualmente la tecnica piu utilizzata per il riconoscimento on line del comp-lesso QRS e quella del filtraggio digitale. Un filtro e una trasformazione lineareche al segnale xt associa un segnale yt definito da

yt =n

∑k=1

f (k)yt−k +m

∑i=1

g(i)xt−i (1)

4

dove f (k) e g(k) sono opportuni coefficienti. Si noti che per dare senso alle for-mule iterative (1) e necessario estendere la definizione del segnale per un insiemedi indici piu ampio di quello di partenza, ponendolo uguale a zero dove necessario.

0 50 100 150

−20

020

4060

8010

0

0 50 100 150 200

−20

020

4060

8010

0

0 50 100 150 200

−20

020

4060

8010

0

0 50 100 150 200

−20

020

4060

8010

0

Figura 3: Nel primo riquadro e riportato un ciclo del segnale ECG campionato a 200 Hz, disponi-bile all’indirizzo web [23]. Nel secondo riquadro si mostra l’effetto dell’applicazione di filtri passaalto e passa basso per attenuare le componenti dovute all’onda P e all’onda T rispetto a quelle delcomplesso QRS. Nel terzo riquadro si mostra l’effetto dell’applicazione di un filtro differenziale.Nel quarto riquadro si mostra l’effetto dell’applicazione di un filtro media mobile applicato alquadrato del segnale precedente. Si noti che, a meno di una traslazione dovuta all’applicazionedei filtri, il segnale rappresentato nel quarto riquadro e significativamente diverso da zero solo incorrispondenza del complesso QRS del segnale originale.

Per il riconoscimento automatico della posizione del complesso QRS si imp-iegano diversi tipi di filtri. Innanzitutto si usano filtri per selezionare un intervallodi frequenze allo scopo di ridurre le componenti estranee al QRS e cioe l’onda P,l’onda T, ecc.. In secondo luogo si usano filtri di tipo differenziale che evidenzianola rapida variazione che caratterizza il complesso QRS. Infine dopo un ulteriorefiltraggio con un filtro tipo media mobile, si ottiene un segnale che e maggiore diuna fissata soglia solo nella finestra corrispondente al QRS iniziale. Le fasi sopradiscritte sono rappresentate nei riquadri di Figura 3.

5

Per segnali ECG campionati a 200 Hz riportiamo i filtri suggeriti in [29], chesi applicano in sequenza nell’ordine che segue:

filtro passa basso (seleziona le frequenze minori di 11 Hz)

yt =1

36(2yt−1 − yt−2 + xt −2xt−6 + xt−12)

filtro passa alto (seleziona le frequenze maggiori di 5 Hz)

yt = xt−16 −1

32(yt−1 + xt − xt−32)

filtro tipo derivata

yt =18 (2xt + xt−1 − xt−3 −2xt−4)

filtro media mobile

yt =1

30

29∑i=0

xt−i.

Nell’ultimo decennio si e diffusa una nuova tecnica di analisi e trattamento delsegnale, basata sulla decomposizione in “ondine” o “wavelet” [22]. La trasformatadiscreta wavelet e una trasformazione lineare sul segnale che si puo interpretarein termini di filtri applicati iterativamente.

Illustriamo come opera la trasformata discreta con le ondine di Haar, suppo-nendo che il segnale iniziale abbia lunghezza n = 2 j per semplicita.

Al primo passo il segnale x = (x1,x2, . . . ,xn) viene trasformato nel segnale

x1 + x2√2

,x3 + x4√

2, . . . ,

xn−1 + xn√2

,x1 − x2√

2,x3 − x4√

2, . . . ,

xn−1 − xn√2

Sia la prima meta del vettore, denotata con s1, sia la seconda meta, denotata cond1, hanno n

2 = 2 j−1 componenti. Al secondo passo si riapplica l’algoritmo alvettore s1, ottenendo due vettori s2 e d2. Iterando il procedimento un numero h divolte con 1 ≤ h ≤ j si ottengono quindi i vettori sh,dh, . . . ,d1 di lunghezza

2 j−h,2 j−h,2 j−h+1, . . . ,2 j−1

rispettivamente. Il vettorew = (sh,dh, . . . ,d1)

e formato da 2 j elementi e costituisce il vettore dei coefficienti wavelet associatoal segnale. La trasformata discreta cosı definita e ortogonale, ovvero preserva lalunghezza del vettore cui viene applicata. In simboli valgono le relazioni

‖x‖2 = ‖w‖2 = ‖sh‖2 +‖dh‖2 + · · ·+‖d1‖2

6

Se indichiamo con M l’operatore lineare che trasforma il vettore x in w, pos-siamo definire dei nuovi vettori

Sh,Dh,Dh−1, . . . ,D1

ponendoSh = M−1(sh,0, . . . ,0)Di = M−1(0, . . . ,0,di,0, . . . ,0)

(2)

Poiche la matrice che rappresenta M e ortogonale, la sua inversa coincide con latrasposta e quindi il calcolo dei vettori Di ha lo stesso costo computazionale delcalcolo dei coefficienti di. I vettori D1, . . . ,Dh si chiamano rispettivamente primo,secondo, . . . , h-esimo dettaglio del segnale x.

Si ha chex = Sh +Dh +Dh−1 + · · ·+D1.

Questa decomposizione prende il nome di analisi multiscala. La trasformatawavelet discreta puo essere utilizzata sia nella compressione del segnale che nellaeliminazione del rumore, eliminando i dettagli scarsamente rilevanti.

Esistono diverse ondine rispetto alle quali si puo definire una trasformatawavelet. Inoltre, la nozione stessa di trasformata puo essere generalizzata in mo-do da poter trattare convenientemente gli effetti di bordo e i segnali di lunghezzaqualsiasi. Un tipo di generalizzazione e la “Maximal Overlap Discrete WaveletTransform” (MODWT) [22] che, a differenza di quella precedente, produce vet-tori di coefficienti della stessa lunghezza del segnale iniziale. Gli algoritmi peril calcolo delle trasformate wavelet sono molto efficienti e sono implementati innumerosi software, anche di dominio pubblico. Per analizzare i dati in questolavoro abbiamo utilizzato il software statistico di dominio pubblico R [33] cheimplementa l’analisi wavelet nel package waveslim .

Per applicare le wavelet al riconoscimento del complesso QRS un possibilemetodo consiste nell’utilizzare la MODWT e la sua inversa con l’ondina “Daubechies8”[22]. L’essenza del metodo consiste nel selezionare i vettori di che contengono in-formazioni sul complesso QRS, ma contengono scarse informazioni sulle altreonde. Per esempio, nella Figura 4 si nota che i vettori d4 e d5 hanno, in cor-rispondenza delle onde P e T del segnale originale, valori relativamente trascur-abili rispetto a quelli relativi al complesso QRS. Dopo aver introdotto una oppur-tuna soglia, se una componente dei vettori d4 e d5 e in valore assoluto minoredella soglia, essa viene posta uguale a zero, altrimenti si lascia invariata. Questodefinisce due nuovi vettori d ′

4 e d′5 e si costruisce un nuovo segnale applicando

a d′4 e d′

5 la trasformata inversa. Come si vede nella Figura 5 il nuovo segnale esignificativamente diverso da zero in corrispondenza dei complessi QRS del seg-nale originale. Perfezionando questo metodo, gli intervalli QRS possono essereprecisamente localizzati in modo automatico.

7

Time

EC

G

0 500 1000 1500 2000

010

000

Time

d2

0 500 1000 1500 2000

−30

00

200

Time

d3

0 500 1000 1500 2000

−50

050

0

Time

d4

0 500 1000 1500 2000

−20

00−

500

1000

d5

0 500 1000 1500 2000

−40

000

4000

Figura 4: Nel primo riquadro della figura e riportato un tratto di segnale ECG campionato a 1000Hz. Nei riquadri successivi abbiamo riportato i coefficienti wavelet d2, . . . ,d5 della MODWT conl’ondina “Daubechies 8”. Si noti che le scale delle ordinate sono diverse per ogni riquadro. Nonabbiamo rappresentato i coefficienti d1 perche contengono solo rumore ne i coefficienti d6, d7

e d8 e s8 in cui le informazioni necessarie per localizzare il complesso QRS si mescolano alleinformazioni relative alle altre onde.

8

Time

0 500 1000 1500 2000

050

0015

000

Time

0 500 1000 1500 2000

−10

000

500

Figura 5: Nel primo riquadro e riportato un segmento ECG relativo ad una derivazione. Nelsecondo riquadro e riportata l’inversa della MODWT applicata ai coefficienti d ′

4 e d′5.

9

Un importante problema diagnostico aperto e quello di riconoscere nell’ECG imicropotenziali quali ad esempio quello relativo al transito dello stimolo nervosonel fascio di His e i potenziali tardivi. I metodi di analisi attualmente implemen-tati sono basati sulla tecnica dell’averaging [2] e il loro utilizzo clinico e ancoraoggetto di ricerca.

Poiche i micropotenziali sono eventi localizzati nel tempo, le ondine sono uncandidato naturale per migliorarne il riconoscimento [1] e [19].

3 Variabilita nel lungo periodo della successione RR

Il segnale ECG, pensato come funzione del tempo, e solo approssimativamenteperiodico, avendo alcune caratteristiche variabili, la principale delle quali e l’in-tervallo di tempo che intercorre tra due picchi R consecutivi (intervallo RR). No-tiamo che il picco R corrisponde alla sistole, avvertita come il battito principaledel cuore, che si manifesta anche nel battito del polso. L’analisi computerizzatadella sequenza RR consente quindi di “ascoltare il polso” per intervalli di tempomolto lunghi. I tracciati RR possono presentare differenze qualitative evidenti inrelazione alle condizioni fisiologiche e patologiche, come, per esempio, nei casimostrati in Figura 6. Per quantificare la variabilita della serie RR al fine di ri-conoscere diverse patologie, sono stati proposti numerosi indici. Alcuni di essisono standardizzati ed accettati dalla comunita internazionale dei cardiologi [28]e cominicano a trovare applicazione nella pratica clinica. La complessita delle se-rie RR di lunga durata e pero tale da stimolare la ricerca di nuovi indici e modellimatematici in grado di predirne il comportamento. Gli indirizzi di ricerca consoli-dati sulla “Heart Rate Variability” (HRV) sono basati sull’analisi spettrale classica[5] e sulla teoria dei sistemi dinamici caotici [17]. Recentemente hanno trovatoapplicazione metodi di analisi delle sequenze RR noti come analisi simbolica olinguistica. Questo paragrafo e diviso in due sezioni. Nella prima tratteremodell’analisi spettrale e nella seconda dell’analisi simbolica.

3.1 Analisi spettrale

La regolazione della frequenza cardiaca avviene, in condizioni normali, prevalen-temente sotto il controllo del sistema nervoso autonomo e, in maniera subordinata,sotto il controllo umorale [18]. Il sistema nervoso autonomo esercita il suo con-trollo attraverso due componenti: il simpatico e il vago (o parasimpatico). Si eosservato che la stimolazione simpatica aumenta la frequenza cardiaca mentre lastimolazione vagale la diminuisce. Entrambe esercitano il controllo in tempi del-l’ordine di pochi battiti, mentre il controllo umorale agisce su scale temporali piugrandi.

10

30000 32000 34000 36000 38000 40000

400

800

1200

1600

Battiti

RR

6000 8000 10000 12000 14000

400

800

1200

1600

Battiti

RR

4000 6000 8000 10000 12000

400

800

1200

1600

Battiti

RR

Figura 6: Sequenze RR di lunghezza 10000 estratte da tracciati Holter ambulatoriali nei casidi normalita (primo riquadro), trapianto cardiaco (secondo riquadro) e fibrillazione atriale (terzoriquadro).

11

Per mettere in luce le due diverse componenti del controllo neuroautonomi-co del battito cardiaco, negli ultimi due decenni si e usata una tecnica di analisispettrale della sequenza RR [21].

Richiamiamo i fondamenti su cui si basa l’analisi spettrale dei segnali discreti[5]. Ogni segnale discreto xt , t = 0, . . . ,n−1 puo essere scritto come

xt =n−1∑j=0

d( f j)e2πi f jt (3)

dovef j =

jn

j = 0, . . . ,(n−1)

e

d( f ) =1n

n−1∑t=0

xte−2πi f t (4)

Le frequenze f j si chiamano frequenze armoniche e dipendono dal numero n dicampioni di cui e composto il segnale xt . Il vettore d = (d( f0), . . . ,d( fn−1) sichiama trasformata di Fourier discreta di x. In conseguenza delle proprieta diortonormalita delle funzioni esponenziali complesse, si ha

‖x‖ = n · ‖d‖ (5)

In generale, d(1− f ) = d(− f ) e inoltre, se x e reale, d(− f ) = d( f ).Il periodogramma di un segnale reale discreto e la funzione definita, per ogni

f nell’intervallo 0 ≤ f ≤ 12 , da:

I( f ) = n|d( f )|2

Il periodogramma fornisce una indicazione di come le diverse frequenze con-tribuiscono al segnale. Se si assume che la sequenza dei dati sia la realizzazione diun processo stocastico Gaussiano e stazionario X1,X2, . . . ,Xn, e possibile definireuna funzione della frequenza, chiamata densita spettrale, che caratterizza il pro-cesso [27]. Tale densita puo essere stimata con due metodi. Il primo consiste inuna regolarizzazione del periodogramma ottenuta con una media mobile relativaad una finestra di lunghezza opportunamente scelta rispetto alla lunghezza dellaserie. Il secondo consiste nello stimare dalla serie un modello autoregressivo diordine opportuno. Un modello autoregressivo di ordine p, AR(p), e definito da

Xi = φ1Xi−1 + · · ·+φpXi−p +Zi

dove φ1, . . . ,φp sono i coefficienti del modello e Zi ∼ N(0,σ2) e una sequenzaindipendente Gaussiana. I coefficienti φi definiscono un polinomio Q(z) = 1 +

12

Battiti

RR

0 200 400 600 800 1000 1200 1400

700

800

900

1000

1100

0.0 0.1 0.2 0.3 0.4 0.5

110

010

000

Frequenza

Spe

ttro

0.0 0.1 0.2 0.3 0.4 0.5

200

1000

5000

2000

0

Frequenza

Spe

ttro

rego

lariz

zato

0.0 0.1 0.2 0.3 0.4 0.5

200

1000

5000

2000

0

FrequenzaS

pettr

o A

R (

ordi

ne 1

0)

Figura 7: Nel primo riquadro e riportato il grafico di una successione RR relativa ad un intervallodi circa venti minuti. Nel secondo riquadro e riportato, in scala logaritmica, il periodogrammadella successione mostrata nel primo riquadro. Nel terzo riquadro il periodogramma regolarizzatoottenuto sostituendo ad ogni valore la media effettuata considerando i trenta valori precedenti e itrenta valori successivi. Nel quarto riquadro e riportata una stima della densita spettrale ottenuta daun modello autoregressivo di ordine 10.Il picco localizzato intorno a 0.1 Hz corrisponde all’attivitasimpatica, quello intorno a 0.25 Hz all’attivita vagale.

φ1z+ · · ·+φpzp. La densita spettrale stimata con un modello AR(p) e la funzionedefinita per frequenze f ∈ [0, 1

2 ] da ([27])

σ2

|Q(e−2πi f )|2

Nell’ambito dell’analisi delle sequenze RR, si conviene di suddividere l’inter-vallo delle frequenze in tre fasce. La fascia VLF (Very Low Frequences) tra 0 e0.04 Hz, la fascia LF (Low Frequences) tra 0.04 e 0.15 Hz e la fascia HF (HighFrequences) tra 0.15 e 0.4 Hz. Secondo recenti studi clinici, l’azione di controlloesercitata dalle due componenti del sistema nervoso si riflette generalmente in duepicchi del periodogramma. Il picco relativo al controllo simpatico si localizza nel-l’intervallo LF mentre quello relativo al controllo vagale si localizza nell’interval-lo HF. (Figura 7). Alcune patologie possono quindi essere riconosciute attraversomodifiche dello spettro della sequenza RR, cfr. ad esempio [21].

13

3.2 Analisi simbolica

Usualmente l’analisi spettrale viene effettuata su registrazioni dell’ordine di trentaminuti in condizioni controllate. In presenza di successioni RR non stazionarie, inparticolare quelle che provengono dalle registrazioni Holter delle 24 ore, vengonomeno le ipotesi che sono alla base dei metodi dell’analisi spettrale. E possibileaffrontare l’analisi di queste sequenze anche con un altro metodo, chiamato anal-isi simbolica che ha diversi vantaggi tra cui quello di essere piu robusto rispettoalla non stazionarieta [3], [6], [7], [8] [9]. Il modello che adottiamo per descri-vere i dati e ancora quello di una sequenza di variabili casuali X1, . . . ,Xn di cuila successione dei dati x1, . . . ,xn e una realizzazione. La dipendenza tra le vari-abili e data dalla distribuzione congiunta del vettore k dimensionale (Xi, . . . ,Xi+k)che non dipende da i per l’assunzione di stazionarieta. I dati a disposizione nonsono sufficienti a studiare questa distribuzione, anche per valori piccoli di k; imetodi dell’analisi simbolica consentono di estrarre comunque delle informazionisignificative sulla distribuzione congiunta.

Un metodo si basa sulla codifica binaria delle differenze tra due valori con-secutivi della sequenza. Quando la differenza e positiva si associa il simbolo 1,altrimenti il simbolo 0. Se almeno uno dei valori consecutivi e anomalo o cata-logato dal software come artefatto, si codifica con NA (Not Available). Per certiproblemi la codifica binaria puo essere convenientemente sostituita da una cod-ifica ternaria, per esempio introducendo una soglia δ > 0 e assegnando −1 alledifferenza minori di −δ, 1 alle differenze maggiori di δ e zero altrimenti.

Una volta codificata la serie delle differenze, si possono considerare le parole,definite come stringhe di simboli consecutivi. Per esempio, consideriamo la suc-cessione 1,2,5,3,7,2,3,1,4. La codifica binaria delle sue differenze e la sequen-za 1,1,0,1,0,1,0,1 e le parole di lunghezza tre sono (1,1,0), (1,0,1), (0,1,0),(1,0,1), 0,1,0), (1,0,1).

L’istogramma di tutte le parole binarie di lunghezza k di una successione didati x1, . . . ,xn fornisce quindi informazioni sulla distribuzione congiunta del vet-tore (X2 − X1,X3 − X2 . . . ,Xk+1 − Xk) anche per valori di k non troppo piccoli.Quando si applicano questi metodi alle successioni RR estratte da registrazioniHolter delle 24 ore e ragionevole considerare valori di k intorno a 6. Un primomotivo e che l’azione del sistema nervoso si puo rilevare nell’arco temporale di6 battiti e inoltre il numero di parole binarie, 26, e piccolo rispetto al numero deibattiti nell’arco delle 24 ore, circa 105.

Si noti che per una successione stazionaria di variabili aleatorie indipenden-ti Xi la successione delle differenze Xi+1 −Xi non e una successione di variabiliindipendenti. Pertanto la distribuzione delle parole relativa a quest’ultima e nonbanale ma, come dimostrato in [7] e “universale”, ovvero non dipende dalla dis-tribuzione comune delle Xi. Nel paragrafo successivo riportiamo la dimostrazione

14

0 10 20 30 40 50 600.

000.

020.

04

Normale

Parole binarie di lunghezza 6

Fre

quen

za r

elat

iva

0 10 20 30 40 50 60

0.00

0.02

0.04

Fibrillazione atriale

Parole binarie di lunghezza 6

Fre

quen

za r

elat

iva

0 10 20 30 40 50 60

0.00

0.02

0.04

Serie di variabili indipendenti

Parole binarie di lunghezza 6

Fre

quen

za r

elat

iva

Figura 8: Istogramma delle frequenze delle parole binarie di lunghezza 6 per una sequenza RRnelle 24 ore. Nel primo riquadro, soggetto normale. Nel secondo riquadro, soggetto affetto dafibrillazione atriale. Nel terzo riquadro, simulazione di una sequenza di variabili aleatorie indipen-denti di lunghezza 100000. Per identificare le parole sull’asse delle ascisse abbiamo associato adogni parola l’intero k per cui lo sviluppo binario di k−1 e la parola stessa.

di questo risultato come esempio di approccio matematico all’analisi simbolica.Questo consente di stabilire un test di indipendenza simbolica per una genericasuccessione di variabili, basato sul test del χ quadro, che risulta particolarmenterobusto in presenza di deboli fenomeni non stazionari e che non dipende dalladistribuzione delle Xi. Un’applicazione di questo metodo riguarda la fibrillazioneatriale. In questa patologia molto diffusa la successione RR si presenta forte-mente variabile, “randomica” e debolmente non stazionaria. Un esempio di unaserie siffatta e mostrato nel terzo riquadro della Figura 6.

Nella Figura 8 viene riportato il confronto dell’istogramma delle parole bi-narie di un soggetto con fibrillazione atriale con un soggetto normale e con unasimulazione di una successione stazionaria di variabili indipendenti. Si vede adocchio, ma puo essere quantificato in maniera precisa [8], la grande somiglianzadell’istogramma della fibrillazione atriale con quello della successione simulata.Cio conferma il fatto che nella fibrillazione atriale cronica il controllo nervososul battito e molto ridotto e suggerisce la possibilita di quantificarne la perdita diefficienza attraverso una misura della distanza dell’istogramma da quello previstoteoricamente per una distribuzione di variabili indipendenti. Per maggiori dettagli

15

si veda [8].Si noti che l’impiego dell’analisi simbolica e anche motivato dalla presenza

nei dati medici di numerosi valori anomali, dovuti all’interferenza di cause acci-dentali nel processo di acquisizione. Questo puo rendere problematica l’interpre-tazione dei risultati ottenuti per esempio con l’analisi spettrale. I metodi basati suiconteggi di parole sono invece locali; le parole che contengono valori anomali sipossono semplicemente eliminare.

Una possibile applicazione di tali metodi potrebbe riguardare gli algoritmiche determinano il funzionamento dei defibrillatori impiantabili nei quali occorrememorizzare poca informazione e di qualita inferire a quella che si ottiene dagliECG ambulatoriali [31].

4 Universalita della distribuzione delle parole bina-rie

In questo paragrafo illustriamo il risultato sull’analisi simbolica di una genericasequenza di variabili aleatorie indipendenti ed ugualmente distribuite che abbi-amo citato nel paragrafo precedente a proposito dell’analisi della sequenza RR infibrillazione atriale.

Consideriamo innanzitutto il seguente metodo per codificare un segmento x1, . . . ,xn+1di una serie numerica in una pemutazione.

In Rn+1 si consideri il sottoinsieme ∆ (diagonale grassa) definito come l’in-

sieme dei punti (x1, . . . ,xn+1) tali che esistono almeno due indici i , j per cuixi = x j e indichiamo R

n+1 \∆ con Rn+16= . Sia Sn+1 il gruppo simmetrico, ovvero il

gruppo delle permutazioni di {1, . . . ,n+1}.Denotiamo con

(i1, i2, . . . , in+1)

la permutazione(

1 2 . . . n+1i1 i2 . . . in+1

)

La codifica consiste nell’applicazione della funzione Π : Rn+16= → Sn+1 definita nel

modo seguente:Π(x1, . . . ,xn+1) = (π(1), . . .,π(n+1))

doveπ(i) = 1+#{ j : x j < xi}

(Il simbolo # denota la cardinalita). Notiamo che con questa definizione, se π−1 el’inverso di π, allora

16

xπ−1(1) < xπ−1(2) < · · · < xπ−1(n+1)

Possiamo inoltre codificare un segmento di una serie numerica in una paro-la binaria con il seguente metodo, gia introdotto nel paragrafo precedente. SeZ2 denota l’insieme {0,1}, indichiamo con Z

n2 l’insieme delle parole binarie di

lunghezza n. Definiamo la funzione W : Rn+16= → Z

n2

W (x1, . . . ,xn+1) = (w(1) . . . ,w(n))

dovew(i) =

{

0, if xi > xi+11, if xi < xi+1

(6)

Per esempioW (181,32,42,115) = (0,1,1)

Le codifiche in permutazioni e in parole binarie sono legate dalla seguenterelazione.

W (Π(x)) = W (x) ∀x = (x1, . . . ,xn+1) (7)

Questa e la ragione per cui abbiamo scelto π e non la sua inversa nella definizionedi Π.

Ci occuperemo ora del calcolo del numero di permutazioni che corrispondonoad una data parola.

Sia X = (X1, . . . ,Xn+1) una collezione di n + 1 variabili casuali indipenden-ti identicamente distribuite con densita di probabilita f positiva e assolutamentecontinua rispetto alla misura di Lebesgue su R, e sia P la misura di probabilitaprodotto su R

n+1. Consideriamo gli eventi

Aπ = {(x1, . . . ,xn+1) ∈ Rn+16= : Π(x1, . . . ,xn+1) = π}

parametrizzati dalle permutazioni π ∈ Sn+1. Si noti che Aπ puo essere identificatocon l’evento

{Xπ−1(1) < Xπ−1(2) < · · · < Xπ−1(n+1)}

I sottoinsiemi Aπ formano una partizione di Rn+16= . Definiamo la misura di

probabilita PΠ su Sn+1 indotta da P

PΠ(π) = P(Aπ)

Un proprieta di PΠ e espressa dal risultato classico

17

Lemma ([25]) La probabilita PΠ e uniforme su Sn+1, ovvero

PΠ(π) = 1/(n+1)!

Ora consideriamo la misura di probabilita indotta da P su Zn2 o equivalente-

mente da PΠ in virtu di (7). Per ogni parola w definiamo il sottoinsieme

Bw = {(x1, . . . ,xn+1) ∈ Rn+16= : W (x1, . . . ,xn+1) = w}

e definiamo la probabilita indotta PW

PW (w) = P(Bw)

Consideriamo l’esempio delle permutazioni di S3 e le corrispondenti parole.

Permutazioni (1,2,3) (1,3,2) (2,1,3) (2,3,1) (3,1,2) (3,2,1)Parole 11 10 01 10 01 00

La probabilita indotta sulle parole di lunghezza n puo essere semplicemente cal-colata contando quante permutazioni corrispondono a una data parola e dividendoper (n+1)!. Nell’esempio abbiamo

PW (11) = 1/6, PW (10) = PW (01) = 1/3, PW (00) = 1/6

In generale, lo stesso tipo di argomento dimostra che PW si calcola esplicita-mente a partire da PΠ e non dipende dalla densita f . In questo senso diciamo chee universale.

Mostriamo ora come sia possibile calcolare direttamente PW senza riferirci aPΠ. Il metodo di calcolo si basa su un argomento ricorsivo.

Introduciamo alcune notazioni. Con |w| denotiamo la lunghezza di w, con 1n

denotiamo la parola di lunghezza n costituita da soli 1, con vw la parola ottenutaconcatenando v e w, con v • w denotiamo l’insieme costituito dalle due parole{v0w,v1w} e con () la parola vuota, cioe l’unica parola in Z

02.

Sia {Pn}n≥0 una famiglia di distribuzioni di probabilita, dove Pn e definita suZ

n2 e soddisfaciente alle due seguenti proprieta

1. P0(()) = 1

2. P|v|+1+|w|(v•w) = P|v|(v)P|w|(w)

Quando risulta chiaro dal contesto elimineremo il pedice da Pi.Notiamo che, del momento che le P sono probabilita, si ha sempre

(∗) P (w0)+P (w1) = P (w•).

18

Teorema. Se la famiglia di probabilita {Pn} soddisfa le proprieta 1 e 2 e sePn(1n) e nota per tutti gli n, allora le Pn sono completamente determinate.

Dimostrazione: La dimostrazione consiste in un algoritmo esplicito per ilcalcolo di P (w). Per la parola vuota si ha P (()) = 1 per la proprieta 1. Per paroledi lunghezza 1, P (1) e nota per ipotesi e si ha P (0) = 1−P (1). In generale, datauna parola binaria w, si assuma di conoscere P (u) per tutte le parole di lunghezzaminore di |w|. Se w = 1n allora P (1n) e nota per ipotesi. Altrimenti sia w =u0v dove in v non appare 0. Per (*) si ha P (w) = P (u • v)− P (u1v). InoltreP (u • v) = P (u)P (v) per la proprieta 2 e siamo in grado di calcolare i due fattoriP (u) e P (v) dal momento che le due parole hanno lunghezza inferiore a quella diw. Per calcolare P (u1v) consideriamo l’ultimo 0 in u e decomponiamo la parolacome prima. Iterando la procedura finalmente otteniamo parole che contengonosolamente 1. �

Un esempio aiutera a chiarire l’algoritmo utilizzato nella dimostrazione delteorema.

P (1010) = P (101•)−P (1011) = P (101)−P (1011) =

P (1•1)−P (111)−P (1•11)+P (1111) =

P (1)P (1)−P (111)−P (1)P (11)+P (1111) =

P (1)2 −P (13)−P (1)P (12)+P (14)

Non e difficile verificare che la probabilita PW soddisfa le proprieta 1 e 2 e chequindi si puo utilizzare questo algoritmo per il calcolo di PW . Infatti, il simboloi-esimo w(i) nella parola w e una variabile casuale che dipende solo dalla differen-za Xi+1 −Xi. Quindi w(i) e w(i + 2) sono indipendenti per l’indipendenza dellevariabili Xi. Questo implica la proprieta 2. Inoltre, siccome PW e indotta da PΠ siha

PW (1n) = PΠ(1,2, . . .,n+1) =1

(n+1)!che per n = 0 e la proprieta 1.

Come esempio calcoliamo PW (1010), completando i calcoli dell’esempio prece-dente.

PW (1010) = PW (1)2 −PW (13)−PW (1)PW (12)+PW (14) =(

12

)2− 1

4!− 1

213!

+15!

=215

Come conseguenza dell’universalita di PW si ha che qualunque distribuzionevenga utilizzata per generare una sequenza di variabili casuali al calcolatore, (uni-forme, gaussiana, esponenziale, ecc.), le frequenze relative delle parole ottenute

19

approssimano i valori di probabilita stabiliti dal teorema. Si puo avere un’idea del-la distribuzione di PW per parole di lunghezza 5 guardando l’ultimo istogrammadella figura 8.

5 Altri indirizzi di ricerca

Concludiamo accennando ad altri indirizzi attuali della ricerca matematica, sia nelcampo dell’analisi dell’HRV, sia nella modellistica fisiologica del funzionamen-to del cuore. Tra i metodi matematici nell’analisi dell’HRV di cui non abbiamoparlato nel paragrafo 3 citiamo in primo luogo i modelli sulla generazione dellearitmie. Questi si basano su un sistema dinamico definito dall’iterazione di unamappa della circonferenza in se [17] e cercano di interpretare le aritmie alla lucedella teoria dei sistemi dinamici caotici: intermittenza, raddoppiamento del pe-riodo, biforcazioni, ecc. Altri approcci alla variabilita della frequenza cardiacasono basati sull’analisi multiscala delle serie temporali [13] e su indici ispiratidalla teoria dei sistemi dinamici non lineari (dimensione di correlazione, espo-nenti di Lyapunov, ecc.). Nell’ambito della vastissima letteratura in questi settoricitiamo [4] e [10] come esempio dei contributi di gruppi interdisciplinari italiani.Un sito dove e possibile reperire materiale sulle applicazioni cliniche della ricercanel campo dell’HRV e [32].

Nell’ambito della modellistica fisiologica, importanti settori di applicazioniriguardano la formazione e la propagazione del segnale elettrico nel tessuto car-diaco. Questi fenomeni sono oggetto di numerosi modelli che incorporano la strut-tura cellulare delle fibre miocardiche, la loro anisotropia e le correnti ioniche cheattraversano le membrane. La teoria si basa su sistemi di equazioni alle derivateparziali. Ci limitiamo a citare l’articolo di rassegna [11] come esempio del con-tributo dei matematici italiani a questo importante filone di ricerca. La simu-lazione numerica di questi sistemi richiede algoritmi paralleli e ingenti risorse dicalcolo [12].

Accanto ai modelli di conduzione sono anche stati sviluppati modelli di sin-cronizzazione atrio-ventricolo basati sull’ accoppiamento di oscillatori non lineari[20]; tra i contributi della scuola di bioingegneria italiana citiamo [14].

Oltre che dal punto di vista dell’elettrofisiologia il cuore viene studiato anchedal punto di vista meccanico e fluidodinamico, come parte del piu complessosistema cardiovascolare. Un importante filone di ricerca si occupa di simulazioninumeriche di modelli evolutivi basati sulle equazioni di Navier Stokes. Per unaesposizione di queste problematiche e ulteriori indicazioni bibliografiche citiamo[24] e [15].

Ringraziamenti Ringraziamo vivamente i nostri colleghi del Policlinico “Um-

20

berto I” dell’Universita di Roma “La Sapienza”: innanzitutto Giuseppe Guarini,per le numerose conversazioni sia sugli aspetti clinici sia sulle applicazioni dellamatematica alla medicina; inoltre Maria Ambrosini, Giuseppe Germano, MauroCacciafesta, Pietro Cugini e Mario Curione per il supporto sugli aspetti clinici eper averci fornito i dati.

Riferimenti bibliografici

[1] Addison P. S., Wavelet transforms and the ECG: a review, Physiol. Meas. 26R155-R199, (2005) .

[2] Cain M. E. et al. Signal-Averaged Electrocardiography JACC 27 238-249,(1996).

[3] Albert, C.-C. Yang, Shu-Shya Hseu, Huey-Wen, Yien, Ary L. Goldberger,C.-K. Peng Linguistic Analysis of the Human Heartbeat Using Frequencyand Rank Order Statistics, Phys. Rev. Lett., 90 (2003) .

[4] Balocchi R., Menicucci D., Landini L., Santarcangelo E., SebastianiL., Gemignani A., Ghelarducci B., Varanini M. Deriving the respirato-ry sinus arrhythmia from the heartbeat time series using empirical modedecomposition Chaos Solitons and Fractals 20, 171-177, (2004)

[5] Bloomfield P. Fourier analysis of time series. An introduction John Wileyand sons, New York, (2000)

[6] Cammarota C., Guarini G., Ambrosini M. “Analysis of stationary periods ofheart rate via symbolic dynamics”, Medical Data Analysis, Lecture Notes inComputer Science vol. 2526, Colosimo, Giuliani and Sirabella eds. Springer2002

[7] Cammarota C., Rogora E. Testing indipendence in time series via universaldistributions of permutations and words Int. J. Bif Chaos, 15, 1757-1765,(2005)

[8] Cammarota C., Rogora E. Independence and symbolic independence ofnonstationary heartbeat series during atrial fibrillation Physica A, 353,323-335, (2005)

[9] Cammarota C., Rogora E. Time reversal, symbolic series and irreversibilityTo be published on Chaos, Solitons & Fractals.

21

[10] Censi F. etr al. Recurrent patterns of atrial depolarization during atrial fib-rillation assessed by recurrence plot quantification, Annals of BiomedicalEngineering, 28, 61-70, (2000)

[11] P. Colli Franzone, L. Guerri, M. Pennacchio Mathematical models andproblems in electrocardiology, Riv. Mat. Univ. Parma, (6) 2∗, 123-142(1999).

[12] Colli Franzone P., Pavarino L. F. Parallel Solver for reaction-diffusionsystems in Computational Electrocardiology Mathematical Models andMethods in Applied Sciences, 14, 883-911 (2004)

[13] Costa M., Goldberger A.L., Peng C.-K. Multiscale entropy analysis ofbiological signals. Phys Rev E, 71 (2005).

[14] Di Bernardo D., Signorini M.G., Cerutti S. A model of two non linear cou-pled oscillators for the study of heart beat dynamics Int. J. Bif Chaos, 8,1975-1985, (1998)

[15] Domenichini F., Pedrizzetti G., Baccani B. Three-dimensional filling flowinto a model left ventricle; J Fluid Mech 539, 179-198, (2005)

[16] Einthoven W. Die galvanometrische Registrirung des menschlichen Elek-trokardiogramms, zugleich eine Beurtheilung der Anwendung des Capillar-Elektrometers in der Physiologie. Pfulgers Arch. Ges. Physiol. 99(1903)

[17] Glass L, Mackey M. C. From clocks to chaos P.U.P., Princeton (1988).

[18] Guarini G., Fiorelli G., Malliani A., Violi F., Volpe M. Trattato Italiano diMedicina interna “Teodori”, Soc Ed. Universo, (2001).

[19] Ishikava Y., Mochimaru F. Wavelet Theory-Based Analysis of High-Frequency, High-Resolution Electrocardiograms: A New Concept forClinical Uses Progress in biomedical research 7, 179-184 (2002)

[20] Keener J., Sneyd J. Mathematical physiology Springer, New York (1998).

[21] Malliani A., Principles of cardiovascular neural regulation in health anddisease, Kluwer (2000).

[22] Percival, D. B. and A. T. Walden. Wavelet Methods for Time Series Analysis,Cambridge University Press (2000).

22

[23] Pogorelov, T. File Mathematica disponibile all’indirizzo webhttp://library.wolfram.com/infocent er/Ma thSour ce/44 76/

[24] Quarteroni A., Modeling the cardiovascular system - A Mathematical Ad-venture, SIAM News, 34 (5), (2001), Part I and 34 (6), (2001), PartII.

[25] Rohatgi V. K., An introduction to Probability Theory and MathematicalStatistics, New York, Wiley ed., (1976).

[26] Russo, L La rivoluzione dimenticata Feltrinelli (1996).

[27] Shiryayev A. N. Probability, Springer-Verlag, (1984).

[28] Task force of the european society of chardiology and the north americansociety of pacing and electrophysiology. Heart rate variability. Standards ofmeasuremant, physiological interpretation and clinical use. Circulation, 93pp. 1043-1065, (1996).

[29] Tompkins W. J. ed. Biomedical Digital Signal Processing. Englewood Cliffs,N. J. Prentice Hall, (1993).

[30] Waller, D. A demonstration on man of electromotive changes accompanyingthe heart’s beat. J Physiol 8 229-234, (1887).

[31] Wessel W. et al. Short-term forecasting of life-threatening cardiac arrhyth-mias based on symbolic dynamics and finite-time growth rates, PhysicalReview E, 61 733-739, (2000).

[32] http://www.physionet.org

[33] http://www.R-project.org

23