13
테테테테 테테테 2020 테 2 테 테테테테 테테테 테테테 테테 테테테테 테테 테테테 테테 테테 테테테 테테 테테 테테 테테테

aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

테크니컬

리포트

2020 년 2 차

인공지능

학습용

데이터 구축

헬스케어 영역 체부암 과제

치매 진단을 위한 의료 영상 데이터

Page 2: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

개요: 치매 진단을 위한 뇌영상 데이터 셋이란?치매는 후천적으로 기억력을 비롯한 여러 가지 인지기능의 장애가 나타나 일상생활을 혼자 하기 어려울 정도로 심한 상태를 말한다. 대표적으로 알츠하이머병과 혈관성 치매가 있으며, 그 외에도 루이체 치매, 알코올성 치매, 뇌손상으로 인한 치매 등 다양한 원인으로 인해 치매가 발생한다. 따라서 치매를 진단할 때에도 여러 가지 검사를 통해 종합적으로 판단한다. 치매를 진단하는 방법에는 신경인지기능 검사(신경심리검사), 뇌 촬영 검사, 진단의학 검사 등이 있으며, 세부적으로도 MMSE, SNSB, CERAD-K, MRI, PET, CT, GDS-K 등 많은 검사 방법이 있다.한편 국내외로 치매 환자가 증가하고, 치매의 진행 과정 추적 및 연구에 대한 중요성이 부각되면서 치매 환자의 데이터를 축적하고 공개하는 프로젝트가 시작되었다. 대표적으로 미국의 ADNI (http://adni.loni.usc.edu), 호주의 AIBL (https://aibl.csiro.au/), 영국의 UK Biobank (https://www.ukbiobank.ac.uk/)가 치매 환자 데이터셋을 공개하는데 반해, 국내에서는 아직 공개 데이터셋이 축적된 적이 없다. 특히 최근 인공지능을 기반으로 한 각종 진단 모델에 대한 관심이 높아지는 현 상황에서 적절한 데이터 셋의 구축은 타 국가의 진행 상황과 비교하면 더욱 시급한 문제이다.따라서 본 사업의 주요 목적은 국내외에서 진행되는 치매 진단 및 치료 연구에 도움이 될 수 있는 치매 환자 데이터셋을 구축하는 것이다. 이로써 치매 진단과 치료에 관한 연구를 시작하려 했으나 데이터의 부족으로 인해 진행이 침체되어 있던 기관 및 기업의 개발을 다시 촉진시킬 수 있을 것이다. 또한 어쩔 수 없이 해외의 데이터 셋을 사용하거나 많은 비용과 시간을 들여 데이터 셋을 직접 구축해 사용하던 회사, 병원의 연구 부담을 줄여 각 기관의 진단 및 치료 기술의 질도 개선될 수 있다.그리고 더 나아가 병원 및 의료인의 전문성에 따른 치매 진단의 편차를 예방하기 위한 ‘AI 치매 자동 진단 시스템 개발’에 활용하고자 한다. 전처리 과정을 거친 치매 환자 데이터를 통한 알고리즘 학습을 통해 누구에게나 접근성이 높은 시스템을 개발하여 환자가 전문 의료인을 만날 여건이 되지 않더라도, 그리고 정기적으로 받는 건강검진에서도 치매 여부 및 진행 과정을 알 수 있는 환경을 조성한다.여기서 가장 기대되는 부분은 치매의 조기 진단이다. 치매의 발병 원인들 중 치료가 가능한 것은 우울증, 갑상선 질환, 약물 부작용, 뇌종양 등의 이유로 약 15%에 못 미치지만, 이마저도 치료 시기를 놓치면 완치가 어렵다. 하지만 발병 초기에 치매 진단을 받으면 치료가 어려운 알츠하이머 치매의 경우에도 약물 치료로 진행을 더디게 만들어 치료제가 개발될 때까지 병의 진행을 막거나 증상을 완화시킬 수 있다. 국내에서 이런 대규모의 데이터를 축적하고 공유하는 것은 이번이 처음이다. 그만큼 데이터와 그 활용 방법에 대한 이해가 부족하다면 데이터셋의 사용이 어려울 수 있다. 따라서 그런 문제를 방지하고자 이와 같은 문서 가이드라인이 작성 되었다. 이하 항목에서 기술되어 있는 데이터셋 설계 및 구조를 잘 숙지한다면, 치매 연구 및 치료 기술의 원활한 수행과 개발이 가능함은 물론 추후 직접 데이터를 구축하고자 할 때에도 아래의 양식을 참조하여 양질의 데이터셋을 생산할 수 있을 것으로 기대된다.

데이터셋의 구성

본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200 건과 T1 MRI, 인지기능검사를 시행한 ‘MRI Full-set’ 데이터 3,000 건, 그리고 인지기능검사 중 하나와 MMSE/CDR 을 시행한 ‘인지기능검사 set’ 8,300 건으로 구성되어 있다. 각 데이터셋 안에는 amyloid PET-CT 단독 데이터 1,200 건, MRI 단독 데이터 6,050 건, 임상정보 단독 데이터 8,300 건, MRI 와 임상정보가 포함된 추적관찰 데이터 1,050 건이 포함되어 있다.PET-CT 검사를 실시한 환자는 T1 MRI 검사와 인지기능검사를 모두 시행하였기 때문에 PET Full-set 데이터는 MRI Full-set 데이터 내에 구성된다.PET 데이터셋과 MRI 데이터셋은 영상 파일과 어노테이션 (annotation), 라벨링 (labeling) 데이터 파일이

Page 3: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

폴더별로 들어 있는 트리 구조로 구성되어 있다. MRI 데이터의 어노테이션은 각 뇌의 부위를 분할 (segmentation)한 정보를 표시하고, PET 의 어노테이션은 아밀로이드 검출 부위를 표시한다. 임상정보 데이터셋은 인지기능검사와 임상진단 정보를 포함하며, SNSB 와 CERAD-K, MMSE, CDR 의 항목별 점수와 총 점수, 환자의 인적사항과 치매 진단 여부, 치매 원인 질환 진단 여부도 포함된다. 임상진단 정보 중 치매 진단 여부가 MRI Full-set 데이터와 PET Full-set 의 최종 레이블이 된다.

표 1 데이터셋 구분

데이터셋구분

검사 항목데이터개수

인지기능검사(SNSB/CERAD-

K)MMSE/CDR

T1 MRI

AmyloidPET-CT

PET Full-set Y Y Y Y 1200MRI Full-set Y Y Y N 3000

임상정보 데이터 set Y Y N N 8300

추적관찰 데이터 set Y Y Y N 1050

표 2 세부 데이터 개수

데이터 항목세부 데이터

항목데이터 개수

비고

인지기능검사데이터

SNSB 2900 인지기능 검사 중 SNSB 검사 시행 MMSE/CDR 을 반드시 포함

CERAD-K 5400 인지기능 검사 중 CERAD-K 검사 시행 MMSE/CDR 을 반드시 포함

MMSE/CDR 8300 의사의 진단이 포함된 임상정보 임상정보에는 환자정보(성별, 나이,

교육연수) 포함

임상정보 only 4250 MMSE/CDR 시행 데이터 중 인지기능검사 (SNSB/CERAD-K)를 시행하지 않은 데이터

영상데이터

T1 MRI 6050 T1 MRI 검사 시행

Amyloid PET-CT 1200 Amyloid PET-CT 검사 시행 T1 MRI 데이터를 반드시 포함

T1 MRI Only 2000 T1 MRI 데이터 중 Amyloid PET-CT 데이터,

인지기능 검사, 임상정보를 포함하지 않는 데이터

데이터셋의 설계 기준과 분포

데이터셋은 기관 내 협력 병원에서 가지고 있는 데이터와 향후 과제 수행 기간동안 수집 할 수 있는 데이터 양을 고려하여 설계하였다. MRI Full-set 과 PET Full-set, 임상정보 데이터셋 각각에서 성별, 나이, 교육연수, 인지기능 수준, 데이터 수집 장비, 치매/정상 진단, 인지장애 원인 질환이 일정한 분포를 갖도록 수집, 검수하였다.

표 3 데이터셋 분포

성별 연령대

남자 여자 50 대 60 대 70 대 80 대

Page 4: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

30% 이상 40% 이상 5% 이상 20% 이상 30% 이상 20% 이상

인지기능 APOE 유전자

정상 경도인지장애 치매 E2 포함 E3 포함 E4 포함

30% 이상 30% 이상 20% 이상 10% 이상 50% 이상 15% 이상

인지장애 원인 질환 PET-CT

알츠하이머 혈관성 파킨슨 /루이소체 기타 이상 정상

30% 이상 30% 이상 30% 이상 30% 이상 20% 이상 60% 이상

데이터 구조

전체 데이터 구조

전체 데이터는 모든 환자의 T1 MRI 분석 결과, PET-CT 분석 결과, 인지기능검사 결과, 임상 정보, 치매 진단 레이블 정보가 포함된 Information.csv 파일과 각 환자 별 검사 정보 폴더 약 6050 개로 이루어져 있다. 각 폴더 이름은 원천데이터를 수집한 병원과 환자 번호를 코드로 익명화하여 조합하였고, 환자의 폴더 안에 다시 T1 MRI 폴더 (T1) 와 PET-CT 폴더(PET), 그리고 환자 정보 레이블 파일 (subInfo.json) 이 들어있다. 환자의 폴더 안에 폴더 두 개가 들어있는 경우는 해당 환자가 PET full-set 에 포함되는 환자이고, 폴더가 한 개만 들어있는 경우는 해당 환자는 MRI full-set 또는 MRI only 데이터셋에만

그림 1 전체 데이터 구조

Page 5: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

포함되는 환자임을 의미한다.

Information.csvcsv 파일 안에는 모든 환자의 환자 정보 레이블 (환자 정보, 나이, 성별, 교육연수), 임상정보 (치매 진단, 치매 세부 진단, MCI Type, 추가 진단, APOE 검사 결과), PET 검사 결과 (Amyloidosis, PET 검출여부, 부위별 SUVr 점수), MRI 검사 결과 (대뇌 부위별 피질 두께, 피질 면적, 백질 부피, 피질하 영역 부피) 데이터가 포함되어 있다. 환자의 검사 항목에 따라서 데이터별로 null 값이 있을 수 있으며, 필요에 따라 각 데이터셋 별로 추출하여 사용해야 한다. (MRI Full-set 추출, PET Full-set 추출 등, 해당 데이터셋 추출 방법은 후술)

표 4 csv 파일 데이터 구조

구분 항목명 세부항목 세부 설명

환자정보

Subject No. 환자(대상자) 익명화 번호

생년월일

만 나이

성별Male 남자

Female 여자

교육연수 총 교육 연수 (숫자)

임상정보

치매 진단

CN Cognitive Normal (정상)CIND Cognitive impairment no dementia

Dementia 치매

치매 세부 진단

CN Cognitive Normal (정상)Preclinical AD Alzheimer 치매로 진행가능성 높음

Early MCI 경도인지장애 초기

Late MCI 경도인지장애 후기

AD Dementia Alzheimer 치매

nonAD Dementia Alzheimer 가 아닌 다른 병리의 치매

unknown Dementia 병리가 확인되지 않은 치매

Other cause 조헌병, 우울증등 정신과적 병리

MCI TypeaMCI 기억력을 위주로 인지기능검사 이상소견

naMCI 기억력이외의 인지기능검사 이상소견

추가 질병

multi-aMCI

추가 질병 추정

ADSDHMDDSNAPSAH

suspected ADmixed pathology

semantic variant FTLD

Page 6: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

구분 항목명 세부항목 세부 설명

FTLDVaD

DLBDBipolar

Delirium

APOE

E2/E2:0E2/E3:1E2/E4:2E3/E3:3E3/E4:4 치매와 관련된 ApolipoproteinE4/E4:5

PET결과

AmyloidosisExist 대뇌 피질 amyloid 침착

nonExist 대뇌 피질 amyloid 침착안됨

PET, MRI, NP 유무 O , X

PET

ACC Anterior Cingulate Cortex

CS Striatum

Pons Pons, SUVR 의 reference value

FL Frontal Lobe

PL Parietal Lobe

PCC Posterior Cingulate Cortex

Precuneus Precuneus

TL Temporal Lobe

인지기능검사

CERAD_K

CERAD_J1 verbal fluency

CERAD_J2 Boston Naming Test

CERAD_J3 MMSE-SE

CERAD_J4 Word list memory

CERAD_J5 constructional

CERAD_J6 Word list recall

CERAD_J7 Word list recognition

CERAD_J8 Constructional recall

CERAD_J9A Trail Making Test A

CERAD_J9B Trail Making Test B

CERAD_J 가 1,2 Stroop Test

임상정보

CDR(Clinical

Dementia Rating Scale)

CDR : 0 정상

CDR : 0.5 경도인지장애

CDR : 1~ 치매

CDR_SBCDR_SB : 0 Normal (정상)

CDR_SB : 0.5~4.0 Questionable Cognitive Impairment

Page 7: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

구분 항목명 세부항목 세부 설명

CDR_SB : 0.5~2.0 Questionable Impairment

CDR_SB : 2.5~4.0 Very Mild dementia (약한 경도 치매)

CDR_SB : 4.5~9 Mild dementia (경도 치매)

CDR_SB : 9.5~15.5 Moderate dementia (중도 치매)

CDR_SB : 16~18 Severe dementia (심도 치매)

GDS

1

Pre_Dementia

No Cognitive Decline (정상)

2 Very Mild Cognitive decline(아주 약한 경도 인지 장애)

3 Mild Cognitive Decline(경도 인지 장애)

4

Dementia

Moderate Cognitive decline(중도 인지 장애)

5 Moderately severe cognitive decline(심한 중도 인지장애)

6 Severe cognitive decline(고도 인지 장애)

7 Very severe cognitive decline(심한 심도 인지 장애)

MRI결과

aseg.vol volume-based subcortical segmentation(부피 중심 피질하 세분화)

lh.aparc.area left-surface-based cortical parcellation(왼쪽 표면적 중심 피질 분할)

lh.aparc.meancurv.table left-meancurve-based cortical parcellation(왼쪽 meancurve 중심 피질 분할)

lh.aparc.thickness left-thickness-based cortical parcellation(왼쪽 두께 중심 피질 분할)

lh.aparc.volume left-volume-based cortical parcellation(왼쪽 부피 중심 피질 분할)

rh.aparc.area right-surface-based cortical parcellation(오른쪽 표면적 중심 피질 분할)

rh.aparc.meancurv right-meancurv-based cortical parcellation(오른쪽 meancurv 중심 피질 분할)

rh.aparc.thickness right-thickness-based cortical parcellation(오른쪽 두께 중심 피질 분할)

rh.aparc.volume right-volume-based cortical parcellation(오른쪽 부피 중심 피질 분할)

T1 폴더 (T1 MRI 데이터)

T1 폴더는 T1 MRI 데이터 (.dcm)를 비식별화하고 전처리 (freesurfer) 분석이 완료된 결과 생성된 폴더에서 log 파일들과 원본 MRI 데이터 (.mgz)를 삭제하고 비식별화된 MRI 영상 (MRI 영상 이미지 폴더), 분석에 필요 없는 부위를 제거하고 k-평면에 정렬시킨 MRI 영상 (분석/보정된 MRI 영상 폴더), 영상 속 뇌 부위를 segmentation 한 정보를 담은 폴더 (segmentation 폴더), 그리고 각 segmentation 과 이미지에 대한 레이블 정보 (Label 정보 폴더), 각 부위별 통계 데이터 (stats 폴더)로 이루어져 있다.실제 모델링과 분석에 쓰이는 데이터는 stats 폴더에 있는 *.stats 파일들이며, MRI 영상과 segmentation 정보, label 정보는 MRI 영상을 시각화하고 stats 파일의 부위를 정의하는 데 쓰인다. Stats 파일은 각 뇌의 부위의 두께, 부피, 면적, 주름 등의 평균, 분산, 최소/최대값 등의 통계 데이터를 markdown 형식과 tab 으로 분리된 텍스트 형식으로 담고 있다. Information.csv 에 포함되지 않은 데이터를 사용하고 싶다면 stats 파일에서 필요한 데이터를 추출하여 사용해야 한다. (데이터 추출 방법 역시 후술)

Page 8: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

PET 폴더 (PET-CT 데이터)

PET 폴더는 비식별화된 PET-CT 이미지가 들어있는 폴더와 영상 분석 결과 Amyloid 검출 의심 부위를 어노테이션 하는데 쓰일 label 정보가 함께 들어있다. Label 정보는 json 파일로 저장될 예정이며, 필요시 Amyloid 검출 결과를 MRI 분석 결과처럼 stats 파일로 제공할 수 있다 (추후 PET 폴더 업데이트시 내용 업데이트)

데이터 예시

Information.csv (정렬)

구분 Column Value

환자정보

Subject No. sub_0001_3 sub_0002_1

생년월일 320905 (이하생략)만 나이 86 .

성별 0 .

교육연수 16

임상정보 1

치매 진단 Dementia치매 세부 진단 4

MCI Type 치매

추가 질병 NullAPOE 4

Amyloidosis 1PET 0MRI 1NP 1

PET결과

CS NullPons NullFL NullPL Null

PCC NullPrecuneus Null

TL NullAverage Null

추후 업데이트시 PET 폴더 이미지로 수정

예정

그림 2 MRI 와 PET 폴더의 구조

Page 9: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

구분 Column ValueAmyloid pos/neg Null

인지기능검사

CERAD_J1 4CERAD_J2 3CERAD_J3 16CERAD_J4 5CERAD_J5 7CERAD_J6 1CERAD_J7 0CERAD_J8 3

CERAD_J9A NullCERAD_J9B Null

CERAD_J1 가 1 NullCERAD_J1 가 2 Null

임상정보 2

CDR 1CDR Sum of Box 4.5

GDS 4

MRI결과

Left-Lateral-Ventricle 19787.6Left-Inf-Lat-Vent 1266.1

Left-Cerebellum-White-Matter 13453.9Left-Cerebellum-Cortex 52660.2

Left-Pallidum 1335.33rd-Ventricle 3065.74th-Ventricle 2132.7Brain-Stem 18127.7

(이하 200 여개 컬럼 생략)

csv 파일에는 MRI, PET-CT, 신경심리 검사를 하지 않더라도 정보가 저장되어 있기 때문에 null 값이 포함되어 있다. 따라서 검사 결과를 얻고 싶다면 임상 정보 부분에서 PET, MRI, NP 에서 각각 1 (검사 시행했음) 값을 찾아 필터링해야 한다.

Page 10: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

T1 MRI 데이터

그림 3 MRI 데이터 예시

Page 11: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

PET-CT 데이터 예시

(추후 PET 폴더 업데이트시 내용 업데이트)

데이터 구축 과정

데이터의 유형은 크게 ‘환자의 기본정보 및 인지기능검사 결과’, ‘PET’, ‘MRI’의 세가지로, 구축 과정 다이어그램은 다음과 같다.

인지기능검사

인지장애 진단 및 인지기능 검사를 통한 각 대상자의 임상 정보를 EMR 차트 리뷰로 액셀에 입력한다.

T1 MRIMRI 영상 데이터는 PACS 를 통해 DICOM 파일 형태로 다운로드 받은 후 각 대상자 번호로 정리된다. 그리고 NIfTI 파일로 변환하는 익명화 작업을 하고 검수를 거친다. Freesurfer 를 이용하여 전처리 과정을 거쳐 정량화된 수치로 생성 및 저장된 stats 파일은 104 개의 뇌 영역 ROI 의 피질 두께, 부피 정보를 포함하고 있으며, 이를 text 파일로 추출하여 엑셀로 정리한다.

PET-CT

Page 12: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

MRI 영상과 마찬가지로 DICOM 형태의 Amyloid PET 영상 데이터를 NIfTI 파일로 변환하는 익명화 작업을 거친 결과물 nii 파일을 의학과 전문의들이 리뷰하며 amyloid 양성으로 판단한 근거 영역을 bounding box 로 annotation 한다. 또한 freesurfer 세부 기능 중 PETsurfer 를 이용해 뇌 영역별 SUVR (standardized uptake value ratios) 값을 계산하고 stats 파일에 정량화된. 수치로 저장된 데이터를 text 파일로 추출해 액셀로 정리한다.

검수와 품질 확보

대량의 데이터를 빠른 시간 내에 축적해야 하는 만큼, 크라우드 소싱 인력이 도입되었다. 크라우드 소싱 방식의 데이터 가공 작업을 보완하기 위해 검수 프로세스를 정립하고, 참여기관에서 준전문가 인력이 직접 크라우드 소싱 인력에 대해 교육과 훈련을 실시하였다. 또한 참여기간과 용역기관의 인력들이 데이터를 교차 검증하는 과정을 거치고, 일정량의 데이터가 전처리 완료될 때마다 1 차 검증을, 데이터셋이 일정량 모여서 모델 개발이 진행될 때마다 2 차 검증을 실시하여 데이터의 품질을 확보하였다.

일차검증: 전문가 인력과 용역기관 사이의 교차검증

MRI 영상과 PET-CT 영상은 일정 양만큼 전처리가 완료 될 때마다 영상 데이터를 가공 작업한 크라우드 소싱 인력 (용역기관)과 훈련된 준전문가 인력 (참여기관) 사이에서 교차검증을 거쳤다. 원천 데이터의 문제, 데이터 가공의 문제, 어노테이션의 문제로 분석을 더 이상 진행할 수 없다고 판단되면 해당 데이터는 제외하였다.

그림 4 데이터 검수 프로세스 개요

Page 13: aihub.or.kr  · Web view2020. 12. 29. · 본 데이터셋은 T1 MRI, Amyloid PET-CT, 인지기능 검사를 모두 시행한 ‘PET Full-set’ 데이터 1,200건과 T1 MRI, 인지기능검사를

이차검증: 데이터의 유효성과 관련된 품질 검증

전처리가 모두 완료된 데이터셋을 대상으로, 일정량의 데이터셋이 쌓일 때마다 MRI 분석 알고리즘을 업데이트하여 모델 내에서 데이터의 유효성을 검증하였다.

(추후 데이터 품질 검사 업데이트시 내용 추가)

데이터 구축 담당자

수행기관: 여의도성모병원

참여기관(데이터 품질 검증) : ㈜유노믹, 이메일: [email protected]