25
권영모 , 조용현 , 성민경 , 정연돈 데이터베이스 및 정보시스템 그룹 , 정연돈 교수 연구실 고려대학교 Database Lab. Database Lab.

차세대컴퓨팅학회발표 최종자료(권영모)

  • Upload
    youngmo

  • View
    740

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 차세대컴퓨팅학회발표 최종자료(권영모)

권영모 , 조용현 , 성민경 , 정연돈

데이터베이스 및 정보시스템 그룹 , 정연돈 교수 연구실

고려대학교

Database Lab.Database Lab.

Page 2: 차세대컴퓨팅학회발표 최종자료(권영모)

22

목 차

I 개 요 ( 무선 센서 네트워크란 ?)

부분 순서 트리 ( POT : Partial Ordered Tree)III

POT 의 구성 및 질의 처리IV

실 험 & 성 능 평 가V

결 론VI

센서 데이터 저장 기법 & 질의 처리II

Page 3: 차세대컴퓨팅학회발표 최종자료(권영모)

개 요 ( 센서 네트워크란 ? )

무선 센서 네트워크란 ?무선 네트워크에 연결된 수많은 센서 노드들의 그룹

노드의 구성

• Sensing devices (e.g. temperature, humidity)

• Radio (wireless) communication

• Battery power

Volcanic Area(Sensing Fields)

Sensor Node

Radio range

The base stationData collectionAnd monitoring the fields Area Monitoring Sensor Network

3

Page 4: 차세대컴퓨팅학회발표 최종자료(권영모)

개요 ( 센서 네트워크란 ? )

4

Page 5: 차세대컴퓨팅학회발표 최종자료(권영모)

센서 네트워크의 응용 분야 (1 / 2)

5

건강 변기

배드 / 베게

신발

거실환경수면환경

욕실환경

헬스자전거

이동환경

의류시계

접적 지역 적 침투 및 이동 탐지

군 시설물 및 물류 관리 / 무인 감시

작전활동 및 각종 훈련 시 위치 추적

체온 , 혈당 , 체성분 , 혈압 , 심전도 , 호흡 ,

펄스 등

생체정보 모니터링 시스템 구축

모바일 헬스 케어 연동하 국민건강 증진 기여

군사 시설 홈 헬스 케어

Page 6: 차세대컴퓨팅학회발표 최종자료(권영모)

센서 네트워크의 응용 분야 (2 / 2)

6

의료 보건

생태계

도로교통

농업

공공시설

보안관리공공시설물 및

자산 물류 관리

보건의료 서비스

진료서비스 환경 시스템

동식물 분포 및 서식 조사

교통정보제공

사고정보 및 교통정보제

주차장관리

공영주차장관리

불법주차관리차량 불법주차 및 방치차량관리

재난관리

재난관리 및 재난 점검 이력 관리

보안 시스템 공공기관 및

자산관리

물류 관리

농 업

생태계 분석

문화재 보호 및 관리

문화재 관리 및

관광문화 정보제공

화산 지역 및 자연

생태계 분석

센서 네트워크는 “ IT 코리아 5 대 미래전략”의 핵심

Page 7: 차세대컴퓨팅학회발표 최종자료(권영모)

한정된 배터리 용량을 이용하여 최대의 네트워크망 동작 시간과 신뢰성이 보장된 무선 센

서 노드 구성 뿐만 아니라 에너지 소모량과 네트워크의 성능 문제를 함께 고려해야 함

특정 노드만 제어

네트워크 크기가 큰 환경 적합

특정 노드에 데이터 영역 할당

네트워크 내에 데이터 저장

사용자가 원하는 데이터만 전송

데이터 저장을 위한 전송 불필요

많은 데이터가 발생하는 환경

센서 자체 내에 직접 저장

질의 배포 , 저장 위치 색인 불필요

센서 자체 데이터 저장 불가능

지정된 기지국에 저장

가장 기본적인 저장 기법

외부 저장 기법 (ES) 직접 저장 기법 (LS) 데이터 중심 저장 기법 (DCS)

응용 환경에 적합한 에너지 효율적인 센서 네트워크의 구축 필요

센서 네트워크의 설계 및 개발 시 고려사항

• 센서의 계산 능력 , 저장 공간

• 설치 용도 및 설치 지역

• 데이터의 신뢰성과 보안성

• 데이터 저장 기법과 질의 처리

• 데이터 값의 변화 분포 및 특성

• 사용자의 질의 종류

( 정합 질의 , 영역 질의 , k- 최상의 질의 )

• 에너지 소모와 처리 시간 및 비용

• 지속성 , 일관성 , 확장성 , 부하 분산

질의 처리시 고려사항

에너지 효율적인

데이터 저장

기법 요망

질의 종류에 따른 효

과적인

질의 처리 기법 요망

센서 데이터의 저장 기법

7

Page 8: 차세대컴퓨팅학회발표 최종자료(권영모)

외부 저장 기법 (1 / 2)

외부 저장 기법 (External Storage : ES)감지한 데이터를 지정된 기지국의 로컬 데이터베이스에 저장하는 방식

• 모든 센싱 데이터가 발생 즉시 상위 노드로 멀티 홉 방식으로 전송

장점

• 센서에 데이터가 저장되지 않기 때문에 센서 자체의 저장 공간 불필요

• 모든 데이터가 동일한 데이터베이스에 존재하고 직접 이루어짐

• 질의를 배포하거나 데이터 저장 위치를 색인하는 과정 불필요

• 질의 처리가 간단하고 네트워크 비용이 소요되지 않음

단점

• 기지국과 근접한 상위 노드일수록 멀티 홉 라우팅 특성 때문에 많은 데이터를 전송하는 문제 발생 및 데이터 전송 비용이 큼 ( 센서 수명 단축초래 )

• 동시다발적인 데이터 발생으로 인한 중앙 시스템 네트워크의 병목현상 발생

• 불필요한 데이터가 기지국으로 전송됨에 따른 과부하 발생 / 데이터 상실

• 기지국은 높은 데이터 저장 비용이 발생

8

Page 9: 차세대컴퓨팅학회발표 최종자료(권영모)

직접 저장 기법 (1 / 2)

직접 저장 기법 (Local Storage : LS)감지한 데이터를 각 센서 노드 내에 직접 저장하는 방식

• 사용자가 원하는 데이터만 멀티 홉 방식으로 기지국으로 전송

• 각 센서는 질의 처리기 (Query handler) 을 가짐

장점

• 외부 저장 기법에 비해 에너지 소모 면에서 효율적

• 데이터 저장의 위한 전송 비용이 없음

• 많은 데이터가 발생하는 환경에 적합

단점

• 질의 처리에 필요한 데이터 저장 위치를 특정화 할 수 없으므로 질의 처리를 위해서 모든 센서에 질의를 전송해야 함 ( 질의 비용 과다발생 )

• 질의 처리 비용이 네트워크 크기에 비례하여 증가

• 질의 처리 시간이 많이 소요

9

Page 10: 차세대컴퓨팅학회발표 최종자료(권영모)

데이터 중심 저장 기법 (1 / 2)

데이터 중심 저장 기법 (Data Centric Storage : DCS) 외부저장 기법과 직접 저장 기법의 혼합형

• 데이터 영역을 분할 하여 각 센서 노드들에게 할당

• 특정 센서 노드 (Home node) 에 전송 및 저장하여 전체 데이터를 색인

장점

• 사용자는 Home node 만 접근하여 원하는 정보를 쉽게 획득 가능

• 원하는 데이터가 저장된 위치를 알 수 있음 (Low cost query handling)

• 특정 센서 느드만 제어 하여 효율적이고 정확한 위치로 라우팅 가능

• 상위 노드의 부하 집중 방지 / 다른 센서의 질의 처리 관여 방지

• 네트워크의 크기가 크고 특정 데이터의 저장이 많이 발생하는 환경에 적합

단점

• 사용자 질의와는 상관없이 , 특정 데이터로 전송하기 때문에 직접 저장 기법에 비해 데이터 저장 비용이 큼

• 특정 데이터 영역의 데이터 집중현상인 저장소 핫스팟 (Hot Spot) 문제 발생

• 특정 센서의 저장 공간 부하 문제로 인한 빠른 에너지 소모 ( 센서 수명 단축)

10

Page 11: 차세대컴퓨팅학회발표 최종자료(권영모)

부분 순서 트리 ( POT )

부분 순서 트리 ( partial ordered tree : POT)

정의

• 부모 노드는 자식 노드보다 큰 데이터 값을 갖는 트리로

• 부분 순서 트리의 루트 (root) 는 자신의 트리 내에서 지역적으로 가장 큰 데 이터 값을 가진 센서 노느를 루트로 가지며 ,

• 데이터의 크기가 연속되는 센서 노드들로 이루어진 트리 구조의 클러스터

11

Page 12: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 의 구성 ( 1 / 3)

각 센서 노드는 자신의 통신 범위 안에 있는 이웃 노드 중에서 가장 높은 센서 데이터 값을 가진 노드를 자신의 부모 노드 (parents node) 로 선택함으로써 트리를 구성함

Np Ns

Nq Nr Nt

19 21 24

23 26

12

센서의 초기 배치

Page 13: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 의 구성 ( 2 / 3)

이웃 노드들에게 자신의 데이터 값과 식별자를 넣은 광고 메시지를 내보냄

Np Ns

Nq Nr Nt

23

26

2626

23

23 24

24

21

2121

21

19

19

13

광고 메시지의 송 ·수신

Page 14: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 의 구성 ( 3 / 3)

임의의 센서 노드 N i 가 자신의 데이터 값보다 더 큰 데이터 값을 포함한 광고 메시지를 수신하지 못하면 스스로 트리의 루트 (root) 가 됨

수신한 광고 메시지 중에서 가장 큰 데이터 값을 보낸 센서 노드를 자신의 부모 노드로 선정

Np Ns

Nq Nr Nt

root of POT

14

부분 순서 트리의 생성

Page 15: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 를 이용한 정합질의

정합 질의 ( Exact Match Query )

: 정확한 조건을 주고 결과 값을 찾는 질의

예 ) “ 온도가 30 인 센서 노드를 찾아라” ( 온도 , 습도 , 조도 , 빛 , 소리 등 )

기지국은 트리 리스트에서 30 도가 넘는 부분 순서 트리의 루트만 선택하여 질의를 전송

질의를 수신한 트리의 루트는 30 도보다 낮은 데이터를 가진 센서 노드를 만날 때까지 해당 질의를 자식 노드에게 전달

질의가 전송되는 중에 질의 결과가 될 수 있는 데이터를 가진 센서 노드는 트리의 루트 노드에 해당 데이터를 전송

30 도보다 낮은 데이터를 가진 센서 노드를 만나면 질의를 종료하고 루트 노드에 알림

루트 노드는 질의 결과를 기지국으로 전송

기지국은 전송된 질의 결과를 취합하여 최종 질의를 사용자에서 전달 15

Page 16: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 를 이용한 영역 질의

영역 질의 ( Range Query )

: 특정한 범위의 조건을 주고 결과 값을 찾는 질의

예 ) “ 조도가 100lux~150lux 사이의 값을 센서 노드를 찾아라”

기지국은 트리 리스트에서 영역 질의의 작은 범위에 해당하는 조건 값보다 큰 데이터를 갖는 POT 의 루트만을 선택하여 질의를 전송

질의를 수신한 트리의 루트는 100lux 보다 작은 데이터를 가진 센서 노드를 만날 때까지 해당 질의를 자식 노드에게 전달

질의가 전송되는 중에 질의 결과가 될 수 있는 데이터를 가진 센서 노드는 트리의 루트 노드에 해당 데이터를 전송

100lux 보다 낮은 데이터를 가진 센서 노드를 만나면 질의를 종료하고 루트 노드에 알림

로트 노드는 질의 결과를 기지국으로 전송

기지국은 전송된 질의 결과를 취합하여 최종 질의를 사용자에서 전달 16

Page 17: 차세대컴퓨팅학회발표 최종자료(권영모)

POT 를 이용한 K - 최상위 질의

K - 최상위 질의 ( Top - K Query )

: 최상위의 K 개 데이터를 찾는 질의 , [ 순위 기반 질의 ( rank-aware query )]

전체 데이터 셋 (set) 에서 데이터 값의 순위 비교 필요

특정 임계값 ( threshold ) 에 기반한 데이터 제거 방식

예 ) “ 습도가 가장 높은 5 개의 센서 노드를 찾아라”

기지국은 트리 리스트에서 가장 높은 데이터 값을 가진 부분 순서 트리의 루트에게 질의를 전송하여 K 개 만큼 상위 데이터를 전송 받음

높은 데이터 값을 갖는 클러스터를 향해 K 개의 데이터를 수집할 때까지 순차적으로 질의를 전송함으로 원하는 결과 값을 얻음

결과 값에 만족하면 질의를 종료하고 루트 노드에 알림

루트 노드는 질의 결과를 기지국으로 전송

기지국은 전송된 질의 결과를 취합하여 최종 질의를 사용자에서 전달

17

Page 18: 차세대컴퓨팅학회발표 최종자료(권영모)

실 험

시뮬레이션 환경

18

Parameter Value

Traffic Type CBR traffic

Header Size 20 Byte

Data Size 8 Byte/(Sensing Data)

Mac Protocol IEEE 802.15.4

Data Rate < 0.20 Mb/s

Topology Random Deployed

Number of Nodes 100

Antenna Type Omni-Directional

Radio Range 10 m

Page 19: 차세대컴퓨팅학회발표 최종자료(권영모)

성능 평가 (1 / 2)

각 센서 데이터 저장 기법의 질의 처리 성능 비교 분석

19

평균 에너지 소모량

Page 20: 차세대컴퓨팅학회발표 최종자료(권영모)

성능 평가 (2 / 2)

외부 저장 기법

3 가지 모든 질의에서 동일한 값으로 가장 많은 에너지를 소모

모든 센서가 기지국으로 데이터를 전송하는 플러딩 (flooding) 같은 비용 소요

직접 저장 기법

질의를 전체 네트워크에 전송해야 함으로 많은 에너지 소모

질의는 데이터 크기에 비해 상대적으로 작으므로 ES 보다 효율적인 성능 보임 ( 약40% 개선 )

데이터 중심 저장 기법

효율적인 에너지 성능을 보임 , ES 보다 평균 60% 이상의 성능 개선

최종 질의 결과에 영향을 미칠 수 있는 센서 노드들만 데이터를 전송

부분 순서 트리 기반의 직접 저장 기법

가장 효율적인 에너지 성능을 보임 , ES 보다 평균 70% 이상의 성능 개선

단순 직접 저장 기법의 질의 처리보다 평균 30% 이상의 효율적인 에너지 성능 보임

단순 직접 저장 기법의 최상위 질의 수행 시 보다 약 3 배 이상의 성능 개선

20

부분 순서 트리를 이용한 직접 저장 기법은 최상위 질의에서 가장 좋은 성능을 보임(ES 보다 약 85%이상 개선됨 ) 이는 부분적으로 정렬된 색인 구조로 인해 효율적인 데인터 순위 비교가 이루어졌기 때문임

Page 21: 차세대컴퓨팅학회발표 최종자료(권영모)

결 론

센서 네트워크에서 데이터는 전체 네트워크에 분산되어 있음

이와 같은 환경에서 질의 처리는 데이터 저장 기법과 밀접한 연관

본 논문은 ,

ES, LS, DCS 의 세가지 저장 기법과 질의 처리에 대해 살펴보고 ,

POT 의 개념과 생성 구조를 소개하여 ,

정합질의 , 영역질의 , K- 최상의 질의를 POT 기법으로 성능 평가를 비교 수행

실험 및 성능 평가를 통해 직접 저장 기법에서 질의 처리를 효과적으로 지원하는 부분 순서 트리의 에너지 효율성의 우수성을 확인 할 수 있음

•부분 순서 트리는 추가적인 데이터 전송 통신 비용없이 부분적으로 정렬된 트리를 생성

•이를 기지국에서 이용하여 질의를 손쉽게 처리하여 탁월한 에너지 효율성를 보임

21

Page 22: 차세대컴퓨팅학회발표 최종자료(권영모)

22

E-mail : [email protected]

Page 23: 차세대컴퓨팅학회발표 최종자료(권영모)

외부 저장 기법 (2 / 2)

Page 24: 차세대컴퓨팅학회발표 최종자료(권영모)

직접 저장 기법 (2 / 2)

Event Data

Event Data

Page 25: 차세대컴퓨팅학회발표 최종자료(권영모)

데이터 중심 저장 기법 (2 / 2)

Home Node (Animal)

Home Node (Gas)