View
103
Download
1
Category
Preview:
Citation preview
1고려대학교 응용통계학과 DataMining Lab
학내 망 자원 효율화 방안 연구
2014. 11. 7. ( 금 )
고려대학교 응용통계학과 DataMining Lab
빅데이터 트래픽 분석을 통한
2고려대학교 응용통계학과 DataMining Lab 2고려대학교 응용통계학과 DataMining Lab
Contents 빅데이터 트래픽 분석을 통한학내 망 자원 효율화 방안 연구
I. 학내 망 트래픽의 시공간적 사용 행태
II. 유 / 무선 네트워크 트래픽 발생량 분석
III. 토렌트 트래픽 분석
IV. 클러스터링을 이용한 토렌트 사용자 분류
V. Network 트래픽 데이터를 활용한 수업 참여도 / 집중도
분석
3고려대학교 응용통계학과 DataMining Lab 3고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
1. 분석 목적▶ 교내에서 발생하는 토렌트 네트워크 데이터를 추출하여 요일별 , 시간별 사용량을 이용하
여 클러스터를 생성한다 . 클러스터간의 특징을 파악하여 특별한 주의가 필요한 클러스터와
sip 를 파악하여 학내망 네트워크 효율화 방안 제시 .
Use clustering to classify sip by Torrent usage
2. 분석 개요(1) 분석 기간 : 2013 년 1,2 학기 토렌트로 분류된 플로우 데이터
(2) 각 sip 별 토렌트 플로우 수 , 다운받는 양 (i_octet), 업로드 양 (o_octet) 추출
(3) 요일별 ( 주 7 일 ), 시간별 ( 일 24 시간 ) 으로 데이터를 분류하여 추출
(4) 각 sip 별 24 x 7 x 3, 504 개의 변수 생성
4고려대학교 응용통계학과 DataMining Lab 4고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
3. 분석 절차
HDFS 에서 토렌트 네트워크 사용 데이터 추출
클러스터링을 위하여 R 에서 데이터 변형
Log 변형을 통하여 데이터를
정규화
Total within sum of
squares (WSS) 와 Calinski-Harabasz
index (CH) 을 이용하여 클러스터 개수
추정
Principal Component
Analysis (PCA) 를 이용하여 시각적으로 클러스터 개수 확인
Bootstrap 을 이용하여 kmeans 클러스터를 10,000 번 생성하여
클러스터의 유효성 확인
Heatmap 을 이용하여
각클러스트의 특징을 시각적으로 표시
5고려대학교 응용통계학과 DataMining Lab 5고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
3. 분석 절차 (Total Within Sum of Squares, WSS)
▶ WSS 는 클러스터의 중심점 (centroid) 과 클러스터를 이루는 데이터포인트간의 거리를 합한
숫자로 , 클러스터의 개수를 정하는데 유용하다 . 클러스터의 개수가 늘어나면서 WSS 가 줄어
들기 때문에 WSS 가 급격히 줄어들 때를 찾아야 한다 .
6고려대학교 응용통계학과 DataMining Lab 6고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
3. 분석 절차 (Calinski-Harabasz Index, CH)
B 는 클러스터간의 거리를 나타내는 메트릭스 , W 는 클러스터안의 데이터포인트간의 거리를 나타내느 메트릭스 , n 은 총 데이터포인트 개수 , K 는 클러스터의 개수 , zk
는 클러스터의 중심점
Caliński, Tadeusz, and Jerzy Harabasz. "A dendrite method for cluster analysis." Communications in Statistics-theory and Methods 3.1 (1974): 1-27.
▶ CH 는 클러스터간의 분산과 전체데이터포인의 분산의 비율이다 . 분자에 해당하는 부분이 클러스터의 중심점과 전체데이터의 중심점과의 분산을 계산하고 분모에 해당하는 부분이 각 데이터포인트와 클러스터중심점과의 분산을 계산한다 .
7고려대학교 응용통계학과 DataMining Lab 7고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
3. 분석 절차 (Principal Component Analysis, PCA)
▶ 자료가 4 차원 이상일 경우 시각적으로 데이터가 어떻게 생겼는지 알아보기가 힘들다 .
PCA 는 고차원의 자료에서 전체자료를 나타낼 수 있는 주요인 벡터 (Principal Component)를
구하여 고차원의 자료를 2 차원 공간으로 끌어내리는 기능을 한다 .
Wold, Svante, Kim Esbensen, and Paul Geladi. "Principal component analysis." Chemometrics and intelligent laboratory systems 2.1 (1987): 37-52.
8고려대학교 응용통계학과 DataMining Lab 8고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 한 개의 sip)
9고려대학교 응용통계학과 DataMining Lab 9고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 한 개의 sip)
10고려대학교 응용통계학과 DataMining Lab 10고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 한 개의 sip)
11고려대학교 응용통계학과 DataMining Lab 11고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 사용자별 )교직원 , SIP FREQ = 679
12고려대학교 응용통계학과 DataMining Lab 12고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 사용자별 )연구원 , SIP FREQ = 1897
13고려대학교 응용통계학과 DataMining Lab 13고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )K건물 , SIP FREQ = 110
14고려대학교 응용통계학과 DataMining Lab 14고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )K 건물 , SIP FREQ = 110
15고려대학교 응용통계학과 DataMining Lab 15고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )B 건물 , SIP FREQ = 606
16고려대학교 응용통계학과 DataMining Lab 16고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )B 건물 , SIP FREQ = 606
17고려대학교 응용통계학과 DataMining Lab 17고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )C 건물 , SIP FREQ = 446
18고려대학교 응용통계학과 DataMining Lab 18고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 건물별 )C 건물 , SIP FREQ = 446
19고려대학교 응용통계학과 DataMining Lab 19고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 학과별 )A학과 , SIP FREQ = 243
20고려대학교 응용통계학과 DataMining Lab 20고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 학과별 )M 학과 , SIP FREQ = 252
21고려대학교 응용통계학과 DataMining Lab 21고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 학과별 )F 학과 , SIP FREQ = 416
22고려대학교 응용통계학과 DataMining Lab 22고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
4. 토렌트 트래픽 현황 ( 학과별 )G 학과 , SIP FREQ = 120
23고려대학교 응용통계학과 DataMining Lab 23고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 전체 SIP)
24고려대학교 응용통계학과 DataMining Lab 24고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 전체 SIP)
25고려대학교 응용통계학과 DataMining Lab 25고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 전체 SIP)
26고려대학교 응용통계학과 DataMining Lab 26고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 전체 SIP)
27고려대학교 응용통계학과 DataMining Lab 27고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP)
Cluster bootmean Freq 학생 연구원 교직원 Unknown
1 0.84231602 76 11 39 22 4
2 0.956772385 86 15 66 5 0
3 0.80758649 91 8 69 7 7
4 0.773137309 273 72 110 23 68
5 0.651975271 101 25 55 6 15
6 0.985097071 3314 878 578 246 1612
7 0.6923838 170 40 58 60 12
Total 4111 1010 970 369 1722
▶ Bootstrap 을 이용하여 클러스터를 10,000 번 형성한다 . Bootmean 은 해당되는 클러스터가
몇번 형성이 되는지 비율로 나타난것이다 . 숫자가 1 에 가까울수록 클러스터의 유효성이 인정
된다 . 클러스터 5 와 7 은 유효성이 떨어진다 .
28고려대학교 응용통계학과 DataMining Lab 28고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP)
Cluster Freq B학과 D학과 I학과 J학과 M학과 G학과 A학과 H학과 C학과 K학과 F학과 E학과 L학과 N학과
1 76 7 3 5 6 1 3 5 5 0 3 7 2 2 27
2 86 4 8 2 0 0 3 1 9 2 5 26 2 6 18
3 91 6 2 5 4 0 1 5 12 4 5 6 9 7 25
4 273 22 14 2 12 0 4 10 10 1 7 20 10 4 157
5 101 6 4 1 4 0 4 3 10 1 4 12 4 1 47
6 3314 179 98 25 15 6 60 131 112 36 52 148 48 15 2389
7 170 19 5 1 1 2 2 22 10 1 4 8 7 1 87
4111 243 134 41 42 9 77 177 168 45 80 227 82 36 2750
29고려대학교 응용통계학과 DataMining Lab 29고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP)
Cluster Freq K건물 C건물 H건물 I건물 G건물 A건물 B건물 F건물 E건물 D건물 J건물 L건물
1 76 2 5 7 0 5 25 12 4 3 6 3 4
2 86 1 1 4 0 1 31 32 2 13 0 1 0
3 91 4 1 6 0 5 40 15 1 9 2 1 7
4 273 11 9 22 0 10 57 27 10 46 7 6 68
5 101 3 4 6 0 3 23 22 5 4 3 13 15
6 3314 27 263 179 0 131 388 227 58 260 112 57 1612
7 170 1 21 19 0 22 30 12 8 17 24 4 12
Total 4111 49 304 243 0 177 594 347 88 352 154 85 1718
30고려대학교 응용통계학과 DataMining Lab 30고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 1: 교직원 스타일 )
31고려대학교 응용통계학과 DataMining Lab 31고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 2: Heavy User 스타일 )
32고려대학교 응용통계학과 DataMining Lab 32고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 3: Heavy 교직원 스타일 )
33고려대학교 응용통계학과 DataMining Lab 33고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 4: Weekend 스타일 )
34고려대학교 응용통계학과 DataMining Lab 34고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 5: 수요일 집중 스타일 )
35고려대학교 응용통계학과 DataMining Lab 35고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 6: Minimalist 스타일 )
36고려대학교 응용통계학과 DataMining Lab 36고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 전체 SIP, Cluster 7: 십자가 스타일 )
37고려대학교 응용통계학과 DataMining Lab 37고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 학생 SIP)
38고려대학교 응용통계학과 DataMining Lab 38고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 학생 SIP)
39고려대학교 응용통계학과 DataMining Lab 39고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 학생 SIP)
40고려대학교 응용통계학과 DataMining Lab 40고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP)
▶ 클러스터 1 을 제외하면 모든 클러스터가 유효해 보인다 .
Cluster bootmean Freq
1 0.639008 15
2 0.890659 90
3 0.76339 16
4 0.998333 15
5 0.990378 874
41고려대학교 응용통계학과 DataMining Lab 41고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP, Cluster 1, 일요일 교직원 스타일 )
42고려대학교 응용통계학과 DataMining Lab 42고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP, Cluster 2, 화요일 밤샘 스타일 )
43고려대학교 응용통계학과 DataMining Lab 43고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP, Cluster 3, Weekend 스타일 )
44고려대학교 응용통계학과 DataMining Lab 44고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP, Cluster 4, Heavy User 스타일 )
45고려대학교 응용통계학과 DataMining Lab 45고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 학생 SIP, Cluster 5: Minimalist 스타일 )
46고려대학교 응용통계학과 DataMining Lab 46고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 연구원 SIP)
47고려대학교 응용통계학과 DataMining Lab 47고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 연구원 SIP)
48고려대학교 응용통계학과 DataMining Lab 48고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 연구원 SIP)
49고려대학교 응용통계학과 DataMining Lab 49고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 연구원 SIP)
▶ 모든 클러스터들이 유효하게 나타났다
Cluster bootmean Freq
1 0.953435 95
2 0.977008 69
3 0.99128 631
4 0.952295 175
50고려대학교 응용통계학과 DataMining Lab 50고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 연구원 SIP, Cluster 1: 교직원 스타일 )
51고려대학교 응용통계학과 DataMining Lab 51고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 연구원 SIP, Cluster 2: Heavy User 스타일 )
52고려대학교 응용통계학과 DataMining Lab 52고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 연구원 SIP, Cluster 3: Minimalist 스타일 )
53고려대학교 응용통계학과 DataMining Lab 53고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 연구원 SIP, Cluster 4: 수요일 토요일 아침 스타일 )
54고려대학교 응용통계학과 DataMining Lab 54고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 교직원 SIP)
55고려대학교 응용통계학과 DataMining Lab 55고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
5. 클러스터 개수 파악 ( 교직원 SIP)
56고려대학교 응용통계학과 DataMining Lab 56고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 교직원 SIP)
▶ 모든 클러스터들이 유효하게 나타났다
Cluster bootmean Freq
1 0.922136 73
2 0.913887 24
3 0.984908 263
4 0.914262 9
57고려대학교 응용통계학과 DataMining Lab 57고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 교직원 SIP, Cluster 1: Weekend 스타일 )
58고려대학교 응용통계학과 DataMining Lab 58고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 교직원 SIP, Cluster 2: 교직원 스타일 )
59고려대학교 응용통계학과 DataMining Lab 59고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 교직원 SIP, Cluster 3: Minimalist 스타일 )
60고려대학교 응용통계학과 DataMining Lab 60고려대학교 응용통계학과 DataMining Lab
IV. 클러스터링을 이용한 토렌트 사용자 분류빅데이터 트래픽 분석을 통한
학내 망 자원 효율화 방안 연구
6. 분석 결과 ( 교직원 SIP, Cluster 4: Heavy User 스타일 )
61고려대학교 응용통계학과 DataMining Lab 61고려대학교 응용통계학과 DataMining Lab
빅데이터 트래픽 분석을 통한학내 망 자원 효율화 방안 연구
6. 분석 결과
1. 전체 sip 를 이용한 7 개의 클러스터는 5 개가 유효하다고 나왔다 . 시각적으로 봤을때 5 개가
확실한 특징이 있었으며 유효하지 않았다고 본 클러스터 5 와 7 일은 흔하지 않은 시간대에 토렌트
플로우가 발생하는것을 볼수가 있다 .
2. 사용자들을 구분하여 만든 13 개의 클러스터에서는 12 개가 유효하다고 나왔다 . 모든
클러스터들이 시간대별로 특징이 나타난다 .
3. 토렌트플로우가 존재하는 4111 개의 sip 를 분석한 결과 , 대다수가 토렌트를 거의 사용하지
않는것으로 나와있고 , 소수의 sip 가 Heavy User 로 나타나 대부분의 토렌트 플로우를
차지하는것을 볼수가 있다 .
4. Sip 별 언제 토렌트를 사용하는지가 시각적으로 표현이 된다 .
IV. 클러스터링을 이용한 토렌트 사용자 분류
Recommended