Upload
fast-campus
View
315
Download
2
Embed Size (px)
Citation preview
Fastcampus Datascience Project
영화 관객 수 예측 시스템
2016. 8. 5.조 용 환
Github.com/cyh132
1. 주제 선정 이유
나의 관심사
영화
조 용 환
1. 주제 선정 이유
일일관객수 122만명일주일관객수 662만명최종관객수 1761만명
일일관객수 128만명일주일관객수 665만명
최종관객수 => ???
조 용 환
2. 데이터 구성
Sample : 2000년대 이후 개봉 영화 중 최종 관객수 10000명 이상 2600여개
Feature : 영화 정보(개봉월, 상영등급, 상영시간, 제작국가, 장르, 감독, 배우, 배급사)관객 정보(일주일간 관객수, 스크린 점유율, 상영 점유율, 좌석 점유율)
네이버 정보(개봉전 네이버 평점, 평가 참여 인원)
조 용 환
3. 결 과
3,851,000
2,793,5662,565,078
2,345,247
4,909,492
4,699,208
2,609,9142,479,585
2,896,487
2,532,000
4,945,907
4,168,350
2,367,704
2,079,1992,346,446
2,142,522
트로이 내 머리 속의지우개
엣지 오브투모로우
우리 형 해리포터와아즈카반의 죄수
어메이징스파이더맨
스파이더맨2 바람의 파이터
OLS Model
조 용 환
82% 정확도
3. 결 과
예측정확도(86.9%)
예측정확도(87.0%)
최근 상영 종료 영화
6,862,265 명
7,894,705 명
8,676,103 명
9,968,788 명
오차(1,032,440명)
오차(1,292,685명)
실제
실제
예측
예측
조 용 환
3. 결 과
10,767,444 명
6,656,467 명
예측 최종 관객수
일주일 관객수
조 용 환
3. 결 과
10,767,444 명
6,656,467 명
예측 최종 관객수
일주일 관객수
조 용 환
4. 결 론
Insight
네이버 영화 평점(= 네티즌 기대치) 중요 !
감독(10) 배우(6)영향력
시사회
개봉일 당일
중요 !
1등 !
조 용 환
5. 한계점 및 개선점
상영정보
네티즌 반응
홍 보
조 용 환
기획 : 조 용 환
수집 : 조 용 환
모델링: 조 용 환
분석 : 조 용 환
PPT : 조 용 환
발표 : 조 용 환