[R] 시계열 분석을 통한 미래 예측

미래 예측의 중요성

시간에 따른 변화를 이해하는 것은 비즈니스에서 성공을 좌우하는 가장 중요한 요소이며 마케팅과 비즈니스전략 수립에 많이 쓰이고 있다.

시계열 분석이란?

시계열 분석은 날짜 데이터를 사용해 일/월/연 단위로 수치를 예측하거나 이상치를 모니터링 하는데 사용하는 방법

시계열 분석을 통해 시즌/주기/트렌드 등의 패턴을 도출하는 것이 가능하다.

시계열 분석의 절차는

날짜 데이터 → 시계열 분석 → 수치 예측

시계열 분석을 통해 미래에 발생할 수치를 사전에 파악해 급격한 증가 또는 하락에 대처할 수 있다.

시계열 분석 종류

회귀분석 방법
지수평활, 분해방법 등

기초 통계 계산

## R의 기초통계 계산

# 1) 데이터 불러오기기
iris
mtcars

 # 2) 다양한 통계값 산출
# 평균, 중간값, 표준편차 구하기
m1<-mean(iris$Sepal.Length)
m1
m2<-median(iris$Sepal.Length)
m2
s1<-sd(iris$Sepal.Length)
s1

# 3) 표준화 수행
# 평균을 뺀 값에 표준편차를 나눠준다
# 표준화 된 Length_z
iris$Sepal.Length_z<-(iris$Sepal.Length-m1)/s1
head(iris)

# 4) 상관분석
# iris 데이터에 있는 연속형 변수 각각의 조합과 상관관계를 파악한다
# 일반적으로 많이 사용되는 pearson상관계수로 계산한다.
# cor(iris,method=c("pearson"))
cor(iris[,c(1:4)],method=c("pearson"))

library(PerformanceAnalytics)
chart.Correlation(iris[,c(1:4)],pch=19)

# 5) t 검정 
# 평균비교할때 사용한다
# Sepal.Length의 평균이 동등하다.
iris_test<-subset(iris,Species=="setosa" | Species =="virginica")
boxplot(Sepal.Length~Species,data=iris_test)
t.test(iris_test$Sepal.Length~iris_test$Species,var.equal=T)

# 6) 카이제곱 검정
table(mtcars$vs,mtcars$cyl)
chisq.test(mtcars$vs,mtcars$cyl)