미래 예측의 중요성

시간에 따른 변화를 이해하는 것은 비즈니스에서 성공을 좌우하는 가장 중요한 요소이며 마케팅과 비즈니스전략 수립에 많이 쓰이고 있다.

시계열 분석이란?

시계열 분석은 날짜 데이터를 사용해 일/월/연 단위로 수치를 예측하거나 이상치를 모니터링 하는데 사용하는 방법

시계열 분석을 통해 시즌/주기/트렌드 등의 패턴을 도출하는 것이 가능하다.

시계열 분석의 절차는

날짜 데이터 → 시계열 분석 → 수치 예측

시계열 분석을 통해 미래에 발생할 수치를 사전에 파악해 급격한 증가 또는 하락에 대처할 수 있다.

시계열 분석 종류

기초 통계 계산

## R의 기초통계 계산

# 1) 데이터 불러오기기
iris
mtcars

 # 2) 다양한 통계값 산출
# 평균, 중간값, 표준편차 구하기
m1<-mean(iris$Sepal.Length)
m1
m2<-median(iris$Sepal.Length)
m2
s1<-sd(iris$Sepal.Length)
s1

# 3) 표준화 수행
# 평균을 뺀 값에 표준편차를 나눠준다
# 표준화 된 Length_z
iris$Sepal.Length_z<-(iris$Sepal.Length-m1)/s1
head(iris)

# 4) 상관분석
# iris 데이터에 있는 연속형 변수 각각의 조합과 상관관계를 파악한다
# 일반적으로 많이 사용되는 pearson상관계수로 계산한다.
# cor(iris,method=c("pearson"))
cor(iris[,c(1:4)],method=c("pearson"))

library(PerformanceAnalytics)
chart.Correlation(iris[,c(1:4)],pch=19)

# 5) t 검정 
# 평균비교할때 사용한다
# Sepal.Length의 평균이 동등하다.
iris_test<-subset(iris,Species=="setosa" | Species =="virginica")
boxplot(Sepal.Length~Species,data=iris_test)
t.test(iris_test$Sepal.Length~iris_test$Species,var.equal=T)

# 6) 카이제곱 검정
table(mtcars$vs,mtcars$cyl)
chisq.test(mtcars$vs,mtcars$cyl)