Data Story

데이터 사이언스, 쉽게 설명하기

R 7

R - [barplot]

barplot 매개변수 main = ' ' : barplot 제목 xlab = ' ' : x축 변수명 설명 col = '~' : 막대 색 axes = F : 축 미표시 names.arg = : x축 변수명 표시 tip. row.names() or colnames()로 쓰기 beside = T : 행렬 데이터 때, 두개로 구분 + space(0.1,2) 같이 활용할 것. xlim = c(0,5) : x축 길이 조정 ylim = c(0,5) : y축 길이 조정 horiz = T : 막대 가로로 표시 Horizon barplot #기본적인 막대도표 그리는 함수 barplot(c(15,12,5), names.arg=c('G3','G4','G5'), main='car distribution', xlab='the ..

R 2023.01.18

R - [Normality]

Normality library(dplyr) library(ggplot2) #visualization qqnorm(mpg$hwy) qqline(mpg$hwy) 시각적으로 보는 방법보다 정규성 검정을 통해서 확인하는 게 더 낫다. 이 때, 정규성 검정의 귀무가설은 '정규성을 따른다'이다. shapiro.test(mpg$hwy) [그림 2]를 보면 p-value가 유의수준 0.05보다 작기 때문에 귀무가설을 기각하고 대립가설을 채택하게 된다. 따라서 hwy variable은 정규성을 따르지 않는다고 주장할 수 있다. 중심극한정리 동일확률분포를 가진 확률변수 n개의 평균의 분포는 n이 충분히 크다면 '정규분포'에 가까워진다는 것 mu = 30 sigma = 10 set.seed(10) pop

R 2022.12.25

R - R Markdown command

R markdown R markdown을 작성하기 위해서는 일반 R script가 아닌 .Rmd script창을 열어야한다. Rstudio 메뉴창의 file아래 새파일추가 버튼을 클릭하면 R script아래 R markdown을 열어주면 된다. 작성하고자 하는 주제와 저자이름 그리고 문서형식을 선택하고 ok버튼을 누르면 .Rmd script창이 생성된다. R markdown 문법에 맞게 문서를 작성하면 된다. 작성한 문서를 HTML파일로 변환하기 위해서는 .Rmd창 아래 Knit 버튼을 클릭하면 문서가 생성된다. Basic Syntax 1. 강조(Empasis) 글자를 강조하기 위해서 기본적으로 italic과 bold체가 있다. italic은 강조하고자 하는 text 양끝에 * 또는_ bold는 강조하고..

R 2022.12.22

R Visualization - [boxplot]

boxplot boxplot은 자료의 얼마나 퍼져있는지를 볼 수 있는 효율적인 시각화 기법이다. 또한 이상치 여부를 확인할 때도 사용한다. boxplot(mpg~cyl,data=mtcars, main="Car Milage Data", xlab="Number of Cylinders", ylab="Miles Per Gallon") #두 개의 컬럼을 동시에 쓸 수도 있다. # 만약 하나의 컬럼만 사용하고 싶은 경우, len ~ supp =='VC'도 가능하다 boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE, col=(c("gold","darkgreen")), main="Tooth Growth", xlab="Suppliment and Dose") vioplot #vi..

R 2022.12.06