Data Story

데이터 사이언스, 쉽게 설명하기

전체 글 90

SQL - [고급 SQL]

TimeStamps and EXTRACT : 날짜와 시간을 다룬다. 날짜와 시간 정보는 스스로 표와 DB를 만들 때 유용하다. 시간 정보와 날짜 정보를 저장하는 다른 데이터 종류의 Subset이 있다는 것을 기억해두자. 상황에 따라 모든 날짜, 시간, 표준시간대를 표시할지 여부를 결정해야 한다. 예를 들어 근무 시간 표를 만들고자 한다면 출퇴근 시간만 체크하면 되고 표준시간대는 굳이 쓸 필요 없을 것이다.(장기적으로 생각하기.) Math Functions and String Functions Sub-query Self-join ​ 1. TIMESTAMP and EXTRACT - TIMESTAMP show all /*실행시간을 보여주는 매개변수*/ show timezone /*select*/ select ..

Coding Test 2022.12.07

SQL - [AS, JOIN, UNION]

AS as, alias는 맨 마지막에 할당되기 때문에 alias로 필터링을 할 수 없다. Where문이나 Having절 같은 곳에서는 사용할 수 없다. 따라서 원래 열 이름이나 원래 함수 중 하나를 선택해야 한다. select customer_id , sum(amount) as total_spent from payment group by customer_id having sum(amount) > 100 ; JOIN [inner join] select * from TableA inner join TableB on TableA.col_match = TableB.col_match e.g. ​ /^그림 1*/ select payment_id, payment.customer_id,first_name from pa..

Coding Test 2022.12.07

R Visualization - [boxplot]

boxplot boxplot은 자료의 얼마나 퍼져있는지를 볼 수 있는 효율적인 시각화 기법이다. 또한 이상치 여부를 확인할 때도 사용한다. boxplot(mpg~cyl,data=mtcars, main="Car Milage Data", xlab="Number of Cylinders", ylab="Miles Per Gallon") #두 개의 컬럼을 동시에 쓸 수도 있다. # 만약 하나의 컬럼만 사용하고 싶은 경우, len ~ supp =='VC'도 가능하다 boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE, col=(c("gold","darkgreen")), main="Tooth Growth", xlab="Suppliment and Dose") vioplot #vi..

R 2022.12.06