Data Story

데이터 사이언스, 쉽게 설명하기

AWS기초 5

AWS기초 - CloudWatch

CloudWatch CloudWatch는 AWS 리소스 및 AWS에서 실행되는 애플리케이션을 실시간으로 모니터링할 수 있는 기능이다. 개발자가 이벤트(Update, Upload 등의 일련의 행동)를 발생시키면 로그 파일이 생성되고 실시간으로 어떤 일이 일어났는지 확인할 수 있다는 것이다. Monitoring types - Basic Monitoring 5분 간격으로 최소한의 데이터를 수집하여 사용자에게 이벤트를 실시간으로 보여준다. 예) CPU 사용량, 디스크 사용량 - Detail Monitoring 유료이며, 1분 간격으로 자세한 데이터를 수집하여 사용자에게 이벤트를 실시간으로 보여준다. CloudWatch Usecase - 서버 트래픽 문제 해결 언제 어느시간에 서버 트래픽 문제가 생기는지 Clou..

AWS 2023.03.05

AWS 기초 - S3

S3 (Simple Storage Service) AWS의 메인 저장소 - 안전하고 탄력적인 오브젝트 저장 공간을 제공 - 사진, 동영상, Excel 등 다양한 파일 업로드 가능 - 저장소 공간 무제한 - 최상위 폴더와 비슷하고 버킷 생성 시 이름은 고유해야하며 지역명 불허 S3 구성요소 오브젝트는 Key-value조합으로 구성 e.g. 'a.txt' : 'Long time no see' S3 데이터 일관적 모델 데이터 일관적 모델이란, S3 버킷에 새로 업로드하거나 변경할 때 생기는 짧은 지연이다. 두 가지 모델이 존재한다. 더보기 Read after wrtie consistency model 버킷에 업로드할 때 PUT API를 사용해서 업데이트한다. 버킷에 업로드되고 지연없이 사용 가능한 것 Even..

AWS 2023.03.04

AWS기초 - RDS

AWS기초 - RDS RDS Relational Database Service이며, 관계형 데이터베이스이다. DB - RDBS 행과 열로 이루어져있는 2차원적인 공간이다. 테이블, 데이터, 필드로 구성되어있는 데이터베이스이다. e.g. Oracle, MySQL, PostgreSQL, MariaDB - NoSQL 비관계형 DB이고 데이터를 이진 JSON 형식으로 저장해서 딕셔너리처럼 구별되는 데이터베이스이다. Data WareHouse 테이터를 보관하고 사용하는 공간이며 주로 데이터 분석 작업을 지원한다. DB와 Data WareHouse의 차이를 알아두어야 한다. 더보기 DB DB는 데이터가 담긴 테이블을 물리적으로 보관하고 있는 시스템이다. Data WareHouse Data WareHouse는 여러 ..

AWS 2023.03.03

AWS 기초 - EC2

EC2 - Elastic Compute Cloud(탄력적 컴퓨팅 클라우드)이며, 클라우드 공간 크기를 탄력적으로 변경 할 수 있는 가상의 서버 기능 제공한다. - EC2는 인스턴스로 불리며 클라우드 공간에 가상의 서버를 만들어서 AWS에서 제공하는 다양한 애플리케이션을 활용할 수 있다. - 사용량이 많으면 임시적으로 공간을 늘리고, 적으면 디스크 공간을 줄일 수 있으며, 가상의 서버라서 CPU, Network 등의 다양한 설정이 가능하다. EC2 비용 EC2를 이용하는데 비용이 당연히 든다. 대표적으로 세 가지가 구분이 된다. - 온디맨드 시간당 정해진 금액을 지불하는 방식이며, 주로 소프트웨어 검증이나 테스트 단계에 많이 사용된다. 개발 기간이 짧을 때나, 끝을 알고 있을 때 유용하게 쓰인다. - 스팟..

AWS 2023.03.02

AWS 기초 - IAM

IAM(Identity and Access Management) IAM은 AWS 리소스나 서비스를 누구에게 권한을 줄 것인지 관리 기능을 제공하는 것이다. - 본인이 만든 계정, '루트 계정'으로 모든 리소스를 제약 없이 사용할 수 있고 새로운 유저도 생성할 수 있다. - 액세스 키와 비밀 키는 사람이 이해할 수 없는 긴 문자열이고, API에서 이 키를 가지고 AWS 리소스를 사용한다. - 이제 막 생성된 유저에게 모든 권한을 부여할 수 있고, 데이터를 조회할 수 있는 정도의 권한을 루트 계정의 마음대로 설정할 수 있다. 이처럼 특정 리소스 접근 제한을 주는 것을 '최소 권한 정책'이라고 한다. IAM을 사용하는 이유 충돌 예방에 효과적이다. 데이터 분석팀, 데이터 엔지니어팀 등으로 구분된 부서의 경우,..

AWS 2023.02.27