Data Story

데이터 사이언스, 쉽게 설명하기

AWS 8

AWS기초 - CloudFront

CloudFront Edge Location을 생성하고 Cache에 원본 파일을 저장하는 방법 CloudFront를 이해하기 위해선 다음과 같은 용어의 개념을 알고 있어야 한다. Origin 최초로 웹 사이트를 호스팅한 위치 CDN Content Delivery Network이며, 사용자가 어디에 거주하는지에 따라 웹 페이지를 전달해주는 분산 네트워크 시스템이다. Origin에서 꼭 파일을 받을 필요가 없어지게 되었고 파일 전송 지연을 줄일 수 있었다. Edge Location(Edge Server) CDN이 많은 요청이 오가는 지역 주변에 Edge Location을 생성한다. Origin에서 가지고 있는 콘텐츠를 Edge Location의 Cache(임시 저장 공간)에 보관되고 요청자는 Cache에서 ..

AWS 2023.03.07

AWS기초 - Serverless & Lambda

Serverless 개발자가 구현한 애플리케이션을 클라우드에서 돌릴 수 있게 도와주는 클라우드 기반의 개발 모델이며 AWS 리소스를 자동으로 관리한다. - Autoscaling 네트워크 혼잡도에 따라서 크기를 늘리고 줄일 수 있어서 리소스 자원 관리에 효율적임. - Patching RDS 또는 EC2 내 운영체제를 자동으로 업데이트 해줌. - Fast Release 개발자는 서버 관리와 유지보수에 신경쓰지 않고 코드만 구현하는데 집중하면 되기 때문에 빠르게 배포할 수 있음. - Reduce Cost 특정 동작이 전제되어야 실행되는 것이기 때문에 비용 감소에 도움을 줌. Lambda 서버를 관리하지 않고도 모든 유형의 애플리케이션 또는 백엔드 서비스에 대한 코드를 실행할 수 있는 이벤트 중심의 서버리스 컴..

AWS 2023.03.06

AWS기초 - CloudWatch

CloudWatch CloudWatch는 AWS 리소스 및 AWS에서 실행되는 애플리케이션을 실시간으로 모니터링할 수 있는 기능이다. 개발자가 이벤트(Update, Upload 등의 일련의 행동)를 발생시키면 로그 파일이 생성되고 실시간으로 어떤 일이 일어났는지 확인할 수 있다는 것이다. Monitoring types - Basic Monitoring 5분 간격으로 최소한의 데이터를 수집하여 사용자에게 이벤트를 실시간으로 보여준다. 예) CPU 사용량, 디스크 사용량 - Detail Monitoring 유료이며, 1분 간격으로 자세한 데이터를 수집하여 사용자에게 이벤트를 실시간으로 보여준다. CloudWatch Usecase - 서버 트래픽 문제 해결 언제 어느시간에 서버 트래픽 문제가 생기는지 Clou..

AWS 2023.03.05

AWS 기초 - S3

S3 (Simple Storage Service) AWS의 메인 저장소 - 안전하고 탄력적인 오브젝트 저장 공간을 제공 - 사진, 동영상, Excel 등 다양한 파일 업로드 가능 - 저장소 공간 무제한 - 최상위 폴더와 비슷하고 버킷 생성 시 이름은 고유해야하며 지역명 불허 S3 구성요소 오브젝트는 Key-value조합으로 구성 e.g. 'a.txt' : 'Long time no see' S3 데이터 일관적 모델 데이터 일관적 모델이란, S3 버킷에 새로 업로드하거나 변경할 때 생기는 짧은 지연이다. 두 가지 모델이 존재한다. 더보기 Read after wrtie consistency model 버킷에 업로드할 때 PUT API를 사용해서 업데이트한다. 버킷에 업로드되고 지연없이 사용 가능한 것 Even..

AWS 2023.03.04

AWS기초 - RDS

AWS기초 - RDS RDS Relational Database Service이며, 관계형 데이터베이스이다. DB - RDBS 행과 열로 이루어져있는 2차원적인 공간이다. 테이블, 데이터, 필드로 구성되어있는 데이터베이스이다. e.g. Oracle, MySQL, PostgreSQL, MariaDB - NoSQL 비관계형 DB이고 데이터를 이진 JSON 형식으로 저장해서 딕셔너리처럼 구별되는 데이터베이스이다. Data WareHouse 테이터를 보관하고 사용하는 공간이며 주로 데이터 분석 작업을 지원한다. DB와 Data WareHouse의 차이를 알아두어야 한다. 더보기 DB DB는 데이터가 담긴 테이블을 물리적으로 보관하고 있는 시스템이다. Data WareHouse Data WareHouse는 여러 ..

AWS 2023.03.03

AWS 기초 - EC2

EC2 - Elastic Compute Cloud(탄력적 컴퓨팅 클라우드)이며, 클라우드 공간 크기를 탄력적으로 변경 할 수 있는 가상의 서버 기능 제공한다. - EC2는 인스턴스로 불리며 클라우드 공간에 가상의 서버를 만들어서 AWS에서 제공하는 다양한 애플리케이션을 활용할 수 있다. - 사용량이 많으면 임시적으로 공간을 늘리고, 적으면 디스크 공간을 줄일 수 있으며, 가상의 서버라서 CPU, Network 등의 다양한 설정이 가능하다. EC2 비용 EC2를 이용하는데 비용이 당연히 든다. 대표적으로 세 가지가 구분이 된다. - 온디맨드 시간당 정해진 금액을 지불하는 방식이며, 주로 소프트웨어 검증이나 테스트 단계에 많이 사용된다. 개발 기간이 짧을 때나, 끝을 알고 있을 때 유용하게 쓰인다. - 스팟..

AWS 2023.03.02

AWS 기초 - IAM

IAM(Identity and Access Management) IAM은 AWS 리소스나 서비스를 누구에게 권한을 줄 것인지 관리 기능을 제공하는 것이다. - 본인이 만든 계정, '루트 계정'으로 모든 리소스를 제약 없이 사용할 수 있고 새로운 유저도 생성할 수 있다. - 액세스 키와 비밀 키는 사람이 이해할 수 없는 긴 문자열이고, API에서 이 키를 가지고 AWS 리소스를 사용한다. - 이제 막 생성된 유저에게 모든 권한을 부여할 수 있고, 데이터를 조회할 수 있는 정도의 권한을 루트 계정의 마음대로 설정할 수 있다. 이처럼 특정 리소스 접근 제한을 주는 것을 '최소 권한 정책'이라고 한다. IAM을 사용하는 이유 충돌 예방에 효과적이다. 데이터 분석팀, 데이터 엔지니어팀 등으로 구분된 부서의 경우,..

AWS 2023.02.27

AWS 기초

AWS AWS란 Amazon Web Service 줄임말이고, 아마존에서 제공하는 클라우드 플랫폼이다. - 가장 오래된 역사를 가지고 있다. - 세계에서 가장 경쟁력있고 수많은 고객 보유하고 있다. - AWS만의 융통성 있는 컴퓨팅 비용이나 클라우드의 깊은 지식 없어도 누구나 아키텍쳐를 만들 수 있는 쉬운 가이드 제공한다. AWS 기능 - 실시간 데이터 처리 파이프라인을 거쳐 스토리지에 저장된 것이 아닌 초당, 분당 실시간으로 전송되는 데이터를 실시간 데이터라고 함. AWS IoT를 통해서 데이터를 읽고 저장소에 바로 보관할지, 전처리를 거치고 저장소에 보관할지 등에 대해 의사결정을 해야하는데, AWS로 모두 구현이 가능하다. - 배치 데이터 처리 실시간 데이터 처리와 달리, 데이터를 많이 모아둔 후, ..

AWS 2023.02.26