Data Story

데이터 사이언스, 쉽게 설명하기

Data Analysis 94

보호 기간이 가장 길었던 동물 (SQL 문제 풀이)

https://school.programmers.co.kr/learn/courses/30/lessons/59411📌 문제 개요동물 보호소에 들어온 동물(ANIMAL_INS)과 입양을 간 동물(ANIMAL_OUTS)의 데이터를 기반으로,입양된 동물 중 보호소에 가장 오래 머문 동물 2마리의 ID와 이름을 조회하는 문제다.보호 기간은 입양일 - 입소일 기준으로 계산하며, 보호 기간이 긴 순으로 정렬한다. 🗂️ 테이블 구조ANIMAL_INS컬럼명타입설명ANIMAL_IDVARCHAR(N)동물의 ID (기본키)ANIMAL_TYPEVARCHAR(N)동물 종DATETIMEDATETIME보호 시작일INTAKE_CONDITIONVARCHAR(N)입소 상태NAMEVARCHAR(N)이름 (nullable)SEX_UPON..

Coding Test/SQL 2025.04.15

부서별 평균 연봉 구하기 (SQL 문제 풀이)

문제 링크: https://school.programmers.co.kr/learn/courses/30/lessons/284529 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 이번에는 부서별 평균 연봉을 계산하는 SQL 문제를 하나 정리해봅니다.테이블 조인 + 서브쿼리 + 소수점 반올림 등실무에서도 자주 쓰이는 패턴이어서 꼭 한번 직접 쿼리 짜보는 걸 추천드려요! 🗂️ 사용 테이블HR_DEPARTMENT컬럼명타입설명DEPT_IDVARCHAR부서 IDDEPT_NAME_KRVARCHAR국문 부서명DEPT_NAME_ENVARCHAR영문 부서명LOCATIONVARCHAR부서 위치HR_EMPLOYEES컬럼명타..

Coding Test/SQL 2025.04.14

조회수가 가장 높은 게시글의 첨부파일 경로 구하기 (SQL 문제 풀이)

SQL 문제를 풀다가 꽤 흥미로운 상황을 만났다.단순히 JOIN하고 ORDER BY만 하면 끝나는 문제인 줄 알았는데,막상 풀다 보니 출력 형식이 조금 까다롭다.이런 게 코딩 테스트나 실무에서도 자주 헷갈릴 수 있겠다 싶어서 정리해두려고 한다.문제 이해하기사용하는 테이블은 두 개다.USED_GOODS_BOARD – 중고거래 게시글 데이터USED_GOODS_FILE – 게시글에 첨부된 파일 정보USED_GOODS_BOARD컬럼명타입설명BOARD_IDVARCHAR(5)게시글 IDWRITER_IDVARCHAR(50)작성자 IDTITLEVARCHAR(100)게시글 제목CONTENTSVARCHAR(1000)게시글 내용PRICENUMBER가격CREATED_DATEDATE작성일STATUSVARCHAR(10)거래 상태..

Coding Test/SQL 2025.04.13

[Web Scraping] - bs4 기초

웹 스크래핑 기초부터 시작from urllib.request import urlopenhtml = urlopen("http://pythonscraping.com/pages/page1.html")print(html.read())    음,  좀 더 보기 좋게 bs4 라이브러리를 사용해보자. 이 라이브러리는 간편하게 크롤링 할 수 있도록 도와준다.다.'html.parser'은 html 코드를 파이썬에서 사용하기 편한 형태로 변환해주는 것이라 생각하자from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen('http://pythonscraping.com/pages/page1.html')bs = BeautifulSoup(html...

Web/Web Scraping 2025.03.12

Chronos 논문 리뷰

👁️ REVIEW 2023년, TimeGPT 논문이 나왔다. 이는 제로샷 예측과 이상치 탐지 태스크에 적용할 수 있음을 배울 수 있었다. 그러면서, LLMTime 등 LLM(Large Language Model)을 투입시키는 연구도 활발히 진행되었다. 뿐만 아니라, 오픈소스 기반 모델인 Lag-LLaMA로 제로샷 예측이 가능해졌다. 이 열기를 이어받아, Amazon 연구원들도 뛰어들게 되었다. 이 연구원들이 제시한 `Chronos`가 무엇인지 알아보자. Original Paper Chronos Chronos는 제로샷 확률 예측을 위한 프레임워크고, Transformer 기반의 언어모델 아키텍쳐를 활용해 예측 태스크에 적용했다. 그리고, Chronos는 NLP(Natural Language Process)..

Paper 2024.04.14

Computer Vision - [선형 AutoEncoder를 활용한 이미지 축소 및 복원]

선형 AutoEncoder를 활용한 이미지 축소 및 복원 (MNIST 데이터셋 사용) 라이브러리 가져오기 import tensorflow as tf from tensorflow.keras.models import Sequential, Model from tensorflow.keras.layers import Dense, Input import numpy as np import matplotlib.pyplot as plt tf.__version__ 데이터셋 가져오기 from tensorflow.keras.datasets import mnist (X_train, y_train), (X_test, y_test) = mnist.load_data() X_train.shape, y_train.shape #((600..

DL/Computer Vision 2024.02.27

Computer Vision - [CNN with tensorflow]

CNN(Convolution Neural Network)를 활용해 호머와 심슨을 분류해보자. 1. Import the library import matplotlib.pyplot as plt import seaborn as sns import zipfile import numpy as np from google.colab.patches import cv2_imshow import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, Dense, Flatten, MaxPool2D from tensorflow.keras.preprocessing.image import Im..

DL/Computer Vision 2024.02.20

Computer Vision - [얼굴 인식 2 (Face Recogintion using dlib, shape predictor 68 face landmarks)]

지난 번 포스팅에는 LBPH 알고리즘으로 얼굴 인식을 태스크를 진행했다. 이번에는 68개의 얼굴 포인트를 감지해서 정확도를 높혀보고자 한다. 1. 라이브러리 가져오기 import dlib import cv2 import PIL import Image from google.colab.patches import cv2_imshow 2. 데이터셋 가져오기 import os import zipfile path = "~/yalefaces.zip" zip_object = zipfile.ZipFile(file=path, mode='r') #read zip_object.extractall("./") zip_object.close() # 메모리 해제 3. 태스크와 모델 정의 # dlib에서 어떤 태스크를 수행할 것이며,..

DL/Computer Vision 2024.02.07