Data Story

데이터 사이언스, 쉽게 설명하기

딥러닝 6

Computer Vision - [Fruit and Vegetable Classification]

과일과 채소의 이미지를 보고 분류하고자 한다. MobileNetV2 모델을 전이 학습했다. 해당 데이터셋에는 바나나, 사과, 배, 포도, 오렌지, 옥수수, 양파, 감자, 레몬 등으로 구성되어 있다. 데이터셋은 Kaggle Dataset을 활용한다. https://www.kaggle.com/datasets/kritikseth/fruit-and-vegetable-image-recognition Fruits and Vegetables Image Recognition Dataset Fruit and Vegetable Images for Object Recognition www.kaggle.com 1. Load library 사용할 라이브러리를 가져오자. import pandas as pd import numpy..

DL/Computer Vision 2024.01.29

Computer Vision - [CNN (Convolutional Neural Network)]

CNN (Convolutional Neural Network) 연구실에서도 자주쓰는 이미지 처리 모델, CNN을 사용해보자. import dlib image = cv2.imread(".jpg") # 사전에 학습된 모델 가져옴 cnn_detector = dlib.cnn_face_detection_model_v1(".dat") 경계 박스를 만들어주자. # 숫자를 크게할수록 작은 얼굴을 탐지한다. detections = cnn_detector(image, 4) for face in detections: l, t, r, b, c = face.rect.left(), face.rect.top(), face.rect.right(), face.rect.bottom(), face.confidence print(c) cv..

DL/Computer Vision 2024.01.26

MLP기반 시계열 예측, TSMixer 논문 리뷰

Transformer 아키텍처는 NLP에서 굉장한 성능을 보여줬다. 그러나, 시계열 예측에서는 그렇지 않다. Transformer 기반의 모델로는 Autoformer, Informer 등이 있는데, 훈련하는 시간도 오래걸리고, 간단한 Linear Model이 benchmarket datasets 에서 더욱 좋은 성능을 보여줬다. 여기서 말하는benchmarket datasets란, 모델의 성능들을 비교할 수 있는 기본 데이터셋들을 의미한다. Original Paper TSMixer Google Cloud AI Research 팀에서 TSMixer을 제안했다. TSMixer은 멀티레이어 퍼셉트론(MLP) 기반 모델이며, 시간과 특성 차원을 더 좋은 예측을 위해 섞는 방식이다. TSMixer Training..

Paper 2023.12.11

TimesNet 논문 리뷰

TimesNet(23.04) 👁️ REVIEW 딥러닝 최신 시계열 모형으로 20년에 N-BEATS, 22년 N-HiTS, 최근에 나온 BatchTST가 있었다. N-BEATS와 N-HiTS는 MLP 기반이고 BatchTST는 Transformer 아키텍쳐를 사용한다. 우리가 볼 TimesNet은 CNN 모델을 기반으로 다양한 태스크를 수행한다. 그래서 시계열 분석 모형을 구축하기 위해선 사용하기에 좋은 선택지다. 이번에 리뷰할 TImesNet은 시계열 분석 또는 예측, 이상치 탐지, 분류, 대치법(imputation)이 가능한 다재다능 모델을 설명하고자 한다. Original Paper TimesNet 💡 TimesNet은 여러 기간에 걸친 Variation을 포착하기 위해 1차원 공간을 2차원 공간(I..

Paper 2023.11.21

TimeGPT 논문 리뷰

3년 동안 많은 시계열 관련 논문들이 있었다. 예를 들어 N-BEATS, PatchTST 그리고 TimesNet. 이 기간 동안 ChatGPT같은 LLM(Large Language Model)도 발전했는데 새로운 입력(문장 등)에 훈련 과정없이 대부분의 태스크에 적용할 수 있게 되었다. ‘그렇다면, 시계열 예측에서도 거대 데이터셋을 학습해서 별도의 훈련 과정없이 사용할 수 있을까?’ 이 질문이 ‘TimeGPT’로 이어지게 되었다. 저자, Azul Garza, Max Mergenthaler-Canseco는 LLM 속에 있는 아키텍쳐와 기술을 사용하였고, zero-shot inference가 가능한 최초의 시계열 기반 모델을 구축하였다. Original Paper TimeGPT 위의 그림을 보면 여러 도메인..

Paper 2023.11.14

Computer Architecture - [GPU]

GPU (Graphic Processing Unit) GPU는 컴퓨터 그래픽을 처리하는 장치입니다. 🔺 Image from codingworldnews.com 🔺 Image from 게사장블로그 ​ GPU는 컴퓨터 그래픽을 처리하는 장치이며, 그래픽 카드(VGA)는 GPU와 쿨링 케이스, 외부 출력 포트 등을 포함하는 장치입니다. 즉, VGA 내부에 GPU가 존재합니다. ​ 구조 ALU(실제 연산 담당) GPU는 그래픽과 같은 특화된 연산을 빠르게 수행하기 위해서 필요없는 부분을 과감히 지웠습니다. CPU는 적은 수의 고성능 코어 몇 개와 보조장치로 이루어졌다면, GPU는 그냥 수백개의 코어를 결합한 구조입니다. GPU는 직접 작업을 처리하기 어렵지만, 연산력을 높이는 데에는 특화되어 있습니다. 특정된 ..

Computer Science 2022.12.17