Paper

TimesNet ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ

_data 2023. 11. 21. 10:30

TimesNet(23.04)

๐Ÿ‘๏ธ REVIEW


๋”ฅ๋Ÿฌ๋‹ ์ตœ์‹  ์‹œ๊ณ„์—ด ๋ชจํ˜•์œผ๋กœ 20๋…„์— N-BEATS, 22๋…„ N-HiTS, ์ตœ๊ทผ์— ๋‚˜์˜จ BatchTST๊ฐ€ ์žˆ์—ˆ๋‹ค. N-BEATS์™€ N-HiTS๋Š” MLP ๊ธฐ๋ฐ˜์ด๊ณ  BatchTST๋Š” Transformer ์•„ํ‚คํ…์ณ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ๋ณผ TimesNet์€ CNN ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ค์–‘ํ•œ ํƒœ์Šคํฌ๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. ๊ทธ๋ž˜์„œ ์‹œ๊ณ„์—ด ๋ถ„์„ ๋ชจํ˜•์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•ด์„  ์‚ฌ์šฉํ•˜๊ธฐ์— ์ข‹์€ ์„ ํƒ์ง€๋‹ค.

์ด๋ฒˆ์— ๋ฆฌ๋ทฐํ•  TImesNet์€ ์‹œ๊ณ„์—ด ๋ถ„์„ ๋˜๋Š” ์˜ˆ์ธก, ์ด์ƒ์น˜ ํƒ์ง€, ๋ถ„๋ฅ˜, ๋Œ€์น˜๋ฒ•(imputation)์ด ๊ฐ€๋Šฅํ•œ ๋‹ค์žฌ๋‹ค๋Šฅ ๋ชจ๋ธ์„ ์„ค๋ช…ํ•˜๊ณ ์ž ํ•œ๋‹ค.

Original Paper

TimesNet

๐Ÿ’ก TimesNet์€ ์—ฌ๋Ÿฌ ๊ธฐ๊ฐ„์— ๊ฑธ์นœ Variation์„ ํฌ์ฐฉํ•˜๊ธฐ ์œ„ํ•ด 1์ฐจ์› ๊ณต๊ฐ„์„ 2์ฐจ์› ๊ณต๊ฐ„(Intra-period, Inter-period๋ฅผ)์œผ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๋ชจ๋ธ๋งํ•œ๋‹ค.

 

์ข…์ข… ์‹ค์„ธ๊ณ„์—์„œ์˜ ์‹œ๊ณ„์—ด๊ฐ’์€ ์—ฌ๋Ÿฌ ๊ธฐ๊ฐ„์— ๊ฑธ์นœ ์ฃผ๊ธฐ๊ฐ€ ์žˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ด๊ฑธ Multi-Periodicity๋ผ๊ณ  ํ•œ๋‹ค. ์ด๊ฒŒ TimesNet์ด ํƒ„์ƒํ•˜๊ฒŒ๋œ ๊ณ„๊ธฐ๋‹ค.

์ž๋™์ฐจ ๊ตํ†ต๋Ÿ‰์„ ์ƒ๊ฐํ•ด๋ณด์ž. ์ถœ๊ทผ๊ธธ, ํ‡ด๊ทผ๊ธธ์— ๊ตํ†ต๋Ÿ‰์ด ํ™œ๋ฐœํ•˜๊ณ  ์ฃผ๋ง๋ณด๋‹ค ํ‰์ผ์— ๊ตํ†ต๋Ÿ‰์ด ๋งŽ๋‹ค. ๋˜ ๋‹ค๋ฅธ ์˜ˆ๋กœ๋Š” ๊ธฐ์˜จ์ด ์žˆ๋‹ค. ๋ฐค๋ณด๋‹ค ๋‚ฎ์ด ๊ธฐ์˜จ์ด ๋†’๊ณ , ๊ฒจ์šธ๋ณด๋‹ค ์—ฌ๋ฆ„์ด ๋†’๋‹ค. ์ด ๋‘ ์˜ˆ์ œ์—์„œ๋Š” Multi-periodicity๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด๋ ‡๊ฒŒ ๋‘ ๊ฐœ์˜ ์ฃผ๊ธฐ๊ฐ€ ๊ฒน์น˜๋Š” ๊ฒฝ์šฐ์— ๋ชจ๋ธ๋ง์ด ๋ณต์žกํ•ด์ง€๊ณ , ๋ฐ์ดํ„ฐ์˜ ๋ณ€๋™์„ฑ์„ ํ•ด์„ํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์ด ๋ฐœ์ƒํ•œ๋‹ค. ์ด๋Š” ๋‹ค์–‘ํ•œ ์ฃผ๊ธฐ์˜ ๋ณ€๋™์„ฑ์ด ์„œ๋กœ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉด์„œ, ๋‹จ์ผ ์ฃผ๊ธฐ๋ฅผ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋ณด๋‹ค ์˜ˆ์ธก์ด ๋” ์–ด๋ ค์›Œ์ง„๋‹ค.

๊ทธ๋ž˜์„œ TImesNet์€ Multi-periodicity ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ์‹œ๊ณ„์—ด ๊ฐ’์„ 2D๋กœ ๋ณ€ํ˜•ํ•˜์—ฌ intraperiod-variation๊ณผ interperiod-variation ๋กœ ๊ตฌ๋ถ„ํ•˜์˜€๋‹ค. intraperiod-variation์€ ๋‹จ๊ธฐ์ ์ธ ์ฃผ๊ธฐ์—์„œ ์ผ์–ด๋‚˜๋Š” ๋ณ€๋™์ด๋‹ค. interperiod-variation์€ ์žฅ๊ธฐ์ ์ธ ์ฃผ๊ธฐ์—์„œ ์ผ์–ด๋‚˜๋Š” ๋ณ€๋™์ด๋‹ค.

  • ์˜จ๋„์˜ ๊ฒฝ์šฐ ํ•˜๋ฃจ๋™์•ˆ ์ผ์–ด๋‚˜๋Š” ๋‚ฎ๊ณผ ๋ฐค์˜ ๋‹จ๊ธฐ์ ์ธ ์˜จ๋„ ์ฃผ๊ธฐ๋Š” intraperiod-variation์ด๋‹ค.
  • ํ•˜๋ฃจ์™€ ๋‹ค์Œ ๋‚  ํ•˜๋ฃจ์˜ ์ฃผ๊ธฐ ๋˜๋Š” ์ž‘๋…„ ์—ฌ๋ฆ„๊ณผ ์˜ฌํ•ด ์—ฌ๋ฆ„์˜ ์žฅ๊ธฐ์ ์ธ ์˜จ๋„ ์ฃผ๊ธฐ๋Š” interperiod-variation์ด๋‹ค.

Architecture of TimesNet

๋ชจ๋ธ์˜ ๊ตฌ์„ฑ์„ ๋ณด์ž.

์œ„ ๊ทธ๋ฆผ์€ TimesNet์˜ ์•„ํ‚คํ…์ณ์ด๋‹ค. ์™ผ์ชฝ TimesBlock์ด ์—ฌ๋Ÿฌ๊ฐœ ์Œ“์•„์ ธ์žˆ์œผ๋ฉฐ ์ž”์ฐจ์™€ ํ•จ๊ป˜ ์ด์–ด์ ธ ์žˆ๋‹ค. ํ•˜๋‚˜์˜ TimesBlock์— k๊ฐœ์˜ ๋ ˆ์ด์–ด๊ฐ€ ์กด์žฌํ•˜๊ณ  ์ฒ˜๋ฆฌ ํ”„๋กœ์„ธ์Šค๊ฐ€ ์กด์žฌํ•œ๋‹ค.

  1. FFT for Periods : ์‹œ๊ณ„์—ด ๊ฐ’์ด ์„œ๋กœ ๋‹ค๋ฅธ ์ฃผ๊ธฐ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด FFT(Fast Fourier Transform)์„ ๊ฑฐ์นœ๋‹ค.

  1. Reshape : Intraperiod, Interperiod ํŒจํ„ด์„ ํŒŒ์•…ํ•˜์—ฌ 2D Vector๋กœ ๋ณ€ํ™˜๋œ๋‹ค.
  2. Parameter-efficient Inception block : 2D Vector๋ฅผ ์ž…๋ ฅ ๋ฐ›๊ณ  ๋‹ค์–‘ํ•œ ํฌ๊ธฐ์˜ 2D ์ปค๋„์„ ์‚ฌ์šฉํ•ด์„œ ํ•™์Šต ๋ฐ ์˜ˆ์ธก์„ ํ•œ๋‹ค.
  3. Reshape Back : adaptive aggregation์„ ์‚ฌ์šฉํ•ด์„œ 1D Vector๋กœ ์žฌ๋ณ€ํ™˜ํ•œ๋‹ค.

Detail

์กฐ๊ธˆ ๋” ๊ตฌ์ฒด์ ์œผ๋กœ ๋ณด์ž.

1. 2D ๊ณต๊ฐ„ ๋ฐฐ์—ด ๋ฐฉ๋ฒ•

  • Intraperiod-variation ์‚ฌ๊ฐํ˜•์„ ๋ณด๋ฉด ํ•ด๋‹น period ๋™์•ˆ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”ํ–ˆ๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.
  • Interperiod-variation์€ period์™€ ๋‹ค์Œ period ์‚ฌ์ด์˜ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”ํ–ˆ๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.

ํ•œ ๋‹ฌ ๋™์•ˆ์˜ ๊ตํ†ต๋Ÿ‰์„ ์˜ˆ๋กœ ๋“ค์–ด๋ณด์ž.

์›”์š”์ผ์—์„œ ํ™”์š”์ผ ๊ตํ†ต๋Ÿ‰, ํ™”์š”์ผ๋ถ€ํ„ฐ ์ˆ˜์š”์ผ ๊ตํ†ต๋Ÿ‰ → Intraperiod-variation

์ฒซ์งธ ์ฃผ ์›”์š”์ผ์—์„œ ๋‘˜์งธ ์ฃผ ์›”์š”์ผ ๊ตํ†ต๋Ÿ‰, ์ฒซ์งธ ์ฃผ ํ™”์š”์ผ์—์„œ ๋‘˜ ์งธ์ฃผ ํ™”์š”์ผ ๊ตํ†ต๋Ÿ‰ → Interperiod-variation

์ดํ›„ Intraperiod-variation๋ฅผ y์ถ•, Interperiod-variation๋ฅผ x์ถ•์— ๋ฐฐ์น˜ํ•˜์—ฌ 2D๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค.

 

์™œ ์ด๋ ‡๊ฒŒ ๋ณ€ํ™˜ํ• ๊นŒ?

1D์˜ ๊ฒฝ์šฐ ์ธ์ ‘ํ•œ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ์™€ ๋ณ€๋™์„ฑ์„ ๋น„๊ตํ•˜๋Š”๋ฐ, 2D๋กœ ๋ณ€ํ™˜ํ•˜๋ฉด ๋ฐ์ดํ„ฐ์˜ ๋ณ€๋™์„ฑ์„ ๋”์šฑ ๋Œ€ํ‘œํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

2. ๋‹ค์–‘ํ•œ ์ฃผ๊ธฐ๋ฅผ ์ฐพ๋Š” ๋ฐฉ๋ฒ•

์‹œ๊ณ„์—ด ๊ฐ’์—์„œ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ฃผ๊ธฐ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด FFT(Fast Fourier Transform)๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. FFT๋Š” Frequency(๋นˆ๋„)์™€ ๊ฐ•๋„(Amplitude)๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค.

์œ„์˜ ํŒŒ๋ž€ ์„ ์ธ FFT ๊ทธ๋ฆผ์„ ๋ณด๋ฉด, Amplitude ๊ฐ’์ด ํŠ€์–ด์˜ค๋ฅด๋Š” ๊ตฌ๊ฐ„๋“ค(Frequency1, Frequency2…)์ด ์ค‘์š”ํ•˜๋‹ค. ๊ทธ ๊ตฌ๊ฐ„๋“ค์„ ๊ฐ๊ฐ ์ถ”์ถœ ํ›„ 2D ์ปค๋„๋กœ ์ผ์‹œ์ ์ธ ๋ณ€๋™์„ ํฌ์ฐฉํ•œ๋‹ค.

3. Inception Block

๋ณ€ํ™˜๋œ 2D๋Š” inception block์œผ๋กœ ์ „์†ก๋œ๋‹ค. Inception ๋ชจ๋“ˆ์€ ์ปดํ“จํ„ฐ๋น„์ „ ๋ชจ๋ธ์ธ googleNet์œผ๋กœ ๊ตฌ์ถ•๋œ๋‹ค. ์ด๋Ÿฌํ•œ Computer Vision ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•œ ๊ฑด, 2D ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ์ฒ˜๋ฆฌํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  TimesNet์—์„œ Vision Backbone์„ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ๋Š” ์žฅ์ ์„ ๊ฐ€์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

 

inception ๋ชจ๋“ˆ์˜ ํ•ต์‹ฌ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํฌ์†Œํ•˜๊ฒŒ ์œ ์ง€ํ•ด์„œ ํ‘œํ˜„ํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด, ๊ธฐ์ˆ ์ ์œผ๋กœ ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ(Neural Network)์˜ ํฌ๊ธฐ๋ฅผ ์ฆ๊ฐ€์‹œํ‚ฌ ์ˆ˜ ์žˆ๊ณ , ์—ฐ์‚ฐ์„ ํšจ์œจ์ ์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค. ์ด๋Š” ๋‹ค์–‘ํ•œ ์ปจ๋ณผ๋ฃจ์…˜๊ณผ ํ’€๋ง ์—ฐ์‚ฐ์œผ๋กœ ์ˆ˜ํ–‰๋˜๊ณ  ์ดํ›„ ๋ณ‘ํ•ฉํ•œ๋‹ค. ์•„๋ž˜์™€ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ๋ง์ด๋‹ค.

aggregation(ํ†ตํ•ฉ)

aggregation์„ ์ง„ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด์„œ 2D๋Š” ๋ฐ˜๋“œ์‹œ 1D ๋ฒกํ„ฐ๋กœ ๋ณ€๊ฒฝ๋˜์–ด์•ผ ํ•œ๋‹ค. ์™œ๋ƒํ•˜๋ฉด ๊ฐ๊ฐ์˜periods์—๋Š” ๋‹ค๋ฅธ amplitudes๊ฐ€ ์กด์žฌํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ด๋Ÿฌํ•œ ๊ฐ periods์˜ ์ƒ๋Œ€์  ์ค‘์š”์„ฑ์„ ์‚ฌ์šฉํ•ด aggregation์„ ํ•˜๊ธฐ ์œ„ํ•ด FFT๋˜ํ•œ softmax layer์— ์ „์†ก๋œ๋‹ค.

ํ†ตํ•ฉ๋œ ๋ฐ์ดํ„ฐ๋Š” ํ•˜๋‚˜์˜ TimesBlock ์ถœ๋ ฅ์œผ๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค. ์ดํ›„, ์ž”์ฐจ ์—ฐ๊ฒฐ์„ ๊ฐ€์ง€๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ TimesBlock์„ ์Œ“์•„, TimesNet ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•œ๋‹ค.

Conclusion

TimesNet์€ Inception ๋ชจ๋“ˆ์„ ํ™œ์šฉํ•ด ์˜ˆ์ธก๊ณผ ๋ถ„๋ฅ˜, ์ด์ƒํƒ์ง€์™€ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์‹œ๊ณ„์—ด ๋ถ„์„ ์ž‘์—…์—์„œ ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๋Š” CNN ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ด๋‹ค.