Chronos ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ
๐๏ธ REVIEW
2023๋ , TimeGPT ๋ ผ๋ฌธ์ด ๋์๋ค. ์ด๋ ์ ๋ก์ท ์์ธก๊ณผ ์ด์์น ํ์ง ํ์คํฌ์ ์ ์ฉํ ์ ์์์ ๋ฐฐ์ธ ์ ์์๋ค. ๊ทธ๋ฌ๋ฉด์, LLMTime ๋ฑ LLM(Large Language Model)์ ํฌ์ ์ํค๋ ์ฐ๊ตฌ๋ ํ๋ฐํ ์งํ๋์๋ค. ๋ฟ๋ง ์๋๋ผ, ์คํ์์ค ๊ธฐ๋ฐ ๋ชจ๋ธ์ธ Lag-LLaMA๋ก ์ ๋ก์ท ์์ธก์ด ๊ฐ๋ฅํด์ก๋ค. ์ด ์ด๊ธฐ๋ฅผ ์ด์ด๋ฐ์, Amazon ์ฐ๊ตฌ์๋ค๋ ๋ฐ์ด๋ค๊ฒ ๋์๋ค. ์ด ์ฐ๊ตฌ์๋ค์ด ์ ์ํ `Chronos`๊ฐ ๋ฌด์์ธ์ง ์์๋ณด์.
Chronos
Chronos๋ ์ ๋ก์ท ํ๋ฅ ์์ธก์ ์ํ ํ๋ ์์ํฌ๊ณ , Transformer ๊ธฐ๋ฐ์ ์ธ์ด๋ชจ๋ธ ์ํคํ ์ณ๋ฅผ ํ์ฉํด ์์ธก ํ์คํฌ์ ์ ์ฉํ๋ค. ๊ทธ๋ฆฌ๊ณ , Chronos๋ NLP(Natural Language Process) ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค. ๋ณดํต NLP๋ชจ๋ธ์ NLP์์ ๋ค์ ํ ํฐ์ ์์ธกํ๊ธฐ ์ํด ์ฌ์ฉ๋๋๋ฐ, ์๊ณ์ด์ ์ ์ฉํด๋ณด๊ธฐ ์ํด ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ค. ๊ทธ๋ฌ๋, NLP์์๋ ์ ํ ๊ฐ๋ฅํ ํ ํฐ์ด ๊ณ ์ ๋์ด ์๋๋ฐ, Time Series ๋ฐ์ดํฐ๋ ์ ํ์ด ์๋ค.
์๋ฅผ ๋ค์ด, ‘๋๋ ํ๊ตญ์ธ์ด๋ค.’ ๋ผ๋ ๋ฌธ์ฅ์ ์๊ฐํด๋ณด์. ํํ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋๋์ด ๋ณผ ์ ์๊ณ , ๊ณต๋ฐฑ ๊ธฐ์ค์ผ๋ก ํ ํฐํํ ์ ์๋ค. ์ฆ, ํ ํฐ์ผ๋ก ์ ํ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ์ด ํ์ ๋์ด ์๋ค. ์๊ณ์ด ๋ฐ์ดํฐ๋ ์ด๋จ๊น?
์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด, y์ถ์ 0์์ 700๊น์ง ์๋ค. ์ด๊ฑฐ๋ฅผ ์ด๋ป๊ฒ ํ ํฐํ ํด์ผํ ๊น? ์์์ ์ ๋๊น์ง ๊ณ ๋ คํด๋ณด๋ฉด, ์ ํ์์ด ํ ํฐํ๋ฅผ ์งํํ ์ ์๋ค. ์ด๋ ๊ฒ ๋๋ฉด, ์์ธก ๊ฒฐ๊ณผ๊ฐ ์ข์ง ์๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ํ์คํฌ์ ๋ง๊ฒ ์ฌ์กฐ์ ํ ํ์๊ฐ ์๋ค. ๊ทธ๋์ ์ฌ์กฐ์ ์ ํ๊ฒ ๋๋ฉด, ์ ๋ก์ท ์์ธก์ ์ํ ๋ชจ๋ธ์ ์ฌ์ ์ ํ์ตํ ์ ์๊ฒ ๋๋ค.
๐ Architecture of Chronos
๋ชจ๋ธ์ ๊ตฌ์ฑ์ ๋ณด์.
์ ๋ชจ๋ธ์ Chronos์ ์ํคํ ์ณ๋ค.
- (์ผ์ชฝ) ์ฐ์๋ ํ ํฐ์ ์ป๊ธฐ ์ํด ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ค์ผ์ผ๋งํ๊ณ ์์ํ๋ฅผ ๊ฑฐ์น๋ค.
- (์ค๊ฐ) ์ป์ ํ ํฐ์ ์๊ณ์ด ์ธ์ด ๋ชจ๋ธ(์ธ์ฝ๋-๋์ฝ๋ ๋๋ ๋์ฝ๋ ๋ชจ๋ธ)์ ํฌ์ ์ํจ๋ค. ๊ทธ๋ฌ๋ฉด, ์ด ์๊ณ์ด ์ธ์ด ๋ชจ๋ธ์ด cross-entropy loss๋ฅผ ์ฌ์ฉํด์ ํ์ต์ด ๋๋ค.
- (์ค๋ฅธ์ชฝ) ์ถ๋ก ๊ณผ์ ์์, ์์ํ, ์ค์ผ์ผ๋ง ์์ ์ ์ญ์ผ๋ก ์งํํด ์๋ ๊ฐ์ ์ป๋๋ค.
๐๏ธDetail
์กฐ๊ธ ๋ ๊ตฌ์ฒด์ ์ผ๋ก ๋ณด์.
1. ์๊ณ์ด ๋ฐ์ดํฐ ํ ํฐํ
์์์, LLM์ ์ ํด์ง ๋จ์ด ํ ํฐ์ผ๋ก ์๋๋๊ธฐ ๋๋ฌธ์ ์๊ณ์ด ๋ฐ์ดํฐ ๋ํ ํ์ ๋ ํ ํฐ์ ์งํฉ์ผ๋ก ์ฌ์กฐ์ ํด์ผํ๋ค๊ณ ๋งํ๋ค. Chronos ์ ์๋ ๋จผ์ , ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ ์ ํ ๊ฐ์ผ๋ก ์๋ ์ฒ๋ผ ํ๊ท ์ค์ผ์ผ๋ง ํ๋ค.
์ดํ ๊ณ ์ ๋ ์๋ก ์์ํํ๋ ๊ฒ์ ์ ์ํ๋ค. ๋ฌผ๋ก , ๋ค๋ฅธ ์ค์ผ์ผ๋ง์ ์จ๋ ๋์ง๋ง, ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์์๋ ํ๊ท ์ค์ผ์ผ๋ง์ด ์ข ๋ ํจ๊ณผ์ ์ด๋ผ๊ณ ๋งํด์ ํ๊ท ์ค์ผ์ผ๋ง์ ์ฌ์ฉํ๋ค. (Salinas et al.,2020) ์ด ๊ณผ์ ์ ๊ฑฐ์น๋ฉด, ์๋์ ์์ผ๋ก ์ ์ฉ๋๋ค.
๋ฐ์ดํฐ๋ฅผ ์ค์ผ์ผ๋ง ํ์ ๋ ๋ชจ์์ด ๊ทธ๋๋ก ์ ์ง๋๊ณ , Y์ ๋ฒ์๊ฐ ์ค์๋ค. ๊ฒฐ๊ตญ LLM์ ํ๋ จํ๊ธฐ ์ํ ๊ณ ์ ๋ ํ ํฐ์ ์งํฉ์ผ๋ก ํํ๋๊ธฐ ์ฝ๋ค.
2. ์์ํ
์ ์ค์ผ์ผ๋ง ๊ณผ์ ์ ํตํด y์ถ ๋ฒ์๊ฐ ์ค์์ง๋ง, ์ฐ์์ ์ธ ๊ฐ์ ์ด์ฐ์ ์ธ ๊ฐ์ผ๋ก ๋งคํ์ ํด์ค์ผํ๋ค. ์ด๋ ๊ฒ ํด์ผ, Context Token์ ์์ฑํ ์ ์๊ณ , ๊ฒฐ๊ตญ LLM์ ํฌ์ ํ ์ ์๋ค. ์ด๋ป๊ฒ ํ ์ ์์๊น?
๋ฐ์ด๋(Binning) ๋ฐฉ๋ฒ์ผ๋ก ์์ํํ๋ค.
์์ ๊ฐ์ ๋งจ ์ผ์ชฝ์ผ๋ก, ํฐ ๊ฐ์ ์ค๋ฅธ์ชฝ์ ๋ฌ์ ์ผ์ ํ ๊ฐ๊ฒฉ์ผ๋ก ๊ฐ์ ๋ฐฐ์น ํ๋ค. ์๋ ์์๋ 100๊ฐ๋ก binning ํ ๊ฒฐ๊ณผ๊ณ , ๊ฒฐ๊ตญ Token์ 1~100์ ๊ฐ์ ๊ฐ์ง๊ฒ ๋๋ค.
๐ก ๊ผญ ์์๋ฌ์ผํ ๊ฒ์, Chronos๋ temperature, day of weeks, week of years ๋ฑ์ ๋ณ์๋ฅผ ์ฐ์ง ์๊ณ , ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ฐ์๋ ํ ํฐ์ผ๋ก ๊ณ ๋ คํ๋ค. ์ดํ ์์ํ๋ฅผ ํตํด์ ์ง๊ด์ ์ด์ง๋ ์์ง๋ง, LLM์ ๋ชจ๋ธ์ ์ต์ํ์ผ๋ก ์ ์ฉํ ์ ์๊ฒ ๋ง๋ ๋ค.
3. ํ๋ จ
ํ๋ จ์ ํ ๋, ์ฃผ๋ณ bin์ ๊ฐ์ ์ฐธ์กฐํ๋ฉด์ ํ์ตํ๊ฒ ๋๋ค. ์ฆ, ‘๋ถํฌ’๋ฅผ ํ์ตํ๋ค. ๊ฐ์์ฒด์ ์ง์คํ๊ธฐ๋ณด๋ค, ๋ถํฌ์ ์ง์คํ๊ธฐ ๋๋ฌธ์ ์ ๋ก์ท ์์ธก์ ์ํด ์ฐ์ผ ๋ฏธ๋ ๋ฐ์ดํฐ ๊ฐ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ธฐ๋ํด๋ณผ ์ ์๋ค. ๋ถํฌ๋ฅผ ํ์ตํ๊ณ ์์ธก ํ๋ฅ ๊ฐ์ด ์ถ๋ ฅ์ด ๋๋๋ฐ, ์ ์๋ categorical cross entropy๋ฅผ ์์คํจ์๋ก ์ฌ์ฉํ๋ค. ์, ํ์คํ ๋ ํนํ ์ ๊ทผ๋ฒ์ด๋ค.
4. ์ถ๋ก
context token์ ์ ๋ ฅํ ํ ๋ชจ๋ธ์ ์ง์ ํ ์๋์ฐ๋ฅผ ๊ฐ์ง๊ณ ์ฐ์์ ์ผ๋ก token์ ์ถ๋ ฅํ๋ค. ์ดํ ‘์ญ์์ํ’,’์ญ์ค์ผ์ผ๋ง’์ผ๋ก ์๋๊ฐ์ผ๋ก ๋ฐํํ๋ค.
๐์ฌ๊ธฐ๊น์ง๊ฐ Chronos์ ๋ํ ์ค๋ช ์ด๋ค. ์ด! ์ ๊น, ์ ๋ก์ท ์์ธก์ด๋ผ๋ฉด, ๋ชจ๋ธ์ด ๋ค์ํ ํจํด์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ํ์ต ํด์ผํ์ง ์๋? ์ ๋ต! ๊ทธ๋ผ, ๋ฐ์ดํฐ ์ฆ๊ฐ์ ๋ํด ์์๋ณด์ ๐ (์ด๊ฒ๋ง ์๋ฉด ๋์ด์์, ์ข ๋ง ๋ ์ฝ์ด๋ด ์๋ค!)
5. ๋ฐ์ดํฐ ์ฆ๊ฐ
๊ณต๊ฐ ์๊ณ์ด ๋ฐ์ดํฐ์ ํ์ง๊ณผ ์์ ์์ฐ์ด์ ๋นํด ํ๋ถํ์ง ์๋ค. ๊ทธ๋์, ๋ฐ์ดํฐ๋ฅผ ํ๋ถํ๊ฒ ๋ง๋ค์ด์ค์ผ ํ๋๋ฐ, ์ ์๋ ‘TSMix, Kernel Synth’๋ฅผ ์ ์ํ๋ค.
TSMix
๊ฐ๋จํ๋ค. ์๋ณธ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํน์ ๊ธธ์ด๋ก ์ํ์ค ๋ฌด์์ ์ถ์ถ์ํ๋ค. ์ดํ ์ค์ผ์ผ๋งํ๊ณ convex combination์ ์ทจํ๋ค.
KernelSynth
๋์ฑ ํ์ฅํ๊ธฐ ์ํด ๊ฐ์ฐ์์ ์ฒ๋ฆฌ๋ฅผ ์ฌ์ฉํด์ ํฉ์ฑ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๋ง๋ ๋ค.
์ข ๋ ์ค๋ช ์ ๋ถํ๋ณด์๋ฉด, ์๊ณ์ด ๋ฐ์ดํฐ์์ ์ ํ, ์ฃผ๊ธฐ ๋ฑ KernelBank์์ ์ ์ํ๋ค. ์ดํ, ์ ํ ์ปค๋์ด ๊ณฑ์ ์ ์ฌ์ฉํด์ ์์ ๊ณผ ๊ฒฐํฉ๋์ด 2์ฐจ ํจ์ ํํ๊ฐ ๋๋ค. ๊ทธ ํ, ์ฃผ๊ธฐ(์. ๊ณ์ ํจํด)์ ์ถ๊ฐํด์ 2์ฐจ ํจ์์ ๊ฒฐํฉํ๋ค. ์ฌ๊ธฐ์ ์ป์ ์ต์ข ์ปค๋์ ํน์ ๋ถํฌ ๋ด์์ ์ํ์ ์์ฑํ๋ ๊ฐ์ฐ์ค ํ๋ก์ธ์ค์ ๋ฃ๊ฒ ๋๋ค.
Conclusion
5๊ฐ์ง๋ก ์ ๋ฆฌํด๋ดค๋ค.
1. Chronos๋ LLM ๋ชจ๋ธ์ ์ฌ์ฉํด์ ํ์ตํ๊ณ ์ถ๋ก ํ๋ค.
2. ์ด๋ฅผ ์ํด ์ฐ์์ ์ธ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ค์ผ์ผ๋ง ๋ฐ ์์ํ๋ก context token๋ก ๋ฐ๊ฟ์ค๋ค.
3. ๋ชจ๋ธ์ ๊ฐ ์์ฒด๋ณด๋ค ๋ถํฌ๋ฅผ ํ๋ จํด ์ผ๋ฐํ ์ฑ๋ฅ ํฅ์์ ๊ธฐ๋ํด๋ณผ ์ ์๊ฒ ํ๊ณ , categorical cross-entropy ์์คํจ์๋ฅผ ์ฌ์ฉํด ํ๋ จํ๋ค.
4. ์ต์ข ์ ์ผ๋ก ์ป์ context token์ ์ญ์์ํ ๋ฐ ์ญ์ค์ผ์ผ๋ง์ผ๋ก ์๋ณธ ๋ฐ์ดํฐ๋ฅผ ์ป๋๋ค.
5. ์ ๋ก์ท ์์ธก์ ์ํด ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ ํ์๊ฐ ์๋๋ฐ, ๋ฐ์ดํฐ ์ฆ๊ฐ(TSMix, KernelSynth) ๊ธฐ๋ฒ์ ์ฌ์ฉํด ์ฆ๊ฐํ๋ค.
My opinion
์ด์ ์๋ LLM์ผ๋ก ์๊ณ์ด ๋ฐ์ดํฐ์ ์ ์ฉํ๋ ๊ฒ๋ค์ ๋ด์์ ์ด๋ ต์ง ์๊ฒ ์ฝ์ ์ ์์๋ค. ๊ทธ๋ฌ๋, ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฒ์ ํ์คํ๊ฒ ์ดํดํ๊ธฐ ์ด๋ ค์ ๋ค. ํนํ KernelSynth๊ธฐ๋ฒ์ ์ถ์์ ์ผ๋ก๋ง ์ดํดํ ์ ์์ง, ๊ตฌ์ฒด์ ์ผ๋ก ์ ๋ชจ๋ฅด๊ฒ ๋ค. ์ด ๋ถ๋ถ์ ๋ฐ๋ก ๊ณต๋ถํด์ผ๊ฒ ๋ค.