일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 집값예측
- 아파트가격비교
- 빅데이터
- 판다스
- 부동산 집값 예측
- 부동산 저평가 지역
- 리치고
- 빅데이터분석
- pycaret
- seaborn
- KDT
- pandas
- 주피터노트북
- >>>>>>HEAD
- 데이터시각화
- =======
- 부동산
- 크롤링
- 네이버
- 네이버데이터랩
- 실거래가분석
- 데이터랩
- LF will be replaced by CRLF the next time Git touches it
- 파이썬
- 파이캐럿
- 부동산저평가
- 부동산 저평가
- 데이터분석
- 네이버트렌드
- python
- Today
- Total
20대 마무리
[#6] 시계열 데이터 분석 - 모델 선정 (LSTM) 및 변수 설정 본문
이전에 ARIMA와 FBprophet으로 부동산 데이터를 잘 예측하지 못하는 것을 확인한 후, 논문을 참고하여 새로운 모델인 LSTM 모델을 선정했습니다.
LSTM 모델은 다른 모델과 다르게 다른 변수들을 추가할 수 있고, Epoch과 학습률을 조정할 수 있다는 점에서 선택했습니다.
추가로 LSTM 모델을 부동산 데이터 예측에 적용하는 과정에서, 부동산 데이터가 상당히 많은 변수들의 영향을 받는다는 점을 인지하고 여러가지 거시경제 변수들을 추가하였습니다.
변수들은 기존에 유사서비스 분석에서 소개한 '리치고' 모델에서 사용했던 변수들과, 여러가지 부동산 시계열 데이터 예측 논문들에서 사용한 변수들을 참고했습니다.
사용한 거시경제변수
-MMI(광공업지수)
-CPI(소비자물가지수)
-대출금리
-환율
-M2(통화량)
-주가
-전세가격지수
-건축허용면적
-거래량
선정한 거시경제변수들을 기존의 가격지수 데이터 형태와 맞게 월별 데이터로 뽑아서, 같은 형식의 데이터 프레임으로 정리했습니다.
이후 해당 변수들을 추가하여 LSTM을 통해 예측한 결과입니다.
ARIMA와 FBprophet에서 예측한 결과와는 확연히 좋은 퍼포먼스를 보이는 것을 확인할 수 있습니다.
하지만 어느정도의 경향성만 따라갈 뿐, 각각의 시기에서는 큰 RMSE값을 보이는 곳이 많고, 예측 알고리즘으로 적용하기에는 아직 무리가 있어보입니다.
부동산 데이터의 가격지수 변화에 영향을 주는 어떤 변수를 추가해야 하는데, 이에 대해서 부동산의 지역성에 대한 문제를 반영할 방법을 강구하게 됩니다.
'PROJECT > 부동산 저평가 지역 예측' 카테고리의 다른 글
[#9] 시계열 데이터 분석 - 양방향 LSTM (0) | 2022.06.07 |
---|---|
[#7] 시계열 데이터 분석 - 클러스터링 (0) | 2022.06.07 |
[#5] 시계열 데이터 분석 - 모델 선정 (ARIMA vs FBprophet) (0) | 2022.06.06 |
[#4] 데이터 수집 - 경기도 부동산 가격지수 (0) | 2022.06.06 |
[#3] 데이터 수집 - scope 줄이기 (0) | 2022.06.06 |