간단하고 강력하게 수정함.
종목의 1분봉 데이터를 수집 -> 피처 데이터 1,5,15,30,60 생성 -> 라벨링 데이터 1,5,15,30,60 생성 -> XGBOOST 지도학습 데이터 생성
이렇게 바꾼 이유는 강화 학습은 AI에게 어떻게든 수익을 내봐! 라고 방치하는 느낌이면 XGBoost 지도학습은 AI에게 이런 차트 상황(피처)일 때 15분 뒤에 가격이 오를지(라벨)를 맞혀봐!라고 명확한 문제를 주는 것.
이렇게 하면 어떤 타임프레임이 예측에 가장 기여했는지, 확률 기반 베팅 및 비중 조절, 빠른 피드백이 가능함.
매매 방법 2가지 후보(바뀔 가능성 높음)
1. 멀티 타깃(Multi-Target) 모델링
여러 개를 다 예측하게 만들 예정.
- 구조: 한 번의 학습으로 "5분 뒤 확률", "15분 뒤 확률", "30분 뒤 확률"을 각각 독립적으로 출력하게 함.
- 활용: 시스템이 "5분 뒤 상승 확률은 낮은데, 60분 뒤 상승 확률은 매우 높네?"라고 판단하면 조금 더 긴 호흡의 스윙 매매로 대응할 수 있음.
2. 라벨링 데이터 자체를 피처로 활용
m01, m05, m15, m30, m60의 라벨링을 모두 생성한 뒤, 이 중에서 가장 '예측 성능(Accuracy)'이 좋게 나오는 시간대를 데이터 분석을 통해 역으로 찾아낼 수 있음.
나중에 백테스팅을 통해 결정해야 할 듯
--------------------------------------------------------------
시계열 모델 교체
📊 XGBoost vs LightGBM (1분봉 대용량 환경 기준)
| 구분 | XGBoost | LightGBM | 승자 |
| 메모리 사용량 | 상당히 높음 (OOM 터질 확률 높음) | 매우 적음 (메모리 최적화 압도적) | LightGBM |
| 학습 속도 | 느림 (hist 모드를 써도 무거움) | 빠름 (XGB 대비 3~5배 이상) | LightGBM |
| 트리 성장 방식 | Level-wise (층별로 균형 있게 성장) | Leaf-wise (오차를 가장 많이 줄이는 잎부터 파고듦) | 상황에 따라 다름 |
| 과적합 (Overfitting) | 방어력 좋음 | 데이터가 적을 땐 쥐약이나, 지금처럼 데이터가 억 단위로 많으면 오히려 패턴(수익률)을 훨씬 날카롭게 잡아냄 | LightGBM |
| NaN/범주형 처리 | 지원하지만 추가 설정 필요 | 네이티브로 완벽하고 매우 빠르게 지원 | LightGBM |
= LightGBM
'AI 주식 자동매매' 카테고리의 다른 글
| AI 트레이딩 시스템 의사 결정 엔진 만들기 (1) | 2026.04.28 |
|---|---|
| AI 주식 트레이딩 개발(퀀트 트레이딩) 데이터 관리 수정 사항 기록(DuckDB) (0) | 2026.04.26 |
| AI 트레이딩 시스템 설계 변경(지도학습, 강화학습) (0) | 2026.04.22 |
| 유니버스 셀렉터 + Rule Scoring 통합 설계도(DB 포함) (0) | 2026.02.01 |
| 수집 스샷 (0) | 2025.12.25 |