AI 주식 자동매매

AI 트레이딩 시스템 설계 방향 수정

아이띠불로구 2026. 4. 22. 19:53

간단하고 강력하게 수정함.

종목의 1분봉 데이터를 수집 -> 피처 데이터 1,5,15,30,60 생성 -> 라벨링 데이터 1,5,15,30,60 생성 -> XGBOOST 지도학습 데이터 생성

 

이렇게 바꾼 이유는 강화 학습은 AI에게 어떻게든 수익을 내봐! 라고 방치하는 느낌이면 XGBoost 지도학습은 AI에게 이런 차트 상황(피처)일 때 15분 뒤에 가격이 오를지(라벨)를 맞혀봐!라고 명확한 문제를 주는 것.

 

이렇게 하면 어떤 타임프레임이 예측에 가장 기여했는지, 확률 기반 베팅 및 비중 조절, 빠른 피드백이 가능함.

 


 

매매 방법 2가지 후보(바뀔 가능성 높음)

1. 멀티 타깃(Multi-Target) 모델링

여러 개를 다 예측하게 만들 예정.

  • 구조: 한 번의 학습으로 "5분 뒤 확률", "15분 뒤 확률", "30분 뒤 확률"을 각각 독립적으로 출력하게 함.
  • 활용: 시스템이 "5분 뒤 상승 확률은 낮은데, 60분 뒤 상승 확률은 매우 높네?"라고 판단하면 조금 더 긴 호흡의 스윙 매매로 대응할 수 있음.

2. 라벨링 데이터 자체를 피처로 활용

m01, m05, m15, m30, m60의 라벨링을 모두 생성한 뒤, 이 중에서 가장 '예측 성능(Accuracy)'이 좋게 나오는 시간대를 데이터 분석을 통해 역으로 찾아낼 수 있음.

 

나중에 백테스팅을 통해 결정해야 할 듯

 

--------------------------------------------------------------

 

시계열 모델 교체

📊 XGBoost vs LightGBM (1분봉 대용량 환경 기준)

구분 XGBoost LightGBM 승자
메모리 사용량 상당히 높음 (OOM 터질 확률 높음) 매우 적음 (메모리 최적화 압도적) LightGBM
학습 속도 느림 (hist 모드를 써도 무거움) 빠름 (XGB 대비 3~5배 이상) LightGBM
트리 성장 방식 Level-wise (층별로 균형 있게 성장) Leaf-wise (오차를 가장 많이 줄이는 잎부터 파고듦) 상황에 따라 다름
과적합 (Overfitting) 방어력 좋음 데이터가 적을 땐 쥐약이나, 지금처럼 데이터가 억 단위로 많으면 오히려 패턴(수익률)을 훨씬 날카롭게 잡아냄 LightGBM
NaN/범주형 처리 지원하지만 추가 설정 필요 네이티브로 완벽하고 매우 빠르게 지원 LightGBM

= LightGBM