Skip to content

Competition project for classifying soaring stocks using XGBoost and stacking-based ensemble with advanced feature selection and threshold tuning.

Notifications You must be signed in to change notification settings

ILaskira/Soaring-Stock-Prediction-Challenge

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 

Repository files navigation

🚀 Soaring Stock Prediction

本專案致力於建構一套能預測「潛在飆股(soaring stocks)」的機器學習系統,重點在於資料處理策略與模型設計。 📘 詳細資料處理與建模流程請見 🔗 完整建模與分析流程(competition_details.md)

⚠️ 注意:因應主辦單位規範,原始資料無法公開,以下僅說明技術流程與建模方法。


🔧 專案流程

1. 特徵工程與變數篩選

  • 結合領域知識初步篩選出重要變數
  • 運用多種變數選擇方法,從上萬個特徵中精選出 23 個關鍵變數
    相較於多數參賽者使用上百變數,我們以約十分之一的特徵達成相似甚至更佳的預測表現

2. 資料前處理

  • 處理遺失值:採用 KNN 補值、中位數填補等策略
  • 類別不平衡處理:使用 SMOTE、ADASYN 等重抽樣技術改善樣本比例失衡問題

3. 建模與調參

  • 主模型:XGBoost / LightGBM
  • 調參策略:Grid Search CV,同時設定正則化參數以降低過擬合風險

4. 模型融合與預測

  • 採用 Stacking 方法進行多模型融合
  • 根據預測機率與風險排序篩選潛在飆股

✅ 成果概述

我設計了一套具備高度策略性的資料處理與建模流程,具體特色如下:

  • ⚙️ 多階段特徵選擇策略:結合 XGBoost 與 Permutation Importance,精準篩選具穩定預測力的變數
  • 🔀 精簡模型 × 差集模型設計:建構變數兩兩互斥的多個模型,提升 Stacking 多樣性與效果
  • 🧠 Stacking 融合策略:以簡潔的 meta-model(Logistic Regression)整合異質模型,強化整體表現
  • 🔍 特徵完整性驗證:訓練反向模型驗證未選變數之預測貢獻,佐證特徵選擇具高度覆蓋率與解釋力

📊 最終成果

Public Macro F1 Private Macro F1 Leaderboard 排名
0.8366 0.8262 Top 3%

🎯 模型整體兼顧效能、效率與解釋性,展現出良好的實務應用潛力。

🔗 參賽證明(飆股比賽參賽證明)


📖 延伸閱讀與完整報告

更多技術細節、資料處理流程、模型設計邏輯與分析策略,請參考我們的完整技術說明文件:

🔗 完整建模與分析流程(competition_details.md)

包含各階段實作邏輯、參數選擇依據、驗證策略與最終成效分析。

About

Competition project for classifying soaring stocks using XGBoost and stacking-based ensemble with advanced feature selection and threshold tuning.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published