ML4T 3rd Edition (Chapters Summary)

🇹🇭 ภาษาไทย

เอกสารหน้านี้คือการรวบรวมเนื้อหาและ Learning Objectives จากบทที่เหลือของหนังสือ Machine Learning for Trading (3rd Edition) จำนวน 24 บท โดยแบ่งออกเป็น 6 ส่วนหลัก (Parts) ตามวงจรการพัฒนาระบบ Algorithmic Trading (The Quant Workflow) เพื่อให้เห็นภาพรวมตั้งแต่ Data จนถึง Live Trading

Part 1: Foundations & Frameworks

(Chapters 1, 6, 7, 27)

  • Core Philosophy: “The Process Is Your Edge” อัลฟ่าไม่ได้มาจากโมเดลใดโมเดลหนึ่ง แต่มาจากกระบวนการวิจัยที่แข็งแกร่ง
  • Defining the Task: การออกแบบโจทย์ให้ถูกต้อง (Labeling, Horizon, Feasibility) และควบคุมปัญหา Search Bias ผ่าน Trial Logging
  • The Systematic Edge: การปรับเปลี่ยนกรอบความคิดเป็น Systematic Mindset, การจัดการ Bias และเส้นทางอาชีพ Quant ยุคใหม่ที่ต้องเป็น T-shaped

Part 2: The Data Universe

(Chapters 2, 3, 4, 5)

  • Data Engineering: การทำงานกับ Market, Fundamental, และ Alternative Data โดยเน้นย้ำเรื่อง Point-in-Time Correctness เพื่อป้องกัน Lookahead bias
  • Microstructure: การทำความเข้าใจ Order Book, Market Regimes, และ Data Quality Checks
  • Synthetic Data: การใช้ข้อมูลสังเคราะห์เพื่อแก้ปัญหา Data Scarcity ในการเทรด แต่ต้องระวังปัญหา Overfitting เข้ากับตัว Generator

Part 3: Feature Engineering

(Chapters 8, 9, 10)

  • Financial Features: การสร้าง Alpha Factors จากข้อมูล, แยกแยะ Signal ออกจาก State Variables, และลด Degrees of Freedom
  • Text & Model-Based Features: การใช้ NLP (Transformers) เพื่อดึง Sentiment จากข่าว/เอกสาร SEC, และใช้ Model (เช่น Volatility Filters, Regime probabilities) สร้างเป็น Features ส่งต่อให้โมเดลหลัก

Part 4: ML Models for Trading

(Chapters 11, 12, 13, 14, 21, 23)

  • The ML Pipeline: การตั้งค่า Walk-forward validation, จัดการ leakage, และแปลผลด้วย SHAP
  • Advanced Models: การเลือกใช้ระหว่าง Gradient Boosting (XGBoost, LightGBM) สำหรับข้อมูล Tabular และ Deep Learning (Transformers, PatchTST) สำหรับ Time Series
  • Latent Factors & RL: การสกัด Risk Factors ด้วย PCA/Autoencoders, การใช้ Reinforcement Learning สำหรับปัญหา Execution/Hedging, และการใช้ Knowledge Graphs ดึงความสัมพันธ์

Part 5: Strategy, Portfolio & Risk

(Chapters 16, 17, 18, 19, 20)

  • Strategy Synthesis: IC (Information Coefficient) อย่างเดียวไม่พอ ต้องดูว่า Signal ทนต่อ Trading Costs ได้หรือไม่
  • Portfolio & Risk: การทำ Mean-Variance Optimization, Kelly Sizing, การวัด Risk ด้วย VaR/CVaR, Drawdown analysis และการตั้งระบบ Kill Switches
  • Transaction Costs: การโมเดลค่าธรรมเนียม Slippage/Impact ให้เสมือนจริงใน Backtest

Part 6: Production & Operations

(Chapters 25, 26)

  • Live Trading Systems: การสร้างสถาปัตยกรรมที่ “Run unchanged” ทั้งใน Backtest และ Live ป้องกันความคลาดเคลื่อน (Divergence)
  • MLOps: ระบบ Monitoring สำหรับตรวจสอบ Data Drift, Concept Drift, พร้อมระบบ Circuit Breakers หลายระดับเพื่อป้องกันความเสียหายในโลกจริง

🇬🇧 English

This page synthesizes the Learning Objectives from the remaining 24 chapters of Machine Learning for Trading (3rd Edition). The content is organized into 6 logical parts following the quantitative trading workflow, from data engineering to production MLOps.

Part 1: Foundations & Frameworks

(Chapters 1, 6, 7, 27)

  • Core Philosophy: “The Process Is Your Edge.” Alpha stems from a rigorous research process, not just isolated models.
  • Task Definition: Translating financial hypotheses into formal learning tasks, preventing search bias, and separating exploration from confirmation.
  • The Systematic Edge: Adopting a systematic mindset to counter cognitive biases and navigating modern quant career paths as a T-shaped professional.

Part 2: The Data Universe

(Chapters 2, 3, 4, 5)

  • Data Quality: Navigating market, fundamental, and alternative datasets with strict adherence to Point-in-Time Correctness.
  • Microstructure: Understanding market mechanics, order books, and L1/L2/L3 data constraints.
  • Synthetic Data: Utilizing classical and generative simulations to counter data scarcity, while mitigating the risk of overfitting to the generator.

Part 3: Feature Engineering

(Chapters 8, 9, 10)

  • Financial Features: Designing structurally sound alpha factors, separating signals from state variables, and controlling search degrees of freedom.
  • Text & Model Extraction: Leveraging Transformer-based NLP for textual sentiment and using intermediate models (filtering, volatility) to engineer advanced features.

Part 4: ML Models for Trading

(Chapters 11, 12, 13, 14, 21, 23)

  • The Pipeline: Establishing walk-forward validation and interpreting linear/non-linear models via SHAP.
  • Advanced Models: Deploying Gradient Boosting Machines (XGBoost/LightGBM) for tabular data and modern sequence models (Transformers) for time-series.
  • Latent Factors & RL: Utilizing PCA/Autoencoders for risk extraction, Reinforcement Learning for order execution, and Knowledge Graphs for relational signals.

Part 5: Strategy, Portfolio & Risk

(Chapters 16, 17, 18, 19, 20)

  • Strategy Evaluation: Moving beyond raw Information Coefficient (IC) to evaluate signal survival post-execution costs.
  • Portfolio Construction: Applying Mean-Variance optimization, Kelly sizing, and setting strict risk controls (VaR, CVaR, Drawdown constraints).
  • Transaction Costs: Accurately modeling market impact and slippage to ensure backtest realism.

Part 6: Production & Operations

(Chapters 25, 26)

  • Live Systems: Designing dual-mode event-driven architectures where deterministic strategy logic runs seamlessly across backtest, paper, and live trading.
  • MLOps: Implementing continuous monitoring for data/concept drift, and deploying multi-level circuit breakers to safeguard live capital.