Causal Machine Learning

🇹🇭 ภาษาไทย

Causal Machine Learning (อ้างอิงจากบทที่ 15 ของหนังสือ Machine Learning for Trading) เป็นโครงร่างเนื้อหาที่มุ่งเน้นการประยุกต์ใช้ Causal Inference ในการเทรดด้วยอัลกอริทึม เพื่อหาความสัมพันธ์เชิงสาเหตุที่แท้จริง แทนที่จะเชื่อแค่ความสัมพันธ์เชิงสถิติ (Correlation) เพียงอย่างเดียว

ประเด็นสำคัญ (Key Takeaways)

  1. แยกแยะ Signal ออกจาก Causal Effect: เป้าหมายหลักของการทำ Causal ML คือการแยก “Predictive Signal” (สัญญาณที่บังเอิญทำนายได้) ออกจาก “Causal Effect” (ผลกระทบที่เป็นเหตุเป็นผลจริงๆ) เพื่อหลีกเลี่ยงตัวแปรแทรกซ้อน (Confounding variables) ที่มักพบในตลาดการเงิน
  2. เครื่องมือ Causal Discovery ทรงพลัง: แนะนำการใช้โมเดลเฉพาะทาง เช่น Double Machine Learning (DML) สำหรับประมาณการผลกระทบจากตัวแปรแบบต่อเนื่อง และ Bayesian Structural Time-Series (BSTS) เพื่อใช้วัดผลกระทบจากเหตุการณ์ (Discrete events) ต่อราคาหรือพอร์ตโฟลิโอ
  3. การค้นหาโครงสร้างเชิงสาเหตุ: มีการใช้วิธีการใหม่ๆ เช่น PCMCI, NOTEARS หรือ VAR-LiNGAM เพื่อพยายามสร้างแผนภาพเชิงสาเหตุ (DAGs) จากข้อมูล Time Series
  4. ความสำคัญของ Validation: ในการวิเคราะห์เชิงสาเหตุ การตรวจสอบ (Validation) สำคัญมาก โดยแนะนำให้ใช้ Placebo tests, Sensitivity analysis, และ Subset-stability checks เพื่อรับประกันความน่าเชื่อถือของโมเดล

🇬🇧 English

Causal Machine Learning (based on Chapter 15 of Machine Learning for Trading) outlines the application of causal inference in algorithmic trading. It focuses on identifying true causal relationships rather than relying solely on statistical correlations.

Key Takeaways

  1. Distinguishing Signal from Effect: The primary goal is to separate pure “Predictive Signals” from genuine “Causal Effects” to avoid being misled by confounding variables inherent in financial markets.
  2. Powerful Causal Tools: Introduces methods like Double Machine Learning (DML) for estimating the impact of continuous treatments, and Bayesian Structural Time-Series (BSTS) for measuring the impact of discrete events on time-series data.
  3. Causal Discovery Methods: Explores modern techniques like PCMCI, NOTEARS, and VAR-LiNGAM to uncover candidate causal structures (DAGs) from financial time-series data.
  4. Rigorous Validation: Emphasizes that causal claims require strict validation tools, including Placebo tests, Sensitivity analysis, and Subset-stability checks, to ensure the findings are robust and not merely spurious correlations.