數據不會說謊?但它常誘導你得出錯誤的因果推論

因果推論

紮實的數據品質,並不保證產出具備實戰價值的真洞察

為了進一步優化投資成果,我們打算引入擇時交易指標來動態調節投資部位。因為剛好手邊有一篇關於以 GDP 成長率作為擇時依據的學術論文有不錯的結果,因此我就請同事以這篇論文為依據,以「GDP 成長率能否作為股市擇時指標」為主題來進行研究。
這位同事表現得非常專業,精準地處理了數據滯後性與觀測期偏差等所有技術細節,避開了回測中最棘手的「前視偏誤」問題。如此扎實的數據品質,理當可以產生一份可信的研究報告。

同事的回報是:根據 GDP 調整比重後,波動明顯降低,夏普值略優於大盤,因此得出的結論認為 GDP 是一個能有效降低風險的參考依據。

洞察的價值:看穿「多此一舉」的複雜化作業

一般來說,投資成果的優化不外乎是在風險不變的前提下,提高投資報酬;或是在報酬不變的前提下,降低投資風險。而同事的結論明顯不符合這個期待,只是單方面根據風險降低,推論實驗的變因(GDP)是有效的因子。我並沒有馬上指出他的失誤,而是向他提問:「如果要讓風險與報酬同步下降,有沒有更直觀的方法?」他很快反應過來,並說出:「只要減少實際投入市場的資金比重就行了。」沒錯,分母不變(本金不變)的情況下,參與市場的風險資金變少,本來就會降低波動(風險)和報酬。

這就是問題的核心:這個看似有效的模型(根據 GDP 的數值低買高賣調節投資部位), 其實只是扮演了「讓資金閒置」的角色。如果一個指標真的具備價值,應該要能顯著提升夏普值(Sharpe Ratio),而不是靠犧牲報酬來降低曝險而讓風險下降。如果效果只是持平,我們大可直接減碼就好,透過 GDP 數據來調節反而還要額外承擔模型失靈的風險。

主管的決策思維:研究的本質是因果,而非關聯

即便是資深同仁,也常在不經意間被研究主題制約,當研究主題設定為「GDP」時,大腦會慣性地在「GDP」與「最終結果」之間強行建立連結。因此決策時要避免被「研究的主題」不小心產生錨定效應,並且更強調「邏輯上的因果鏈」,以這次研究為例,我後續提給同事的建議就是「保持懷疑,才有機會看見更純粹的真相」,時時提醒自己: 「這個結論,可以有邏輯的解釋因果關係嗎?還是只有統計上的相關性而已。」避開這種心理慣性,我們才能在繁雜的數據中,做出真正正確的決策。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端