過去在很多本書裡面, 都看到厚尾這個名詞. 以前, 我始終搞不清楚厚尾和 "長尾效應" 是不是同一件事?
現在我總算是比較清楚了. 厚尾 (fat tail) 是指統計上的特性. 如果一個分布的峭度 (kurtosis) 大於常態分佈 (normal distribution), 它就叫做 Leptokurtic. 這表示有比較多的機會, 這個分佈會在遠離 mean 的地方有值.
因此我們可以說厚尾 (fat tail) 可以導致明顯的長尾 (long tail), 但是 Chris Anderson 所提出的長尾效應對峭度很低的分佈仍然成立, 只要遠離 mean 的地方一直有值, 累積起來還是一個長尾.
反之, 若是峭度比常態分佈還小 (< 3, 因為常態分佈的峭度恰好是 3), 就叫做 Platykurtic, 它會有比較多的值靠近於 mean. 這是搞財務的人比較喜歡的狀況. 因為這表示他們的估計出槌的機會比較低.
另外還有機會看到一尾 (one tailed) 和兩尾 (two tailed) 的說法. 因為財務產品會估計他們的獲利的信心度. 以常態分佈為例, 在信心度 95% 的情況下, 獲利不會超過 1.96 倍的標準差, 或是低於 -1.96 倍的標準差, 此時考慮的是過高或過低兩尾的信心度.
當然, 客戶可能不介意獲利超過 1.96 倍的標準差, 畢竟多賺沒啥不好, 此時只要考慮一尾的信心度就好. 在同樣的狀況下, 賣方可以誇稱他有 97.5% 的信心度, 不會虧到 -1.96 倍標準差下.
超過幾倍標準差這個東西, 叫做 z-value, z-score, 或是 z-statistic. 統計值先減掉統計的 mean, 再除以 standard deviation 就可以得到.
z = (x – µ) / std
對了, 峭度的計算忘了講, 他是第四階的 moment.
kurtosis = summation ((xi – u)4) / (N * std4 )
excess kurtosis = kurtosis – 3
因為 3 就是常態分佈的峭度, 以此可做為峭度高低的分野.