如何利用樣本做估計

假設我想知道整家公司的平均體重, 那麼只用一個部門來估計準不準呢? 答案是不準, 因為我們明明知道庶務二課或是秘書課的人都不胖, 所以據此估計出來 “滿帆商事" 的平均體重就會有點誤差. 這不需要數學好就可以知道.

反之, 如果根據一把抓起的豆子重量, 來估計一整桶豆子的重量範圍, 相對就比較準確了.

假設一把抓的豆子總共有 n = 100 顆, 平均數 m = 1g, 標準差 µ = 0.1g. 若整桶豆子約有 N = 10,000 顆, 可計算出樣本誤差 D = 1.96 x µ / sqrt(n) = 1.96 x 0.1 / 10 = 1.96 x 10-2.

為啥是 x 1.96 呢? 因為假設重量為 N(0,1) 的常態分佈, 在 95% 的範圍內, 標準差為 1.96. 當樣本數很大, 樣本誤差趨近於 0; 反之樣本數為 0 的時候, 樣本誤差趨近於無限大. 如果只有一個樣本, 樣本誤差大約是 2 倍 (1.96 倍) 標準差.

[本圖取自 WIKI 標準差]

換言之, 我們認為那桶豆子的平均重量為 m – D ~ m + D 之間, 也就是 1 – 1.96 x 10-2 ~1 + 1.96 x 10-2 或 0.9804~1.0196 g.

或曰, 怎麼和整桶豆子數量級 N 無關? 如果以井觀天, 以蠡測海, 也是用這個公式嗎? 非也, 這時候樣本誤差 D  還要乘上一個修正值 K = sqrt ((N – n) / (N – 1)).

把 Dnew 重寫一次得到Dnew = 1.96 x µ x K / sqrt (n).

直覺地說, 當 n 趨近於 N, 表示我一把已經把豆子抓光了, 那麼誤差應該修正為 K = 0 與 Dnew = 0. 因為 Dnew = 1.96 x µ x K / sqrt(n) .

如果真的由井底蛙來估計天空的大小, N >> n 將使得 K = 1. 因此我們知道 K 介於 0~1 之間,

為了抓一個手感, 我們假設 K = 0.49 的話, 則 N – n = 0.7 x (N -1), 0.3N = n – 0.7. 假設 N 和 n 都比較大, 那麼 n > 0.3N 是必須的. 也就是說, 想要讓修正值 K < 0.5, 那麼好歹得一把抓起 3 成的豆豆.   

以上整理自 “真希望老師這樣教統計".

變量之分析

和多變量分析相對的, 是較簡單的單變量分析, 線性迴歸分析即為其中的一種. 假設我們有一群 X 和一群 Y. 而兩者有這樣的線性關係:

Y = a + bX

那麼只要算出 a 和 b, 我們就可以用 X 求 Y, 或是用 Y 求 X 了. 計算 a, b 的步驟如下:

1. 計算 X 與 Y 的平均值 XY.

2. 計算 X 的離均差平方和. SUM (Xi X)2

3. 計算 Y 的離均差平方和. SUM (Yi Y)2

4. 計算 X 的離均差 x Y 的離均差的和 = 離均差交乘積

SUM ((Xi X) x (Yi Y))

5. 計算

b = 離均差交乘積 / X 的離均差平方和

= SUM ((Xi X) x (Yi Y)) / SUM (Xi X)2

a = Y – b x X

至於多變量要怎麼分析呢? 最簡單的方式就是用 Excel.

以上摘自 "真希望老師這樣教統計", 作者是菅民郎和土方裕子.

我讀 «靈劍» + «天觀雙俠»

上週去 Costco 的時候剛好看到 “靈劍" (全 3 卷) 和 “天觀雙俠" (全 4 卷), 趁著剛看過 “神偷天下" 的熱情, 就一口氣把鄭丰的全部作品買回來研讀.

正如網路上的評價, “靈劍" 比較難被讀者接受, 但 “天觀雙俠" 確實是一篇罕見的傑作. 鄭丰女士能夠以 “天觀雙俠" 獲得全球華文新武俠小說大賽的首獎, 真的是實至名歸.

這三本作品發表的順序上, 原本和故事發生的順序相反. 不過我既然同時有了這三套書, 正好可以按照故事發生的先後順序來閱讀, 首先是 “神偷天下", 接著是 “靈劍", 最後才是 “天觀雙俠".

靈劍的故事是描述 “正教" 與 “火教" 的對抗史. 這次故事的主角凌霄是一個有特異功能的人, 他可以和動物說話, 又能夠看見別人的未來. 所以咧, 不能接受武俠小說變成神怪小說的人應該沒辦法受得了第一卷的故事.

第一卷故事結束之後, 男主角和對頭 – 火教教主同時失去特異功能. 不過它還是沒有變成一般的武俠小說, 因為作者很明顯地對於篤信宗教卻強烈排它的行為痛加駁斥. 只要把書中的火教教徒口中 “天神" 代換為其他宗教的 “神", 保證那些教徒看得似曾相似, 七竅生煙. 故本書不討喜也是很正常的.

因為這些彆扭的地方, 本書的可讀性的確是低了點. 然而, 把本書當作 “天觀雙俠" 的前傳, 也算是值得一讀了. 這次登場的歷史人物主要是王守仁和寧王. 火教利用寧王造反, 而男主角則協助王陽明平亂. 可惜我看了 “回到明朝當王爺" 之後, 胃口變大了一點. 還挺希望江南四大才子可以在本書登場…, 可惜他們沒出現, 哈!

天觀雙俠的主角是 “靈劍"  男主角凌霄, 男配角成達, 女主角燕龍, 加上反派男主角 – 火教教主段獨聖的下一代.  雙俠的特色是一次寫兩個主角 – 凌昊 和趙. 雖然我先前覺得鄭丰女士在 “神偷天下" 刻劃人物不夠生動. 不過在 “天觀雙俠" 一書中卻大大改觀. 原來她可以一次寫出這麼多有個性的角色. 

這次的故事比較正統, 沒有太奇怪而不能消化的神通和咒術, 主角的蹤跡也東到朝鮮, 西到藏人家, 北到塞外. 連戚繼光, 嚴嵩, 織田信長都編進了小說家言. 其中在提到青幫的時候, 描述的 “切口" 與 “海底" 都活靈活現, 彷彿有青幫的人提供第一手資料. 即使寫得不對都像是真的. 可見作者對這本書相當用心.

據作者在書中的附錄中說的, 她花了八年左右的時間才斷斷續續完成 “天觀雙俠". 原本覺得出版無望, 才會放到網路上供大家欣賞. 想不到 2006 年一舉成名, 獲得極高的評價, 也超出了作者自己的預期. 當然我們希望她愈寫愈好. 既然金庸前輩沒有新作了, 不能讓武俠小說就此走入孤寂才好.

我讀 «神偷天下»

神偷天下的作者鄭丰是陳履安先生的女兒, “2006武俠小說大賽冠軍", 有 “女版金庸" 的稱號. 神偷天下是套新書, 一共三卷, 每本 200 NTD.

本書描述以偷盜為業的男主角楚瀚, 學成頂級輕功 “蟬翼神功" 和 “胡家取術" (也就是竊術) 後, 發生了類似韋小寶以假太監混入宮中, 進而左右了明朝國運的神奇遭遇. 所謂竊鉤者誅, 竊國者侯. 當小偷當到把天下給偷了, 這就是本書的主軸和賣點的所在.

既然作者被稱為女版金庸, 讀者不免要比較一下兩人的異同. 我覺得相同的地方在於他們同樣把武俠與歷史融和. 雖然近來出現大量以明朝為背景的小說, 但是其它人多不談武俠. 畢竟珠玉在前, 先入為主; 前人的故事系統對後進者的壓力相當大. 舉例來說, 任何人想把丐幫寫成壞人, 難度就未免太高了.

書中對於人物刻劃算是有型有款, 可惜某些重要人物的塑造, 感覺還是不夠到位. 比方說女主角百里緞的行徑常常無法預測, 這個變數固然增強了故事的張力. 然而, 為什麼她會有這種個性並沒有交代, 一個人物沒有根, 只有枝葉, 我想讀者很難對她產生深刻的共鳴.

另外, 故事的轉折雖然有趣, 但是有些小地方不太合情理. 我想, 如果鄭丰小姐多寫幾本書後應該就會更進步吧! 畢竟武俠故事本來就是虛構的. 想要讓它像真的, 就要處處自圓其說. 只要圓謊圓得好, 就是不錯的小說.

這本書基本上還滿吸引我的, 結局也出人意表. 呃, 還沒看過的人都不想知道故事大綱對吧! 那麼我只稍稍暗示一下. 笑話中傻女婿做過這樣一首詩: “岳父岳母圓又圓, 少了一個缺半邊. 大家哭得亂糟糟,…", 缺的那一句就是大結局了.

[note] 楚瀚被三家村同輩打傷後, “若不撐著拐杖, 就寸步難行", 然而他竟然還練功不輟~~~

我讀 «投行分析師的叛逆宣言» (下)

本書的第三章 “賺錢就是硬道理" 中, 作者點評了幾個行業的投資價值.

1 電訊業 成長有限 
2 電力業  中國電力業不容易賺錢
3 航空業  虧錢容易賺錢難 
4 金融業  槓桿大, 景氣恢復時漲幅大 
5 基礎建設  作者最愛, 風險小, 透明度高, 管理容易 
6 製造業  軍備競賽, 品牌脆弱
7 房地產業  往往高估土地價值 
8 食品和飲料業  競爭太激烈 
9 零售業  護城河薄弱
10 燃氣, 供水, 汙水處理  作者最愛 
11 農業股  看好農業, 但農民正在往城市移轉 
12 啤酒業  幾百家酒廠都賺不到錢, 只要提高售價, 就有人加入市場 

在本章中, 作者提到幾件有趣的事情. 包括通膨狀態下, 建商屯地具有非常充分的理由. 在激烈競爭下, 仍然會有新的廠家進入紅海市場. 理由並非是單純地不理性. 只要新廠家有新的設備或經營模式, 就有可能淘汰掉既有的舊廠家. 而紡織業, 啤酒業都因為廠家過多, 面臨誰也贏不了誰的狀態.

本書的第四章 “別被價值陷阱愚弄" 是最好的一章. 大家對於價值型投資都耳熟能詳. 但是很多股票其實只有價值的陷阱, 而不具備投資價值.

首先, 公司的銷售額能否成長是股價高低的關鍵. 即使公司有大批的資產, 但是經營團隊沒有活化資產的能力的話, 只能製造出漂亮的股價淨值比, 不能為股民帶來財富.

正常來說, 股價的複合成長率和 EPS 的複合成長率應該是一致的. 如果公司不會愈來愈賺錢, 那麼股價就沒有長期上漲的空間.  很多人投資創業板 (等於香港的興櫃板) 也並非源自於不理性, 而是希望冒更大的風險來博取大富大貴的機會.

本書的最後一章 “股市的噪音與真實景象" 主題比較分散. 歸納起來, 作者說到中國印鈔票的速度並不下於美國. 在貨幣供給超額的狀況下, 未來錢變得更不值錢.全球經濟不景氣, 又使得可投資標的變少, 因此中國股票上漲的機會很大.  

然而, 正如作者自己說的. 未來很難預測. 標普只是說出國王沒穿衣服就搞的世界大亂. 股市真難預測啊!