壽險精算業的祖師爺

在 “Against the Gods" 一書的第五章, 主要是介紹統計. 幾位 “無名英雄" 和意想不到的 “名人" 同台登場.

首先出場的是, 以鈕扣商人的身分加入英國皇家學會的葛朗特 (John Graunt). 他的主要事蹟是在業餘的時候寫了一本書 “根據死亡率所做的自然與政治觀察", 裡面研究了 1603~1661 (?) 年倫敦的出生率與死亡率. 他採用倫敦市政府從  1603 年開始記錄的每週數據, 再加上教會保管的出生與死亡資料, 以抽樣的方法來估計人口. 因為數字來自於政府 (state), 所以統計學後來就叫做 statistic.

葛朗特認為這些數據可以讓商業與政府更穩定. “擁有這樣的知識,…., 就知道這些人消費的數量,  不至於做出乖離事實的預估. " 這個前瞻性的想法, 使得葛朗特也被尊為市場研究之父.  牽涉到經濟與政治之後, 原本枯燥乏味的統計書就變成治國經商的藍圖了.

這本書出版的時間點, 正好是英國由農業社會轉型為發展私有財產與海外貿易的關鍵期. 原本的地主只需要依土地的面積和收成來納稅, 人口多少根本無關緊要. 但是進入需要役男的時代後, 到底有多少人口就至為重要了! 本書大賣 5 版, 使得葛朗特的大名引起廣泛的注意.

現代經濟學之父的佩蒂 (看起來很像女生, 但是他是男的, 著有 “政治算術" 一書) 在巴黎的 “知識期刊" 上發表這本書的書評,  進一步啟發了法國人也做類似的研究. 英王查理二世還特別欽點葛朗特加入皇家學會, 並且對於那些不滿小商人變成 “中研院院士" 的其他學會成員下令: “如果還能找到其他類似的小生意人, 都要讓他們入會, 不許囉嗦!" 看來這位英王相當地有趣, 難怪人稱快樂王 (Merry Monarchy). 當然, 查理二世也做過一些不得人心的事, 比方說強制關閉咖啡館, 避免大家議論國事. 但 16 天後礙於民意又取消了.

葛朗特統計的年代, 歐洲正在流行瘟疫. 以 1603 年為例, 就有 82% 的人死因是瘟疫. 另外 36% 的小孩會在 6 歲前夭折, 我想這是後來流行辦慶生派對的原因, 能活下來真的不容易. 葛朗特最大的貢獻不是在與整理已經知道的事情, 而是推估與建議. 他認為: 急性流行病可能因氣候, 食物引起, 應由政府設法管制. 餓死的人很少, 但是市區內乞丐氾濫成災, 這些乞丐看起來大多健康強壯, 所以他建議政府要加以干預, 把這些乞丐依個人的條件和能力加以訓練, 讓他們自食其力.

葛朗特也知道自己的數據不完整, 所以他做了一些假設. 在倫敦市每年出生 12,000 人的前提下, 假設每戶有 8 個人 (包括僕役), 每兩戶有一個婦女達到可生育的年齡, 因此算出倫敦市應該有 384,000 人 (12,000 x 2 x 8). 另外, 他也用倫敦地圖和每人生存面積來推估出倫敦市應該有 47,520 戶人家來印證第一個方法沒有太偏差. 而當時大家普遍相信倫敦有 200 萬人, 所以就算葛朗特的數據不夠準, 也已經大幅修正了大家 “認為" 的人口數. 

另一方面, 葛朗特依照 36% 的小孩活不過 6 歲, 一般人都活不過 75 歲的資訊, 編列了一個 6~76 歲的餘命表, 而初生嬰兒的壽命期望值是 16 歲. “古人" 真是可憐啊! 這也凸顯出中國的戶部尚書不愛數學. 為何中國就沒有統計數字可以流傳到後世, 難道…因為那是國家機密的關係嗎?

講完了英法, 再講德國. 研究德國人口的是一個英國人 – 哈雷 (Edmund Halley), 沒錯, 就是命名哈雷彗星的天文學家哈雷. 當時德國有一個叫做努曼 (Casper Naumann) 的神職人員, 他的教區有一種迷信, 認為月亮週期和健康有週期性的關係. 為了破除這種不符合教義的說法, 努曼找數學家萊布尼茲幫他的忙. 萊布尼茲把報告轉給倫敦皇家學家, 因此引起頂尖天文學家, 35 歲的哈雷的注意 (大概是牽扯到天體運動吧?)

哈雷是個神童, 還沒念完牛津, 就帶著他的 24 吋望遠鏡去南半球研究天空, 不到 20 歲就名滿全國. 22 歲的時候, 哈雷就加入皇家學會. 1721 年國王下令頒給他學位, 不過他在 1703 年就在牛津當教授了.

哈雷研究了德國小鎮的人口, 同樣做了一張餘命表, 並且算出該服役的人口數為 1/34. 比葛朗特更進一步的是, 他計算出同一個年齡層的一群人,  在一年內死亡的機率. 比方說 25 歲的有 567 人, 但是 26 歲的人只有 560 人, 因此 25 歲的人有 7/567 活不到明年生日. 哈雷順便幫保險公司計算了保費對照表, 完成了社會期待已久的傑作.

早在西元 225 年羅馬人就有年金保險的記錄了, 而保險的歷史更可以追溯到西元前 1800 年的 “漢摩拉比法典" (Code of Hammurabi), 當中有 282 則條文與船舶的保險有關. 但是保費應該怎麼收呢? 一千多年來, 唯一的依據似乎就是羅馬法律學者烏爾比安 (Ulpian) 的壽命預測表. 葛朗特和哈雷的研究啟發了當代的保險業者, 使得保險業在那個年代蓬勃發展.

17 世紀後半期, 正是英國與荷蘭爭霸於海上的時期. 兩國為了籌措軍費, 相繼地以年金保險的形式向全民舉債. 英國政府繼 1504 年賣過 7 年還本的年金保險之後, 又在 1693 年推出 14 年還本的一百萬英鎊的年金保險. 雖然他們這次已經運用了平均壽命有 14 歲這項資訊. 但是英國政府對於買保單的人, 不論被保險人幾歲都是統一定價. 因此這些保單不但沒有充實國庫, 反變成政府驚人的龐大債務. “依據被保險人的年齡來為保單定價" 這個觀念, 據說到了 1789 年才反映到英國政府的新保險年金之中.

民間的保險業者似乎比政府更加地積極, 自1637 年英國的卡諾皮亞斯 (Canopius) 喝了第一口咖啡之後, 各地迅速開起了許多咖啡館. 這些咖啡館除了提供, 在 “創世紀" (Ultima) 遊戲中, 供勇者打聽情報的功能之外, 就是給保險經紀人賣保險了. 1720 年, 兩家保險公司甚至送給英王喬治一世 30 萬英鎊的賄款, 使他們變成具有獨佔權的保險公司.

1771 年, 獨佔權大概是失效了. 經常聚集在勞埃咖啡館 (Lloyd’s) 的保險經紀人, 自己聚資成立有點像是會員制的保險公司 – 勞埃協會 (Society of Lloyd’s), 以個人的身家來為客戶擔保. 後來勞埃也發展成史上最著名的保險公司之一, 由此可見咖啡館和保險業真的極有淵源.

最近景氣變差之後, 保險經紀人除了轉戰不用錢的大賣場或是公司 lobby 談合約之外, 做生意的手法並沒有太大的變化. 依然是拿大部分人的保險費, 去付給自己, 以及少數真正被理賠的人. 古今的差異, 應該在於業者有了充分的數據做為後盾, 再也不可能像英國政府一樣做賠本生意了. 買彩券的期望值是負的, 買保險也是; 前者在活的時候還用得到, 後者要死了以後才能 “用到" 喔! 

哈雷的研究, 啟發了後來的棣美弗 (Abraham de Moivre). 他在 1725 年出版了一本 “人壽保險", 討論一個被伯努利 (Bernoulli) 分析過的問題. 既然哈雷可以用一個小鎮的樣本, 來說明 346 個 50 歲的人, 其中只有 152 個人活到 70 歲 (41%), 那麼世界上所有的城鎮, 都可以用 41% 來推算嗎? 如果實際上的值是 50%, 那麼因為樣本數過少, 而導致獲得 41% 這個結論的機率有多高?

基於伯努利一族的研究, 棣美弗發現了常態曲線. 也就是估計很偏差的機會不是沒有, 但是機率小得很多. 這個模型就像是一個鐘形,  在標準差之內的狀況經常被重現 (68%), 而 95% 的觀察會落在兩個標準差之內. 這個發現使得棣美弗感到 “開悟", 因此稱之為 “神的計畫“. 棣美弗的重要著作還包括: “抽籤計算法", 後來改名為"機會論".

在研讀棣美弗的論文之後, 皇家學會的一名會士普萊斯 (Richard Price) 也寫了兩篇論文, 後來的一篇據說使得他的頭髮一夜間變白. 1771 年, 普萊斯的著作正式發表, 書名是 “保險金償付論". 這部著作使他贏得精算學(actuarial science) 始祖的頭銜. 至於只研究機率, 卻沒和保險業扯上關係的數學家當然還是大有人在. 比方說我們唸模式識別  (pattern recognition) 一定要讀的貝氏理論 (Bayes’ Theorem) 的貝氏就把遺產捐贈給和他一樣研究統計, 聲譽甚佳的普萊斯.

貝氏的研究主題是: 一個事件發生的機率有多少? 假設抽樣 10 萬根針,  發現了 12 根有瑕疵,  而平均的瑕疵率是萬分之一,  有多少機率這 12 根的出錯是 “正常的" 呢? 貝氏也皇家學會的成員, 但是世人對他了解不多. 我只知道他留下了很多的公式…

在 “Against the Gods" 的第七章, 舉了一個貝氏計算的例子. 根據我修過但不是太優的 pattern recognition 基礎, 我覺得作者的舉例是錯的. 需要使用的公式並不神秘, 就是 P(A|B) x P(B) = P(B|A) x P(A), 兩家工廠的事後機率似乎不可能被扳回那麼多成. 有興趣的人可以幫我驗證一下, 謝謝!

[圖片遺失]

DTS Surround Sensation 與 UltraPC

DTS Surround Sensation 是 Dolby head phone / virtual surround 的競爭技術, 主要用在 2 聲道喇叭或是耳機上模擬 3D 的音效. 如果要讓人可以感覺到 3D 音效, 通常都是依靠 HRTF model (Human Related Transfer Function), Surround Sensation 亦然.

從 DTS 的網站可以看到另一個相關技術: Surround Sensation – Ultra PC,  它是由兩個部分組合而成的:

  • DTS Neo: PC™ takes 2-channel (stereo) audio and transforms it into a full-bandwidth 5.1-channel matrix.
  • DTS Surround Sensation™ allows you to enjoy 5.1/6.1/7.1 – channel audio from just 2 speakers, using a surround effect.

DTS Neo:PC 把 audio 由 2 聲道模擬成多聲道, Surround Sensation 把多聲道塞到 2 聲道裡面. 把這兩個東西串起來, 就叫做 Surround Sensation – Ultra PC.

至於 Dolby 方面, 也是採用相同的思維. 少的變多, 多的再變少, 就可以模擬出立體聲的感覺.

好強的天空火 (SkyFire)

原本我的 HTC 手機上是跑 IE explore 當作預設的瀏覽器, 因為如果不這麼做的話, RSS 就會看不到. 因此就算灌其他的瀏覽器也沒有比較方便. 換了手機之後, 由於已經內建 Opera 瀏覽器, 感覺可以看的網頁頓時多了很多, 甚至於也可以在上面寫 blog 喔!

然而,  免費版的 Opera 還是讓人有些許遺憾. 因為它並不支援完整的 flash 功能, 還有網頁的排版也和 PC 上看到的不一樣. 本以為人生就這樣了, 想不到平靜的心還有浪潮…那就是有人拋出 skyfire 這個單字來! 第一時間我還以為那是 firefox 的筆誤, 但是隨即想到它可能是另外一個高竿的瀏覽器. 果然, 稍加 google 就找到了它!

http://www.skyfire.com/

Skyfire 的技術, 雖然我沒仔細研究. 但是從 performance 就可以略窺一二. 它的秘技就是先找一台 server 幫你瀏覽網頁, 然後用類似 progressive JPEG 的技術把圖秀在你的手機上. 因此, 手機上呈現的就是和 PC 上一模一樣的網頁, 感動地叫人傻眼.. 所謂雲端運算, 就是這個東西啦! 所以這個瀏覽器帶個 “天" 字 (sky)! 特別是 skyfire 的反應相當快, 明知道它是給你看圖檔而已, 卻不會有嚴重 delay 的感覺, 足可以擔得起一個 “火" 字 (fire). 因此這個名字還真不是亂取的.

因為是圖檔的形式, 瀏覽器的左上方有放大縮小鍵, 共有 5 級 zoom 可以選擇. 其他的地方都和一般 PC 的瀏覽器用起來差不多. 據說也有人用 skyfire 在 facebook 上種菜, 開餐廳之類的. 最近在臉書上種菜好像已經是全民運動了. 我去 Subway 買午餐, 就聽到兩個店員在討論養狗, 養雞有什麼用? 如果讓老人家來聽他們對話, 好像真的在種菜一樣. 若不是和養魚, 撿寶石等前後對話連貫起來, 我也聽不出有何異狀.

既然 skyfire 這麼強, 可以 porting 到我們的產品上嗎? 我看了一下他們支援的 platform, 其實只有 PC, Windows Mobile 5/6 和 Symbian S60, 沒轍啦! Skyfire 的另外一個缺點是, 不能設定自己的首頁. 反正一定要把 Skyfire 當作首頁就是了. 另一方面, 它也用自選的社交網站 widget (facebook, twitter 等) 與 RSS 的資訊 (只有英文) 來充實這個首頁, 以免使用者太過不爽~~~

下圖取自 Skyfire 網頁, http://www.skyfire.com/product, 由左至右是 Hulu, facebook, CNN, Yahoo 的網頁.

[note] 在沒有鍵盤的手機上, 如果要實現拖曳的功能, 在 skyfire 也是可以解決的, 進入右下角的 Menu ->  settings -> Show Page Drag Controls, 把這個 drag 的選項勾起來! 這樣在螢幕的右上角, 就會適時地出現兩個 icon, 箭頭的表示滑鼠左鍵, 手掌表示要拖曳, 這樣就OK了!

CE-HTML vs HTML-5

這兩個 format 都可以用在消費性產品, 我對它們的理解是這樣:

傳統的 HTML 4 格式太有彈性, 對於 header, sidebar, foot 都是當作 div 的某個特例. 但是 HTML 5 把它們專門化, 這樣就可以省下額外的描述, 以加快傳輸速度. 同樣地, 以前對於某個 resource 的描述, 都是看完 HTML 的標籤才知道要做甚麼事, 但 HTML 已經把它們專門化了. Video 就有 video 專屬的寫法, audio 亦然.

至於 CE-HTML 其實是一種 XHTML, 所以它是 XML 系列而不保證和傳統的 HTML browser 相容. 因此 CE-HTML 並不忌諱多傳一些 tag, 而是強調比較 powerful. CE-HTML 的 CE 表示 consumer electronics.

[reference]

HTML5: http://www.alistapart.com/articles/previewofhtml5

CE-HTML: http://en.wikipedia.org/wiki/CE-HTML (英文)

http://blog.csdn.net/chszs/archive/2009/06/09/4254281.aspx (中文)

 

賭徒列傳

要講賭徒, 先要有講賭具. 警察在抓賭博的時候, 就是要找到賭具和賭資, 才能夠將一干賭徒定罪! 簡單又有公信力的賭具, 應該非骰子莫屬了.

骰子怎麼來的呢? 在希臘人的時代, 他們就懂得用牛距骨製成的骰子來比大小了…牛距骨是個長方體, 寬的一面是 3 和 4, 窄的一面是 1 和 6. 雖然加起來都是 7, 但是現代的小朋友都知道 3 和 4 出現的機率高於 1 和 7, 而希臘人好像不知道? 總之, 他們一次擲 4 個骰子, 若是出現 1,3,4,6 四個不同的數字, 就是最大的一把, 稱之為維納斯 (Venus), 所以本部門的第一顆 IC Venus 的編號其實也可以叫做 1643 之類的. 然而, 因為古人不懂得機率, 並沒有把機率和 Venus 更低的 4 個 1 或是 4 個 6 當作 "勝投" !

達文西曾經向不太知名的帕契歐里 (Luca Paccioli) 請教平方根的乘法與 99 乘法表, 可見得帕契歐里在當時的數學界算是厲害的人物, 而且據此看來達文西不可能發明時光機器. 言歸正傳, 帕契歐里寫了一本 "算術大全", 裡面提到了這個問題: "甲乙兩人玩丟骰子, 並且協議先贏 6 把的人獲勝; 結果就在甲贏 5 把, 乙贏 3 把的時候, 遊戲不得已結束了, 試問彩金要如何分配?"

這個命題從 1494 年這本書出版到 1654 年左右都沒有正確的解答. 巴斯卡應該是第一個正確分析這個問題的西方人, 中國數學家朱世傑在 1303 年已經用 "四元玉鑑" 解過這類問題, 而阿拉伯數學家伽音更是比巴斯卡早了 450 年. 由此可見, 機率甚至於排列組合的觀念, 其實很晚才出現在西方世界. 雖然他們早就開始賭博了, 連希臘神話的宙斯, 波賽頓, 黑帝斯都是用擲骰子來分配天堂, 海洋與地獄管轄權的. 真正把賭博當作一門學問的人, 就是本文的男主角 – 卡達諾醫生 (Cirolamo Cardano).

卡達諾生於 1500 年左右, 天性非常好賭, 著有 "大術" (討論代數), "賭博手冊" 等 300 本書. 1540 年, 加號和減號才發明, 1557 年等號才出現 (因為發明人認為 "沒有比兩條平行線更對等的東西"), 因此, 卡達諾的數學能力相當了得, 他不僅僅是一個賭鬼, 也會解 3 次方程式與開負數的平方根喔! 連採用 a, b, c 來寫方程式都是他的創舉.

在 "賭博手冊" 一書中, 卡達諾第一次把機率這個概念和賭博的理論整合. 亦即以分數來表示某個骰子或樸克牌出現的機率 – 在多少次活動中, 應該出現多少次結果. 據說每天都在賭博的卡達諾, 開啟了機率分析的大門. 擲兩個骰子, 出現 7 點的機率比 5 點或 6 點都高, 這件事其實古人並不曉得. 唯有好賭的卡達諾會認真研究這件事, 並且寫成書來傳世.

或許大家以前都沒聽過卡達諾這號人物, 但是很多人應該都知道中國的四大發明, 這四大發明就是見聞廣博的卡達諾所歸納出來的喔! 身為賭徒, 數學家, 名醫, 探險家的卡達諾一生過得相當精采, 只不過死得不太好, 據說他花錢無度, 被人砍掉右手的全部手指 (要戒賭?), 而且 43 歲就被毒死了. 

接下卡達諾棒子的大師是名人伽利略, 他寫過一篇論文叫做 "擲骰子論". 因為這是供養他的圖斯卡尼大公命令他寫的, 他以義大利文寫就, 而不是標準的拉丁文, 表示這難登大雅之堂. 至於這篇論文的內容,  則是大量引用 "賭博手冊". 經過名人的印證, 機率的觀念在這篇論文寫就的 1623 年, 已經正式成為數學家的共識了.

1623 年巴斯卡 (Blasise Pascal) 誕生, 他是天生的數學家. 據說他在少年時代就發明了能夠做加減法的機械式計算機. 巴斯卡的一生其實相當神奇, 他幾度閉關修行, 號稱忘記了數學是什麼東西? 不過在他與另外一位法國貴族兼賭徒傑米爾 (Chevalier de Mere) 的交會之中, 終於解決了帕契歐里陳年的賭資分配難題. 傑米爾用這個題目像巴斯卡挑戰, 而巴斯卡又求助於費瑪 (Pierre de Fermat), 他們聯手合作, 開啟了新局.

傑米爾是一個有名的賭徒. 他率先算出連續擲一枚骰子 4 次, 出現 6 點的機率大於 5 成 (1/6 + 5/6×1/6 + (5/6)2x1/6+(5/6)3 x 1/6 = 51.77%). 因此, 他只要一直押 6, 就會神奇地贏錢, 而別人還莫名其妙, 以為他有賭神附身! 後來他改賭兩顆骰子, 以為賭兩個 6, 在 24 次擲骰中也是一樣的勝率, 結果輸了一大筆錢. 後來他痛定思痛, 重新算出這樣的勝率是 49.14%, 要擲到第 25 把才有 50.55% 的勝率.

而費瑪的職業是律師, 並且為西元前 250 年亞歷山大港的數學家丟番圖 (Diophantus) 而寫了一本 "算術" (Arithmetic). 算術這本書裡面有個 x4+y4+z4 = u2 的式子, 費瑪在註腳裡面自問自答: "為什麼丟番圖不用兩個數字的四次方, 使它們的和為另一個數的平方? 因為做不到, 我可以精密證明. 我發現這個命題有很棒的證明, 但書上的空白太窄了, 無法把它寫出來." 這就是有名的費瑪最後定理. 畢達哥拉斯證明直角三角形斜邊的平方是另外兩邊平方的和,  但三次方以上就不存在這種關係. 

搞定了帕契歐里賭資分配問題後, 巴斯卡的人生也進入了賭局. 他進入巴黎的波爾羅亞修道院, 並且些了一本 "沉思錄". 其中的一篇 "巴斯卡的賭注" (le pair de Pascal) 問道: "上帝存在, 或不存在. 我們應該選擇哪一邊? 理性無法答覆." 事實上, 巴斯卡選擇安全牌, 也就是決定信神! 聰明的巴斯卡建立了巴黎的第一條商業公車路線, 因此錢對他來說絕對不是問題. 他要追尋的是永生吧! 他把錢捐給修道院, 然後和修道院的其他修士, 寫成了重要的著作 "邏輯" (又名思考的藝術).

這本書, 共同作者據信包括阿爾諾 (Antoine Arnauld), 主要討論機率, 並且指出在 10 人賭局中,  "輸一枚銅板的機會為 9, 贏 9 枚銅板的機會為 1". 本書說這是有史以來, 用數字計算機率, 見諸文字的第一次. (我很好奇卡達諾難道都是用文字表示機率的嗎? 哈!) 本書的另外一句話可能更為經典: "對傷害的恐懼不僅跟傷害的嚴重性成正比, 也跟受傷的機率成正比." 大家都怕死, 但人只會死一次, 所以也有人不怕~~~

[note] 本篇整理自 Against the Gods 第三第四章.

[note2] 對了! 關於帕契歐里賭資分配問題的正確解答, 現在連報社記者都會算了, 所以我忘了解釋. 獅象打 7 戰四勝的總冠軍戰, 打完 5 場之後, 象贏了 3 場, 獅贏了 2 場, 賭盤怎麼開? 用巴斯卡三角形來解釋, 就是把還沒打的場次 2 場, 用 22 = 4, 去找相加等於 4 的那列巴斯卡三角形來展開:

1  2  1

= 象象  象獅 or 獅象 獅獅

未來象連贏兩場的機率是 1/4, 象獅各 1 勝的機率是 2/4, 獅隊連趕兩場的機率是 1/4. 而象隊已經贏 3 場了, 所以只要先贏一場就不必打第二場. 因此象對獅的賭盤是 (1+2) : 1 = 3:1.

雖然象獅誰先再勝一場意義不同, 好像不應該混為一談. 但是 "1 2 1" 的 "2" 表示已經預知雙方各一勝, 因此這個數字歸象隊所有.

這個問題用巴斯卡三角形來看似乎小題大作, 但是若用 7 戰 4 勝制, 獅先贏 1 場來給大家分析賭盤, 恐怕很多人就沒辦法反應過來了. 因此把數學方法找出來才能舉一反 N.