顯示廣告
隱藏 ✕
※ 本文為 dinos 轉寄自 ptt.cc 更新時間: 2014-10-12 08:41:03
看板 MLB
作者 todd7622 (感覺野球^_____________^)
標題 Re: [專欄]巨人VS國民的賽後諸葛
時間 Sun Oct 12 00:23:39 2014


※ 引述《wallflowers (whatever works)》之銘言:
: 看到這個作者的文章我實在覺得有些感嘆,筆者用很多數字來支持他的論點, 但卻堆疊的很怪,某方面讓人覺得很像在掉書袋
: 1.單純用投手WAR來表示一個球隊的“近況”? 光是決定用哪個指標來代表“近況”
: , 就夠你寫一篇小論文了
: 2.用季後賽經驗來做文章?這個你聽曾公在電視裡講講可以,不然97的馬林魚和01響尾蛇就直接投降就好啦
: 發明Pecota系統的Nate Silver在他的書說,好的分析一定同時包含了質化和量化的資料,要賣弄數據,相信沒人比得過BP那群數據頭。
: 這位作者的文章裡我看到很多數據....但...沒有球賽的觀察....通篇就是數據累績後的結論
: -----
: Sent from JPTT on my Samsung GT-I9500.

你說的是精準預測
我建議大家去看
有中文版

剛好前一陣子有寫一篇
不嫌棄的話就參考一下吧~


其實,魔球 (Money Ball) 的爭辯早就結束了。

魔球真正的精神,應該是如何在市場中找出被低估的價值,但是出版社和電影片商在市場
壓力下,半惡意地扭曲這個思想,變成新穎的統計數據和方法如何打敗傳統球探 (在製造
種族對立以提升話題性的功力上,美國和台灣基本上一樣高竿,也一樣垃圾),魔球中所
謂的數據派和傳統派,兩個團體的偏激分子的戰爭讓球界的所有人都被貼上標籤,先進來
的許多老屁股就被貼成傳統派,而另一群人就被歸在數據派,自稱數據派的人儘管否認,
事實上那段時間他們的確是想闡述這件事情:新穎的統計數據和方法可以打敗傳統球探。

有好一陣子網路上數據派說話都很大聲,畢竟運動家、紅襪甚至是藍鳥隊的戰績確實很不
錯,後來被歸在傳統派的紅雀、巨人紛紛拿到世界大賽冠軍,才又讓這個嚴重倒向一邊的
蹺蹺板恢復平衡,人們開始知道,傳統派那邊不全然是那麼一無是處 (事實上被歸在傳統
派的人也讀統計數據,有些甚至奉行魔球思想,但很多數據派還是大力抨擊這些人,我猜
大概是罵那些老屁股讓他們很有成就感)。


初探魔球的球迷,很容易會在其中迷失方向,我會建議您再接著看另一本書,Nate
Silver 寫的精準預測 (The Signal and the Noise)。

老棒球迷對 Nate Silver 肯定不陌生,PECOTA 預測系統的發明人,實際上他在其它預測
領域也很有名,比方說美國的總統大選,2008 年 50 個洲成功預測命中 49 洲,2012 年
更是 50 洲全數命中,是統計和預測鬼才。


精準預測的第三章 <我在乎的只有輸贏> 是棒球迷不可錯過的精彩章節,紅襪隊的明星二
壘手 Dustin Pedroia 是這裡的主角,故事就從他開始。

Keith Law是 ESPN 著名的棒球評論家,在 Dustin Pedroia 的新人球季就提出這樣的報
告:Dustin Pedroia 的力量和揮棒速度,無法穩定打中大聯盟投手的球,他也沒有體力
,如果他能穩定打出兩成六的打擊率,他就還有用處,而如果他可以不要在三壘手和游擊
手之間換來換去的話,當個後備的內野手還會有未來。事實證明,這個報告錯得離譜。


相反地,PECOTA 系統預測 Dustin Pedroia 是最有前途的球員第四名。PECOTA 是 Nate
Silver 在會計事務所工作時創造出來的 (假裝在幫客戶寫模型,實際上是在用 excel 寫
 PECOTA 系統,這種事我也幹過,上班用 excel 算賠率假裝是幫客戶做問題反映報表。
excel 是上班偷雞好物無誤),中間劈哩啪啦花了好長的篇幅介紹 PECOTA 系統的思考邏
輯,非常精彩,但礙於版權 (實際上是怕各位看到這邊就按上一頁跳出),我這裡就先打
住不談。


看起來 PECOTA 系統大勝球探。事實是這樣嗎?2006 年,PECOTA 成功預測到 Dustin
Pedroia、Ian Kinsler、Matt Kemp 等人是未來明星,Baseball Amerca (棒球美國,以
傳統球探意見為主) 連前兩位都沒列入百大潛力新秀,但是,PECOTA 同時也預測 Joel
Guzman、Donald Murphy、Yusemiro Petit 等人是未來巨星,而棒球美國預測到了很多
 PECOTA 沒選到的球員,包括 Jon Lester、Troy Toluwizki、Nick Markakis,把 2006
年兩套系統擺在一起比較,2011 年他們所創造的勝場數 (wins above replacement

player) 分別是 PECOTA 546 場,棒球美國 630 場,棒球美國大勝。

主要在於,以傳統球探為主的棒球美國能夠學習 (雖然電腦也能在資料庫夠龐大的狀況下
做學習動作),學習一些他們本來沒有的統計技術,他們也能看到一些無法量化的東西,
比方說各種心理素質和生活習慣,假設現在有兩位球員,打擊率都是 .300 和 10 支全壘
打,但 A 球員假日都去做慈善義工,B 球員則是去酗酒嗑藥,但是電腦預測 B 球員是未
來巨星,這種結果你接受嗎?


統計預測學家最常犯的錯誤就是過度自信,認為無法量化的東西就不重要,這不能怪他們
,因為人天生就是感性的動物,無法理性看待每件事情是最大缺點,而且喜新厭舊,對後
來出現的科技技術抱持極度樂觀的看法。棒球數據大師 Bill James 就承認,80 年代他
寫的很多東西都是錯的,最大的改變就是他有孩子了,了解到每個人都是某些人的寶貝,
球員卡、電玩裡那些人物,你真的不會想到他們也是人,正在盡力而為。


魔球中讓人覺得守備不甚重要,事實上重要極了,而且 Billy Beane 很重視這塊,剛好
前陣子和同事討論到守備數據,我必須說你用這些數據真的要很小心,而且很多守備數據
決定的關鍵早在賽前就擬定好了,包括內野手之間的跑位溝通、外野手之間的跑位溝通、
內外野手誰要 cover 比較多的領空範圍,還有各種暗號搭配,甚麼時候誰要進去補位,
這些數據上都看不出來,但這是守備的一環,剛好這又能扯到團隊氣氛,半調子數據頭認
為這種東西不是很重要,事實上重要極了,好的團隊氣氛不一定會讓球隊變的更好,但不
好的團隊氣氛球隊鐵定會變得更糟,因為缺乏溝通,電腦沒辦法幫你檢視這些 (除非你去
下條件教它,只有極少數菁英做得到這種事),它只能幫你統計結果。


魔球中也讓人覺得教練只是人形立牌,我是不知道 Billy Beane 是不是曾經這樣想,但
如果你真的抱持這種想法,那顯然是想把管理學丟進垃圾桶。

真正厲害的人,早就利用球探和電腦各自有的智慧在做事情了,比方說紅襪隊跟紅雀隊,
如果你想知道人類和電腦能抗衡到什麼地步,本書也有一章關於西洋棋大師和電腦較勁的
故事,歡迎自行購買閱讀。


Nate Silver 說,魔球已死,魔球萬歲,這是我那場多年論戰後看到最精闢的註解。

--
Orange and Blue Blood (A blog about NYM )

http://www.sportsv.net/authors/todd7622

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.63.202
※ 文章網址: http://www.ptt.cc/bbs/MLB/M.1413044624.A.0DA.html
TSbb: 你不要這麼專業好不好?1F 10/12 00:28
tucker: 你不要這麼專業好不好?2F 10/12 00:29
tucker: 另外是"Keith" Law,todd大好像對名字叫Keith有點苦守XD
tucker: 最後苦守要更正成「苦手」
lym0715: 推:罵那些老屁股讓他們很有成就感5F 10/12 00:33
※ 編輯: todd7622 (1.169.63.202), 10/12/2014 00:34:42
lym0715: 這篇把網路上假數據派的盲點都講到一些了 以為學外國數據6F 10/12 00:34
lym0715: 頭的文章筆法語氣 就是專業的數據分析專家
todd7622: 已改 感謝tucker再度糾正XD8F 10/12 00:35
lym0715: 尤其是認為無法量化的東西就不重要9F 10/12 00:35
※ 編輯: todd7622 (1.169.63.202), 10/12/2014 00:37:50
tucker: 不敢~我自己也很常中了拼音文字的陷阱orz 感謝好文!10F 10/12 00:40
honey4617912: 書籍推坑文無誤11F 10/12 00:41
ohb: 這本書非常有趣 XD12F 10/12 00:43
DerekJeter02: 好想買來看~~13F 10/12 00:43
ocean11: 很棒14F 10/12 00:59
kurt28: 推15F 10/12 02:22
cacac: 恩,心理素質,球隊氣氛,甚至教練因素的體會,主要還是得16F 10/12 02:48
cacac: 看球賽才抓得準確。單看數據,或缺這塊去解釋數據易有盲點
rssh0106: 不能預測的事情太多,這就是棒球棒的地方18F 10/12 03:16
joanamyx: 推19F 10/12 04:28
Kreen: 推~20F 10/12 04:53
rosefan: 同意21F 10/12 05:41
Pujols5: 不是無法量化就不重要吧 是無法量化只好不管他22F 10/12 08:27
Pujols5: 畢竟是要做統計去分析 如果無法量化還要把他放進數據裡
Pujols5: 那就不叫統計啦
goopa: 推這篇~25F 10/12 08:34

--
※ 看板: dinos 文章推薦值: 0 目前人氣: 0 累積人氣: 244 
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇