偷壘豈止盜壘而已?-淺談跑壘新數據:IBP。

  說到「中華職棒很快」的球員,你會想到誰?  從過去幾年來看,大概是:王勝偉、林智平、鄭達鴻、林志祥等諸位,為什麼你會覺得他們很快?因為他們很會盜壘。  沒錯,我們評估一位球員的速度,在中華職棒可參考的數字只有盜壘數,也許還可以參考一下SB%(盜壘成功率),不過這時候問題來了:速度和跑壘技巧,只能用盜壘來衡量嗎?  有些球員不怎麼盜壘,但是其實很會「偷」壘包--你會發現有些球員在壘,碰到理論上應該只能跑二壘的時候,他能溜到三壘,理論上只能跑三壘的時候,他有辦法得分。  在05年一位棒球作者Dan Fox提出一個很有趣的數字,叫做IBP,英文全名是:Incremental Base Percentage ,可以翻譯成「增量進壘率」。  這個數字的計算方式如下:考慮三種狀況,分別是在前面壘包無人的狀況下:一、跑者在一壘,打者擊出一壘安打 二、跑者在二壘,打者擊出一壘安打 三、跑者在一壘,打者擊出二壘安打  以狀況一來說,分別計算在打到左外、中外、右外野且無人、一人、兩人出局時,跑者跑到二壘、三壘和回來得分或是出局的數字,將之累計後計算機率,再將機率乘上壘包數。  同樣以狀況一為例,假設無人出局,打者打到右外野時,跑者跑一個壘包的機率是.600,跑兩個壘包的機率是.200,跑回本壘的機率是.065,而出局的機率是.035,則可以算出聯盟狀況一的平均進壘率是:(.600*1)+(.200*2)+(.065*3)+(0.035*-1) = 1.16。  假設有某位跑者在同樣的狀況下跑出的壘包數是2,

QT電子試玩

則我們可以說:這位跑者比聯盟平均多進了0.84個壘包。  加總所有狀況之後,我們可以得到總和數字,即:IBP。  嗯……講起來很複雜,算起來倒不是這麼複雜,問題是:這種數字只有兩種方式計算,一種是看完全聯盟所有的比賽並且即時記錄,另一種則是去追尋Game log。  兩種都很麻煩,整天追著球跑那是數據專業公司才能做的事情,而追Game log,一來中華職棒每隔一年就會把前年的Game log拿掉,另一方面就算這樣看似很輕鬆,有心想做的人還是得花上大部分的時間一場一場慢慢翻log。  可是我得講,我相信臺灣絕大部分做進階數據的人都有正職,

DB多寶試玩

要在正職之外找時間梳理類似的數字,搞不好一做就得做整年。  與此類似的還有:Range Factor(因為需要守備局數)、得分矩陣(需要分開狀況看得分),

信用球版

這些都是外國已經有,但是國內很難做的數據。  非常幸運的,今年財團法人資訊工業策進會有開一個「Data Engineer巨量資料分析就業養成班」,

場中投注

他們試著用程式來分析中華職棒2014年的game log,並且成功做出2014年中華職棒全聯盟的IBP。  中間種種辛勞,數之不盡,在此感謝以下諸位學員:鍾育修、賴敬元、鄭詩博、謝鎮宇、朱哲霆、石平、林彥廷、朱致宏與陳盈慈。  感謝強者我朋友火風提供支援,讓我們除了盜壘之外,還有另一個數字可以參考。  球員在場上狂奔,當他們成為跑者的時候到底進壘觀念如何很難衡量 CPBLTV截圖    好,回歸主題:以IBP來看,到底誰的跑壘好、誰的跑壘有點糟?  中華職棒2014年全年度共有81位打者面對過以上三種跑壘狀況,面對超過10次的則有31個人,我們取這31個人來排序,先跟各位說明:IBP = 1 是聯盟標準值。  中華職棒2014年IBP    如上,黃底部分是聯盟IBP > 1.1(以及很接近)的跑者,依照順序是以下諸位:林智平、藍寅倫、潘武雄、林泓育、劉芙豪、林瑋恩、胡金龍和張建銘。  至於底下藍底的部分,則是聯盟IBP < 0.95的跑者則依序是以下諸位(從最差算上來):鄧志偉、林益全、陳子豪、陽冠威、高國慶、彭政閔、陳鏞基以及黃浩然。  有沒有人讓你很意外的?  去年達成生涯百盜的林智平,從兩方面數字來看他都是2014中職第一的跑壘者 CPBLTV截圖   我想大於1.1的部分,大家看到林泓育大概都傻了,而小於0.95的部分,陳子豪出現在名單裡相當讓人意外。林泓育感覺跑得不是很快,可是額外進壘數卻意外地高,陳子豪感覺好像很會跑,結果額外進壘數卻低於聯盟平均。  更別提盜壘超過10次的陳鏞基和彭政閔,別忘記:這是2014年的數字,那時候彭政閔還跑得動。  那,前文提到的王勝偉、鄭達鴻和林志祥呢?  查表可以發現:王勝偉的IBP是1.08、林志祥是1.043,最妙的是不在榜內的跑者鄭達鴻:0.905。鄭達鴻當這樣的跑者是9次,僅差一次,如果他排進最下位排行榜的話,會在陳子豪之後,陽冠威之前。  這些各隊盜壘領先者,除了林智平是盜壘數和IBP都極高之外,王勝偉、林志祥則是盜壘很多但是跑壘表現可稱一般的跑者,而鄭達鴻呢?  大概可以說是「球迷以為他很會偷,就數據面來看他其實並不怎麼會偷」的類型。  鄭達鴻跟林泓育可說是相反的跑者,林泓育不怎麼盜壘、但是進壘數字很好,其實跑壘觀念看來相當不錯。  由於盜壘成功率和IBP並沒有顯著的相關關係,我們可以說,要觀察一位跑者的能力,除了看盜壘成功率以外,最好還能參考IBP,

線上電子老虎機

才能知道跑者真正的跑壘能力。  當然,這裡還是想額外一提:目前的數據是單年度,單年度的數據因為樣本小所以或許會出現誤差。可以的話,其實很想做生涯累計,問題是中華職棒的game log,在網上只保存兩年(去年和前年),想要做深入一些的數據,現在幾乎是不可能,也很難做長時間分析。  我不知道中華職棒大聯盟是否開放查詢game log,因為我寫信給聯盟問過「是否開放付費查詢某些數據」,根本沒有收到回音……  在外國,打開FanGraphs、Baseball reference或是Baseball Cube,可以參考的數據甚多,當然一方面是因為國外重視賽伯計量學(Sabermetrics,簡單來說就是棒球統計),

ATG孫行者

所以有專業的公司在統計,然而另一方面我想大聯盟願意釋出資料也是很重要的。  可是在臺灣,唉……連Game log的格式都不一致,一些部分還是仰賴人工辨識,雖說中華職棒開放查詢的部分不少,不過我得講,還是有些進步的空間。數據層面的進步通常也代表著棒球的進步。  雖然有些人會說NPB官網提供的數據不怎樣,不過根據本站作家果子購買日本年度觀戰手冊與我分享的內容表示,觀戰手冊以去年來說,投手有登記使用球種和球種頻率,防守數據甚至提供UZR。  不是日本人不重視進階數據,只是他們不免費提供這些數據(這些數據在美國是免費的,只要你不要做太進階的搜尋都會免費)。中華職棒甚至不提供「付費費員查詢更進階數據」的服務,我得講,這也是一條財源。  嗯……我有點抱怨太多了,先回到主題:跑壘分析就這樣結束了嗎?  不,接下來要來談:IBP和跑壘是否有關,這次將會比較深入地分析盜壘與IBP之間的關係,請期待下一篇! 後篇:擅長進壘就擅長盜壘?-從IBP作中職球員跑壘中度分析本文同步發表於:卡爾的粉絲團,