Sauder将这种可视化技术称为“数据转储”:2012年奥运会网球决赛在罗杰?费德勒与安迪?穆雷两人之间展开,这张图包含了决赛中每个球的反弹和球拍击打数据。
DAMIEN SAUNDER,美国环境系统研究所
利用可视化技术研究体育运动的做法至少可以追溯到埃德沃德?迈布里奇的时代,他曾利用摄影术证明了一辆奔驰的马车会完全离开地面。
随着光学追踪、生物传感器和大数据分析的兴起,新技术正在改变我们对运动的认识。篮球比赛中,安装在天花板上的摄像头会追踪每一位选手。棒球比赛中,会对每次投掷以及被击中棒球的速度和抛物线进行追踪。足球比赛中,能掌握到选手的运动轨迹及其全场跑动距离。本月即将在美国举办的职业网球巡回赛中,尽管有着IBM和SAP这样的技术型公司作为赞助商,却在引进追踪技术方面慢人一步。
不过在2006年的时候,网球运动中引进了名为“鹰眼”的即时回放系统,从而为数字化网球分析打开了一扇门。转播公司能利用鹰眼的数据对比赛进行现场说明,在女子网球巡回赛中也能为比赛选手提供现场指导。尽管其数据不会对公众开放,但制图高手和网球数据可视化研究者Damien Saunder并没有因此退却。
Saunder就职于制图软件公司“美国环境系统研究所”,是一位技巧高超的制图师,负责世界上最大的地图集《地球:白金版》等项目。他出生在澳大利亚,孩提时代曾密切关注职业网球比赛,但由于时差的限制只能通过新闻报纸稍加了解。多年之后,特别是在现场追踪技术的帮助之下,制图学和地理信息系统成为了追踪职业网球比赛的方法之一。如今,Saunder经营着一家为选手和教练提供建议的咨询公司,他正在从事一项引人注目的可视化网球分析,从运动数据中发掘出宝贵的资料。
当我从澳大利亚过来时,我在环境系统研究所的一项任务就是试图找出我们技术的新用法,以及能够与之合作的新行业。我喜爱网球等体育运动,所以我把关于制图学、映射和数据可视化的原理都思考了一番,然后想,为什么不能把它应用在网球上呢?观看网球的时候,在我眼里那就是一项发生在矩阵之中的运动。我在空间中看到了表示位置的x/y坐标值,以及表示高度的z坐标值,我看到了球的轨迹,还有开放的空间。我创建了“GameSetMap”公司,试图教导球场上的人们数据图表的价值所在,将数据存储在一个地理信息系统中,并使其可视化。
这一切全都与空间有关。我想让对手在球场上的站位变得不堪一击,或是容易失手犯错,从而难以赢得比赛。同样,我希望创造更大的发挥空间,让对手离开场外,从而为我赢得比赛获得大量机会。如果你能保持赢面并将失误最小化,通常就更容易在比赛中获胜。
你说过,许多赛后分析都不得要领,但你的分析能够提供帮助,这是什么意思?
让我们以ACE球为例来加以说明:在网球比赛中,ACE球是指一方发球,球落在有效区内,但对方没有触及到球而直接得分的发球。或许有选手能在整场比赛中打出12记ACE球,但这只是个很粗浅的数据,因为我们忽略了两个非常重要的因素。首先就是球的落点问题:这12记ACE球都击打在哪里?它们是落在边线还是底线?它们是连续落在同一个位置吗?我们忽略了地理位置方面的因素。
其次是时间问题。这些ACE球是什么时候打出的?如果这12记ACE球中,有10记是该选手在0:15或15:0的比分下打出的,其重要性就要有所削弱。但如果该选手是在破发点或是局点的时候打出的ACE球,就更加让人印象深刻了。所以,如果我们不知道这些ACE球的具体落点和时机的话,就会对“12记ACE球”这个数字的具体含义不甚了解。而这正是数据可视化和通常制图的基本目标。
这张三维“热图”显示了网球在球场上的运动频率。图中最高、颜色最深的区域显示了网球比赛中球经过最频繁的区域。
DAMIEN SAUNDER, GAMESETMAP
那么,这些数据从何而来呢?你在关于地理信息系统和网球分析的第一篇研究论文中表示,是通过比赛视频手动追踪采集了所有这些数据点,对吗?
我在我们的地理信息系统软件中覆盖了一张球场的透视图,这样软件的3D摄像头就会与电视摄像头相匹配。我建了一个数据模型来辅助数据捕捉,然后就采集到了球的每次反弹以及每个选手的每次击球。我估计这一共花了25个小时左右。之后,我就能通过两次击球之间的位置来大致计算选手的运动。
你曾在一个项目中与日本电视公司合作,对高排位的网球选手锦织圭进行研究,并获得了鹰眼的数据。什么是鹰眼,它是如何改变你的策略的?
鹰眼是一种光学追踪系统,球场上设置了十个摄像头,它们能基本上对网球进行实时追踪,并模拟出其飞行轨迹。然后,它们会对场上的击球选手贴上标签进行数据捕捉,人们再手动追加一些其他的标签,例如是否是“非受迫性失误”等。
以锦织圭的项目为例,包括鹰眼的数据在内,我们获得了关于他的数十场比赛数据,那可真是一次真正的突破性进展。它使我们如今不必浪费时间在数据捕捉上,而是可以直接进行分析。我们有关于速度的数据,也有矢量数据,我们还有能够计算球旋转的模型。我们能将选手的运动和轨迹联系起来,找出选手运动对比赛的影响。
对于网球比赛来说,这是不是就像《点球成金》那样?计算机分析将会改变教练评估选手优势和劣势,以及制定比赛策略的方式?
实际上你说的这只是最基础的东西。在一场网球比赛中,有太多人眼无法顾及到和记住的东西,要想仅凭人力对比赛结果作出公正的判决难度很大。可以说几乎不可能,比分方面也是如此。除非你将比分引入游戏树(注:Game tree,是指组合博弈理论中用来表达一个赛局中各种后续可能性的树,也叫博弈树、赛局树)中,才能对此作出一些假设和分析,但在你看到可视化数据之前绝不会真正有全面的了解。
这种真正的挑战正是我热爱网球数据可视化的原因所在,我们(制图师)的任务就是将现实生活中的复杂地理环境简化成人们能够理解的图表形式。同样,这就是我们正在试图用这些数据去做的事。
————利用网球可视化技术看比赛————
2012年伦敦奥运会网球决赛:所有的击打和反弹
Damien Saunder,美国环境系统研究所
缺乏官方数据,只好手工采集数据
Damien Saunder,美国环境系统研究所
Saunder在没有光学追踪系统帮助的条件下采集了奥运会的网球比赛数据;他通过视频记录手工采集了相关运动数据,并将之输入到3D地理信息系统软件“ArcScene”中。他表示,这花了他25个小时的时间。
可视化发球局
Damien Saunder,美国环境系统研究所
“在网球中,发球是你唯一能完全自己作主的事情,”Saunder说道。他利用数字化的数据,将费德勒和穆雷在2012年奥运会网球决赛中的发球标记出来。他的兴趣在于衡量发球模式的可预测性。在高手之间的网球比赛中,如果选手能够提前预测出其落点所在,甚至有可能接住对手一记非常出色的发球。上图中,彩色的群集代表着拥有相似特性的发球(包括但不仅限于落点)。要想看明白这张可视化图片,你得知道两位选手都是站在球场底线发的球。Saunder表示,他原本可以通过将所有数据放到同一侧的方式来使之更加易懂,但那样的话读者就无法得知不同选手在不同侧的发球表现。至于出现这种情况的原因,他尚不清楚。
发球的价值难以预测,但它有时候真的很重要
Damien Saunder,美国环境系统研究所
Saunder认为,安迪?穆雷之所以能在这场决赛中击败罗杰?费德勒,是因为他更善于在关键时刻打出漂亮的发球。费德勒的发球虽然更加难以预测,但大部分都发挥在了比赛中不甚重要的时刻。上图中,每位选手的发球通过颜色加以区分(红色代表费德勒,蓝色代表穆雷),这些发球对比赛结果的重要性通过大小加以区分,而它们是否为选手赢得发球局则是通过钩形符号加以区分。同样是在这座球场上,费德勒曾于几个月前的温网决赛中击败了穆雷,如今穆雷在沸腾的观众面前摘走了金牌。
可视化网球比分:“游戏树”
Damien Saunder, GAMESETMAP
Saunder表示,他小时候生活在澳大利亚,由于大部分比赛都发生在当地时间深夜,所以无法得知它们的具体比分状况,这曾经让他很失望。上图中绘制出了拉斐尔?纳达尔在2013赛季的出色战报。Saunder使用决策树这种统计学工具,绘制出了纳达尔在每场比赛中的每局比分。它体现出了比赛是如何从0:0走向最终胜利(右下)的具体过程,我们可以发现,纳达尔一旦在比赛前期取得领先,就能迅速解决对手。上图展现的是纳达尔直落三盘击败斯坦?瓦林卡的比赛,纳达尔在这次比赛中所有发球全部得分。
游戏树:纳达尔面对的艰难比赛
Damien Saunder, GameSetMap
这张图中,纳达尔在美网公开赛与诺瓦克?乔科维奇展开对决,这场比赛要更加紧张激烈。乔科维奇最终在2013赛季排名第二,仅排在纳达尔之后。
游戏树:罕见的直落出局
Damien Saunder, GameSetMap
在2013年世界巡回赛总决赛中,纳达尔以3-6和4-6的比分被乔科维奇击败出局,这是他当年职业生涯中的最后一个主要赛事。
游戏树:整体而言出色的2013赛季
Damien Saunder, GameSetMap
可视化选手运动轨迹
Damien Saunder, GameSetMap
这张图是Saunder对费德勒和穆雷在2012年奥运会网球决赛中运动轨迹的趣味小发现。它显示出了双方运动轨迹随着比赛进程而发生的变化,红色代表费德勒,绿色代表穆雷。垂直高度代表了比赛中的比分,所以它看上去似乎一直在“增长”。Saunder觉得红线和绿线的样子看上去就像是一棵圣诞树,因此把它用在了一张节日贺卡上。
(译者:红心之王、mikegao)
本文暂时没有评论,来添加一个吧(●'◡'●)