网站首页 > 技术文章 正文
?今天ESPN的RPM(真实正负值)数据新鲜出炉了,按往年惯例,都要尝一下鲜,讲点内容。但今年的第一波RPM数据比之往年有更多意外,很多球员的RPM异常难以理解。据说今年ESPN改了算法,这个数据的具体规律需要再摸索一段时间,按说应该再等几周,让样本再攒一攒再说。但很多人在后台问,不写也免不了要回答,索性还是把大家可能关心的一些问题拿出来说说。
有这样一个声明:
不管对任何数据,切忌一刀切判断,奉之为真理或者一竿子打死都太极端,以数据为武器来开会或者与朋友开撕,本来比张口就来要理性一些,但逮着一个数据未经思考就以为掌握了核武器,那又是另一回事了,所以千万不要有这样的言论:
“A球员的RPM比B球员高,所以A球员一定比B球员厉害!”
“A球员的RPM竟然比B球员高,RPM就是垃圾!”
两种都不可取。
我先列一个总图,大家找找感觉。横轴为进攻,纵轴为防守,圆圈颜色的攻防综合,越绿数值越大,圆圈大小则为基于RPM的胜利贡献值,表现球员的赛季累积贡献。
OK,我们开始分析几个具体问题。
1.詹姆斯和浓眉奇怪的RPM对比。
下图是湖人队内的RPM对比:
不难看出,这张图最诡异的地方在于湖人双核的巨大差距。詹姆斯排名19-20赛季第一期RPM数值的榜首,并且遥遥领先,这点倒是可以理解,预期在更大样本数值稳定后,扬尼斯、武藏的RPM会追上来,顶层几个球员最后的数值差距应该会比现在要小。
但如果不列出湖人队内的图表,你在总榜上都找不到浓眉哥的身影,甚至在湖人队内,浓眉哥都没有比角色球员们体现出绝对优势。
这个问题我在之前写浓眉的文章里讲过——詹姆斯的功能性在湖人唯一,其他球员难以替代,而浓眉提供的大部分能力,湖人都有穷人版,他的意义在于提升这支球队的上限,让湖人真正具备了争冠特质。
实际上,在基础on/off数据上,詹姆斯就比浓眉体现出极大的优势,詹姆斯在场比不在场,球队百回合要多赢14.1分,而浓眉这个数据竟然是-4分。
on/off数据肯定是简单粗暴的,它没法解决两个最基本的质疑:
第一,我怎么知道你on/off数据好看,不是因为你经常跟大腿同时在场打球;
第二,我怎么知道你on/off数据好看,不是因为遇弱重拳出击刷出来的?
基础的on/off数据不能消除轮换和对手影响是硬伤,毕竟浓眉在场时,湖人百回合赢7.9分,面对的更多是对手首发球员或者在收官阶段,而浓眉不在场时,湖人百回合赢11.9分,都是在衔接段时间,含金量不一样。
所以RPM存在的意义,就是因为它“真实”,它把on/off数据的这种缺陷规避了,你可以想象有这样一个方程式:
A+B+C+D+E+a+b+c+d+e=比分
ABCDE和abcde分别指两支球队在场的5个球员,而我们知道,NBA如此多的比赛、如此多的轮换搭配方式,会产生茫茫多的方程式,某种意义上,RPM就是求这么多方程式的解,再做其他的修正。这种计算逻辑,显然把队友、对手的变量都考虑进去了,但这需要大量的样本组合,才能让结果变得稳定——毕竟,你得遭遇全联盟各种球队、各种球员(打了4场公牛没打雄鹿,跟打了4场湖人没打勇士的球员,他们之间的比较就完全不公平),以及你在队内的轮换组合也比较丰富之后(如果A和B永远同上同下,就无法区别比赛影响到底是谁造成的),才能让大家的计算背景变得相似。
另外,篮球比赛有极大的随机性,球员状态起伏很多时候是无法解释的。这一场13中1,下一场可能又15中10,投篮效率高低不一定完全因为防守,有的夜晚空位连铁,有的夜晚强投超神都不稀奇。当家球星在的时候反而输球,他缺席还能赢强敌的现象也比比皆是。大家都清楚,“演我”这种事,运气成分太大,没有足够的样本,实在难以消除运气的影响。
所以,RPM可信的前提,一定是有数量足够的样本,而现在RPM的一些异常现象,本来都可以用一句样本太小来解读——20几场,样本真的太小了,RPM得论年看。
所以浓眉的RPM难看,显然是一个暂时的现象,你可以等等再说。但从湖人的配置来看,浓眉如果到赛季最后RPM还比詹姆斯差不少,也并不稀奇。RPM虽然能尽可能消除轮换和对手的影响,但篮球不是1+1一定等于2的游戏,球队内稀缺程度不同的资源,对球队的影响程度当然也是不同的。湖人没有詹姆斯就没有了发动机,而湖人没有浓眉还有人护筐,也有人打低位。浓眉让湖人变得特别,是因为他能在这支湖人整体班子考到90分的情况下,还能往上再提升5分——越往高处,收益就越递减,能提升上限的,那都是神人。
2.快船攻防的坑很清晰
莱昂纳德本赛季进攻状态不好,最近效率虽然有所回升,真实命中率也只调回到55.5%,导致他在队内的ORPM只排到第4,算是不意外的结果。而他比上赛季常规赛更抢眼的防守表现,也在DRPM上体现了出来,综合攻防之后,他还是这支球队RPM最高的球员。
这张图更大的价值是直观的反映一下快船攻防两端的坑都在哪。
本赛季快船的进攻没有达到预期,目前进攻效率110.5排在联盟第8——当然不差,但即使考虑到核心球员伤病和轮休,你对快船的要求肯定也更高一些。
你可以从很多角度去解读快船的进攻,我们就简单的从RPM看一下——贝弗利本赛季成为了ORPM为负的球员,这项数据排到了控卫第79,而过去贝弗利的进攻影响是正面的,三分球、少量处理球、冲前板的定位清晰干练,本赛季三分失准之后产生了巨大落差,让他从进攻正面作用的球员,反而变成了球队最拖进攻的球员——好在,他在回暖了。
反过来,看一下路爹的位置,就明白为什么快船防守是联盟第7,而不是跟雄鹿角逐联盟第1了。
3.小次郎的进攻影响力
武藏的进攻在球队里自成一档是理所当然的,为什么成了防守悍将我也不懂,要看样本增加后回落到哪,不要太当真。
小次郎的ORPM才令人震惊。主攻手的ORPM相对不容易失真,毕竟主攻手对进攻的影响太直接了,而且主攻手在场上干了什么,大家也很容易注意到。
小次郎的ORPM排在队内第3有点不可思议,即使考虑到他最近的回暖,把真实命中率调到了49.9%——这显然很低了,但对这赛季的小次郎来说凑合了——以及靠着还比较多的助攻数据,也很难撑起进攻影响力,毕竟小次郎的助失比也只有1.66。
基础数据之外,小次郎的on/off数据还显示,他在场时,红队百回合少得11.7分——如果一个球员的基础数据和on/off数据都有硬伤,最终ORPM还能排到控卫前20,说实话,无法解释,要等样本进一步增加之后才能判断到底发生了什么了。
今年的RPM第一版有不少奇异现象,这里就不一一解读了,大家有兴趣的可以自己思考一下原因,比如巴顿联盟第1的DRPM,塔图姆联盟第2的DRPM,防守悍将CJ麦科勒姆,贝尔坦斯进攻影响力超武藏等等。
今年的RPM头版解读内容就少写一点了,不是我偷懒,实在是小样本下解读太多意义不大,并且今年的数据也太奇怪,虽说RPM每年第一版问世都有一些怪异的现象,但今年的头版尤其诡异,因为不了解ESPN具体怎样改了算法,现在需要等等,看美国那边有内幕消息的数据专家们作出怎样的解释了。
- 上一篇: 做目标检测毕设 怎么准备正负样本?
- 下一篇: 单场正负值具有偶然性,样本放大才有说服力!
猜你喜欢
- 2024-10-12 深度学习难分样本挖掘(Hard Mining)
- 2024-10-12 推荐系统系列之隐语义模型 基于隐语义模型的协同过滤
- 2024-10-12 「机器学习」利用图网络小数据学习进行性质预测
- 2024-10-12 论文荐读:理解图表示学习中的负采样
- 2024-10-12 策略产品经理干货系列之推荐系统离线评估方法与指标介绍
- 2024-10-12 终于搞懂了PR曲线 pr曲线调色在哪里
- 2024-10-12 记:多标签分类问题 多标签分类 focal loss
- 2024-10-12 开始构建机器学习模型之前,我们该怎么选择样本?
- 2024-10-12 数据样本量不足,试试大佬都在用的办法(暨反欺诈建模场景实操)
- 2024-10-12 推荐系统之隐含语义模型LFM(2)负样本采集
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)