k1体育十年品牌2015-2016赛季NBA赛事比分简单数据分析

小编 2024-05-04 06:08

  k1体育原始数据比较简单,依次包含了比赛日期、比赛开始时间、客队、客队得分、主队、主队得分、个人比赛数据(Box Score)、是否有加时赛、备注等。虽然数据简单,但依然有非常大的分析空间。本文为了实践之前学习的R语言相关内容,只做了一项非常简单的数据分析。

  其中,第二个参数header默认为FALSE,即数据框的列名为“V1,V2...”,设置为TRUE时以CSV文件的第一行作为列名。参数sep是分隔数据的分隔符,默认为空格,可以设置为逗号(sep=,),分号(sep=;)和制表符(tab)。参数colClasses 为每一列指定一个类,为了方便处理,先将所有的数据都指定为字符型(character)。由于字符型数据在读入时自动转换为因子,所以参数stringAsFactors=FALSE是为了防止导入的数据进行任何的因子转换。

  具体可查阅《R语言实战(第2版)》第二章中“2.3.2 从带分隔符的文本文件导入数据”相关内容。关于如何导入Excel数据可以参考文章【R语言】:导入Excel数据和【R语言】:简单数据处理分析。

  >

  首先对原始数据进行初步分析:第一列比赛日期(Date)的列名无需更改;第二列为比赛开始时间,原列名包含有英文缩写ET,推测其为美国东部时间East Time的缩写,决定把列名更改为Start_time;第三列为客场或中立球队,更改为V_team;第四列是客队得分,更改为V_PTS;第五列是主场或中立球队,更改为H_team;第六列是主队得分,更改为H_PTS;第七列是详细的个人比赛数据,应该有内链,但没有抓取到,随后删除;第八列标记了是否进行了加时赛(如果有是OT,没有为空);第九列是备注,全部为空,随后删除。

  比赛日期、客队、客队得分、主队、主队得分这五个列向量为空的数据都需要删除。

  比赛日期这一列包含的内容为星期(缩写)+月(缩写)+日(数字)+年(数字),利用函数str_split_fixed()将该列拆分为星期、月日年两列。

  这两列数据在随后数据分析中都有用,将在分析之前再跟实际需求分别赋值到数据框中。

  此外,原始数据已经按照比赛时间的升序排列,目前暂时不变,之后将根据需要另做排序。

  NBA整个赛季的比赛非常多,整个赛季总共近1300场比赛。可一个赛季下来,一周7天从星期一到星期天,到底联盟更喜欢把比赛安排到哪一天呢?会是周五晚上,还是周六晚上呢?还是其他某天晚上呢?

  其中,关于函数text()和函数minor.tick()的详细用法可参考:【R语言】:图形初阶(3)

  NBA整个2015-2016赛季(包含常规赛和季后赛),在一周内周三晚上的比赛数量最多(竟然不是周末),其次是周五晚上,周一晚上和周六晚上的比赛数量一样多,并列第三。

  NBA的各项数据是一个非常大的数据宝藏,今天这个非常简单的数据分析的小例子,仅仅利用非常少量的数据以及非常简单的数据源。

  NBA数据几乎拥有无限多可以分析的点以及可以深挖的内容,并且NBA各支球队目前也非常重视各项数据,并且用于指导球队的技战术提升和比赛。

下一篇: k1体育十年品牌有哪些堪称经典的 NBA 比赛?
上一篇: NBA季后赛:哈登狂砍33分快船逆袭击败独行侠k1体育
相关文章
返回顶部小火箭