当前位置: 高中信息技术 / 综合题
  • 1. (2023高二上·温州期末) 小王收集了近三年浙江省部分高校的一段录取分数线,存储到“gxlqx.xlsx”Excel文件中,部分数据如图所示:

    请回答以下问题:

    1. (1) 在数据分析和数据挖掘前,小王需要先对数据进行整理,下列关于数据整理的说法,正确的有(   )(多选,填字母)
      A . C5单元格数据缺失,可直接用温州医科大学“口腔医学”专业2020分数线填充 B . 第7行是重复数据,可以直接删除 C . D2单元格的分数线异常,可上网搜索实际数据并进行修改 D . 为了方便后续数据统计与分析,将“2021分数线”列数据中所有的“分”字去除
    2. (2) 小王通过Python编程,检索2021年最低录取分数线最高的前10所学校,代码如下:

      import pandas as pd

      import matplotlib.pyplot as plt

      plt.rcParams['font.sans-serif']=['simhei'] #指定中文默认字体

      df=pd.read_excel ("gxlqx.xlsx")

      df=df[0:10]

      以下选项中有两项是能实现加框处功能的,请选择并按正确顺序填写

      A . df=df.sort_values("最低分数线",ascending=True)

      B . df=df.sort_values("2021 分数线",ascending=False)

      C . df=df.groupby("2021 分数线",as_index=False).min()

      D . df=df.groupby("学校",as_index=False).min()

    3. (3) 小王对以上分析结果做了数据可视化处理,效果如下,请在划线处填入合适的代码。

      x=df["学校"]

      y=df["2021分数线"]

      plt.title("2021年最低录取分数线排名的前10个学校")

      plt.show ( )

微信扫码预览、分享更方便