当前位置: 高中信息技术 / 综合题
  • 1. (2022高三上·浙江月考) 大力老师收集了学校高三年级7选3选课数据,存储在“选课情况.xlsx”中,其数据格式如图所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。

    1. (1) 大力老师收集的数据存在一些问题,需要进行数据整理,下列说法合理的是(   )(多选)
      A . 数据集中格式不一致的数据,需要进行格式转换 B . 数据集中的异常数据应该直接删除或忽略 C . 数据集中的缺失的数据可以用任意值填充 D . 数据集中的重复数据须在审核的基础上进行合并或删除
    2. (2) 为实现统计各班技术选考人数,并找出技术选考人数最多的3个班级,大力老师通过Python编程进行数据处理,并以图表的形式呈现结果。实现上述功能的Python程序如下,请在划线处填入合适的代码。

      import pandas as pd

      import matplotlib . pyplot as plt

      plt . rcParams [ " font . sans-serif " ] = [ " SimHei " ]      #中文显示df = pd . read_excel ("选课情况. xlsx")

      g = df . groupby ("班级").技术.

      df1 = pd . DataFrame ( { "班级":, "技术人数" : g . values } ) df1 = df1 . sort_values ( "" , ascending = False )

      x =

      y = df1 . 技术人数 [ 0 : 3 ]

      plt . bar ( x , y , lable = "选技术人数" )

      plt . title ( "技术选科人数最多的三个班级" ) plt . xlabel ( "班级" )

      plt . ylabel ( "人数" ) plt . legend ( )

      plt . ylim( 40 , 50 ) plt . show ( )

微信扫码预览、分享更方便