当前位置: 高中信息技术 / 综合题
  • 1. (2022高二下·绍兴期末) 小明搜集了某网络购物平台2021年1月1日至2021年9月30日时间段内的日用化妆品销售数据,原始数据如下图a所示。

    1. (1) 小明对数据进行了整理,下列操作不恰当的是(   )(单选,填字母)。
      A . 发现记录中有6 条重复,对这6 条记录进行了删除 B . 发现记录中有38 处数据项缺失,直接删除相关记录 C . 将某条记录中订单日期“2050-6-9”订正为“2021-6-9” D . 将某条记录中订单日期“2021#3#11”修改为“2021-3-11”
    2. (2) 小明发现数据中仍有极少量时间段外的记录混杂其中,利用Python 及pandas 模块进行处理。请回答问题:

      ① 采用pandas 模块中的(单选:填字母:A .Series / B .DataFrame)

      数据结构存储全部数据会比较高效。

      ② 全部数据保存于变量df 中,为筛选出订单日期为2021 年第一季度内的所有记录,

      可以执行Python 语句df1 =  ,则df1 中保存筛选结果。(单选,填字母。

      提示:多条件筛选时,条件之间用“&”连接,表示需要同时满足这多个条件)

      A.df[ (df['订单日期'] <= '2021-1-1' ) & (df ['订单日期'] <= '2021-3-31') ]

      B.df [ (df ['订单日期'] >= '2021-1-1') & (df ['订单日期'] >= '2021-3-31') ]

      C.df [(df ['订单日期'] >= '2021-1-1') & (df ['订单日期'] <= '2021-3-31')]

    3. (3) 经过以上两步处理之后,为了解“所在地市”第一季度“订购数量”前10 名的情况,

      编写如下Python 程序段:

      #数据整理结果保存于变量df1中,代码略

      g = df1.groupby('所在地市', as_index = False).sum()

      print           )

      则划线处的代码可为(   )(多选,填字母)

      A . g.sort_values('订购数量',ascending = False) [0:10] B . g.sort_values('订购数量',ascending = True).tail(10) C . g.sort_values('订购数量',ascending = True)[0:10] D . g.sort_values('订购数量',ascending = False).head(10)
    4. (4) 根据以上数据整理结果,小明对第一季度所在地市的“订购数量”进行可视化处理,如图b所示。

      实现上述功能的Python程序部分代码如下:

      #按“所在地市”对第一季度数据分组并求和,再按“订购数量”升序排序

      #选取最后10条数据,存入变量s,代码略

      import matplotlib.pyplot as plt

      x = s['所在地市']

      y =

      plt.barh(x, y, color = 'r')

      plt.show( )

      程序中划线处代码应为

    5. (5) 小明借助大数据技术,对近几年来该网络购物平台的日用化妆品销售数据进行了分析。

      应用该分析结果可能提供的数据服务是(列举一条即可)。

微信扫码预览、分享更方便