(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得 = =9.97,s= = ≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数 作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( ﹣3 +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592, ≈0.09.
抽取次序 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
零件尺寸 | 9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
抽取次序 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
零件尺寸 | 10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得 = xi=9.97,s= = =0.212, ≈18.439, (xi﹣ )(i﹣8.5)=﹣2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在( ﹣3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi , yi)(i=1,2,…,n)的相关系数r= , ≈0.09.
(Ⅰ)记A表示时间“旧养殖法的箱产量低于50kg”,估计A的概率;
(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg | 箱产量≥50kg | |
旧养殖法 | ||
新养殖法 |
(Ⅲ)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.
附:
P(K2≥K) | 0.050 | 0.010 | 0.001 |
K | 3.841 | 6.635 | 10.828 |
K2= .
海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:
(Ⅰ)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(Ⅱ)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg | 箱产量≥50kg | |
旧养殖法 |
| |
新养殖法 |
|
(Ⅲ)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
P(K2≥k) | 0.050 | 0.010 | 0.001 |
K | 3.841 | 6.635 | 10.828 |
K2= .
最高气温 | [10,15) | [15,20) | [20,25) | [25,30) | [30,35) | [35,40) |
天数 | 2 | 16 | 36 | 25 | 7 | 4 |
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(Ⅰ)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(Ⅱ)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
最高气温 | [10,15) | [15,20) | [20,25) | [25,30) | [30,35) | [35,40) |
天数 | 2 | 16 | 36 | 25 | 7 | 4 |
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
男生 | 女生 | 合计 | |
挑同桌 | 30 | 40 | 70 |
不挑同桌 | 20 | 10 | 30 |
总计 | 50 | 50 | 100 |
Ⅰ 从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率;
Ⅱ 根据以上 列联表,是否有 以上的把握认为“性别与在选择座位时是否挑同桌”有关?
下面的临界值表供参考:
参考公式: ,其中
愿意被外派 | 不愿意被外派 | 合计 | |
70后 | 20 | 20 | 40 |
80后 | 40 | 20 | 60 |
合计 | 60 | 40 | 100 |
参考数据:
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 |
(参考公式: ,其中 )
(Ⅰ)应收集多少位女生样本数据?
(Ⅱ)根据这 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示).其中样本数据分组区间为: , , , , , .估计该年组学生每周平均体育运动时间超过 个小时的概率.
(Ⅲ)在样本数据中,有 位女生的每周平均体育运动时间超过 个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有 的把握认为“该年级学生的每周平均体育运动时间与性别有关”.
附:
(Ⅰ)求该批零件样本尺寸的平均数 和样本方差 (同一组中的数据用该组区间的中点值作代表);
(Ⅱ)若该批零件尺寸 服从正态分布 ,其中 近似为样本平均数 , 近似为样本方差 ,利用该正态分布求 ;
(Ⅲ)若从生产线中任取一零件,测量尺寸为 ,根据 原则判断该生产线是否正常?
附: ;若 ,则 , , .
整理评分数据,将分数以 10 为组距分成6 组: ,得到 服务机构分数的频数分布表, 服务机构分数的频率分布直方图:
定义市民对服务机构评价的“满意度指数”如下:
温度x/℃ | 21 | 23 | 24 | 27 | 29 | 32 |
产卵数y/个 | 6 | 11 | 20 | 27 | 57 | 77 |
经计算得: , , , ,
,线性回归模型的残差平方和 ,e8.0605≈3167,其中xi , yi分别为观测数据中的温度和产卵数,i=1, 2, 3, 4, 5, 6.
(Ⅰ)若用线性回归模型,求y关于x的回归方程 = x+ (精确到0.1);
(Ⅱ)若用非线性回归模型求得y关于x的回归方程为 =0.06e0.2303x , 且相关指数R2=0.9522.
( i )试与(Ⅰ)中的回归模型相比,用R2说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为35℃时该种药用昆虫的产卵数(结果取整数).
附:一组数据(x1 , y1), (x2 , y2), ...,(xn , yn), 其回归直线 = x+ 的斜率和截距的最小二乘估计为
= − ;相关指数R2= .
反对 | 支持 | 合计 | |
男性 | 70 | 60 | |
女性 | 50 | 120 | |
合计 |
K2= ,其中n=a+b+c+d独立性检验临界表:
P(K2≥k) | 0.100 | 0.050 | 0.010 | 0.001 |
k | 2.706 | 3.841 | 6.635 | 10.828 |
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
人数 | 数学 | |||
优秀 | 良好 | 及格 | ||
地理 | 优秀 | 7 | 20 | 5 |
良好 | 9 | 18 | 6 | |
及格 | a | 4 | b |
成绩分为优秀、良好、及格三个等级;横向、纵向分别表示地理成绩与数学成绩,例如:表中数学成绩为良好的人数共有20+18+4=42.
①若在该样本中,数学成绩优秀率是30%,求a,b的值;
②在地理成绩及格的学生中,已知a≥11,b≥7,求数学成绩优秀人数比及格人数少的概率.
年龄 | [15,25) | [25,35) | [35,45) | [45,55) | [55,65] |
支持“延迟退休”的人数 | 15 | 5 | 15 | 28 | 17 |
45岁以下 | 45岁以上 | 总计 | |
支持 | |||
不支持 | |||
总计 |
①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;
②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.
P(K2≥k0) | 0.100 | 0.050 | 0.010 | 0.001 |
k0 | 2.706 | 3.841 | 6.635 | 10.828 |
.
售价x | 33 | 35 | 37 | 39 | 41 | 43 | 45 | 47 |
销量y | 840 | 800 | 740 | 695 | 640 | 580 | 525 | 460 |
①请根据下列数据计算相应的相关指数R2 , 并根据计算结果,选择合适的回归模型进行拟合;
②根据所选回归模型,分析售价x定为多少时?利润z可以达到最大.
|
|
| |
| 49428.74 | 11512.43 | 175.26 |
| 124650 |
(附:相关指数 )
贷款期限 | 6个月 | 12个月 | 18个月 | 24个月 | 36个月 |
频数 | 20 | 40 | 20 | 10 | 10 |
以上表各种贷款期限频率作为2017年贫困家庭选择各种贷款期限的概率.
组别 | PM2.5浓度(微克/立方米) | 频数(天) | 频率 |
第一组 | (0,25] | 3 | 0.15 |
第二组 | (25,50] | 12 | 0.6 |
第三组 | (50,75] | 3 | 0.15 |
第四组 | (75,100] | 2 | 0.1 |
①求频率分布直方图中a的值;
②求样本平均数,并根据样本估计总体的思想,从PM2.5的年平均浓度考虑,判断该居民区的环境质量是否需要改善?并说明理由.
高一年级 | 7 | 7.5 | 8 | 8.5 | 9 | |||
高二年级 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
高三年级 | 6 | 6.5 | 7 | 8.5 | 11 | 13.5 | 17 | 18.5 |
(Ⅰ)视x分布在各区间内的频率为相应的概率,求P(x≥120)
(Ⅱ)将T表示为x的函数,求出该函数表达式;
(Ⅲ)在频率分布直方图的市场需求量分组中,以各组的区间中点值(组中值)代表该组的各个值,并以市场需求量落入该区间的频率作为市场需求量取该组中值的概率(例如x∈[100,110),则取x=105,且x=105的概率等于市场需求量落入100,110)的频率),求T的分布列及数学期望E(T).