高二数学衡水名师原创专题卷——统计(理)
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分。考试时间120分钟,满分150分。考生应首先阅读答题卡上的文字信息,然后在答题卡上作答,在试题卷上作答无效。
第I卷
选择题
1.对于简单随机抽样,下列说法中,正确的为( ).
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;
②它是从总体中按排列顺序逐个地进行抽取;
③它是一种不放回抽样;
④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种方法抽样的公平性.
A.①②③ B.①②④
C.①③④ D.①②③④
2.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生( ).
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,10人
D.30人,50人,10人
3.已知一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,中位数为22,则x的值等于( ).
A.21 B.22 C.20 D.23
4.下列说法中,正确的是( ).
A.数据 5,4,4,3,5,2 的众数是 4
B.一组数据的标准差是这组数据的方差的平方
C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半
D.频率分布直方图中各小长方形的面积等于相应各组的频数
5.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在2 700~
3 000(单位:克)的频率为( ).
A.0.001 B.0.1 C.0.2 D.0.3
6.下列说法中正确的是( ).
A.y=2x2+1中的x,y具有相关关系的两个变量
B.正四面体的体积与其棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.某地区感染流感人数与外来流感患者人数具有相关关系的两个变量
7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在(56.5,64.5)的学生人数是( ).
A.20 B.30 C.40 D.50
丙的成绩 |
||||
环数 |
7 |
8 |
9 |
10 |
频数 |
4 |
6 |
6 |
4 |
8.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表
甲的成绩 |
||||
环数 |
7 |
8 |
9 |
10 |
频数 |
5 |
5 |
5 |
5 |
乙的成绩 |
||||
环数 |
7 |
8 |
9 |
10[来源:Zxxk.Com] |
频数 |
6 |
4 |
4 |
6 |
s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ).
A.s3>s1>s2 B.s2>s1>s3 C.s1>s2>s3 D.s2>s3>s1 [来源:学|科|网] 9.通过随机抽样用样本频率分布估计总体分布的过程中,下列说法正确的是( ).
A.总体容量越大,可能估计越精确 B.样本容量大小与估计结果无关
C.样本容量越大,可能估计越精确 D.样本容量越小,可能估计越精确
10.从观测所得的数据中取出m个x1,n个x2,p个x3组成一个样本,那么这个样本的平均数是( ).
A. B.
C. D.
第Ⅱ卷
二、填空题
11. 一个总体容量为60,其中的个体编号为00,01,02,…,59.现需从中抽取一个容量为7的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11~12列的18开始,依次向下,到最后一行后向右,直到取足样本,则抽取样本的号码是 .
95 33 95 22 00 18 74 72 00 18 46 40 62 98 80 54 97 20 56 95
38 79 58 69 32 81 76 80 26 92 15 74 80 08 32 16 46 70 50 80
82 80 84 25 39 90 84 60 79 80 67 72 16 42 79 71 59 73 05 50
24 36 59 87 38 82 07 53 89 35 08 22 23 71 77 91 01 93 20 49
96 35 23 79 18 05 98 90 07 35 82 96 59 26 94 66 39 67 98 60
12.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是 .
13.一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是 .
14.甲乙两种冬小麦试验品种连续5年的平均单位面积产量如下:其中产量比较稳定的小麦品种是 .[来源:学_科_网Z_X_X_K]
品种 |
第一年 |
第二年 |
第三年 |
第四年 |
第五年 |
甲 |
9.8 |
9.9 |
10.1 |
10 |
10.2 |
乙 |
9.4 |
10.3 |
10.8 |
9.7 |
9.8 |
15.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7.现去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 , .
16.某鱼塘放养鱼苗10万条,根据这几年的经验知道,鱼苗成活率为95%.一段时间后准备打捞出售,第一次捞出40条,称得平均每条鱼重2.5 kg;第二次捞出25条,称得平均每条鱼重2.2 kg;第三次捞出35条,称得平均每条鱼重2.8 kg.请你根据这些数据,估计鱼塘中的鱼的总重量约是 .
三、解答题
17.某中学高中部共有16个班,其中一年级6个班,二年级6个班,三年级4个班.每个班的人数均在46人左右(44人~49人),各班的男女学生数均基本各占一半.现要调查这所学校学生的周体育活动时间,它是指学生在一周中参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课、上学和放学路上的活动时间不计在内).为使所得数据更加可靠,应在所定抽样的“周”之后的两天内完成抽样工作.试给出抽样方法,分别对男、女学生抽取一个容量相同的样本,样本容量可在40~50之间选择.
18.一个单位有职工160人,其中业务员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法写出抽取样本的过程.
19.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg):
56.5 |
69.5 |
65 |
61.5 |
64.5 |
66.5 |
64 |
64.5 |
76 |
58.5 |
72 |
73.5 |
56 |
67 |
70 |
57.5 |
65.5 |
68 |
71 |
75 |
62 |
68.5 |
62.5 |
66 |
59.5 |
63.5 |
64.5 |
67.5 |
73 |
68 |
55 |
72 |
66.5 |
74 |
63 |
60 |
55.5 |
70 |
64.5 |
58 |
64 |
70.5 |
57 |
62.5 |
65 |
69 |
71.5 |
73 |
62 |
58 |
76 |
71 |
66 |
63.5 |
56 |
59.5 |
63.5 |
65 |
70 |
74.5 |
68.5 |
64 |
55.5 |
72.5 |
66.5 |
68 |
76 |
57.5 |
60 |
71.5 |
57 |
69.5 |
74 |
64.5 |
59 |
61.5 |
67 |
68 |
63.5 |
58 |
59 |
65.5 |
62.5 |
69.5 |
72 |
64.5 |
75.5 |
68.5 |
64 |
62 |
65.5 |
58.5 |
67.5 |
70.5 |
65 |
66 |
66.5 |
70 |
63 |
59.5 |
试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.
20.有顾客反映某家航空公司售票处售票的速度太慢.为此,航空公司收集了100位顾客购票时所花费时间的样本数据(单位;分),结果如下表:
2.3 1.0 3.5 0.7 1.0 1.3 0.8 1.0 2.4 0.9
1.1 1.5 0.2 8.2 1.7 5.2 1.6 3.9 5.4 2.3
6.1 2.6 2.8 2.4 3.9 3.8 1.6 0.3 1.1 1.1
3.1 1.1 4.3 1.4 0.2 0.3 2.7 2.7 4.1 4.0
3.1 5.5 0.9 3.3 4.2 21.7 2.2 1.0 3.3 3.4
4.6 3.6 4.5 0.5 1.2 0.7 3.5 4.8 2.6 0.9
7.4 6.9 1.6 4.1 2.1 5.8 5.0 1.7 3.8 6.3
3.2 0.6 2.1 3.7 7.8 1.9 0.8 1.3 1.4 3.5
11 8.6 7.5 2.0 2.0 2.0 1.2 2.9 6.5 1.0
4.6 2.0 1.2 5.8 2.9 2.0 2.9 6.6 0.7 1.5
航空公司认为,为一位顾客办理一次售票业务所需的时间在5分之内就是合理的.上面的数据是否支持航空公司的说法?请你对上面的数据进行适当的分析,回答下面问题:
(1)根据原始数据计算中位数、均值和标准差,并进行分析;
(2)对数据进行适当的分组,分析数据分布的特点;
(3)你认为应该用哪一个统计量来分析上述问题比较合适?
统计答案解析
一、选择题
1.C
解析:②错.若按排列顺序逐个抽取,则导致了每个个体被抽取的概率不等.
2.B
解析:甲校、乙校、丙校学生人数之比为2∶3∶1,采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生30人,45人,15人.
3.A.
解析:22是x与23的平均数,所以答案为A.
4.C
解析A项错误,众数为 4,5;B项错误,标准差是方差的算术平方根;C项正确;D项错误,面积是频率.
5.D
解析:300×0.001=0.3.
6.D
解析:感染非典的医务人员人数不仅受医院收治病人数的影响,还受防护措施等其他因素的影响,所以选D.A,B是确定性函数关系,C非确定性关系(销售量还与其他因素如质量等有关).
7.C
解析:根据运算的算式:体重在(56.5,64.5)学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在(56.5,64.5)学生的人数为0.4×100=40.
8.B
解析:∵甲==8.5,
;
乙=,
=1.45;
丙=,
=1.05;
由>>,得s2>s1>s3.
9.C
解析:样本容量越大越能反映总体.
10.D
解析:根据加权平均数的定义或直接根据平均数定义即可得出.
二、填空题
11. 18,05,07,35,59,26,39.
解析:先选取18,向下81,90,82不符合要求,下面选取05,向右读数,07,35,59,26,39,因此抽取的样本的号码为:18,05,07,35,59,26,39.
12.63.
解析:由题意第7组中抽取的号码的个位数字为3,这是因为6+7=13,而十位数字为6,故抽取的号码为63.
13.16.
解析:频数=频率×样本容量.
14.甲.
解析:比较它们的方差即可,方差较小的较稳定.
15.9.5,0.016.
解析:最高分是9.9,最低分是8.4,去掉后的数据为9.4,9.4,9.6,9.4,9.7,
它们的平均数,
方差为.
16.24万kg.
解析:先算出三次捞出的鱼每条鱼的重量平均数为
=2.53(kg),
所以鱼塘中的鱼的总重量约为2.53×(100 000×95%)≈24万kg.
三、解答题
17.由于各个年级的学生参加体育活动的时间存在差异,应采用分层抽样;又由于各班的学生数相差不多,且每班的男女学生人数也基本各占一半,为便于操作,分层抽样时可以班级为单位.关于抽取的人数,如果从每班中抽取男、女学生各3人,样本容量各为48(即3×16),符合对样本容量的要求.
18.样本容量与职工总人数的比为20∶160=1∶8,业务人员、管理人员、后勤服务人员应抽取的个体数为,,,即分别为15人、2人和3人,每一层抽取时可采用简单随机抽样或系统抽样,再将各层抽取的个体合在一起,就是要抽取的样本.
19.按照下列步骤获得样本的频率分布.
(1)求最大值与最小值的差.
在上述数据中,最大值是76,最小值是55,它们的极差是76-55=21.
(2)确定组距与组数.
如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的. 于是组距为2,组数为11.
(3)决定分点.
根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).
(4)列频率分布表
频率分布表
分组 |
频数累计 |
频数 |
频率 |
[54.5,56.5) |
|
2 |
0.02 |
[56.5,58.5) |
|
6 |
0.06 |
[58.5,60.5) |
|
10 |
0.10 |
[60.5,62.5) |
|
10 |
0.10 |
[62.5,64.5) |
|
14 |
0.14 |
[64.5,66.5) |
|
16 |
0.16 |
[66.5,68.5) |
|
13 |
0.13 |
[68.5,70.5) |
|
11 |
0.11 |
[70.5,72.5) |
|
8 |
0.08 |
[72.5,74.5) |
|
7 |
0.07 |
[74.5,76.5) |
|
3 |
0.03 |
合计 |
|
100 |
1.00 |
(5)绘制频率分布直方图.
频率分布直方图如图所示:
(第19题)
由于图中各小长方形的面积等于相应各组的频率,这个图形以面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%.
20.(1)根据原始数据计算中位数、均值和标准差如下:
顾客购票花费时间的中位数位置===50.5,将100个数据由小到大排列,中位数在第50个数值(2.4)和第51个数值(2.6)之间,中位数==2.5(分);
平均花费时间为
(分);
标准差为
≈2.85(分).
(2)对数据进行分组的结果如下表:
100名顾客购票花费时间的分组表
花费时间(分) |
频数(人) |
频率(%) |
1以下 |
14 |
14 |
1~2 |
24 |
24 |
2~3 |
20 |
20 |
3~4 |
15 |
15 |
4~5 |
9 |
9 |
5~6 |
6 |
6 |
6~7 |
5 |
5 |
7~8 |
3 |
3 |
8~9 |
2 |
2 |
9以上 |
2 |
2 |
合计 |
100 |
100 |
绘制直方图观察数据分布的特点,直方图如下:
(第20题)
从直方图可以看出,顾客购票所花费时间的分布为左偏.有顾客反映某家航空公司售票处售票的速度太慢,这可能是由少数人提出来的.因此这些少数顾客提出的意见并不能代表大多数人,少数顾客的意见应该作为航空公司完善售票系统加强管理的参考意见.
(3) 从平均数来看,其结果为3.17分,因此,从总体上看,该航空公司办理一项售票业务所需的平均时间约为3.2分;从中位数来看,其结果为2.5分,这说明有一半顾客在2.5分之内可以购得机票.平均数、中位数都在航空公司认为的合理时间(5分)之内.
获得更多试题及答案,欢迎联系微信公众号:ygjjcom
上一篇: 2019-2020学年高二数学衡水名师原创专题卷——统计(文) 下一篇: 2019-2020学年衡水中学高一数学第一章检测卷