高考数学专题11 独立性检验(解析版)

2023-11-09 · U1 上传 · 27页 · 1.3 M

专题11独立性检验例1.2019年11月5日至10日,第二届中国国际进口博览会在上海举行.某宣传媒体组织业内人士对某型号智能机器人进行评分,所得情况如图所示:(Ⅰ)试估计业内人士评分的平均数以及方差(用每个小矩形底边中点近似替代本组数据);(Ⅱ)为了调查评分与性别是否具有相关性,研究人员随机抽取了60位参加评分的业内人士,其中男性与女性人数各一半,根据已知条件完成下面列联表,据此资料,是否有的把握认为评分的高低与性别有关?分数不低于60分低于60分合计男性1630女性1030合计60参考公式:(1),其中.(2).参考数据:0.150.100.0500.0252.0722.7063.8415.024【解析】解:(Ⅰ)依题意,所求平均数为,方差为.(Ⅱ)由题意完善列联表如下:分数不低于60分低于60分合计男性141630女性102030合计243660,没有的把握认为评分的高低与性别有关.例2.某校举行了一次数学竞赛,为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为进行统计,按照,,,,,,,,,的分组作出频率分布直方图,已知得分在,,,的频数分别为16,4.(Ⅰ)求样本容量和频率分布直方图中的,的值;(Ⅱ)估计本次竞赛学生成绩的平均数(同一组中的数据用该组区间的中点值代表);(Ⅲ)在选取的样本中,若男生和女生人数相同,我们规定成绩在70分以上称为“优秀”,70分以下称为“不优秀”,其中男女生中成绩优秀的分别有24人和30人,请完成列联表,并判断是否有的把握认为“学生的成绩优秀与性别有关”?男生女生总计优秀不优秀总计0.100.050.0100.0050.0012.7063.8416.6357.87910.828附:,其中.【解析】解:(Ⅰ)由题意可知,样本容量,,.(Ⅱ)设本次竞赛学生成绩的平均数为,则.(Ⅲ)100位学生中男女生各有50名,成绩优秀共有54名,所以学生的成绩优秀与性别列联表如下表:男生女生总计优秀243054不优秀262046总计5050100,没有的把握认为“学生的成绩优秀与性别有关”.例3.某健身馆为了宣传健身效果,吸引顾客,特别请专业的评估机构对他们500名学员的锻炼成果进行评估打分(满分100分),并且认为评分不低于80分的参与者为健身达人,得到如表:健身达人非健身达人总计男20050250女100150250总计300200500(Ⅰ)判断能否在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系?(Ⅱ)若500名学员中40岁以上的有100人,30岁到40岁的有300人,30岁以下的100人,先从中分层抽取5人进行抽奖活动,再从这5人中抽取两位对其进行全年免单活动,求两人全年免单都在30岁到40岁之间的概率是多少?附:0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828,其中.【解析】解:(Ⅰ)因为,所以能在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系.(Ⅱ)根据分层抽样可知在40岁以上的学员中应抽取1人,记为;在30岁到40岁的学员中应抽取3人,记为,,;在30岁以下的学员中应抽取1人,记为,则从这5人中抽取2人,所有可能情况如下:,,,,,,,,,,共10种情况,2人都在30岁到40岁之间的有,,共3种情况,所以两人全年免单都在30岁到40岁之间的概率.例4.某公司为了推广某项技术,对旗下200名员工的年龄和人数进行了统计,统计其对这项技术的接受程度,从而为后期宣传工作做准备,并绘制了如下频率分布直方图.(Ⅰ)根据如图求样本年龄的中位数和平均数(同一组中的数据用该组区间的中点值为代表)(保留两位小数);(Ⅱ)若将样本分为两个年龄段,年龄在区间,和,分别称为“青少年”和“中老年”,根据相关条件完成下表,并判断是否有的把握认为对新技术接受程度与年龄段有关?青少年中老年合计接受2090不接受110合计200参考公式:,其中.参考数据:0.0500.0100.0013.8416.63510.828【解析】解:(Ⅰ)根据频率分布直方图可知样本年龄的平均数.设样本年龄的中位数为,由题知组距为10,,的频率为,,的频率为,所以中位数在区间,内,所以,即,所以样本年龄的平均数为44.50,中位数为38.67.(Ⅱ)由题意知,样本中的“青少年”共有(人,则“中老年”共有(人.根据频率分布直方图完成列联表如下:青少年中老年合计接受207090不接受4070110合计60140200则:,所以有的把握认为对新技术接受程度与年龄段有关.例5.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:积极型懈怠型总计男女总计男12368女021062(Ⅰ)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率;(Ⅱ)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有以上的把握认为“评定类型”与“性别”有关?附:,0.100.050.0250.0102.7063.8415.0246.635【解析】解:(Ⅰ)由题意知,40人中该日走路步数超过5000步的有35人,频率为,所以估计他的所有微信好友中每日走路步数超过5000步的概率为;(Ⅱ)由表中数据,填写列联表如下;积极型懈怠型总计男14620女81220总计221840计算观测值,所以没有以上的把握认为“评定类型”与“性别”有关.例6.为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分钟),,,,,人数525302515表2:女生上网时间与频数分布表上网时间(分钟),,,,,人数1020402010(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的列联表(此表应画在答题卷上),并回答能否有的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率.表上网时间少于60分钟上网时间不少于60分钟合计男生 60   女生   合计   附:,其中0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.845.0246.6357.87910.83【解析】解:(1)设估计上网时间不少于60分钟的人数,依据题意有,解得:,所以估计其中上网时间不少于60分钟的人数是225人;(4分)(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计男生6040100女生7030100合计13070200其中,因此,没有的把握认为“学生周日上网时间与性别有关”;(8分)(3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为,所以5人中上网时间少于60分钟的有3人,记为、、,上网时间不少于60分钟的有2人,记为、,从中任取两人的所有基本事件为:、、、、、、、、、共10种,其中“至少有一人上网时间超过60分钟”包含了7种,故所求的概率为.(12分)例7.某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为,女性人数为,男性患Ⅰ型病的人数占男性病人的,女性患Ⅰ型病的人数占女性病人的.Ⅰ型病Ⅱ型病合计男女合计(1)完成联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费元.甲团队研发的药物每次接种后产生抗体的概率为,根据以往试验统计,甲团队平均花费为;乙团队研发的药物每次接种后产生抗体的概率为,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:0.100.050.010.0050.0012.7063.8416.6357.87910.828【解析】解:(1)根据题意填写列联表如下;Ⅰ型病Ⅱ型病合计男女合计若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则,解得,由,且,所以的最小值为12,即男性患者至少有12人;(2)设甲研发试验品花费为,则;设乙研发试验品花费为,则的可能取值为、,所以,,所以;因为,所以;①当时,,因为,所以,所以,乙团队试验的平均花费较少,所以选择乙团队进行研发;②当时,,因为,所以,所以,甲团队试验的平均花费较少,所以选择甲团队进行研发;③当时,,所以,甲团队试验的平均花费和乙团队试验的平均费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.例8.某房产中介统计了深圳市某高档小区从2018年12月至2019年11月当月在售二手房均价(单位:万元平方米)的散点图,如图所示,图中月份代码1至12分别对应2018年12月至2019年11月的相应月份.根据散点图选择和两个模型进行拟合,根据数据处理得到两个回归方程分别为和,并得到以下一些统计量的值:残差平方和0.01485570.0048781总偏差平方和0.069193(1)请利用相关指数判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年5月份购买深圳市福田区平方米的二手房(欲购房为其家庭首套房).若该小区所有住房的房产证均已满3年,请你利用(1)中拟合效果更好的模型解决以下问题:估算该购房者应支付的购房金额.(购房金额房款税费;房屋均价精确到0.01万元平方米)若该购房者拟用不超过760万元的资金购买该小区一套二手房,试估算其可购买的最大面积(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按照房屋的计税价格进行征收.(计税价格房款)征收方式见如表:购买首套房面积(平方米)契税(买方缴纳)的税率参考数据:,,,,,,,,参考公式:相关指数.【解析】解:(1)设模型和的相关指数分别是和,则,,,,模型的拟合效果更好.(2)2020年5月份的对应月份代码为18,由(1)知,模型的拟合效果更好,利用该模型预测可得,这个小区2020年5月份的在售二手房均价为:万元平方米,设该购房者应支付的购房金额为万元,税费中买方只需缴纳契税,①当时,契税为计税价格的,故;②当时,契税为计

VIP会员专享最低仅需0.2元/天

VIP会员免费下载,付费最高可省50%

开通VIP

导出为PDF

图片预览模式

文字预览模式
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报
预览说明:图片预览排版和原文档一致,但图片尺寸过小时会导致预览不清晰,文字预览已重新排版并隐藏图片
相关精选
查看更多
更多推荐