时间:2023-08-11 17:18:46
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇大学数学统计学范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
课程代码318.009.1编写时间
课程名称数理统计
英文名称Statistics
学分数3周学时3+1
任课教师*徐先进开课院系**数学学院
预修课程
课程性质:
本课程为数学学院本科生开设,是概率论基础的继续,介绍数理统计学的基础知识。
基本要求和教学目的:
课程基本内容简介:
数理统计是一门理论研究与数学实践相结合的学科,它区别于概率论基础部分,不从概率空间出发,而是考虑如何给随机现象装配一个概率空间。
数理统计学研究数据资料的收集、整理、分析和推断,广泛地应用于社会科学、工程技术和自然科学中。
教学方式:
教材和教学参考资料:
作者教材名称出版社出版年月
教材概率论,第二册,数理统计(两分册)人民教育出版社1979
参考资料陈希孺数理统计引论科学出版社1981
峁诗松,王静龙,濮晓龙高等数理统计高等教育出版社,施普林格出版社1998,2003
J.O.BergerStatisticaldecisiontheoryandBayesionanalysis,2ndedition
中译本:贾乃光译,统计决策理论和贝叶斯分析Springer-Verlag,NewYork
中国统计出版社1985
1988
教学内容安排:
第一章引论
本章的教学目的是阐述数理统计学的基本问题,介绍数理统计学的基本概念。指出了现阶段的教学内容是研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,而不是考虑如何设计获得数据的试验。
统计量是从数据中提取信息的工具。本章介绍了两种常用求估计量的方法,介绍了刻画统计量性能的一致最小方差的概念。
§1统计学的基本问题
§2数理统计学的基本概念
§3求估计量的两种常用方法
§4一致最小方差无偏估计
第二章抽样分布
本章假定待研究的母体服从最常见的正态分布,导出了常用统计量,,的分布。本章的结论是对小样本讨论的,由于正态分布的特殊性,它们也可作为大样本情形的极限分布。
本章还介绍了与正态母体相联系的柯赫伦定理与费歇定理。
§1正态母体子样的线性函数的分布
§2分布
§3分布和分布
§4正态母体子样均值和方差的分布
第三章假设检验(I)
本章的教学目的是让学生认识到参数估计、假设检验和区间估计是针对问题的不同性质而作的三种统计推断,掌握并正确理解显著性检验问题的处理步骤。在本章的执行过程中,给出了一些典型的假设检验问题的分析和理解,以帮助学生掌握和运用这一统计思想。
本章介绍了具有一般意义的广义似然比检验。
§1引言
§2正态母体参数的检验
§3正态母体参数的置信区间
§4多项分布的检验
§5广义似然比检验
第四章线性统计推断
本章主要讨论数理统计学中两类重要的问题,线性模型和回归分析,介绍了处理另一类问题的方差分析。在数学过程中,解释了在复杂问题中使用线性模型的合理性,也分析了统计假设在实际问题中的意义。
在本章的执行过程中,比较了回归分析与线性模型的异同点。
§1最小二乘法
§2回归分析
§3方差分析
第五章点估计
本章从理论的角度讨论了一致最小方差无偏估计的性质。介绍了一些寻找一致最小方差无偏估计的方法。
中图分类号: C829. 2
《概率论与数理统计》是研究随机现象客观规律的一门学科,由于其理论知识的抽象性和思维方法的独特性常常造成学生理解和接受上的困难!特别是在大数据与大众创新双重背景下,随着数字化的进程不断加快,人们越来越多地希望能够从大数据中总结出一些经验规律从而为相关的决策提供一些理论依据[4]。因此积极探索概率统计的创新教学模式[2,3],显得尤为必要!
一、明确教学目标―是教学创新的源泉
高校概率统计学科教学, 对于培养和发展学生的数学素质具有极为特殊的重要作用!在教学中, 我们把教学目标定位在培养和发展学生随机数学素质,体现在重点培养学生四种思维能力:一是随机性思维,即以随机数学解释客观世界的偶然性(随机性)现象的思维。二是公理化思维, 即突出精确性、形式化和符号化。三是模型化思维, 通过建模来刻画事物本质,是该学科应用的基本方式。四是“大统计学”思维,即认识大数据、收集大数据与分析大数据的思维[4]。
二、整合重组教学内容-使创新建立在优化的知识结构上
创新能力的培养, 总是依托一定的知识来承载。知识是创新的源泉,创新是知识的转化与整合。根据创新教育特点, 紧紧围绕培养学生随机性数学素质和创新能力需要, 精选教学内容,坚持整体优化, 着眼发挥知识结构的整体功效, 注重知识之间的相互联系, 选择多方面、多类型的知识,形成创新的知识体系。因此, 可把课程内容整合成三大类知识:一是核心理论知识。主要包括概率论知识、统计学知识、“现代统计分析方法与应用随机过程等理论知识。二是方法性知识。主要指不确定性分析、随机分析、统计推断和大数据技术等方法。三是应用性、前沿性知识。这些知识的学习对培养学生的创新精神和创新能力不无裨益。
三、优化教学过程-体现在创新教学方法上
为了优化教学过程,我们尝试教学方法与手段的多样化, 使讲授、操作和实践相结合, 教学时倡导学生将动手实践、自主探索与合作交流等作为主要学习方式,使学习过程变为一个生动活泼的、主动的和富有个性的过程。经过尝试,初步取得了成效。
(一) 注重数学思想和方法的教学-选讲概率统计史料[1]。引导学生认识其发展历史,激发其学习的动力!比如通过选讲概率统计学家泊松、贝努利、高斯、贝叶斯等对概率统计的贡献,培养学生的创新意识和重新发现“概率统计”的能力,增强其学习兴趣和自信心。
(二)采用案例教学法[3]培养学生的创新思维能力。如选用古典概率公式解决“鞋子配对
收稿日期:
基金项目:国家自然科学基金(11461061)和重庆师范大学博士启动基金项目(15XLB013)资助.作者简介:康元宝(1973-),男,甘肃泾川人,讲师,博士,主要从事随机分析和数学教育育研究.
问题”与“概率与密码问题”等,又如运用“统计估计”思想与“假设检验”方法解决“先尝后买产品的促销问题”、“吸烟与患癌症的相关性”;以及用中心极限定理解决“保险公司盈利与亏损的问题”等等。促使学生养成科学创新思维的习惯。
(三)结合实际,培养学生利用概率统计建模能力。从理论的掌握到应用不是一件容易的事情,学生创新能力的培养是一项艰巨的任务。在教学中, 我建议通过成立概率统计学习兴趣小组,培养学生创新能力。每周活动1― 2 次,经过指导他们学习的方法,并使之充分认识概率统计的实用性,进而培养其创新能力。如鼓励学生通过建模来解决一些实际问题。如分析学生学习成绩与性别的关系,考察入学成绩与在校成绩的相关性等;还可拿出一些相应的全国大学生数学建模题让学生探讨研究,如2014 年A 题的城市表层土壤重金属污染分析问题,可用统计分析等方法解决。这样更能够增强学生的应用意识,培养学生的创新能力!
四、转变评价观念――实施科学的考核评价
评价是教学过程中非常重要的环节。但过去常常把“考试”作为衡量学生学习结果的工具, “一考定终身”。因此, 出现了教学过程中“教”和“学”的目的似乎纯粹是为了“考”的奇怪现象! 这是应试教育的典型特征与悲剧! 我们在概率统计创新教学中,需要转变评价观念, 坚持“考”为教学服务、为培养创新人才服务, 把考试作为实现教学目标的重要手段, 积极改革教学评价方式, 实施科学的考核评价。彻底改变唯分数论的教学评价体系!实行平时考核与期终考试相结合, 加强平时考核检查力度。最后通过成绩分析和反馈改进教学。如对成绩分布情况进行分析, 看是否符合正态分布,利用方差分析判断学生的学体水平和发展趋势。经过对每道题的得分情况进行统计分析, 评价学生对每个知识点的掌握情况和运用能力, 找出薄弱环节, 以便对原教学设计进行调整和改进。再对试题和试卷的信度、效度、难度、区分度等进行全面的分析, 利用最小二乘回归方法检验本次考试的质量, 提出改进措施, 以利于科学的考评!此外,也可通^贯彻如下教学创新模式:注重培养学生自主创新、多向发展和学以致用!
参考文献
[1]. 徐传胜. 运用实际问题改进《概率统计》教学[J] ,数学教育学报, 2000 , 9 (4) : 91~94.
[中图分类号] O21 [文献标识码] A [文章编号] 2095-3437(2015)11-0183-02
一、引言
2009年8月5日的《纽约时报》刊登题为“当今大学毕业生唯一关键词:统计学”文章。[1]文中介绍,哈佛大学人类学家格赖姆斯改行就职Google,从事海量数据的分析工作,整天就是和数学、计算机打交道,用数据分析方法改善Google搜索引擎。文中援引Google首席经济师范里安的话说:“我坚持认为今后10年最性感的工作是当统计师,我可没开玩笑!”麻省理工学院经济学家布林约夫森说:“我们进入了一个一切都可以被监测器和科学仪器数字化和记录的时代(大量数据在不断产生),但最大的问题是我们有没有能力利用、分析这些数据,让其为我们服务。”数据中有大量的珍宝。IBM组织了200名数学家、统计学家和其他数据分析大师为商业分析和优化服务,在数据中探宝,他们计划将探宝队伍扩充到4000人。网络数据的样本量打开了一个新世界,康奈尔大学克莱因伯格说,社会统计中,相比传统采访和问卷调查等形式的抽样,数百万计的网民的网络互动产生的样本量是令人惊奇的。专家警告,统计学面临着严重的危机,单就网络数据的体量就足以使得传统统计模型丧失能力,而且,数据的强相关性未必就有因-果关系。
数据在爆炸,我们在惊梦中进入了大数据(Big Data)时代,大数据正在引起一场革命,它将改变我们的生活、工作和思维[2],统计学是关于数据的科学,它迎来了一场变革,是机遇也是挑战。[3] [4]
二、大数据的产生及其特征
数据化是大数据时代到来的标志。社会网络、电子商务、移动通信、深空探测、卫星遥感、基因测序以及其他科学测量仪器时时刻刻都在自动测量和记录着数据,而且这一趋势在不断增强。2007年所有数据中只有7%是存储在报纸、书籍、图片等介质上,其余全部都是数字数据。Google每天要处理超过24PB2的数据,它是美国国家图书馆所有纸质出版物所含数据量的上千倍。科尔尼公司科学家统计结果显示,仅2012年就产生了2.5ZB的数据,并且数据产生量以每年40%的速度递增,2011、2012两年产生了全球90%的数据,到2020年将达到45ZB,这是天文数字。
我们用中国移动公司为例大致描述一下大数据的产生。2015年中国移动已经达到12.93亿个用户,用户数近似12G,给用户提供通话、短信、上网等服务。若网络流量包月30MB,每天1MB,平均每天网络数据流量达到12PB,若每天还记录用户信息(姓名、身份、职业、位置等),通话(时刻、时长、内容),短信(内容)等,保守估计所产生的数据可以达到300PB,一年将超过100EB=0.1ZB。再看这些数据的形式,它们有文字、表格、符号、图片、语音、数字、影像、上网轨迹等等,如果还考虑这些数据时时刻刻都在改变,每个用户有自己的偏好,可以想象这些数据的体量、变化性、复杂性,如果移动公司利用这些数据进行市场分析和行业规划,这些数据还具有巨大价值。图1描述了大数据的产生及其演化过程。[5]
人们从不同的方面对大数据进行了描述和定义。从特征来看,大数据具有“4V”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。[6]Volume:由于当今数据的体量大,其处理和管理只能依靠专门的技术,驾驭这些先进技术是开启大数据宝藏的钥匙;Velocity:快速处理大数据并获取有用信息;Variety:要开发利用的大数据的数据类型庞杂、数据源众多;Value:大数据中隐含着商机,隐含着企业、行业乃至国家战略决策的依据,它是煤、石油、金属矿产、水等之外的一种新型资源。
图1 大数据的演化图(据科尼尔分析修改[5])
从统计的角度,李金昌认为大数据不是基于人工设计、借助传统方法而获得的有限、固定、不连续、不可扩充的结构型数据,而是基于现代信息技术与工具可以自动记录、储存和连续扩充的、大大超出传统统计记录与储存能力的一切类型的数据。[6]
从技术的角度,维基百科的定义是,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据”。
三、大数据时代的大学统计教学
大数据时代是以数据为中心的时代,是数据驱动的时代。作为关于数据的科学,统计学面临着重大的机遇和挑战,大学统计学教学面临着重大变革。20世纪中叶计算机技术的进步为统计应用的腾飞插上了有力的翅膀,使其应用范围遍及自然科学、社会科学的各个领域,无所不在,使得统计学趋向成熟。如今计算机、互联网、云计算电子商务和社会网络等的发展又将统计学推到了风口浪尖,国际、国内很多统计学家纷纷撰文对统计学为适应新时代的发展所需的变革进行了论述。
孟生旺和袁卫[7]根据2014年11月美国统计学会的统计学本科专业指导性教学纲要,强调了4个方面:(1)数据科学日益重要,统计专业人才不仅需要扎实的数学和统计基础,还要有强大的统计计算和编程能力,可以熟练使用专业统计软件和数据库;(2)真实数据是统计专业教育的重要组成部分;(3)需要更加多样化的统计模型和方法;(4)通过语言、图表和动画等用户易于理解的方式表达数据分析结论的能力。他们还从统计方法与统计理论、数据操作与统计计算、数学基础、实践训练等几个方面对课程设置提出了具体要求。
结合他人的思想,我们认为在教学过程中必须思考几个方面的问题并进行思想方法和教学方法的转变。
(1)对数据的认识,传统统计数据类型包括时间序列数据、截面数据、面板数据以及空间面板数据等,结构性强,针对每类数据都有有效的统计分析方法和模型。然而,如上文提到的通信数据,还有社交网络记录的数据、电子商务记录的客户数据等等,它们往往是传统数据类型的混杂体,既有静态的也有动态的,既有结构性的也有非结构性的。另外,数据库与数据库之间存在大量数据交换与关联,这些数据都不适合传统统计模型,要想在这些数据中挖掘到有用信息,要进行市场分析与决策。面对这些因素,我们在教学中该如何处理,如何思考?另外,这些数据中的变量可能是一个Word文档,可能是一段语音,可能是一幅图片,是不是需要将它们都转化成数字再处理呢?
(2)关于抽样,首先由于网络和科学仪器的进步,数据获取技术得到了前所未有的提高,加上强大的计算机处理能力,通过抽取样本推断总体的属性是不是造成信息浪费呢?维克托主张,当数据处理技术已经发生了翻天覆地的变化时,抽样技术就像汽车时代骑马一样,一切都变了,我们需要的是全部数据而不是样本,统计需要“全数据模式”:样本=总体。
(3)精确与简单,维克托估计大数据中只有5%的数据是结构化的,是可以用传统统计学模型进行分析的,然而其余95%的数据是混杂的,其中隐含的信息不仅多而且可能是更有用的,如果因为追求精确性而拒绝混杂数据将是资源的巨大浪费。他认为,大数据的简单算法比小数据的复杂算法更有效,我们不应该拒绝混杂性,而要以混杂性为标准设计新型数据库进而快速有效地获取有用信息。
(4)因果与相关,相关性回答的是“是什么”,因果关系回答的是“为什么”。维克托主张,大数据时代,我们不必一定要知道现象背后的原因,而是要让数据自己“说话”,知道是什么就够了,知道了是什么就可以创造巨大的社会价值,大数据时代探索世界的方法需要改变。然而,维克托的《大数据时代》中译本作者周涛对“相关关系比因果关系更重要”观点不认同,认为放弃对因果关系的追求就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。我们同意周涛的观点,在巨大的利益面前尽快、尽量多的知道是什么是很重要的,尤其是对商业界来说。探索事物之间的因果关系是统计学的重要使命之一,然而与小数据相比,大数据中的因果关系可能被大量的混杂性掩埋,望远镜和显微镜如何有效地配合使用也是我们不能回避的问题。
统计这门学科的发展一方面必须适应社会的发展,满足社会的需求,另一方面要不断完善其理论、方法体系。这样一来,大学的统计教学既要让学生掌握传统统计学知识,又要激发和培养学生们大胆探索适应大数据时代的新思想、新方法和新应用。
[ 注 释 ]
[1] STEVE LOHR, For Today’s Graduate, Just One Word:Statistics[N].New York Times,2009-08-05.
[2] 维克托著.周涛译.大数据时代――生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.
[3] 耿直,大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1):5-9.
[4] 邱东,大数据时代对统计学的挑战[J].统计研究,2014(1):16-17.
通过对高中数学和高等数学两者之间进行对比,大学概率与高中概率在教学内容上有许多重复之处,对于一些内容在高中教学中要求较低,比如对概率的概念以及频率与概率的区别等方面,高中数学教学中就没有严格的要求,也没有要求学生掌握比较严密的公理化定义.大学统计与高中数学教学内容的对比分析不难看出,两者在教学内容上有很多相似之处,大学数学统计教学内容反映到高中,更多的是偏向于计算技巧的训练,而大学教学在涉及统计教学内容时,比较要注重数学思想的挖掘及数学方法的应用.高中教材统计学的教学要求比较侧重于实际运用,对相关的理论的了解和掌握程度较低,因此,对大学生的统计部分的教学体系基本上没有影响,两者之间的衔接方面存在着一定的不足.
二、实现大学概率统计教学与高中数学教学内容衔接的方式
1.课程内容的衔接
大学数学概率统计教学内容是在高中知识基础上的提高和扩充,其显著特点是知识量增大、理论性增强、系统性增强、综合性增强.我们在高中初步、直观地学习了概率统计的基本知识,在大学我们将对有关知识进行理论化、系统化,合理地编制教材,并且进行一些研究性学习,以实现两者之间更好的衔接.
2.学习方法的衔接
由于高中的学习密度和作业量大,简单的死记硬背的方法和被动的学习态度都会使学习出现僵局,必须使学生意识到调整自己的学习方法的必要性与紧迫性.例如,让学生了解大学所学习的概率统计知识中随机现象及其统计规律性以及全概率公式与贝叶斯公式等,有助于学生对概率统计知识的更好理解,从而实现了大学概率统计知识与高中数学教学内容的衔接.比如高中在古典概型问题的讲解时比较细,题目难度也比较大,因此在大学时就不需要在古典概型上花太多的时间,以有效提高学习时间的利用率,从而使学习效率大大提高.如例题:储蓄卡的密码一般由6位数字组成,每个数字可以是0,1,2, …,9十个数字中的任意一个.假设一个人完全忘记了自己的储蓄卡的密码,问他到自动取款机上随机试一次密码就能取到钱的概率是多少?在该例题的解析中,可以运用高中数学中所学的基本事件的特点以及结合高等数学中古典概型的有限性和等可能性的两个特征,随机试一个密码,相当于作一次随机试验.所有的六位密码(基本事件)共有1000000种.
3.教学方法的衔接高中与大学的数学教学方法均以讲解法为主,但高中教学要对概率统计知识进行详细的讲解,然后总结题型,归纳方法方式,提高教学知识的系统性与网络化.大一应承接高中教学对解题方法有总结归纳,增加练习课次数和题量训练量,先让学生掌握通性通法,使刚入学的学生度过适应期.例如在概率统计内容的概念学习中,可以对易混淆的概念(定理)对比学习;对公式、定理各字母的含义、适用范围、特例等作补充说明等来帮助学习,在老师的指导下使其成为学生自身的学习方法和习惯.例如在例题“在1000个有机会中奖的号码中,在公证部门监督下按照随机抽取的方法确定后两位数为××的号码为中奖号码,应该采取什么样的抽样方法”中,该种类型的例题就可以通过高中数学中系统抽样的方式和高等数学中间隔距离相等的抽取相结合,对例题进行解答.
4.增设数理统计试验
数学课是一门实践性较强的课程,在统计与概率教学内容中,存在许多随机试验,许多规律是从试验中总结出来的.因此,在大学概率统计和高中数学教学内容衔接改革过程中,应该充分利用Excel作为数据处理平台,让学生更好地进行数据的采集和处理,在计算标准差、相关系数、平方和分解等问题时能够收到事半功倍的效果,并且还有利于培养学生的研究、概括、总结能力,巩固和加深统计和概率的知识内容,有利于学习效率的提高,从而实现大学概率统计与高中数学教学内容更好的衔接.
5.高考命题与高等数学知识的衔接
2011年2月,国务院学位委员会进行了学科调整,统计学完全从数学和经济学中独立出来,上升为一级学科,设在理学门类中,编号为0714。统计学上升为一级学科后,下设的二级学科包括数理统计学、社会经济统计学、生物卫生统计学、金融统计、风险管理和精算学、应用统计学。统计学上升为一级学科对统计学专业的教学带来巨大影响。
同时,随着大数据时代的到来,使得传统的统计数据收集、处理与分析方法面临新的挑战,从而推动统计学的发展进入了一个全新的阶段。在统计学上升为一级学科以及大数据时代已经到来的大背景下,统计学专业的课程教学也面临着新的挑战,需要进一步改革与调整。
一、大数据时代的到来
(一)大数据的生成
伴随着人类对客观世界各领域数字化程度的不断提高,每天都有大量的数据产生,并且其产生的速度也越来越快。这些数据来源广泛,其中最主要的来源有:科学研究(如天文学、生物学、高能物理等实验数据)、社交网络、电子商务、物联网、移动通信等。
(二)大数据的定义
为了应对数据大规模增长带来的机遇和挑战,美国《Nature》杂志在2008年9月4日率先提出了“大数据”的概念。国际数据中心IDC 是研究大数据及其影响的先驱,在2011年的报告中定义了大数据:“大数据技术描述了一个技术和体系的新时代, 被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。但是大数据是一个新兴而且内涵不断发展的概念,尚没有统一公认的定义,只能从其特点上加以认识。
(三)大数据的特点
与传统数据相比,大数据的特征可以用五个“V”来表示,即Volume(容量大)、Variety(种类多)、Velocity(时效性强)、Value(价值高)、Visualization(可视化呈现)。大数据容量大是个相对的概念,受时间、行业和数据类型等因素的影响;种类多是指数据集的结构异质性,科技进步导致了结构化、半结构、非结构化数据的日益增多;时效性强是指大数据被生成、处理、移动的速度相当快,是区别于传统数据最显著的特征,这也增加了对即时分析、加工数据的需求;价值高是指大数据潜在的高价值能为评价和决策提供依据。可视化是大数据分析的关键步骤,是对有价值信息加以提炼并显示的过程。
(四)大数据的应用
大数据具有5Vs(Volume、Velocity、Variety、Value、Veracity)特点,蕴含着巨大的社会价值、经济价值和科研价值,已引起了产业界、学术界、政府部门和其他组织的高度关注和重视。
近年来,世界发达国家相继布局大数据战略,诸如联合国“数据脉动”计划、美国大数据战略、英国“数据权”运动,大力推动大数据发展和应用。大数据已纳入我国国家发展战略,国务院2015年8月31日印发了《促进大数据发展行动纲要》的通知(国发[2015]50号),指出:“大数据成为推动经济转型发展的新动力,大数据成为重塑国家竞争优势的新机遇,大数据成为提升政府治理能力的新途径。以数据流引领技术流、物质流、资金流、人才流,将深刻影响社会分工协作的组织模式,促进生产组织方式的集约和创新。探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”
二、大数据给传统统计学带来的冲击
(一)数据收集方法上
不同于传统的调查抽样方法获取数据,大数据的收集来源渠道通常为现代网络渠道,如互联网、物联网等。不同的数据源的数据采集需要专用数据采集技术, 如包含格式文本、图像和视频的网站数据,通常需要web爬虫技术。
(二)数据存储上
大数据的存储不同于传统的数据存储方式,有固定的格式和结构,对于大数据的数据库来说,可以直接将所探测到的信号自动容纳到其中;大数据需要有先进的存储设备,传统的存储设备已经不能容纳如此大量的数据。
(三)数据分析上
传统的统计分析方法,难以胜任对非结构化的大数据的分析。当前大数据分析技术的研究可以分为6个重要方向:结构化数据分析、文本数据分析、多媒体数据分析、web数据分析、网络数据分析和移动数据分析。
(四)数据展示上
数据可视化的目标是以图形方式清晰有效地展示数据的信息。一般来说,图表和地图可以帮助人们快速理解信息。但是,当数据量增大到大数据的级别,传统的电子表格等技术已无法处理海量数据。大数据的可视化展示需要专业的软件来完成。
三、大数据时代统计学专业教学改革
大数据时代的到来对统计学也带来了新的机遇和挑战,特别是大数据对于数据分析人才产生了巨大需求,同时也要求统计专业学生掌握更为复杂统计软件的编程和操作。大数据背景下,统计学要适应新的形势,需要对课程教学进行有针对性的改革。
(一)大数据时代统计学专业毕业生就业方向定位
大数据时代的到来,使各行各业,包括政府、企业、个人都希望能从大数据这座金矿中挖掘出对自己有价值的金子,从而增加了对统计专业毕业生的需求。一直以来,我国统计工作领域主要是政府统计、部门统计、民间统计。传统意义上,政府及各个部门是统计学学生就业的首选。然而,随着大数据时代的来临,越来越多的毕业生选择发展空间更为广阔的民间统计。民间统计相对于政府统计来说,涉及范围十分广泛,包括各类统计咨询公司、统计调查公司、统计研究院等,介于市场和企业、行业之间。民间统计的发展前景十分广阔,可以预见,随着大数据时代的来临,统计学作用的提高,民间统计必会成为统计专业毕业生选择就业的主要渠道之一。
(二)大数据时代统计学专业课程设置改革
大数据时代,在对统计数据分析人才需求增加的同时,也对统计专业毕业生的大数据处理能力提出了更高的要求,这就需要统计学专业在课程设置上,增加大数据处理与分析方法课程,如《大数据分析方法》、《数据挖掘》等,培养学生能够使用专业统计软件(R/SAS/Python)进行大数据的挖掘、清洗、分析等。
(三)大数据时代统计学专业学生实践能力培养改革
在课堂教学之外,通过广泛举办大数据技术创新大赛、大数据技术创新与创业大赛、数据挖掘挑战赛,支持学生成立大数据研究协会,举办大数据相关讲座论坛等方式,增强学生分析和处理大数据的能力。另外,还要加强校外大数据实践教学基地建设,通过与通信、互联网、电子商务等企业大数据开发中心以及大数据研究咨询机构合作,为学生提供给更多的实习、实践机会。
四、总结
总之,面对大数据时代的到来,统计学专业需要积极改革与调整课程的设置,注重学生实践能力的培养,以适应各行各业对大数据分析与挖掘人才的需求。
【关键词】大数据 高中统计 数据分析 内容数据链
大数据的价值性,快速性,大量性,多样性,和预测功为教育提供了一种可能目前教育的形式多种多样,慕课、微课、网络公开课等等。大数据时代下的教育是怎样的呢?是基于个性化学习,是量化的,自我组织学习内容的教育,不仅要了解学生“心声”,认知水平和学习兴趣,而且要师生互动、合作探讨学习内容,将传统课程、教学、教材的内容数据化,利用可视化技术,提高学习兴趣。提升内容吸引力。高中统计内容必须系统化、过程方法直观化,这对高中的统计内容提出了挑战。使专题块和课程案例集以数据知识链为核心,使教育在大数据时代下的“量化”。
一、高中统计内容的新契机是大数据
使教育由数字支撑变化到数据支撑。高中统计教学场景布置,统计内容设计,学习场景的变革等等过去靠“敲脑袋”或者“理念灵感加经验”的东西,在背景为物联网、云计算、大数据下,变成一种由数据支撑的“行为科学”.用数据分析的方法对高中统计内容进行分析、挖掘,利用大数据更改高中统计内容,建立主线为“统计知识链”、目标为培养“数据分析能力”首尾呼应内容数据链,使高中统计内容的系统更加优化。
由于各种原因使高中统计内容,没有得到较好的发展.直到国家教育部颁布了各种政策,统计才得以发展.然而各种问题的存在仍然困扰着我国统计教学发展。大数据关注每一位学生的个性化需求与发展,关注学生的自我意识,分析群体心理,让教师关注学生的兴趣爱好,选择适合学生的方法,让学生自主的、创新的学习。
正如教育家张韫所说:“大数据时代的到来,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能.对于教育研究者来说,我们将比任何时候都更接近发现真正的学生。”大数据在充分了解学生各种需求,目前处于的状态的情况下合理运用各种统计内容,各种现代化的教学方式,不拘泥于传统化教学方式,利用各种资源形成螺旋式上升的统计内容数据链。使每一位学生都乐于学习,其个性化学习需求成为可能。
二、高中统计内容数据链在大数据视域下的内涵
数据高中统计内容的核心研究对象,数据分析是重点,统计学习是在初中的基础上,进一步学习数据统计方面的各种方法;用各种操作培养学生的归纳推断能力、统计思维、数据分析素养,提升学生在数据分析方面的能力,统计内容数据链为学生统计能力的提升提供了研究平台。把课程目标,学生需求、与大数据算法,数据链式结构有机结合起来是大数据视域下的统计内容数据链核心思想,利用大数据,将统计内容数据化,增强内容的可读性,衔接性、合理性、连贯性,织成统计知识,形成统计内容数据链。例如:具体环节为:链宿是“样本估计总体、”等数据分析方法,链源是“系统抽样,等距抽样、分层抽样”,链节是的数据描述、统计图形.通过统计知识的实际应用使“统计知识链”为统计内容数据链的内化,“统计能力链”为其外化,“统计能力链”,“统计素养链”为其发展,成为对学生产生重大影响的“统计思想链”所以,利用大数据的科学方法可使统计内容体系最终形成的统计思想体系;数据结构的链式模型,将促进学生创新思维,增强学生的参与积极性,使高中统计集“知识链、能力链、素养链、思想链”于一体。
三、高中统计内容大数据视域下下的数据链设计
(一)高中数学统计内容知识结构
各种版本的高中数学统计内容都介绍了基本的获取样本数据的获取,提取方法,就是我们常说的用样本推断总体,部分推断整体.统计知识注重培B学生数据分析的能力,利用实例讲解数据的各种思想,方法结合在一起,提高学生的综合能力。例如:结合具体问题情境,学习如何进行数据收集,分析,如何思维理解其含义。
(二)高中数学统计内容的教学要求
课标充分重视高中数学统计内容,并采取了有效的改进和创新措施。教学过程中,注重学生自我特长的发展,创新教学方式,不拘泥于传统的书本知识,强调以人为本,面向未来,让学生有数据意识,学会用数据说话,将统计知识运用于实践。
(三)高中统计内容在大数据视域下数据链设计
量化教育是大数据时代的可行教育,通过数据了解学生的个性化需求,促进学生的个性发展,注重创新式培养。结合教材利用现代化信息技术设计出学生乐于接受的教学方式。从“数据读心”,到“抓心入心”,再到“知心交心”,最终形成“数据育心”的培养链是统计内容数据链的设计原则。例如:分层抽样内容数据链的设计.首先,将分层抽样知识系统化。其次,将分层抽样的过程方法直观化。最后,依据统计内容数据链的设计原则和学生个性化学习需求,动态生成分层抽样内容数据链。把具体问题数据化。使分层抽样内容数据链成为满足自我发展需要的“知识链、方法链、素材链”。
四、结语
综上所述,对统计内容数据我们应该就地取材,因地制宜,开创多种方式的教学方式,注重学生的个性化需求,不要拘泥于传统的教材,注重培养学生的创新思维和自主参与能力,要让学生发挥主观能动性,积极主动的自己去思索,发展自己的特长,学会将具体的事情数据化不用数据的思想去思考问题,去看世界,老师也要探索更好的教学方法。将现代化的科学技术与传统枯燥的教材相结合创造出一种能够发挥学生潜能,特长的教学方式,要循循善诱,引导学生。总之,统计内容数据链能更好地使学生不断提升自己的数据分析“能力链”使学生学会用统计思想、统计方法、统计思维、统计观念、统计意识来认识世界,改造世界。
参考文献:
拓北:薯条需要你的救援,快过来看看!
图丫:薯条的事情就是我的事情,让我来看看,需要我做什么事儿?
拓北:事情是这样的―
薯条A的故事:
薯条A看见数学就头大,每次做作业都把数学放到最后去做。可是可怕的数学偏偏总和他过不去,一周总有那么几天的作业让薯条A感觉很头痛,好多次薯条A都被这些难题折磨到深夜才入睡!薯条A:呜呜―这样下去不要说玩的时间,就是睡觉时间都没了!求救!求救!
薯条B的故事:
数学成绩一般的薯条B特想提高数学成绩,所以他总是花大量的时间看数学书和做数学题。因为刻苦,他平时的数学成绩还好,可是一到考试,看到一道道数学难题他恨不得锤破自己的脑袋找出一个答案。这些难题花费了他大量的考试时间,考试成绩也受到了很大的影响!薯条B:呜呜―可怜的人需要帮助!小编们快帮帮我吧―
图丫:看来薯条们需要一个有效的攻克数学难题的方法,我的建议是:
加油站一
攻克数学难题需要一定的技巧和经验。对小学生来说,老师不会出很难的数学题目,所以大家要学会分析题目中的已知条件之间的关系。通常再难的题目,经过老师的分析,大家都很快理解并做出答案,这是因为老师有正确的解题思路和分析方法。薯条们肯定很想学习这样的思路和分析方法吧?你可以从下面的途径进行学习和练习:
1.多练习。课堂例题要彻底理解和掌握,通常例题都是各种题型变化的基础。然后多做练习题,只有在做题中你才能积累解题的方法和技巧。
2.不害怕。遇到难题不要慌张,不要自暴自弃―完了,我肯定做不出!相反,应该冷静分析并鼓励自己说:我一定能攻克这道难题!然后信心满满地做题,仔细分析已知条件,从中找出解题的关键。
3.新思维。数学难题不会像我们通常做的练习题那样,可以一眼看出解题方法,通常难题是需要调动大脑中的大量细胞的。简单地说就是,你需要培养各种思维方式,特别是逆向思维方式。通常我们都知道:1+1=2,那么,2=什么?答案:
2=1+1
2=0+2
2=1×2
2=4÷2
2=8÷4
……
怎么样,答案是不是很多?思维是不是有一种被扩散的感觉?解决难题就需要有这样活跃而扩散的思维。
4.打基础。难题通常都是从简单或中等难度的题目中延伸出来的,如果你平时数学成绩很糟,考试时,不要马上做难题,先完成简单和中等难度的题目。难题可能会使你的心情非常紧张,如果一道难题解决不了,会直接影响你完成后面的题目。
拓北:老实说,我真的很佩服薯条们攻克难题的决心。如果是我,我早就绕开难题去看电视了,做难题真的要“杀死”很多的脑细胞哦!
图丫:拓北,学习要勤奋,不能畏惧难题,更不能走捷径,否则没有办法提高成绩,更不要说以后学习更深奥的数学知识!学习数学时,如果发现自己厌恶数学,可以这样做―
加油站二
1.正确对待学习困难。学习上存在困难并不可怕,可怕的是不能正确对待困难,总是逃避难题。日积月累,难题会越来越多,自己也会更加没有信心和耐心解决问题。
核心素养导向的课程改革背景下,国家针对学科核心素养的落实提出了明确的要求:“重视以学科大概念为核心,使课程内容结构化,以主题为引领,使课程内容情境化。”[1]由此看来,以学科大概念为核心的课程内容重建是深化课程改革的关键。借助大概念把一些具有逻辑联系的知识点放在一起进行整体设计,就可以在关注知识与技能的同时,思考知识与技能所蕴含的数学本质及其所体现的数学思想,最终实现学生形成和发展数学学科核心素养的目标。基于此,我们以北师大版小学数学“数的认识”这一板块为例,探究了大概念统领的小数数学教学设计策略。
一、寻找知识共性,提炼数学大概念
准确把握数学大概念是合理建立知识结构与妥善进行教学设计的先决条件。然而在实际教学中,课标、教参、教材均没有明确提出相应的数学大概念,需要教师在进行教材解读的过程中研究提炼。究竟如何提炼呢?这就得根据大概念具有统摄性、聚合性和高度概括性的特点,将众多具体知识点的共同属性加以分析得到。小学数学“数的认识”这一板块,主要涉及了整数的认识、小数的认识和分数的认识。其中,整数的认识分四次来学习:一年级上册认识20以内的数,从以“一”为单位逐一计数拓展到以“十”为单位按群计数,初步感受十进位值概念;一年级下册认识100以内的数,拓展了对计数单位“百”的认识,初步体会将小群合成大群而产生的连续十进关系;二年级下册认识万以内的数,通过认识更大的计数单位“千”和“万”,进一步发展十进位值制概念;四年级上册认识比万大的数,丰富对更大计数单位的认识。综合上述分析我们可以看到,整数的认识就是在对整数计数单位逐渐建构的过程中实现的。那么,小数的认识呢?三年级上册,结合“元、角、分”这样直观、具体的单位模型初步理解小数的意义;四年级下册,经历将整数计数单位进行细分的过程,认识更小的计数单位“十分之一”“百分之一”“千分之一”……进一步明晰小数的意义。分数的认识呢?主要集中在三年级下册和五年级上册,经历由感性认识到理性认识的过程,充分感知分数是在平均分的过程中产生的,因而分数的单位和整数、小数所固有的计数单位不同,它与平均分的总份数有关———平均分成了几份,其单位就是几分之一。这样看来,所有分数都可以看成是以分数单位为计数单位进行数数的结果。综观整数、小数、分数的认识,它们究竟有何共通之处呢?我们通过举实例再来一起看一看:整数15,其本质是由1个十和5个一组成;小数0.32,其本质是由3个0.1和2个0.01组成;分数7/8,其本质是由7个1/8组成。比较三者我们发现,“数的认识”这个大单元均围绕“计数单位”而展开,在数计数单位的个数中实现了对数意义的建构,这便揭示了数学大概念中“数”的本质属性:数是由计数单位及其个数累加而成的。
二、重视实践参与,建构数学大概念
教师可以统观整个知识体系,通过类比分析来提炼数学大概念,可学生仅凭已有知识和经验怎样才能建构相应的数学大概念呢?直接告知?显然不妥。那就引导学生经历数学大概念形成的过程吧!教师可以在把握数学知识本质与学生认知起点的基础上,创设真实的教学情境,提出合适的数学问题,让学生走进事实与现象中去,通过独立探究、合作交流、反思总结等学习活动,掌握数学知识、提升数学技能、理解数学本质、感悟数学思想、发展数学素养。下面聚焦“数的认识”板块中一年级下册“100以内数的认识”,谈谈我们的所思所想。明晰了数的概念,便读懂了著名数学家华罗庚“数,来源于数”的真正内涵,清楚地认识到了数数活动的意义与价值。于是,再次走进“认识100以内的数”这个单元,深入剖析每一个数数活动:“数花生”,从与生活密切相关的数实物出发,认识100以内的数,感知100的意义;“数一数”,以数模型的方式认识计数单位“百”,体会“一”“十”“百”的意义及其关系;“数豆子”,借助在计数器上拨一拨、认一认的方式,使学生感受100以内数的组成,感知数是由计数单位及其个数累加而成的,体会位值思想。结合对学情的分析(如图1),为使学生充分经历真实的数数活动,不断完善数概念的建立,丰富对“十进制”“位值制”的理解,进一步发展数感,我们设计了如下教学活动。(一)设置真实情境,丰富现实感知。数是抽象的,对于学生来说将数的符号与视觉材料相联系,建立心理表象最重要。基于使学生充分感受数的现实意义,同时丰富学生对小棒和第纳斯方块的具体感知,我们决定结合我校社会化小机构———“启智小栈”设置如下情境:“开学了,学校启智小栈新进了一批货物,你能帮售货员清点荣誉本、乒乓球、铅笔(小棒模型)和积木(第纳斯方块模型)的数量吗?”引导学生在估一估的基础上运用自己喜欢的方式数一数,初步抽象出实际物体的个数。(二)呈现多样数数,激活已有经验。从20以内拓展到100以内数的认识,对一年级的孩子来说,数量上增加了不少。为了了解100以内数的顺序,教师首先邀请1个1个数的孩子进行展示,重点落实拐弯数,充分体会“一”与“十”的十进制关系。而后呈现2个2个、5个5个、10个10个数的情况,使之感受“虽然数的方法不同,但结果不变”,且10个10个数中还蕴藏着位值思想,更能凸显数的本质属性。(三)借助操作模型,领会核心概念。低年级学生正处于前运思阶段,具象思维占主导,要掌握极为抽象的数概念并非易事。数形结合可以将抽象的数学语言与直观的图形结合起来,让学习过程“看得见”,让思考过程“看得见”。为此,我们创设问题情境“99添1是多少”,让学生通过摆一摆第纳斯方块(积木)、捆一捆小棒(铅笔)、拨一拨计数器,结合不断累加的计数单位及其个数突破99添1为什么是100这个教学难点,使学生充分经历10个一就是1个十、10个十就是1个百的十进制过程,不仅认识计数单位“百”,感知它产生的必要,也深刻感受“一”“十”“百”之间的十进制关系。(四)回归实际生活,提升数学素养。数学来源于生活,还要应用于生活。课末,教师引导学生描述“100个人大约有多少”,想象并验证“100粒米大约有多少”等,从多维度再次感知100的意义,充分发展学生的数感。如上可见,数学大概念的形成有赖于真实问题驱动下大量的经历与感知,这也正好符合了“实践出真知”的教育主张———唯有在实践参与中,学习才能让学习者获得真正的知识,进而发展出关键能力、必备品格和价值观念[2]。
三、打通内部联系,运用数学大概念
美国学者威金斯和麦克泰格把大概念比作车辆的“车辖”,我们知道车辖的主要功能是将车轮等零部件有机地组装在一起,这便揭示了“大概念”具有吸附知识的能力[3]。由此看来,帮助学生建构数学大概念的目的,更在于学生能够依靠相关数学大概念进行自主迁移与运用,在不断加深对大概念理解的同时,也能逐步提升自身学科核心素养。例如,在学生已经理解了“分数就是分数单位及其个数的累加”后,在“分数大小比较”一课,我们嗅到了更浓、更纯的数学味儿。【教学片段】师:你能比较34和14的大小吗?生1:我们可以用手中的纸片折一折、涂一涂。通过折叠,我把这两张正方形的纸都平均分成了4份,左边这张我涂了3份,右边这张我涂了1份,可以看出34大于14(如图2)。生2:我同意你的方法,这样很直观地就比较出来了,但我觉得不借助纸片也能比较。同学们请看,34是3个14,14是1个14,它们的单位相同,我们可以只比较个数,3个比1个多,所以34大于14。……师:分母相同,说明它们的分数单位相同,我们只用比较分子,也就是它们分数单位所对应的个数就可以了。假如分子相同,分母不同,又怎么比呢?比如,12和14。生1:12是1个12,14是1个14,它们的个数相同,就比单位,12大于14。生2:我同意他的想法,我可以画图验证(如图3)。……师:你们能够站在数的本质意义上来比较两个分数的大小,老师太惊喜了!我想再一次向你们发起挑战!你们能比较23和35吗?学生迟疑了一会儿,喃喃自语:23是2个13,35是3个15,它们的单位和个数都不同,怎么比呢?师:是呀,怎么比呢?学生尝试画图,却因技能有限,23和35又太过接近而宣告失败。最终有个学生紧锁眉头,轻声问道:老师,能统一单位吗?就像我们曾经比较3m和30cm时那样。部分学生随声附和:咦,如果能统一单位,问题不就解决了吗?师:不错,若能把它们转化为同分母分数,这问题就变得简单了!不过,怎么统一呢?下课铃响了,暂时留给孩子们自己去琢磨琢磨,咱们后面再来探讨吧!下课了,孩子们仍意犹未尽不断尝试,这股学习的内驱力源自他们已经逐步构建起的数学大概念下的结构化认知。数学大概念的统领改变了按课时设计,将数学知识人为割裂的状态,凸显了学生对所学内容的整体理解,促进了学生的知识建构和方法迁移。依靠数学大概念展开教学活动,数学的深度学习在悄然发生,我们可以预见,学生的高阶思维逐步养成,核心素养得以彰显。
参考文献:
[1]教育部.普通高中数学课程标准(2017年版2020年修订)[M].北京:人民教育出版社,2020:4.
A.46,45,56B.46,45,53
C.47,45,56 D.45,47,53
答案:A 命题立意:本题考查中位数、众数、极差等特征数与茎叶图,难度中等.
解题思路:利用相关概念求解.由茎叶图可知,第15个数据是45,第16个数据是47,所以30天中的顾客人数的中位数是45和47的平均数,即为46.出现次数最多的是45,故众数是45;数据68与最小数据12的差是56,即极差是56,故选A.
2.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:采用简单随机抽样法,将零件编号为00,01,02,…,99,从中抽出20个;采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个,则()
A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是
B.两种抽样方法,这100个零件中每个被抽到的概率都是,并非如此
C.两种抽样方法,这100个零件中每个被抽到的概率都是,并非如此
D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同
答案:A 解题思路:由于简单随机抽样法、系统抽样法与分层抽样法均是等可能性抽样,因此不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是,故选A.
3.从某中学一、二两个班中各随机抽取10名学生,测量他们的身高(单位:cm)后获得身高数据的茎叶图如图甲,在这20人中,记身高在[150,160),[160,170),[170,180),[180,190]的人数依次为A1,A2,A3,A4,图乙是统计样本中身高在一定范围内的人数的程序框图,则下列说法正确的是()
A.甲可知一、二两班中平均身高较高的是一班,图乙输出的S的值为18
B.甲可知一、二两班中平均身高较高的是二班,图乙输出的S的值为16
C.甲可知一、二两班中平均身高较高的是二班,图乙输出的S的值为18
D.甲可知一、二两班中平均身高较高的是一班,图乙输出的S的值为16
答案:C 命题立意:本题主要考查统计与程序框图的相关知识,统计问题与程序框图的结合有可能成为高考命题的热点,此类题目考查的方式多样,难度适中.在该题中对程序框图的考查主要体现在对其循环结构的考查.此类题目易出现的问题主要是不能从整体上准确把握程序框图,无法确定赋值语句、输出语句中各个变量与实际问题的联系,从而不能确定程序框图所要解决的实际问题中的相关数据.所以解决此类问题首先要明确程序框图中的各类数据与实际问题中数据之间的对应关系,准确把握实际问题中数据的实际意义.
解题思路:由茎叶图可知,一班学生身高的平均数为170.3,二班学生身高的平均数为170.8,故二班学生的平均身高较高.由题意可知,A1=2,A2=7,A3=9,A4=2,由程序框图易知,最后输出的结果为S=7+9+2=18.
4.下表是降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程=0.7x+0.35,那么表中m的值为()
x 3 4 5 6 y 2.5 m 4 4.5 A.4 B.3.5
C.3 D.4.5
答案:C 命题立意:本题考查统计的相关知识,难度中等.
解题思路:依题意得=×(3+4+5+6)=4.5,=(2.5+m+4+4.5)=,由于回归直线必经过样本中心点,于是有=0.7×4.5+0.35,解得m=3,故选C.
5.某调查机构对本市小学生课业负担情况进行了调查,设平均每人每天做作业的时间为x分钟.有1 000名小学生参加了此项调查,调查所得数据用程序框图处理,若输出的结果是680,则平均每天做作业的时间在0~60分钟内的学生的频率是()
A.680
B.320
C.0.68
D.0.32
1.1高等教育统计指标中关于图书的指标解释在《高等教育统计指标解释》中,图书统计的相关指标项目被设置在一级指标“资产、校舍”之下,具体说明为:“图书:是指学校图书馆及院系(所)资料(情报)室拥有的正式出版的图书和电子出版物(以万册为计量单位)。”[2]图书属于学校固定资产,因此图书数量指标隶属于“资产”指标项目,并没有被单独设立为一级指标,图书数量指标的下面设有馆藏图书数量和当年新增图书数量2个子指标。1.2高校基本办学条件中关于图书的指标要求《教育部关于印发〈普通高等学校基本办学条件指标(试行)〉的通知》中明确规定,高等学校“基本办学条件指标:包括生均图书。这些指标是衡量普通高等学校基本办学条件和核定年度招生规模的重要依据”[3];文件中还规定,“生均年进书量。这些指标是基本办学条件指标的补充,为全面分析普通高等学校办学条件和引进社会监督机制提供依据。”[3]《普通高等学校基本办学条件指标(试行)》主要用于对普通高等学校办学条件进行监测,并规定限制招生和暂停招生的主要构成要件。该文件中要求本科层次高等学校的生均图书数量不得少于70册,生均年进图书数量不得少于3册,凡是低于上述标准的高校均被视为该项指标不达标[3],有可能影响到该高校下一年度的招生计划。生均图书数量指标不仅可以用来判断高等学校图书经费的投入水平,还可以判断高等学校对图书馆投入的重视程度。
2现行高等教育统计中图书统计存在的不足
尽管以图书数量为基准统计的结果具有一定权威性,便于统计和计算且直观易行,但仍有不尽人意之处。图书馆是高校藏书最多的部门,具有一定的代表性,因此本文以高校图书馆为例,探讨高等教育统计中图书统计存在的问题。
2.1忽视了对图书金额的统计仅对图书数量进行统计的图书统计结果缺乏说服力、公正性和合理性。除馆藏图书数量外,馆藏图书总金额也能够反映学校图书馆纸质图书的状况。例如,数十页的图书价格仅为十几元或几十元,而数百上千页的图书价格可达到百元甚至上千元,价格之差达百倍之多,若仅以数量进行统计,则无法体现被统计图书的真正价值。随着纸张等原材料价格的上涨,出版社出版图书的成本增加,直接导致了图书价格的普遍上涨,使高校图书馆采购图书的成本较过去也有所增加。绝大多数高校图书馆的经费都来源于上级拨款,办学层次和类型不同的高校获得的拨款额度也不同。经费少的图书馆的图书采购难度相对较大,在图书经费有限、图书价格上涨的情况下,采购图书的数量必然会减少。如果图书馆仅为了达到教育统计所要求的指标而只采购便宜的图书增加馆藏数量,那又如何保证图书采购工作的质量?这种做法有只注重政绩之嫌,极易导致急功近利的现象发生,不利于图书馆的藏书建设工作。高校通常以金额拨款形式给图书馆划拨图书采购经费,图书采购的财务报账按图书金额和图书数量进行结算,因此,仅以图书数量作为图书统计的唯一指标无法客观地反映图书馆藏书工作的真实情况。
2.2忽视了对图书利用率的统计图书利用率是反映图书流通情况的最重要指示。随着“以人为本”理念的普及,利用已经成为图书收藏的本质和最终目的。然而,有些图书从进馆开始就很少有人问津甚至从未被读者借阅过,这些图书的数量和金额虽然每次被人为地纳入统计范畴,但却毫无统计价值,影响下一年的采购计划,造成了采购资金的浪费和书架空间的拥挤。
3完善高等教育统计中图书统计指标的建议
《中华人民共和国统计法(2009年修订)》第5条规定,“加强统计科学研究,健全科学的统计指标体系,不断改进统计调查方法,提高统计的科学性。”[4]因此,高等教育统计主管部门应改进和加强统计指标设计理念,增强统计指标的准确性、时效性、科学性、可操作性,把能够真实反映图书馆状况的指标内容考虑和吸纳进来。
3.1馆藏图书数量与馆藏图书金额并行统计图书数量可以反映出图书馆的藏书状态,所以当前高等教育统计仍然需要保留馆藏图书数量和当年新增图书数量2项指标,并在此基础之上增加“馆藏图书总额”、“新增图书金额”指标。将馆藏图书数量与馆藏图书总额、当年新增图书数量与新增图书金额分别对应,在高等教育统计报表中反映出来,以达到图书的数量与金额并行统计的目的。高等教育统计主管部门应重新研究图书的数量与金额间的关系,充分考虑物价因素和经费投入因素对图书采购工作的影响,制订出适合不同层次和类型的高等学校可遵照执行的图书指标统计要求。这既有助于高等学校在新的图书指标统计要求指导下开展图书馆的各项工作,又有助于提升高等教育统计结果的真实性和可靠性。
3.2将图书利用率纳入统计范畴图书利用率是某类图书一段时间内被利用的图书种数与该类图书藏书总种数的比值[5],它可以真实地反映出图书馆的服务水平、服务质量和服务效率,对于优化馆藏图书建设、促进读者服务水平的提升有着十分重要的意义,是图书流通统计中最重要的计量指标。通过统计分析图书利用率,图书馆可以掌握和了解哪些图书使用率高,哪些图书使用率低,哪些图书已经成为“滞书”、“死书”,从而敦促图书馆采取措施使馆藏图书流通起来。统计高校图书利用情况并将其作为一项统计指标纳入到教育统计之中,可以促使高校图书馆采取有效措施提高图书借阅效率,充分而有效地发掘馆藏图书资源,促进图书采购工作的有效开展,防止利用率低的图书进入图书馆,也可减少图书馆的“死书”数量,较大限度地发挥图书经费使用效能,这样既可以节约资金,又防止不必要的图书挤占书架,同时也可以节省读者的查阅时间。图书利用率指标项目的设立可以由高等教育统计的主管部门负责,并由其组织相关专家进行论证以确定合理的指标。虽然图书利用率指标在统计中不如图书数量和金额的统计直观易行,但可由图书馆使用的图书管理信息系统软件实现利用率的统计。高校图书馆一般都拥有独立的图书管理信息系统,可把管理系统软件提供的图书流通的各项数据逐一进行汇总并最终得出图书利用率。图书管理信息系统中的图书流通数据的统计可按时间段设成按月份统计、按季度统计、按年度统计及按累计年度统计等,统计数据中的读者群范围可以视实际统计需要而灵活设定,以满足不同统计范围的统计需要。
4高校图书馆应对高等教育统计工作的措施
4.1将期刊纳入图书统计范畴期刊也是高校图书馆藏书建设的重要组成部分,与图书相比,其学术性和实效性更强、知识内容更新颖,是师生进行科研、学习、撰写论文的重要参考资料,其利用率甚至比图书还高。因此,高校图书馆可以将期刊作为馆藏的一部分,归入纸质图书统计中。具体操作方法为:把过刊按年度合订算作1册图书,将当年各本期刊的合计金额作为这1册图书的定价,然后按图书的台帐要求独立建帐登记,用此方法把上一年的全部期刊登记造册。
4.2将编外图书纳入统计范畴图书馆在进行图书统计工作时,除了要统计《高等教育统计指标解释》中要求的图书馆藏书和院系(所)资料(情报)室所拥有的图书外,还应把全校各教研室、专家研究室、科研课题组、各级领导办公室等处收藏的教学、科研、办公使用的图书以及教材样本、档案样本等一并纳入到图书馆的图书统计范畴。这些图书具有管理使用分散、来源渠道复杂的特点,有的是由出版社赠送的,有的是由作者赠送的,有的是由单位购买的[6],不论来源渠道如何,都是处于使用状态且需要长期保存的学校固定资产,都应统一登记造册,纳入图书馆统一管理范围,由图书馆负责登记到台帐上,各使用单位则认真负责图书的保管和使用。