统计分析汇总十篇

时间：2023-06-22 09:33:05

序论：好文章的创作是一个不断探索和完善的过程，我们为您推荐十篇统计分析范例，希望它们能助您一臂之力，提升您的阅读品质，带来更深刻的阅读感受。

篇（1）

一、研究背景

股票指数的波动程度可以用来衡量金融投资的风险。金融风险是指金融资产在未来时间内预期遭到损失的可能性。随着改革开放的深入和市场经济的逐步建立，金融风险越来越成为人们关注的热点之一。尤其是经济全球化以来，我国的经济发展更容易受到全球市场经济变化的影响和冲击，在此背景之下，探究金融风险已成为近期经济运行中的一个重要话题。

非参数统计是统计学的一个重要分支。它可以只利用样本观察值中一些非常直观地信息进行统计推断，从而从数据中获取有用信息。通过非参统计分析中的Wilcoxon秩和检验法和位置参数差的检验方法等，我们可以得到两个时间段的股指数据的差异性和波动程度情况，从而衡量该时间段的金融投资风险。

二、数据来源

数据分别选取2016年6月和2016年5月每天的的上证指数的开盘股指数据。数据选取最近两个月的股指数据进行分析，具有非常高的研究价值。指标选取的是5月和6月的股指数据，具有时间上的连续性，便于分析。同时数据从上到下是按时间排列的。

三、使用的统计方法

（一）描述性统计分析

描述性统计分析是在对产生的总体的分布不做任何假设的情况下，整理数据、显示数据和分析数据，将数据中有用的信息提取出来的统计方法，常用的描述下统计方法有图形法和数值方法。在本文中，用描述性统计分析对总体的所有变量的有关数据进行集中程度分析、离散程度分析和数据的分布等。

（二）Wilcoxon秩和检验法

1、基本思想

当两组配对资料近似服从正态分布，它们差值的检验可以使用配对t检验法。如果配对资料的正态分布的假设不能成立，就可以使用Frank Wilcoxon（1945）符号秩检验，它是一种非参数检验方法。对配对资料的差值采用符号秩方法来检验。它的基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的（配成对）。用数据的秩代替原数据进行的假设检验的方法为秩和检验。如果相比较组之间秩次之和十分接近，则认为各组之间没有差别；如果相比较组之间的秩和相差十分悬殊，则认为各组间存在差别。

2、Wilcoxon秩和检验的基本步骤

先将原始资料在不分组别的情况下从小到大排序、编秩，然后将所编秩次相加、求和、假设检验。

a.建立检验假设：两总体分布相同；

b.两样本混合统一编秩次，相同观测值（即相同秩）在不同组时取平均秩次，计算两组秩和。

记两个独立的连续型随机变量总体X和Y的样本分别为x1，x2，…，xm和y1，y2，…，yn，不妨假设合样本的各个之间互不相等。记合样本容量为N=m+n。

原假设为：H0：mex=mey在理论上，假设两个总体X和Y的分布函数具有相同的形式，但不一定Τ品植肌＜醇偕瑁

X～F（x-mex），Y～（y-mey）

从而原假设H0：mex=mey等价于H0：X和Y同分布。

将两组样本混合，求出每个样本在合样本中的秩。记样本yj，j=1，2，…，n在合样本中的秩为Rj，则Rj=1，2，…，N。令Wy表示总体Y的样本y1，y2，…，yn的秩之和，即

WY=■Rj

同样定义WX为X样本的x1，x2，…，xm秩之和，我们称WY或WX为Wilconxon秩和检验统计量。

（三）位置参数差检验

有位置参数的差是一个常数的检验问题。假设X和Y的分布函数F（x）和G（y）有这样的关系：存在位置参数a，使得对任意的c都有F（c-a）=G（c）。正如前面所说的，由于在X的分布函数为F（x）时，X+a的分布函数为F（x-a）所以X+a和Y有相同的分布函数，a可以看成Y的位置参数与X的位置参数的差：a=Y的位置参数-X的位置参数。位置参数的差a是否是一个常数η的检验问题有三种情况：aη和a不等于η。所以他们的位置参数的差是否是一个常数η的检验问题可以等价的转换为检验Z和Y的位置参数是否没有差异的检验问题。

四、研究内容及分析

对5月和6月的股指数据分别做描述性统计分析和对这两个月的的股指数据做一个综合比较的描述性统计分析如下：

从上表可以看出五月和六月份的平均数和中位数的差异还是有的，而且与两者共同构造的平均值和平均值都有差异性，当然这种差异性是相对较为稳定的股指数据来说的，从数值上看差异性当然不是很大。

同时从表中可以知道，五月的标准差为63.0975，六月的标准差为36.32061，说明这两个月的股指数据的离散程度是比较大的。因为数据具有时间上的近似连续性我们还可以对数据做出如下散点图。从图中可以看出，5月和6月的股指波动程度不太相同。

Wilcoxon秩和检验法的求解过程如下：

1、将这两个月共40天的股指合在一起，把它们的工资由小到大排列，并记下它们的秩，

2、将五月份的股指数据的秩相加，它们的和为W=299；

3、显然，在W比较小时认为五月的股指数值比六月的小。通过查Wilcoxon秩和检验临界表，在m=20，n=20时，我们有P（W

五、研究结论：

经过以上两种方法的研究，我们可以发现，6月份的股指和5月份有明显性差异。6月份的股指数值比5月份的高。5月份的离散程度比6月的离散程度大，即这两个月的波动程度不一样。经查找资料得出，两个月波动程度不相同的原因有：（1）国际因素，尤其是5月5日时受到市场的干扰，股指大幅下降。还有美联储的议息也使股市不断发生变化；（2）我国货币政策；（3）股票市场制度，今年春夏时我国证监会一直出台各种完善我国金融市场的政策。

参考文献：

篇（2）

0.引言

客观现象之间总是存在着相互联系和相互依存的关系，反映这些联系的数量关系一般来说可分为两类，一类是确定性关系，另一类是非确定性关系。确定性关系是指描述客观现象的变量之间的关系可以用函数关系来表达的，如运动物移和时间的关系；圆的面积和半径的关系；某种商品的销售收入与该商品的销售量和价格之间的关系等等，其特点是，当一个或几个变量的取值确定时，相应的另一个变量的值就完全确定。若当一个或几个变量的取值给定时，相应的另一个变量的值不能完全确定，而是在一定范围内变化，则称变量之间的这种关系为不确定性关系即所谓相关关系。一般来说，人高一些，体重会重一些，但同样高度的人，体重往往不同；再比如空气污染度和人口寿命之间的关系、气象学中的温度和湿度之间的关系等等都是这种不确定关系。回归分析是研究相关关系的一种常用的统计方法，它是建立在对客观事物进行大量实验和观测的基础上，来寻找不确定性现象中的统计规律性的统计方法，回归分析是通过建立统计模型研究变量间相关关系的密切程度、结构状态、模型预测的一种有效工具。但目前已有的结果是使用一个连续向量函数来近似描述相应的不确定性相关关系，这样就有比较大的局限性，类似于一般的函数可能有间断点或是分段函数的问题，本文将把回归函数的定义域作一个划分，然后在每一个子域中用一个连续向量函数来近似描述相应的不确定性相关关系，形成逐段回归统计分析问题。

1.回归分析模型

为叙述方便，我们借用函数关系中关于变量的称呼，将在不确定性关系中作为影响因素的变量X1,X2,…，Xk称为自变量，受自变量取值影响的响应变量称为因变量，用Y表示。假设X1,X2,…，Xk是可控变量，即它们的取值是可以预先给定的，Y是可测的随机变量，当X1,X2,…，Xk的取值为x1,x2,…，xk时，就有一个随机变量与之对应。令

E(Y│X1=x1,X2=x2,…Xk=xk)=f(x1,x2,…，xk)，

（1.1）

从而其它随机因素导致的偏差就是

ε＝Y-f（x1,x2,…，xk）

（1.2）

那么X1,X2,…，Xk与Y之间的不确定性关系可表示为

Y＝E(Y│X1=x1,X2=x2,…Xk=xk)＋ε

＝f(x1,x2,…，xk)＋ε，

（1.3）

通常要求随机误差ε的均值为0，方差存在，即

E（ε）＝0，D（ε）＝D（Y）=σ2。

（1.4）

函数f(x1,x2,…，xk)称为Y对X1,X2,…，Xk的回归函数，而方程

y＝f(x1,x2,…，xk)

（1.5）

则称为Y对X1,X2,…，Xk的回归方程。

以上模型称为回归模型，其中回归方程是一个确定性的函数关系，它也称为理论回归方程。

在回归分析中，在应用上最重要并且理论上解决地最完善的是线性回归问题，所谓线性回归问题就是回归函数为线性函数的回归分析。其数学模型为：

Y＝b0＋b1x1＋…＋bkxk＋ε，

（1.6）

其中E(ε)=0，D（ε）＝D（Y）=σ2；b0,b1…，bk,σ2是未知参数。x1,x2,…，xk称为自变量、解释变量或预报因子，Y为因变量、应变量或预报对象。

为了确定线性回归模型中的未知参数，必须若干次观测，得到自变量与应变量的若干次观测值：

y1，x11，…，x1ky2，x21，…，x2k…yn，xn1，…，xnk

在这种情况下得到下述整体回归模型：

Y1=b0+b1x11+…+bkx1k+ε1Y2=b0+b1x21+…+bkx2k+ε2

…Yn=b0+b1xn1+…+bkxnk+εn

（1.7）

并假设

E（εi）＝0　i＝1，2，…，nDε1…εn＝σ2In（1.8）

其中In为n阶单位矩阵。

为方便起见，通常引入矩阵表示上述模型，记

Y=Y1Y2…Yn，b=b1b2…bk，ε=ε1ε2…εn，y=y1y2…yn，X=1　x11　…　x1k1　x21　…　x2k…　…

…1　xn1　…　xnk。

那么整体回归模型就可写成

Y=Xb＋ε。

（1.9）

利用最小二乘法容易求出其回归方程。

在一些实际问题中，变量之间的相关关系并不是线性的，而是对应某种曲线的非线性相关关系，而其中的许多可以转化为线性回归问题。

2.逐段统计回归模型

许多情况下不能仅用一个向量函数近似代替一种相关关系，而作分段处理效果更好。下面介绍逐段统计回归模型。

首先把回归函数的定义域I划分为互斥的子域Ii（i＝1，2，…，m），然后在每个子域上再根据观测值的散点图来确定适当的回归函数，这就是逐段统计回归模型，具体表述如下：

Y1=f1（x11，…，x■）＋ε1，（x11，…，x■）∈I1，Y2=f2（x21，…，x■）＋ε2，（x21，…，x■）∈I1，

…Ym=fm（xm1，…，x■■）＋εm，（xm1，…，x■■）∈Im，

（2.1）

并假设

E（εi）＝0　i＝1，2，…，m，Dε1…εm＝σ21…1．（2.2）其中fi（xi1，…，x■■）（i＝1，2，…，m）是逐段回归函数，εi（i＝1，2，…，m）是满足（2.2）的随机误差。

3.数值示例

例：观测某系统得出如下数据

试求应变量Y与预报因子X的回归方程。

解：通过作散点图容易发现当预报因子不超过10时，其回归方程应该是一种指数函数，设为y＝αeβt，而预报因子大于10时应该是线性回归问题。利用最小二乘法及变量代换法不难求出其回归方程为：

■＝2．0642＋0．2121x，1≤x≤10，109．2e－0．342x，10＜x≤40．

【参考文献】

［1］张贺祺关于经济回归分析方法的使用评价，内蒙古财经学院学报，2011．（02）：15-19．

［2］李世军,袁光才.城镇居民人均消费支出影响因素计量分析—基于成都市的实证分析，技术经济与管理研究，2006．（02）：53-54．

［3］冯天祥．多元线性回归最小二乘法及其经济分析，经济师，2003．（11）：129．

篇（3）

根据某省电力公司的具体情况，本文所设计的电力行业统计分析系统的总体架构分为数据源、数据仓库架构、数据访问架构以及元数据管理等。

1.2ETL设计

用OWB（OracleWarehouseBuilder）工具对ETL进行实现，其任务为侦测ETL事件，以便启动处理过程，同时跟踪ETL处理日志。ETL的处理过程如下：通过Excel导入管理工具或者OWB将数据源的数据抽取、转换、加载到ODS层的数据缓冲区的增量数据库中；将ODS层的数据缓冲区的增量库的数据抽取、转换、加载到ODS层的数据缓冲区的历史库；将ODS层的数据缓冲区的历史库的数据抽取、转换、加载到ODS层的统一视图信息区的增量库；将ODS层的统一视图信息区的增量库的数据抽取、转换、加载到ODS层的统一视图信息区的全量库；将ODS层的统一视图信息区的全量库的数据抽取、转换、加载到ODS层的对外数据服务接口区；将ODS层的统一视图信息区的全量库的数据抽取、转换、加载到DW（数据仓库）层。

1.3系统数据结构设计

1.3.1ODS设计

存放经过清洗、转换、标准化以后的数据，并对外提供数据服务。为企业提供统一的数据视图，满足业务部门实时获取数据和业务部门间对企业级的数据共享的需求。因此将ODS设计划分为两大部分：数据区、服务区。并按主题进行组织、近实时的集成数据存储，以便最终用户能够快速查询近期细节生产数据。

1.3.2DW（数据仓库）设计

数据仓库模型分为两个区域：核心数据区（企业核心数据历史细节区域）和轻度汇总数据区。核心数据区的数据模型设计依据企业数据模型进行设计，但是每个实体都要加上相应的时间戳。核心数据区的模型相对稳定。轻度汇总数据区的模型设计依赖于分析需求。数据仓库模型是符合3NF的带有时间戳的关系模型。具体操作时应对数据仓库需求进行分解，按业务主题进行组织，将业务主题相关的数据组织成主题域，并对各指标进行分析。

1.3.3DM（数据集市）设计

数据集市的数据分为两类：一类是基于数据仓库的细节数据或轻度汇总数据进行的统计分析，另外一类数据是基于统计分析进一步分析挖掘的数据。数据集市的建模方法是通过调研企业经营的战略目标、综合查询分析系统、同业对标系统、业务管理目标、业务报表等，对这些资料进行分析。根据一体化平台关于分析主题进行细化，构建统一的核心数据集市模型。数据集市模型采用星形模型建模。

1.4元数据管理设计

元数据存储在专用的数据库中。有一类独立于其它工具，被称为元数据知识库（MetadataRepository）的工具，它们为元数据提供一个集中的存储空间。本设计中采用基于OracleOWB（OracleWarehouseBuilder）的元数据管理方案，各个工具集中通过OWB进行管理其中，元数据管理流程主要包括：元数据获取流程（手动和自动）、元数据访问权限管理流程以及元数据流程。元数据知识库通过元数据获取流程，来整合多个源（工具、数据库和流程）中的不同元数据。通过元数据获取流程，将元数据存入知识库中后，为了有效的维护和管理元数据，保持其对于整个数据仓库系统的有效性、准确性和及时性，还需要完成许多管控工作。元数据的方式有很多种：包括从属关系图（dependencydiagrams），数据沿袭表（datalineage），影响分析（impactanalysis），高级搜索，柔性报表，元数据术语表等。在实际工作中，应该有一套具体的流程来使用这些元数据方式，使得用户的查询请求能得到及时有效的反馈。

篇（4）

1.引言

随着盐城经济的迅猛发展，盐城电网也在加速建设，越来越多的变电站相继投入运行，电力调度控制中心所需监控的信息量也随之增加。与此同时，对监控人员的专业技能水平也提出了更高的要求。虽然调度自动化水平日益提高，但能量管理系统还不能完全满足监控人员的需求。能量管理系统主要通过告警窗来向监控人员提示一些遥信变位、遥测越限等信息量，对即时分析某单一故障提供了较大的帮助，然而该告警系统却不具备统计分析等功能，给监控人员进行下一步分析带来不便，图1所示为能量管理系统的告警窗图。

图1 能量管理系统的告警窗图

为了给监控人员提供更加直观、丰富的信息量，进一步提高自动化水平，本文提出构建主站实时监控统计分析系统。该系统具备较为系统的统计分析功能，通过对告警信息、三遥信息的统计分析给出监控人员最为关心的几方面内容，包括：按区域、时间查询告警信息;遥信频繁变位数量的统计;遥信吊牌、未复归信息的统计;厂站工况频繁投退次数的统计;遥测不变化信息的统计;遥信、遥测是否正确的综合分析。

将上述一系列统计分析的结果通过一个友好的可视化界面呈现给监控人员，便于他们在遇到电网的缺陷和故障时，做出最快、最合理的解决办法，从而在一定程度上提高了电网运行的安全性和稳定性。

图2 主站实时监控统计分析系统的构建图

主站实时监控分析系统采用B/S模式，即Browser/Server（浏览器/服务器）结构，来实现一系列的功能。该系统的研究成果以独立模块形式提供给监控人员使用，主要通过对三遥信息、告警信息的统计分析，将监控人员所需要的信息展现出来。其中，服务器是整个系统的核心环节。首先，是信息传输的载体。该系统从能量管理系统的三区数据库中提取所需的原始信息，再将处理过的信息传输给监控人员。其次，具有统计与分析功能，是整个系统的“大脑”。对原始数据进行一系列的统计和分析，通过各种算法得出所要求的结果。

2.系统构建

该系统设计思路：系统采用BS架构，利用服务器对数据进行管理操作，BS客户端用于监控人员的数据读取，整个系统的架构图如图2所示。

3.具体实施方案

3.1 系统数据处理流程

本文在已有的能量管理系统基础上，增加系统数据统计与分析服务器，实现系统数据的处理。如图3所示即为实时监控统计分析系统的数据处理流程。下面为整个系统数据的处理流程：

①三区web服务器不间断同步一区能量管理系统的实时数据，并将同步数据存入三区历史数据库中;

②远程浏览工作站利用浏览器提供的选项选取自己所需要的数据，并将操作指令发送给服务器;

③服务器对接收到的操作指令进行分析、判断，同时生成对应的SQL语句并发送到三区web服务器;

④三区web服务器利用SQL语句到三区历史数据库中快速查询对应的信息，并将查询到的数据返回给服务器;

⑤～⑦服务器结合操作指令，对三区web服务器返回的数据进行统计和分析，并将合理的结果返回到远程浏览工作站的浏览器界面中。

图3 实时监控统计分析系统的数据处理流程

3.2 数据的自动统计与分析

数据统计与处理服务器主要用于对接收到的操作指令进行分析、判断，同时将生成的SQL语句发送到三区web服务器进行数据调取。为方便调控人员对电网的监控，主要提供以下几方面的内容：

（1）综合统计;该功能主要将一个星期内电网出现的事故、异常、遥测越限、变位、告知这五类型号进行一个量化的统计。

（2）综合分析：该功能主要对一个星期内电网出现的事故、异常、遥测越限、变位、告知信号进行分析，并与前段时间进行一个比较，分析电网的安全性及可靠性。

（3）操作统计：可按选取的时间间隔统计遥控、遥调的操作次数。

（4）遥信正确动作次数统计：对遥信的动作次数进行统计，并结合一系列其他遥测、遥信量分析此次动作是否正确。

（5）重载超载：结合提供的变压器信息，分析当前的是否处于重超载状态。

……

这些内容的展示给监控人员处理日常的故障及缺陷提供了很大的便利性，大大提高了工作效率，并从一定程度上提高了电网运行的安全性和稳定性。

3.3 客户端显示

主站实时监控分析系统最终通过客户端将结果展示给用户，为用户提供了一个较为直观的界面。在这样的界面中，监控人员可以清晰的看到遥信频繁变位数量的统计;遥信吊牌、未复归信息的统计;厂站工况频繁投退次数的统计;遥测不变化信息的统计;遥信、遥测是否正确的综合分析等一系列的信息。图4所示为主站实时监控统计分析系统的客户端显示界面。

图4 实时监控统计分析系统的客户端显示界面

4.结论

随着对电力可靠性要求的不断提升，通过告警窗来向监控人员提示一些遥信变位、遥测越限等信息量的模式已经不能满足监控人员的需求。告警窗只能对即时分析某单一故障提供了的信息量，然而该告警系统却不具备统计分析等功能，给监控人员进行下一步分析带来不便。为了给监控人员提供更加直观、丰富的信息量，进一步提高自动化水平，本文提出构建主站实时监控分析系统。该系统具备较为全面的统计分析功能，通过对告警信息、三遥信息的统计分析给出监控人员最为关心的一系列内容。同时，将统计分析的结果通过一个友好的可视化界面呈现给监控人员，便于他们在遇到电网的缺陷和故障时，做出最快、最合理的解决办法，从而在一定程度上提高了电网运行的安全性和稳定性。

参考文献

[1]马坚.浅谈基于B/S架构下的科技项目管理系统[J].青海科技，2011（06）.

[2]曾宝国，程远东，曾妍，胡钢，潘锋.基于PDA的B/S架构基站维护系统研究[J].物联网技术，2011（07）.

[3]车国芳，柯学.提高配电网供电可靠性的方法[J].中国电力企业管理，2011（10）.

[4]梁伟.提高供电可靠性的策略分析[J].河南科技，2011（24）.

篇（5）

[中图分类号]　R195.3[文献标识码]A[文章编号]　1672-4208(2010)09-0030-02

随着社会经济的发展，人们工作、生活、卫生设施不断改善，医疗水平逐步提高，死因谱也相应发生了变化。为了解威胁居民生命和健康的主要疾病及其影响因素，更好地防病治病，现将我院2007～2009年死因网络直报的1003例死亡病例进行统计分析如下。

1　资料与方法

1.1　资料来源2007～2009年我院死因网络直报的《医学死亡证明书》。

1.2　方法依据国际疾病分类标准(ICD-10)，对2007～2009年我院死因网络直报资料进行统计分析。

2　结果

2.1　死亡人数及性别比2007～2009年我院网络直报死亡病例1003例。其中男性652例，占65.00％，女性351例，占35.00％，男女性别比为1.86：1。

2.2　年龄构成死亡人数最多的年龄组为70～79岁组，占26.82％；其次为60～69岁组，占17.05％；最少的为10～19岁组，占1.79％。死亡病例中最小年龄3 d，最大年龄98岁。各年龄段死亡人数及构成比见表1。

2.3　职业分布以离退人员多见，其次为农民和家务待业者，分别占25.02％(251／1003)、15.85％(159／1003)、12.76％(128／1003)。

2.4　死因顺位1003例死因报告病例中，恶性肿瘤、循环系统疾病、呼吸系统疾病占前3位，占全部死亡病例的77.37％。死因顺位及构成比见表2。

篇（6）

1 引言

《档案管理》创刊于1986年[1]，连续入选中文核心期刊，刊发了大量高被引的论文，备受业界关注。为客观准确地反映《档案管理》2012年的载文情况，作者对当年刊发的全部文章进行了各项统计。为确保统计数据的准确，对关键词作了必要的规范，归并了重复引文，剔除了无文献来源的注释性引文，并对全部引文逐一进行了核对，修正了引文中的差错。

2 统计分析方法

利用文献计量学的方法，对该刊2012年刊发的文章从栏目发文量、作者及地域和机构、主题、基金论文、引文类型及年代分布等方面进行统计分析，运用CNKI检索了被引情况。根据载文实际和统计分析的需要，作者统计分析不含“通讯”、“卷首语”、“文摘”等栏目的文章，主题统计分析不含无关键词的文章，引文统计分析不含无参考文献或参考文献类注释的文章。

3 载文统计分析

3.1 载文栏目发文量。2012年《档案管理》设置有“卷首语”、“理论探讨”、“争鸣”、“业务研究”、“局馆长访谈”、“专题沙龙”、“调查报告”、“海外采风”、“工作园地”、“史料钩沉”等18个栏目，共刊发文章277篇，表1是主要栏目的发文数量。发文量集中于“工作园地”、“业务研究”、“调查报告”和“理论探讨”四个栏目（表中单列了占比）。

3.2 作者分布。作者统计针对“工作园地”、 “业务研究”、“调查报告”、“理论探讨”、“海外采风”等9个栏目的242篇文章，其中独著210篇，两人合著28篇，三人合著4篇，分别占统计文章的86.78%、11.57%和1.65%。

3.2.1 作者发文数量。最多的发文6篇，共两人，发文3篇以上的作者共12人（“+”后为第二作者发文数），另有马帅章等28人发文2篇（含非第一作者）。

3.2.2 第一作者地域分布。以第一作者发文最多的为河南作者（168篇），其次是北京（9篇）、山东和上海（各8篇），发文作者涵盖了19个省市。河南省又以郑州、开封、濮阳作者发文数量居多（105篇）。

3.2.3 第一作者机构分布。由于有些文章作者单位不够具体，对统计数据的准确性有一定影响。242篇文章中，各类院校和各级各类档案馆（局）的作者占比较高，分别发文102篇和82篇。

3.3 主题分布。关键词是从文献的标题、摘要和正文中选取的，能够反映文献的主题[2]，因而选用关键词进行主题分析。2012年《档案管理》中有关键词的107篇论文共有关键词401个，篇均3.75个。涉及关键词305个，最多的仅出现8次，可见分散度较大。为较好地反映文献主题，可将表达相同或相关概念的关键词进行必要的统一，如将“档案馆”、“档案局”、“档案部门”等统一为“档案馆”。规范统一后，利用自编的软件处理得到以下统计结果。

3.4 基金论文。2012年基金项目论文共25篇，基金论文占比超过10%。其中，河南省档案局科技项目《转变档案行政管理职能研究》、《档案执法理论与实践研究》各发文3篇，河南省档案局科技项目《档案立法技术研究》发文2篇，基金发文量如表4所示。

3.5 引文统计。2012年《档案管理》文章中，列有参考文献、参考文献类注释的论文96篇，共有引文725条（其中外文13条），篇均引文7.55条。从年代分布看，2005年后的引文数量占66.62%。引用文献类型中，期刊论文最多，占比达70.62%，其次是电子文献、图书和学位论文。表5列示了引文的年代分布（“其他”为1980年前或无法确认年代的）。

引用文献中的期刊论文共涉及期刊139种，其中以档案类期刊为主，排在前9位的都是档案核心期刊，其次是非核心档案类期刊和图书情报类核心期刊。

3.6 被引统计。通过中国知网检索，截至2013年4月23日，2012年《档案管理》刊发的被引论文达25篇，其中《中部六省市级档案网站评估指标体系的构建及评估结果分析》被引3次，《浅谈事业单位档案的信息化建设》等两篇各被引2次。表6列示了十种档案学期刊2012年发文及被引情况。

4 结论

通过以上统计和分析，可以得出以下基本结论。

4.1 从栏目发文分布看，“工作园地”、“业务研究”、“调查报告”和“理论探讨”四个栏目是发文主体，“工作园地”和“业务研究”两栏目的发文量超过发文总数的一半，表明《档案管理》特别注重结合工作实际，与其“以业务指导为主，兼顾学术性和可读性”[1]的定位是一致的。

“卷首语”是许多档案刊物共有的栏目，但《档案管理》六篇卷首语的内容均为“档案依法行政管理”，对做好档案工作有很强的针对性和指导性。

4.2 载文中独著文章居多，发文2篇以上的作者超过40人，他们独立或合作发文的数量超过100篇，表明《档案管理》已形成较为稳定的作者队伍。但作者以个人自由研究为主，论文合作程度偏低[3]。

发文作者的地域和机构数据表明，《档案管理》立足河南，面向全国。注重反映本省的研究成果，注重各级各类档案馆（局）的业务交流，不断传播和促进学术研究。发文作者集中在各级各类档案馆（局）和各类高校，反映了这两个系统科研能力较强[3]。

4.3 从关键词的词频可以看出，《档案管理》2012年特别注重刊载“档案执法”、“档案法规”和“立法”方面的文献，同卷首语的内容相呼应。此外，“档案馆”、“档案”、“档案管理”、“档案鉴定”、“档案服务”等也是刊载的重点，有很强的实际工作指导价值。但列有关键词的论文偏少，在一定程度上影响了主题统计结论的准确性。

4.4 基金项目多为与档案工作相关的省部级以上项目，基金项目级别较高。基金论文占比虽不算高，但针对性很强，较充分地反映了档案科研特别是档案执法和立法研究方面的最新成果。

4.5 引用文献表现出期刊论文多、核心期刊论文比重大、引用年代新的特点，表明刊载的论文注重高水平档案学研究成果的吸收，注重图书情报领域研究成果的借鉴，同时广泛吸纳其他学科的成果。但列有引文的论文偏少，有些著录不准确，外文引文较少。

4.6 尽管统计的时间段较短，而论文的被引和被引率均有较大的滞后性[4]，但截至2013年4月23日的2012年载文被引同其他档案类期刊2012年载文被引的对比表明，《档案管理》有较高的被引量，一定程度上反映了该刊在档案类核心期刊中有较高影响力。

参考文献：

[1]《档案管理》杂志社.《档案管理》简介[EB/OL].（2011-04-25）[2013-04-01].http：///w_NewsShow.asp？ID=0：2628.

[2] 倪丽娟，于淑丽.档案学研究热点分析——基于2004～2008年《档案学研究》、《档案学通讯》论文关键词的词频分析[J].档案学通讯，2010（1）：19～22.

篇（7）

中图分类号：X734文献标识码： A

公路行业作为国民经济的一个重要组成部分，是促进国民经济发展的基础设施。公路事业的发展，对于调整国家生产布局和产业结构，开拓市场，加强城乡地域交流，开发城乡经济资源，促进贫困地区经济发展，改变偏远地区的落后状况，提高人民生活质量，增强国家经济实力等方面起着巨大作用。近年来，由于我国构建社会主义和谐国家，加快了全面建设小康社会步伐，加大了对交通基础设施建设的投入，特别是公路投资结构区域多元化，涉及到国省县乡公路，公路统计的范围更加广泛，对作为公路管理基础工作的公路统计工作要求更精细、更规范、更系统，要求统计数据的质量和实效性也越来越高。

公路统计是公路建设和养护工程中的一个重要组成部分，是公路管理的一项重要的基础性工作，其基本任务是对公路的建设、养护和使用情况进行统计调查，对公路经济活动提供信息资料并实行统计监督，为制订公路交通规划和公路建设养护计划提供依据。在公路事业发展的今天，公路管理也发生了根本性的变化，公路统计工作只有不断提高工作效率，更好地研究、运用各项统计数据为公路建设养护服务，才能适应公路管理发展形势的需要，科学有效的公路管理是公路事业发展的保证。

一、公路统计分析工作的必要性及重要性

（一）社会经济发展的需要

随着社会经济发展的加快，交通是否发达是衡量一个地方经济发展情况的重要指标，从而各地根据路况不同程度地对旧路进行改造及根据规划增加新的公路建设。在公路工程项目建设中，工程的进度、质量和效益是业主和施工单位共同追求的目标。如何搞好公路工程建设期的统计，形成全面有效的统计信息系统，是公路工程建设时期的重要内容。更是检验公路建设各项工作成败得失及合理调配建设资金，制订规范化管理条例的重要依据；做好公路统计工作是全面搞好公路管理工作的基础，是公路交通重要的管理和决策依据。

（二）公路建设和养护管理体制深化改革的需要

在当前市场经济的环境下，公路投资结构趋于多元化，各种经济实体的变换和利益交错，必然给搜集、整理、研究和提供各种公路经济活动的公路统计工作带来一定的变化和影响。公路统计的范围更加广泛，涉及到高速公路、国省道干线公路、县乡公路和农村公路等。公路指标体系、统计方法与以往相比有很大不同，要求更精细、更规范，更系统，统计数据的质量和时效性要求也越来越高。

（三）建设公路统计管理信息化的需要

搞好公路统计管理信息化，是加快实现公路现代化的必然选择，它能从根本上突破和改变旧的公路统计管理方式和手段，提高公路管理的效益和技术水平。随着计算机技术在公路部门的普及应用，公路统计作为信息处理技术的核心部门，其公路建设和养护的大量统计数据，涉及到公路基础数据、路政管理等方面内容，需要平时及时录入信息，大量统计数据均采用计算机技术进行处理，形成各种报表，有关公路数据库的建立、更新、完善任务更加急迫繁重，

（四）公路发展、决策管理的需要

公路统计在公路科学管理过程中扮演着不可替代的角色，近年来，随着我国加大对交通基础设施建设的投入，公路建设事业正以前所未有的速度向前发展，公路投资结构趋于多元化，公路管理的范围更加广泛，涉及到高速公路、国省道干线公路、县乡公路和农村公路等方方面面，公路指标体系、统计方法与以往相比有所不同，要求更精细、更规范，更系统，统计数据的质量和时效性要求也越来越高。

由于公路统计指标具有较强的系统性和完整性，不仅为制定公路发展方针政策、公路养护建设计划和管理法规提供依据，而且为科学组织公路生产，加强公路部门的内部经济核算提供依据。公路愈发展，愈现代化，愈需要依靠统计数据，因这通过对统计资料的分析，揭示公路发展规律，反映公路养护和建设实际，从而制定出与市场相适应的管理政策和法规，以保证公路业健康有序发展。对做好公路统计工作的思考随着我国经济社会和公路建设的快速发展，政府、行业、社会公众对统计数据的及时、准确、方便性要求越来越高，要做好统计工作首先加强统计基础建设工作，提高统计人员素质。

二、存在的问题

（一）一些领导认识不足

在实际工作中，一些公路基层单位的领导只凭上级的文件精神和自己的工作经验来指导生产，没有形成运用统计数据分析解决问题的工作作风和策略，认为统计工作就是填填数字，几分钟就完的事。

（二）公路统计队伍的专业水平差

公路统计队伍人员变换频繁，从事公路统计的人员的敬业精神、文化水平、业务素质不尽如人意，有统计专业技术职称的很少，兼职统计人员较多，许多统计人员没有经过专业培训，便匆忙上岗；上岗以后，也很少进行专业学习，有的仅能完成一般的统计报表，却不善于搜集、整理、汇总各种资料，使统计资料难以准确地反映客观情况，统计人员业务素质有待提高。

（三）统计工作中法制观念淡薄

法制观念淡薄，统计数据存在较大的随意性和盲目性。一些单位的领导出于对部门、个人利益的考虑，对数字造假心知肚明，以行政手段干预报表的各项统计数据，统计人员也只能按领导意图行事。这样统计数据的随意性和盲目性就增大，虚报、瞒报、篡改统计数据现象经常存在，如由于公路养护计划指标逐年都要按比例提高，为了完成指标，编造的数据就失去了统计报表的意义。

三、完善改进公路统计分析工作的措施

（一）加强公路统计工作重要意义的认识

公路愈发展，愈现代化，愈需要依靠统计数据，因为公路统计是揭示公路发展规律，反映公路养护和建设实际，公路统计指标不仅为制定公路发展方针政策、公路养护建设计划和管理法规提供依据，而且为科学组织公路生产，加强公路部门的内部经济核算提供依据。当前是信息技术突飞猛进的时代，公路统计涵盖了公路数据库管理系统、交通量调查统计系统、路面桥梁管理系统等全方位的现代化公路信息网络，通过统计数据分析研究公路的经济活动，是提高领导者管理水平，正确行使领导职责的一项不可忽视的工作。

（二）加强公路统计队伍建设

稳定的高素质的公路统计队伍是重点。公路统计工作人员不但要掌握好统计法律法规、统计基础理论、基础核算等知识，能够熟练地应用基建公路统计专业知识、统计方法进行统计调查、统计整理和统计分析，了解统计的任务与过程，掌握公路统计的各项基本技能；还要在数据处理方面，统计工作人员要能熟练、运用计算机录入基础数据、汇总数据及进行数据分析。更重要的是要注重“现场调查”，统计人员要及时学习、掌握被统计工程的基本情况，了解公路工程专业知识，定期进行现场调查可以大大提高数据的准确性和统计的真实度。不仅如此还要树立起有效的用人方法，创造吸引人的环境氛围还要通过实用各种方法来教育统计人员，要重视提高人员的知识水准。

（三）完善统计法规有关制度

公路统计工作制度是公路统计工作科学管理的重要工作，能够增加公路统计工作水准。强化监督管理机制，建立和完善统计规章制度。做好公路统计工作，必须要有严格的统计管理制度作保证。第一，要建立统计工作领导责任制，这是当前完成统计任务，提高统计质量的一项重要措施。要通过这项制度，一方面促进各单位加强对统计工作的领导，另一方面，切实保证《统计法》的贯彻实施。第二，要积极开展公路统计专项检查工作，重点对基层原始统计数据进行实地抽查，切实纠正个别统计人员以年度计划指标、领导意见来填写各种报表的错误现象，做到数出有据，信息准确，提高统计数据的准确性、真实性、可靠性。第三，强化统计工作的行政管理，进一步健全统计工作的考核评比奖励制度，制订出公路统计工作标准和评比奖励办法，通过综合性的考核，切实提高统计人员的责任感和积极性，促使公路统计工作进一步走上科学化、规范化、制度化的轨道。

参考文献

[1]崔海凤.浅析规范公路统计工作[J].金田.2013,05.

篇（8）

2病案统计工作对计算机网络技术的应用

在医院病案统计工作中采用计算器网络技术需进行合理的配置，同时要想提高病案统计的实用性，需经以下几个步骤进行性：2.1计算机系统的配置。在医院病案统计工作中采用计算机网络技术，促进病案统计工作的网络化，选取的计算机性能应达到相应的要求，主要包括计算机的硬件与软件配置及性能，才能满足需求。从计算机的软件、硬件配置来看，个人认为在计算机硬件配置上，需采用VGA显示器，内存应不小于4G，硬盘容量应超过1T，最好选取的容量越大越好，同时对网卡、网线、打印机及服务器均具备一定的要求。而在计算机软件配置上，需选择中文WCDOS操作系统，Novel网，操作系统应高于Ms-DOS3.3，且酌情优化病案统计管理的首页。2.2应用计算机网络技术。计算机网络技术应用时应将病案与统计联网，再经局域网把原始数据传输至工作站内统计，且进行审核分析，最后制成相应的表格。该思路看起来比较简单，但具体实施也需要一定的步骤及流程，个人认为病案及统计工作的流程，具体应包括：（1）病案统计：将病案数据输入工作站后应进行统计，内容包括：①把病案首页信息传输至工作站；②转换格式，对操作前应转换的格式进行统计，以提高效率；③对病案首页内容进行审核，主要经设置相应条件关卡而实现审核的目的，标准应达到确保数据的准确性与完整性；④对数据进行汇总，并生成报表。（2）病案工作：①对病案进行定期的收集；②对收集的资料进行审核，且进行校对修改；③对病案首页信息进行编码；④把病案首页输至工作站中。以上所述的病案及统计工作流程均是医院病案统计工作中应用计算机网络技术的重要步骤，要想提高计算机网络化的应用价值，需进一步强化以上步骤的掌握情况。以上全部工作的重点为审核医院病案首页数据，审核工作直接关系到病案统计工作的质量。

3病案统计工作中应用计算机网络技术的价值

计算机网络化主要是指数字化管理系统，即为促进病案统计的自动化，经过构建文档一体化，及时归档各种病案文件，经计算机技术有效管理病案统计流程，确保病案信息的科学性、准确性及完整性。3.1提高病案统计工作的实用性。因医院管理的病案信息非常大，这就明显增大了病案管理工作的难度，少数需长时间存储的病案信息通常很难保证存储的完整性，这就导致病案信息的统计工作质量下降，明显阻碍了医院的整体发展[4]。随着近年来计算机网络技术在医院病案管理工作中的应用，明显节省了医院的物力与人力，使病案统计工作变得更加轻松，明显提高了医院物力、人力资源利用的有效性。3.2提高病案管理工作的安全性。病案信息关系到患者的隐私，不同时间、不同人员对病案信息的处理权限也存在明显的差异，应用计算机网络技术进行病案统计即采用电子档案，其采用的实名制明显提高了病案信息的安全性[5]。采用计算机网络化系统进行病案统计具有避免非法用户侵入、权限控制、传输及存储加密等特点，可见病案统计人员在工作时需具备良好的法律意识，做好对病案统计的保密工作，避免泄露隐私。3.3提高病案管理工作的灵活性。应用计算机网络技术进行病案统计可根据不同需求制定合理的报表格式，提高了统计的灵活性，更符合病案管理的发展需求。而在对病案信息进行检索时，不仅包括单一检索条件，还可经多个条件联合进行检索，从而明显提高了检索的灵活性，更符合医院各科室的检索要求[6]。针对突况可经远程会诊，从而实现区域性或全球性的资源共享，给患者的治疗争取时间。3.4提高病案统计的准确性和完整性。因受到医院规模的影响，针对病案信息的核对与整理难度较高，从而明显影响了病案统计的准确及完整。而应用计算机网络技术之后，按照病案首页信息，分类整理病案，存储至计算机内再进行病案统计，为了提高统计工作的效率，需按照实际要求转换信息格式，转换时需注意保证信息的准确性、完整性，防止数据的丢失，需及时进行处理，然后再审核病案首页信息，及时纠正其中存在的错误。

4小结

总而言之，在医院病案统计工作中应用计算机网络技术实现了病案统计工作的信息化、数字化，明显提高了病案管理工作的质量，对于促进医院的信息化建设及整体发展具有重要的意义。

作者:尚书一单位:西南大学计算机与信息科学学院

参考文献

[1]曹静.医院病案统计存在问题与对策研究[J].中国保健营养,2016,26(22):394-395.

[2]王佩玉.医院病案统计中计算机网络化的应用[J].中国保健营养,2016,26(33):369-369.

[3]陈静娴.对医院病案统计工作存在的问题的探讨[J].中国保健营养(上旬刊),2013,23(4):2177-2178.

篇（9）

统计工作的最后一步是撰写统计分析报告，分析报告是发挥统计整体功能、表现统计成果的重要步骤，其有利于发现统计工作中存在的问题。

一、统计分析报告的特点类型

统计分析工作的特点就是数量性，因此统计分析报告就是用数字说话，以事实描述，然后进行议论分析。统计分析报告用简洁的语言表述丰富的统计内涵，做到语言简练意赅。这种独特的表达方式也说明了与其它文体的显著差别。

（一）统计分析报告的特点

1.统计分析报告的是基于大量的调查数据，既要有数据又要有分析，即要提出问题又要有解决问题的措施，因此统计分析报告要比总结报告更加精准。

2.统计分析报告要求从更宽的面上交代背景，用较多的篇幅和事实系统集中地阐述问题、解剖矛盾，比新闻报道更全面具体。

3.统计分析报告必须运用大量的数据材料揭示规律性，在论证文章观点阐述某种看法时比学术论文更侧重用数据、事实说话，深入浅出，虚实结合。

（二）统计分析报告的类型

统计分析报告的类型有许多种，下面就几种经常使用的类型略作说明。

1.进度型统计分析报告。进度型统计分析报告也被称为定期统计分析报告，其分析目的是为了让企业管理阶层能偶实时了解工作的进度和检查企业计划的实施情况，其一般按周、月、季度等编写。

2.专题性统计分析报告。是利用统计资料，进行分析投资建设中的某一方面、某一环节而深入研究编写的分析报告。

3.预测性统计分析报告.是在分析过去和现在的大量准确的统计资料基础上、运用统计预测方法、对未来发展趋势做出较为合理的判断和数量预测，它具有数量性、预见性、差异性、可控性的特点。

二、统计分析预测

电力企业的统计工作具有大量的数据优点，除了对其进行统计分析之外，对电力企业来说更要充分的利用统计分析进行供电情况进行预测，更重要的是对电力的负荷的调研和分析。

伴随着我国用电结构的调整我国的电力供需矛盾得到一定程度的缓解，国内各大电网负荷特性也都发生了根本性的变化，电网运行的特性是电力负荷的特性趋向于正常。各大电网集团的的最大负荷普遍持续高速的增长，电力峰谷差率增大，负荷率下降，水源枯水期和电力高峰期电力供应紧张，电网的调峰难度增大，对电网的正常运行带来很大的安全隐患，因此，对电力负荷的统计、分析和预测对电力企业来说越来越显的重要。

下面论述的是对电力负荷的预测和预警的相关指标，包括了一些还正处于在探索和实践的指标。(1)日最大电力负荷，一天之中电力负荷最大的一段。电能表的计量有一个小时、半个小时、一刻钟和瞬间负荷，日最大电力负荷一般采用的是整点的最大负荷。(2)日平均电力负荷，每天电力用量除以24小时得到的日平均电力负荷。(3)日最小电力负荷，一天之中电力负荷最小的一个时间段，和日最大电力负荷一样，其一般使用的也是整点的电力最小负荷。 (4)月内最大三日平均电力负荷，任意月份内电力负荷最大三日的平均值，也即是每一月内，取电力负荷最大三天中的整点的最大电力负荷，求这三天的平均电力负荷值，该值即是在这个月中的最大三日平均值。对电力负荷的实际分析中，电力的最大负荷是一个最高水平的状态，并不是偶然的电力负荷，其既具有代表性。发达国家一般都是采用月内最大三日平均值最为最大电力负荷。 (5) 日负荷率(γ)，反映一天内的电力负荷平复程度，是日平均电力负荷和日最大电力负荷的一个比值，一天之内若负荷的变化比较大，则日负荷的曲线就会陡峭，日电力负荷率越低，反之则越高。 (6) 日最小负荷率(β)，反映一天内的负荷变化的趋势，是日最小负荷和日最大负荷的比值。一般为了满足电网调峰的需要，在分析电网调峰能力时通常使用的是接近或者是最小的日最小负荷率（去除节假日外），而并非采用平均最小负荷。(7)日峰谷差率，是日最大电力负荷除以日最大电力负荷与最小负荷的差值所得的数值。和日最小负荷率均值一样日峰谷差率反映的也是一天内的电力负荷变化的幅度。

(8) 月不均衡系数(σ)，是指平均日电力负荷和该月份内最大日电力负荷的比值。(9)季度不均衡系数(ρ)，是指全年各月最大电力负荷的平均值和该年份内最大电力负荷的比值。其主要反映的是全年内月最大负荷的不均衡性。 (10) 年平均日负荷率(γav)，指的是全年内日电力负荷的一个平均值。 (11)年平均月负荷率(σav)，指的是全年每个月份的日平均电量的总和与全年每个月份的最大日电量总和的比值。

三、结论

总之，对电力负荷进行统计分析是有效防范电力企业发展风险的重要工作，一直以来受到政府、电力企业和相关部门的高度关注。电力企业的发展关系到我国国民经济发展，电力统计分析与预测是提高电力企业经济效益、保障电力工业健康发展的重要手段。在市场经济体制下研究电力供给与需求的动态变化，及时监测、分析当前和未来电力供需情况具有重要意义。

参考文献：

[1] 陈春琴. 数理统计分析在电力企业负荷预测中的应用[J]. 华东电力, 2006, (05)

篇（10）

统计工作主要分为统计设计、资料收集、整理汇总、统计分析、信息反馈五个阶段，统计工作的前四个阶段均是容易产生统计误差的阶段，其中统计分析是统计工作中最关键的一步，对信息反馈阶段的基础，它是保证统计工作成果准确性的重要部分。因此，统计分析中的误差控制显得尤为重要。

一、统计分析的基本步骤

（一）样本采集。样本采集是进行统计分析的前提和基础，是统计分析的数据来源。样本采集有不同途径，首先，通过实验观察和测量调查，来直接的获取到信息的方法。二是通过文献检索，阅读获得间接信息。样品采集过程中，除了要注意数据的真实性和可靠性，而且还特别注意两种不同类型的信息之间的区别：一个连续的数据，也称为测量数据，是指通过实际测量获得的数据；二是间歇性的数据，是指类的事情，也被称为计数数据，等级等属性点数获得的计数数据。对不同的样本数据，在样本采集的初期就应该进行分别对待，保证后续工作的顺利进行。

（二）整理样本数据。整理数据由统计设计标准的分类收集的数据汇总过程中。由于收集到的数据大部分是无序的，零散的，不系统的，统计进入所需的研究数据核查的目的和要求按照之前的计算，不包括其中的一部分不真实的，然后总结或列表，从而简化了原数据可视化，系统化，并能反映在初次分配中的数据。

（三）数据分析。分析数据是指整理数据的基础上，相应的统计计算，获得的数据分布的总体统计特征的统计结论的过程中，它是核心和关键的统计分析。数据分析通常分为两个层次：第一个层次是用来形容一种方法来计算的统计数据反映的集中趋势，分散程度和相关的强度与外部代表性的指标，第二个层次是基于描述性统计，并与推论统计方法进行数据处理，以此来推断总体样本的信息，并进行分析和推测的整体特点和规律。

二、统计工作过程中误差控制

（一）统计设计。统计设计是确定统计工作的主要目的、预期达到何种效果的统计流程、规则的重要步骤。统计设计方案要求考虑问题要全面，针对不同的统计目的确定样本及样本容量。样本量的大小不取决于总体的多少，而取决于：1.研究对象的变化程度；2.所要求或允许的误差大小（即精度要求）；3.要求推断的置信程度。当所研究的现象越复杂，差异越大时，样本量要求越大；当要求的精度越高，可推断性要求越高时，样本量越大。因此，在统计设计阶段，合理的确定样本及样本容量是减少统计分析误差的根本条件。

（二）样本采集。样本采集过程即统计资料搜集过程。数据的准确性、真实性是确保统计工作顺利进行以及统计分析、信息反馈的根本要素。样本采集过程应注意一下问题：

1.统计调查人员培训。在进行统计调查之前，统计工作的设计者、组织者应该针对统计调查人员进行一次业务培训。每一项统计调查都是为统计分析的最终目的服务，为更好的收集统计数据，应该让统计调查人员透彻理解统计调查的具体规则、必需调查项目以及必须遵守的相应素质，以减少被调查者对统计调查的误解与抗拒，以此确保统计调查数据的真实性与完整性。

2.调查方式。统计调查有比较实用的调查方式，调查的方式有普查、重点调查、典型调查、抽样调查、统计报表制度等。具体收集统计资料的调查方法有：访问法、观察法、报告法等。具体采用哪种方式，选取的原则就是结合统计调查目的，节省统计调查经费，选取最优的调查方式或多种调查方式相结合。

3.数据完整。统计数据要求各项数据必须完整，如果某一样本各项数据不完全，就决定该样本才具失败，该样本必须被舍弃，因此，缺失数据项目太多会影响样本的容量，最终会使得统计调查结果失真，失去统计调查意义。

（三）数据整理。数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程。它是数据统计分析的基础。数据整理一般遵循以下流程：

有上述流程可以看出，应该加强数据审查工作，在这一阶段，很容易判断出是否出现人工录入失误或数据缺失项等相关问题，减少非系统误差出现。

（四）数据分析。在统计分析阶段，要求统计分析人员熟悉统计调查的目的、数据结构及构成等客观因素，根据数据的汇总分类等预处理结果，合理地选择拟合模型。在此阶段，应该注意的就是正确看待每一种统计分析方法的假设条件以及拟合优度等理论要求。

三、结束语

在统计设计阶段由于设计者不可能完全掌握统计调查对象的总体趋势，在数据分析阶段由于采用拟合模型分析，所以存在一定的系统误差，而这些系统误差是不可避免的，只能通过统计专业人员的专业知识进行理论上的优化，降低系统误差。在数据采集、数据整理阶段，只有加强人员培训、数据审查等办法避免数据输入等非系统误差。同时，在避免非系统误差的同时也应该审查被舍弃的样本数据，避免遗漏正常的异常值，导致异常值丢失对调查对象的总体认识的影响。

免责声明以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。

上一篇: 加强行业税收管理下一篇: 教育研究实践