时间:2023-03-20 16:07:19
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇计算机数据库论文范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
2.1恢复技术的内涵
数据库的恢复技术,又称“修复技艺”,是指当计算机数据库系统存在故障而引起数据丢失等现象时再次对毁损、丢失的数据信息进行修复的操作技术。为降低由于操作不当等人为因素以及系统本身的缘故而造成损失的可能性,同时也是出于减少客户自身损失的考虑,所以进行数据库系统的恢复备份必不可少。
2.2恢复技术的基本形式
数据库的恢复技术主要可以按照普通恢复、全盘恢复、邮件恢复和批日志恢复等进行归类。首先,普通恢复就是说在数据修复环节,对之前已经备份完毕的数据信息进行简要补充,或者采用经过远程控制的分步备份方式对数据进行简单修复的形式。由于未涉及到使用者之前的日志文档等的备份,所以它并不是对所有数据的完全恢复。其次,全盘恢复的形式。这种形式是当进行数据库的恢复操作时,涉及到了整个计算机数据库中的备份数据以及使用者处理个人事务的备份文档等。因此,这种恢复手段即便可能耗费大量的功夫,但其可以使电脑数据库中发生的损失降到最低;另外,它也可以使计算机恢复到之前某个还原点的状态。还有,就是批日志恢复的形式。此恢复技术形式最大的优势就在于:它可以降低恢复数据时所占用的储存空间,相比之下,其操作步骤也比普通恢复和全盘恢复更为简便。邮件恢复要求相关处理人员必须具备良好的实际操作能力,它也是一项针对管理者的技术性的恢复形式。除此之外,务必要维护好所需处理的数据信息,更有效地提高数据恢复的安全性、科学性。
2.3恢复技术的主要方法
计算机数据库主要的修复方式可分为转储并建立相关日志、依照实际情况进行判断解决两种。第一,转储并建立相关日志文档。它要求带有一定的周期性并循环拷贝数据库中的全部数据,然后再把所备份的信息储存到其他介质中。因其简易的操作方法,这种数据库的修复方法一直以来都是最为常见的一种。第二,根据具体状况进行操作处理。如果计算机数据库存在着某些问题或故障,可以依照以下两种情况做出判断、进行处理。一,假设计算机数据库因受到的损坏过于严重而无法继续使用,这时候就应当启用一张新磁盘,并在其中拷贝一份实时数据,之后再借助日志库的重做处理进行新数据库数据的更新操作。这样不光能够恢复到之前的样子,同时又令现有的数据库数据得到更新升级;二,若是数据库未遭到损坏或程度较轻的话,再或者只是其中某几项数据不再可依赖的话,是完全没有必要拷贝已存档的数据库内容的,只要通过日志库中撤销处理的执行便能够那些没有考虑好便做出的改动,进而让数据库恢复到正常的工作状态。
二、计算机数据库在信息管理中的应用现状
就目前技术的发展结构而言,在计算机数据库技术实际运行过程中,整体技术维度和技术运行机制也在发生改变。第一,计算机数据库技术的应用范围在逐渐扩展。在实际生产生活中,应用计算机数据库技术的频率和市场前景越来越大,无论是工业、农业以及文化产业等,都将其视为有效的信息处理工具[2]。因此,计算机数据库技术的安全性和适配性尤为重要,各行业也在自身发展进程中不断摸索和技术优化,真正建立切实有效的管控模型和管理机制,确保管理维度的实效性,也为信息结构优化奠定坚实基础[3]。第二,计算机数据库技术的安全性也在探索中逐渐得到强化,也突显出计算机数据管理项目的具体要求,只有优化其安全价值,才能更好的建构高度机密性以及敏感性数据管理维度,保证了信息备份管理以及恢复功能的有效性,对于数据信息的复制和备份,要在优化信息维度的基础上,真正实现了数据库的安全性升级。
三、计算机数据库技术在信息管理中的应用优化路径
(一)优化计算机数据库技术在信息管理中的安全性
要保证数据完整性,就要从安全应用以及安全管控模型出发,建构系统化管理维度和管控要求,保证数据在得到共享的同时,相应的数据信息也是安全准确的。因此,技术人员要结合计算机数据库技术的相关要求,提升信息完整度和安全性[4]。
(二)优化计算机数据库技术在信息管理中的实践性
在实际信息管理和信息控制过程中,要积极落实理论和实践的融合机制,确保管理维度和管理效果的最优化。伴随着计算机技术的高速发展,将数据库原理和数据库管理技术模型进行深度管控,是提升数据科学性以及合理性的重要路径,也是研究数据分析机制以及计算机数据库技术应用模型的重要参数,因此,要保证理论联系实践,建构计算机数据库技术应用整体。
(三)优化计算机数据库技术在信息管理中的技术性
对于计算机数据库技术来说,最基本的就是技术参数,因此,要保证计算机数据库技术在信息管理中得到推广,最基本的就是要保证技术模型的安全性和准确性,并且积极落实计算机共享体系。计算机数据库技术最根本的要求就是要规避数据库被非法入侵,确保其技术安全和信息共享安全。但是,在实际管理机制中,信息的绝对安全存在风险。提升计算机数据库技术的技术安全性,能更好的落实信息应用价值,确保信息维度得到有效优化。因此,相关项目技术人员要利用加密技术对非共享信息进行系统化管控,提高管控效果的同时,积极落实技术性管理要求,借助权限管理机制、数据加密技术以及强制存取控制技术等措施,进一步优化计算机数据库技术的技术安全性[5]。
四、结束语
总而言之,在信息管理过程中积极应用计算机数据库技术,能在满足共享需求的基础上,充分发挥信息的实用性价值,确保信息得到充分利用,也为实践优化提供动力,确保技术模型以及信息管理维度之间形成有效的控制机制,也为数据应用研究奠定坚实基础,保证计算机数据库技术和信息管理之间的优化契合。
作者:陈文杰 单位:
参考文献:
[1]王瑜.探究计算机数据库安全管理与实现途径[J].建筑工程技术与设计,2016,15(11):2074-2074.
[2]温林芝.试析计算机数据库安全管理技术与方法[J].数字技术与应用,2015,15(04):183-183.
2关系数据库技术在计算机网络设计中的基本原理
在计算机网络技术发展的过程中,数据库技术存在着众多的种类,其中根据数据库模型的运行模式可以分为:网状模型数据库技术、层次模型数据库技术以及关系数据模型数据库技术。这些数据库技术在不同的计算机网络设计活动中有各自的优势,其中关系数据模型数据库技术,以其完美的数据连结技术和高度的数据模型适应性,成为计算机网络设计活动中通用的一种数据库技术。其在运行过程中展示出的完善的数据连结性,能够在计算机网络设计活动中,对任何相关的计算机网络数据进行关联,并能够在一定数据基础上对多种数据进行综合性的关系链接。这种数据信息服务的全面性和数据链接服务形式的多样性,能够极大的满足计算机网络设计活动中多样化的数据信息需求,所以在具体的计算机网络设计活动中成为使用者首选的数据库类型,被广泛的应用于计算机网络设计中。计算机网络设计活动是一个复杂、系统的工程性活动,在其运行活动中要求下属的各个模块都要最大程度上的兼具数据信息服务的全面性和便捷性。在关系数据库中这一系统要求被很好的体现了出来,关系数据库拥有自己管理信息交互平台,能够基于C语言等网络编程语言与使用者进行数据库信息的交流,提高了数据库使用的便捷性和全面性。在计算机数据库软件系统结构中包含着两个数据库访问系统,一个是开放数据库连接性(ODBC),一个是数据访问对象(DAO),这两个数据库访问系统相互独立,能够单独向用户提供数据信息服务。其中ODBC不仅能够基于SQL语言与使用者进行数据信息交互,而且对C语言和SQL数据库之间的访问机制进行了定义,让使用者可以通过C语言这样一种计算机网络设计活动中常见的语言形式与数据库进行信息交互,保证了关系数据库对计算机网络设计活动数据信息交互,让计算机网络设计人员能够通过其最常用的信息交互方式与关系数据库进行交流,保证了关系数据库与计算机网络设计活动积极、有效的互动。DAO为计算机网络设计提供了数据库机制,这一机制是从关系数据库的整体出发对关系数据库内部组成部分和内容的一种规范。当一个关系数据库体系结构由多个DAO构成时,DAO自身的数据库管理机制就会发挥作用,从DAO自身的数据资源特点出发,对关系数据库整体进行协同管理,保证整个关系数据库的数据信息服务的高效进行。DAO的这种自我管理机制和其自身的数据访问对象本质是相互分离的,在具体的管理活动中自我管理机制和数据访问对象能够进行各自独立的管理,让每一个DAO都可以在保证自身数据访问对象性质的基础上,同时实现自身和DAO群体的管理,这种各自独立的数据访问对象管理和运行管理,在保证DAO数据服务对象专业性的同时,也方便了自身的升级改造。而且在关系数据库运行活动中,DAO可以链接相应的网络数据库,实现数据资源的网络化共享和管理。
3关系数据库在计算机网络设计中的优势
关系数据库在计算机网络设计中具有强大的数据存储功能,以及简便的数据转换功能等强大的优势,以下将对关系数据库在计算机网络设计中的优势进行详细的阐述。
3.1强大的数据存储功能
强大的数据存储功能,是关系数据库在计算机网络设计活动中运用的主要优势。随着计算机网络设计应用范围的不断扩大,计算机网络设计活动的内容含量越来越大,内容的组成形式也变得越来越复杂,面对计算机网络设计活动这样一种发展趋势,相应的关系数据库的数据储存能力和数据管理能力变得极为重要。关系数据库的应用,不仅能够对计算机网络设计活动中需求和产生的大量计算机网络设计数据进行及时的存储,而且能够借助内部管理机制的帮助,对这些数据进行有效、准确的规划和管理。关系数据库的应用让计算机网络设计活动的数据管理环节,成为计算机网络设计环节的一个效率增长点。在具体的操作活动中计算机网络设计人员,可以利用数据库强大的数据存储功能将设备参数输入到网络拓扑结构中,进而借助网络拓扑结构对关系数据库进行高效、快捷的操作。如果不能有效的利用关系数据库的辅助作用,有效管理复杂的数据信息,那么计算机网络设计势必会陷入困境中。
3.2简便的数据转换功能
关系数据库在计算机网络设计活动中的优势,还体现在不同数据之间的转换功能。在计算机网络设计活动中,因为设计活动本身可能会涉及到社会经济的各个领域,自身的设计形式也会因为网络设计目标的不同而大相径庭,在计算机网络设计活动中,计算机网络设计的数据从呈现形式和传递方式上都是有本质上的不同的,所以在对计算机网络设计数据进行管理的时候,不同数据之间的转换是一个关键性的问题,只有解决了计算机网络设计活动中的数据转换和数据转换效率的问题,才能促进计算机网络设计活动高效进行。关系数据库在计算机网络设计活动中的应用在一定程度上解决了这一关键性问题,因为关系数据库本身存在的关联性,就是要从两组不同数据中寻找共同点,并基于这些共同点建立二者之间的普遍联系,关系数据库的这种工作机制,在不同形式的数据之间的转换活动中也有积极的作用。数据的两种不同呈现形式本质上也是两种不同数据之间联系的一种体现,二者之间本质内容和内在逻辑的联系是普遍存在的。关系数据库可以根据这一特点,结合自身的工作机制,对二者进行本质上的联系,这样一种在计算机网络设计活动中复杂无比的问题,在关系数据库的参与下立刻变得可实现、可操作。关系数据库的存在只是解决了计算机网络设计活动数据转化能力的有无问题,只有强化计算机网络设计活动中数据转化能力的效率和便捷性,才能在网络设计的实际工作中起到更加积极的效果。所以在关系数据库的建立健全活动中,对其自身的数据转换能力的强化,是关系数据库发展完善的未来方向。这一改进必须要将关系数据库的数据转化能力与关系数据库的信息交互系统结合起来,保证使用者对关系数据库的数据转换能力有更加直接的参与和应用,同时要结合计算机网络设计活动发展的实际,对网络设计活动中可能会涉及到的数据呈现形式进行系统、详细的统计,并在关系数据库中对这些数据的呈现形式进行广泛的应用。具体而言,就是要在关系数据库中,对计算机网络设计活动中可能会涉及到的数据呈现形式进行定义,并设置相应的数据转化机制,在对数据信息进行存储时,尽量选择应用范围最广的数据呈现形式进行存储,以最大限度的保证计算机网络设计活动的数据需求,同时也要定义好各种数据呈现形式的转化机制,在使用者产生特殊的数据呈现形式需求时,能够运用相应的数据转换机制,进行数据呈现形式的转换,以保证计算机网络设计活动的高效进行。
1如何优化Parse
1.1SQL语句的Parse处理步骤:
1)计算语句值
2)共享池中有无与此语句值相同的语句?
3)共享池中有与此语句字符完全匹配的语句?
4)准备要运行的SQL语句
5)为新语句在共享池中创建空间
6)将语句存放在共享池中
7)修改共享池图,标明语句的值和在共享池中的位置
8)执行准备好的SQL语句
最理想的是,语句只执行1、2、3和8步来进行处理。不经过2、3步来测试被传给Oracle的语句要使用1~8步进行处理。只经过1、2、3、8的SQL语句要比经过1~8步的语句更为有效。
1.2在共享池中重用SQL语句
当SQL语句被传递给Oracle处理时,其秘诀是重复使用已经在共享池中的语句,而不是让Oracle在接受语句时去准备新的语句。前面表明,如果Oracle接受了一个与共享池中的语句相一致的语句,就重用共享池中的语句。
Oracle提供在数据库中存储代码的能力。当应用系统开始运行时,从数据库中读取代码(可用PL/SQL语句编制)并像其它语句那样传递到共享池中去处理。从数据库中取出的代码是编译过的并驻留在共享池中。
可以利用数据库中存储的程序代码设计应用系统,检查所有的事务处理以及主要的通用的过程,研究现有的应用系统并把主要的处理程序转换为数据库中存储的程序代码。在Oracle中存储代码可以通过过程、程序包、函数、触发器等来实现。
2如何优化Execute和Fetch
2.1避免无计划的全表扫描
全表扫描连续从表读取所有数据,而不管数据是否与查询有关。避免不必要的全表扫描有两个充足理由:1)全表扫描没有选择性
2)过全表扫描读取的数据很快从SGA的缓冲区移走(如果正在扫描的表不是“高速存储”的表)
在基于规则优化的情况下,如果下列任何条件在SGA语句出现,就要对一个表进行全表扫描。
1)该表无索引
2)对返回的行无任何限定条件(如无Where语句)
3)对数据表与任何索引主列相对应的行无限定条件。例如,在City-State-Zip列上创建了三列复合索引,那么仅对State列有限定条件的查询不能使用这个索引,因为State不是索引的主列。
4)对索引主列的行有限定条件,但条件或者是NULL或者是不相等。例如,City列上存在索引,在所有下列情况下都不会使用索引。
Wherecityisnull
Wherecityisnotnull
Wherecity!=’liaoning’
5)对索引主列的行有限定条件,但条件在表达式里使用。例如,如果在City列上索引,那么限定条件
WhereCity=’liaoning’
可以使用索引。然而,如果限定条件是
WhereUPPER(City)=’liaoning’
那么不会使用City列上的索引,因为City列在UPPER函数里。如果将City列与文本字符串联结在一起,也不会使用索引。例如,如果限定条件是
WhereCity||’x’like‘liaoning%’
那么不会使用City列上的索引。
6)对索引主列的行有限定条件,但条件使用Like操作以及值以‘%’开始或者值是一个赋值变量。例如,在所有下列情况下都不会使用索引:
WhereCitylike‘%aonin%’
WhereCitylike:City_Bind_Variable
如果表小、索引列无选择性,基于开销的优化器可能决定使用全表扫描。
2.2只使用选择性索引
索引的选择性是指索引列里不同值的数目与表中记录数的比。如果表有1000个记录,表索引列有950个不同值,那么这个索引的选择性就是950/1000或者0.95。最好的可能性选择是1.0。依据非空值列的唯一索引,通常其选择性为1.0。
如果使用基于开销的最优化,优化器不应该使用选择性不好的索引。
索引的选择性是指索引列里不同值的数目与表中记录数的比。如果表有1000个记录,表索引列有950个不同值,那么这个索引的选择性就是950/1000或者0.95。最好的可能性选择是1.0。依据非空值列的唯一索引,通常其选择性为1.0。
索引的选择性是指索引列里不同值的数目与表中记录数的比。如果表有1000个记录,表索引列有950个不同值,那么这个索引的选择性就是950/1000或者0.95。最好的可能性选择是1.0。依据非空值列的唯一索引,通常其选择性为1.0。
2.3管理多表联结
Oracle提供了3个联结操作:NESTEDLOOPS、HASHJOIN和MERGEJOIN。MERGEJOIN是一组操作,在所有行被处理完之前,它不返任何记录给下一操作。NESTEDLOOPS和HASH是行操作,因此会很快将第一批记录返回给下一个操作。
在每个联结选项里,必须执行一些步骤以获取最好的联结性能。如果没有适当地优化联结操作,那么联结所需的时间也许随着表的增长而呈指数级地增长。
2.4管理包含视图的SQL语句
如果查询包含视图,优化器有两种执行查询的方法:首先解决视图然后执行查询,或者把视图文本集成到查询里去。如果首先执行视图,那么首先完成全部的结果集,然后用其余的查询条件做过滤器。
首先解决视图会导致查询性能下降的问题,这取决于所涉及表的相对大小。如果视图被集成到查询里,那么查询的条件也可以应用于视图里,并且可以使用一个小一些的结果集。然而在一些情况下,也许可以通过视图分离组操作提高查询性能。
如果一个视图包含集合的操作(如Groupby、SUM、COUNT或者DISTINCT),那么视图不能被集成到查询里去。
不使用组或者没有集合操作的视图的SQL语法可以被集成到大的查询里去。
2.5优化子查询
当使用自查询时,也许会碰到几个独特的问题。涉及子查询的查询潜在问题如下:
?也许在执行完查询的剩余部分前执行子查询(与执行分组功能的视图相似)。
?子查询也许要求特定的提示,但这些提示不直接与调用该子查询的查询有关
?可以作为单个查询执行的子查询也许被代替写成几个不同的子查询。
?也许在使用notin子句或者notexists子句时,不能在最有效的方式下进行子查询的存在查询。
1)当执行子查询时
如果一个查询包含子查询,那么优化器有两种完成查询的方法:首先完成子查询,然后完成查询(“视图的方法”),或者将子查询集成到查询里去(“联结”的方法)。如果首先解决子查询,那么整个子查询的结果集将首先被计算,并且用查询条件的剩余部分做过滤器。如果没有使用子查询去进行存在检查,那么“联结”方法将通常要比“视图”方法完成得好。
如果一个子查询包括集合操作,如groupby,SUM或者DISTINCT,那么不能集成子查询到查询的其余部分里去。非集成的子查询限制了提供给优化器的选项。
2)如何组合子查询
一个查询可以包含多个子查询,使用的子查询越多,集成或者重写它们到大的联结里就越困难。既然有多个子查询使集成困难,就应该尽可能地组合多个子查询。
3)怎样进行存在检查
有时子查询不返回行(记录),但可以进行数据正确性检查。在相关表里的记录或者存在或者不存在的逻辑检查,称为存在检查。可以使用exists和notexists子句提高存在检查的性能。
2.6管理对非常巨大的表的访问
随着表增长到比SGA的数据块高速缓冲区存储器的空间显著大时,需要从另一个角度优化对这个表的查询。
1)问题
当表和它的索引小的时候,在SGA里可以有高度的数据共享。多用户读表或索引范围扫描可以反复使用同一个块。随着表的增长,表的索引也在增长。随着表和它的索引增长到比SGA里提供的空间大时,范围扫描需要的下一行将在SGA里找到的可能性变小,数据库的命中率将减小。最后,每一个逻辑读将要求一个单独的物理读。对使用非常大的表的优化方法着眼于特别的索引技术和有关索引的选择。
2)管理数据接近
在访问非常大的表期间,如果倾向于继续使用索引,那么应该关注数据接近,即逻辑相关记录的物理关系。为了使数据最大限度地接近,应该连续往表里插入记录。记录按通常在表的范围扫描里使用的列排序。
3)避免没有帮助的索引扫描
如果要对大表使用索引扫描,那么不能假定索引扫描将比全表扫描执行得更好。不紧跟表访问的索引唯一扫描或范围扫描执行得比较好,但紧跟通过RowID的表访问的索引范围扫描也许执行得差。随着表增长到比数据块高速缓冲存储器大得多,最终,索引扫描和全表扫描间的平衡点打破。
4)创建充分索引的表
如果表中的数据相当稳定,充分索引一个表是很有用的。创建一个复合索引,它包括所有在查询期间通常选择的列。在查询期间,查询要求的所有数据可以通过索引访问提供,不需要任何表访问。
5)并行选项
可以把一个数据库任务,比如Select语句,分为多个单元的工作,由多个Oracle进程同时执行。这种能够允许数据库的单个查询活动由多个协调的进程透明地进行处理的能力,称为并行查询选项(PQO)。
并行选项调用多个进程来利用空闲的系统资源,以减少完成任务所需要的时间。并行选项并不减少处理过程所要求的资源数量,而是把处理的任务分散给多个CPU。为了从并行选项中得到最大的好处,应该使CPU和磁盘上的I/O不要满负荷使用。因为并行的目的是使更多的CPU和磁盘同时参与处理数据库的命令,一个缺乏CPU和I/O资源的服务程序是不能从并行选项中得到好处的。
2.7使用UNIONALL而不是UNION
最常用的集操作是UNION操作,UNION操作使多个记录集联结成为单个集。UNION操作的数学定义是返回记录的单个集并且没有重复的行,所以在合并结果集里,Oracle只返回不同的记录。
当UNION操作用作SQL语句的一部分时,唯一性要求强迫Oracle移走重复的记录。Oracle的移走重复记录的功能是SORTUNIQUE操作,它与使用DISTINCT子句时执行的操作类似。
UNIONALL操作允许重复。UNIONALL不要求SORTUNIQUE操作,从而节省了开销。UNIONALL是一个行操作,所以当其变为有效就返回给用户。而UNION包括SORTUNIQUE集操作,在全部记录的集的排序结束前,不返回任何记录给用户。
当UNIONALL操作产生巨大的结果集时,不需要任何排序便返回记录给应用的事实意味着第一行检索的响应时间更快,并且在许多情况下,可以不用临时段完成操作。
在有些情况下,UNIONALL和UNION不返回同样的结果。如果在应用环境中,结果集并不包含任何重复的记录,则可以把UNION转换成UNIONALL。
2.8避免在SQL里使用PL/SQL功能调用
对于增加PL/SQL的使用,许多用户试图利PL/SQL功能的优势产生可重复使用的代码。其中一个强迫重复使用PL/SQL功能的方法是在SQL语句里使用。例如,可以创建一个将国际货币转换为US$的函数。这个函数称为US$。示例如下:
selecttransaction_type,US$(amount,currency)
frominternational_transaction
whereUS$(amount,currency)>1000;
执行前面的SQL语句没有所期望的那样好。在测试时,它的性能大约比下面得出相同结果的SQL语句慢大约几十倍。
selecttransaction_type,
amount*exchange_rateUS$
fromexchange_rateer,international_transactionit
whereer.currency=it.currency
andamount*exchange_rate>1000;
响应时间不同的原因是混合PL/SQL和SQL时,Oracle使用的机制不同。在SQL查询里嵌入PL/SQL功能时,在执行时,Oracle将调用分成两部分:用带有赋值变量的SQL语句代替功能调用以及对每一个函数调用的无名PL/SQL块。
selecttransaction_type,:a1
frominternational_transaction
where:a1>1000
和
BEGIN
:a1:=US$(:amount,:currency);
END
对在international_transaction表里的每一行,将执行在前面示例里显示的无名块两次。无名块调用导致查询响应时间的剧增。应该避免在SQL语句里使用PL/SQL功能调用。
参考文献
[1]瓮正科,王新英著.Oracle8.XForWindowsNT实用教程[M].北京:清华大学出版社,1999.
[2]萨师萱,王珊著.数据库系统概论[M].北京:高等教育出版社,2000.2.
关键词地理信息系统,数据库访问,空间数据库引擎(SDE),C/S模式,ODBC.
引言
近年来,网络技术得到迅速的发展,这就为信息资源的共享提供了技术上的可能.作为信息密集型的地理信息系统(GIS)上升到网络平台可谓适逢其时.但从目前的应用情况来看,除了国外极少的公司拥有网络版的GIS之外,在国内还处于试验研制的阶段.因此,尽快地研制出我国自主版权的网络GIS的原型和产品,并在技术手段上达到国际先进水平,是摆在我们面前的一项迫切的任务.
1网络计算的几种模式及特点
(1)传统的集中式.这是一种主机-终端模式,所有的计算任务和数据管理任务都集中在主机上,终端只是主机输入/输出设备的延长.这种模式的优点是容易管理,缺点是对主机的性能要求很高,也浪费了作为终端的计算机的计算能力,并且从性能价格比来看,在购置费用相当的情况下,一台主机的性能往往比不上几台计算机所组成网络的性能;因此这种模式已逐渐退出主流.字串5
(2)客户机/服务器(client/server,简称C/S)模式.一般说来,在这种模式下,服务器只集中管理数据,而计算任务分散在客户机上,客户机和服务器之间通过网络协议来进行通讯.客户机向服务器发出数据请求,服务器将数据传送给客户机进行计算,计算完毕,计算结果可返回给服务器.这种模式的优点充分利用了客户机的性能,使计算能力大大提高;另外,由于客户机和服务器之间的通讯是通过网络协议进行的,是一种逻辑的联系,因此物理上在客户机和服务器两端是易于扩充的.它是目前占主流的网络计算模式.
(3)浏览器/服务器(browser/server)模式.在这种模式下,用户端只需一通用的浏览器,如Netscape或Explore,便代替了形形的各种应用软件.服务器则为Web服务器.浏览器和服务器之间通过TCP/IP这一通讯协议进行连接.浏览器发出数据请求,由Web服务器向后台取出数据并计算,将计算结果返回给浏览器.这种模式的优点是:由于用户端所用软件只是一个简单的浏览器,用户基本上无需培训,用户端软件也无需维护;软件的升级与修改只在服务器端进行,对用户透明;服务器与浏览器可处于不同的操作系统平台.其缺点为:Web动态技术不够成熟,各种标准有待统一,如各厂家的动态协议互不支持、浏览器之争等.总之,它是一种先进的但发展还未成熟的技术.字串4
基于以上的分析,应选择客户机/服务器模式作为GIS访问网络数据库的实现模式.
2C/S模式下的GIS访问网络数据库的结构设计
设计在总体上分为C/S两层(见图1),以充分利用C/S模式的跨平台、易扩充、数据独立等优点.在client端又分两层来进行设计——GIS功能层和数据请求层,GIS功能层是GIS的功能实现部分,数据请求层是GIS的数据实现部分.数据请求层作为一中间层,起到数据转换的作用,对上是具有GIS特点的数据文件,对下是标准的数据库记录.这种分层设计的形式一方面充分利用了现有的单机版本GIS研究成果;另一方面,GIS功能层和数据请求层的开发可同时进行,只要接口标准不变,本层的变动不会影响到另一层.
Fig.1ThegeneralframeworkofGISaccessingdatabasebasedonC/Smodel
值得一提的是ESRI公司的空间数据库引擎(spatialdatabaseengine,简称SDE)的设计方案(见图2).它是目前国际上领先的GIS数据处理的网络计算模型.其数据的访问形式为:由用户的应用程序(userapplication)通过SDE应用编程接口(SDEAPI)向SDE服务器提出空间数据请求,SDE服务器内存放有空间对象模型,并依据空间对象的特点在本地完成空间数据的搜索,并将搜索结果通过网络向用户的应用程序返回.字串2
对比图1和图2可以看出两者采用的都是C/S模式,并且都将GIS功能实现与数据请求进行分层处理;所不同的是面向数据库的数据请求实现的位置:图1
在客户机端实现,图2在服务器端实现.在服务器端实现的主要优点为:(1)对于空间对象模型及相关的计算模式的升级可以只在服务器端实现,而且对客户机端透明;(2)由于SDE服务器与数据库ORACLE7.2的结合非常紧密,因此数据的搜寻速度非常快.对于图1来说,把数据请求层放在客户机端,对数据库的依赖程度就不同于SDE服务器,后者对数据库的选型有极强的依赖性(目前SDE服务器只在ORACLE7.2实现),相反,它是一种非常开放的结构,它所支持的服务器不但可跨数据库系统平台,而且还可跨操作系统平台.可以说,图1和图2两种设计模式的优缺点是相互对应的.
3数据库访问方式的比较
基于程序的访问数据库的几种方法如下.
(1)专用的数据库访问工具.如PowerBuilder,Delphi等,它偏向于对数据库中数据的管理和显示,具有限的计算功能.既不适于用它来开发GIS应用系统,也难以将它们的数据操纵功能与现有的GIS应用系统紧密结合.
(2)嵌入数据库语言的常规语言.各数据库厂家为了让用户程序能直接访问自已的数据库,基本上都提供了专有的面向C语言的预编译头和静态库,如Sybase公司的OPENCLIENT和ORACLE的PRO*C.字串5
(3)开放数据库互连性应用编程接口(opendatabaseconnectivityapplicationprogramminginterface,简称ODBCAPI)[2,3].它是微软(Microsoft)公司提出的数据库访问形式.它通过确保所有的应用系统遵循标准的调用层接口,提供对特定数据源命令进行解释的驱动程序来保持应用系统的互用性.这样的应用系统是开放的,只要有相应数据源的ODBC的驱动,它就无需改变代码而可访问相应的数据库.
在确定访问数据库的方式时,ODBCAPI的开放性的优势是不言而喻的,但这种方式在效率上不如第二种访问形式.应说明的是:ODBCSQL语法分为3层,即最小层、核心层和扩展层,尽管目前的大型数据库都能支持到扩展层,但为了保证应用系统的开放性,在具体编程实现时,尽量只使用最小层和核心层的语法.
4某电信局配线系统的实现
客户机为MAPGIS/ODBC/WINDOWS95,服务器为SQLSERVER/WINDOWSNT,要访问的相关表中记录约为13万条.要求从地理底图上选中某一DP,在数据库中寻找出从这一DP到配线架的可用通路,并在数据库中作相应配线修改.如图3所示.结果表明:(1)程序实现了MAPGIS访问网络数据库的功能;(2)客户机和服务器均为PC机(主频166MHz),每次操作反应时间为数秒,换机观察,发现服务器的性能是整个网络计算的瓶颈.
字串8
5结论
(1)C/S模式为目前网络平台GIS的首选,将GIS功能与数据库访问分层实现有利于保护现有的开发成果;(2)将数据请求层放在客户端和以ODBC作为数据库的访问方式保证了应用系统的开放性,其访问可跨越数据系统和操作系统平台;(3)实例表明,应用系统的反应速度更多取决于服务器的性能,而不是ODBC的效率.
参考文献
计算机技术的飞速发展,为古典文献研究的现代化提供了坚实的基础,其贡献是有目共睹的。然而,计算机技术在古典文献研究中的运用仍然存在着极为严重的缺陷也是不容回避的。笔者近几年来主持并直接参加设计“e书库”数据库的过程中,感到有必要将自己的一些想法提供给正在设计有关软件的计算机专业人员、愿意使用该类软件的专家学者们参考。
一、我国古典文献数据库建设的历程
自古以来,历代学者对古典文献整理与研究一直沿袭手工操作的方式,然而自上世纪80年代后,计算机技术开始涉入到古典文献研究中,对传统的古典文献整理与研究方法(自然也对一切需要使用古典文献资料的专业研究)起到了极大冲击。
首先简单回顾一下计算机技术在古典文献研究领域内发展的历程。上世纪80年代初,我国一些图书馆、大专院校及科研机构陆续开始大规模地利用计算机设计并建立数据库。大致说来有两类数据库,一类是书目数据库,一类是文献数据库。南京图书馆于90年代初率先建立书目数据库,对读者检索有关书目起到了极大的帮助。之后,各地图书馆纷纷效尤,类似的书目数据库很快就普及了。虽说至今各地图书馆的书目数据库的检索方式,仍存在机读编码格式不统一的问题,然而书目数据库提供的方便快捷的查询功能,对读者来说无疑是一件大好事,具体到学术研究来说,至少为研究者提供了一个比较方便的查找有关古典文献的实用工具。
在建立书目数据库的同时,一些大专院校与科研机构开始研发各自的文献数据库。从数据制作格式来说,大致可以区分为两类,一类是图像格式,即将按原著内容扫描成PDF图像文本,另一类是元数据格式,即录入文献文本内容(或扫描并转化为电子文本)导入数据库,并转换成可阅读与检索的数据库机读格式。一般说来,无论是PDF格式还是元数据格式,它们数据库容量都较大,也提供了较为原始的检索方式,为学术研究提供了不小的帮助。从上述两类制作格式的数据库来说,PDF图像文本可以直接阅读图像文字,但总体说来不太适应古典文献整理与研究的需要。而元数据格式较为精致,初步具备了较为方便的常用的功能,可以检索、作卡片等等。
古典文献数据库从收录的文献内容来说,大致可以分为两类:一类是类目数据库,即按“类”收录有关图籍,如经学类、史学类、文学类以及甲骨文、金文或出土文献资料、石刻资料等等,另一类是综合数据库,如《四库全书》、《四部丛刊》、《国学宝典》之类数据库。
大陆最早的古典文献数据库是河南大学的《宋人笔记检索系统南宋主要历史文献》,建立于1987年。之后,各种数据库纷纷涌现,比较重要的有南京大学、河南大学、苏州大学联合研制的《计算机甲骨文信息处理系统》、中国社会科学院《全唐诗》、《先秦魏晋南北朝诗》、《全上古三代秦汉三国六朝文》、《十三经》、《全唐文》、《诸子集成》等数据库、北京大学《全宋诗》数据库、南京师范大学《全唐五代宋词》数据库、四川大学《宋会要辑稿》数据库(与海外合作)等等。港台古籍数字化起步较早,均采用繁体字形式。1984年台湾中央研究院历史语言研究所开始研发《汉籍全文资料库》,香港中文大学则有《汉及以前全部传世文献》、《魏晋南北朝全部传世文献》、《竹简帛书出土文献》数据库等等。其中《竹简帛书出土文献》收录《马王堆汉墓帛书》、《武威汉简》、《睡虎地秦墓汉简》、《银雀山汉简》、《居延汉简释文合校》及其它散见简牍共140多万字的竹简帛书出土文献,价值颇高。
值得注意的是,这些数据库主要是提供给本单位研究人员使用的,当然也有部分数据库对外开放,为其他研究者提供一定帮助。虽然这些数据库有种种限制,但它们无疑为古典文献的研究(当然包括其它专业的学术研究)提供了方便。之后,随着网络技术的发展,各科研机构、大专院校、各地方的图书馆、以及其它数以百计的网站向用户提供收费或不收费的古籍文献检索服务,甚至还提供古籍文献的下载服务。显然,这些工作的开展,为学术研究的现代化提供了极为有力的支持。至今为止,据笔者所查索到的除科研机构、大专院校、各地图书馆数据库之外,提供各种文献下载的中文网站至少在200个以上,其中就有不少古籍文献下载的网站。这些古典文献数据库或有关网站的建立,确实为古典文献整理与研究乃至其它学术研究提供了极有价值的帮助。
二、目前存在的问题
当然,我们也应该清醒地看到,在古典文献数据库大量涌现的同时,一些潜在的问题与数据库本身的缺陷严重地制约着古典文献数据库的正常发展。
从古典文献数据库技术发展角度来说,笔者认为大致经过三个发展阶段。第一阶段是PDF图像文本数据库,其数据来源主要是以扫描方式获得,形成PDF图像文本。这种图像文本优点是直观,与原书分毫不差,但它的缺点是功能极其单一,仅可供浏览图像和简单地检索书目。虽然第一阶段的数据库功能极少,但毕竟能方便而直观地阅读文献了,因此引起了学者们广泛的兴趣。必须指出的是,由于功能太少,这类数据库难以进一步发展。
第二阶段是元数据数据库,以香港迪志公司投资、书同文数字化技术有限公司设计、上海人民出版社出版的《四库全书》、书同文数字化技术有限公司设计、万方数据电子出版社的《四部丛刊》、尹小林《国学宝典》、南开大学永川公司的《二十四史》,以及大陆、港台等大专院校或科研机构制作的较大型的数据库为代表。它们的优点是具有较多的基本功能,如检索、卡片、打印等功能,有些还附加了日历查询、字典、音乐背景等附加功能。然而,它们都不允许对数据库内的文本错误进行修订、没有图表处理能力、不提供功能升级服务(某些软件提供所谓新版本,实际上只是增加一些文献文本,并未真正提升软件服务功能)。而且由于各自为政,开发者大都采取自定义方法来自造非常用的生僻词,因此各种数据库之间字库不能相互兼容。这一阶段的古典文献数据库也有吸收第一阶段数据库有图像的优点,如上述提及的《四库全书》就附有图像,以利研究者核对文字。该阶段绝大多数数据库注意到版权问题,但仍有一些数据库在版权上出现较大问题,乃至引起法律纠纷。
计算机技术广泛地涉入文科研究领域,各种古典文献数据库纷纷建立,当然给古典文献整理与研究的现代化提供了极其有利的帮助,然而,在笔者看来,目前计算机技术在这一领域中的运用形成纷乱无序的“战国时代”,有许多亟待解决的问题,否则将会影响或说削弱计算机技术在古典文献研究(乃至其它学术研究)中巨大作用。对此弊病,笔者拟作一概述,企望引起有关部门、数据库开发者及使用者的重视,以期真正使计算机技术对古典文献整理与研究起到更大的促进作用。大致说来,主要问题有以下几个方面:
其一,缺乏整体领导与规划,国家投资与收益不对称。当然,首先应该看到,国家有关部门已经着手做了一些规划,也实施建立一些比较大的古典文献数据库,如2002年10月,国家科技图书文献中心受科技部的委托,牵头联合中国科技信息研究所、国家图书馆、上海图书馆、中科院图书馆、北京大学图书馆等单位,启动了我国数字图书馆标准规范建设项目。这一项目的目的就是力图建立我国比较统一和规范的数字图书馆标准,自然也会对建立古典文献数据库有较大的借鉴与参考的价值。又如北京大学《中国基本古籍库》、上海图书馆《古籍影像光盘制作及检索系统》等等,也由国家有关部门投入大量资金,而且已经启动并完成了部分内容。不过也应该强调,由于国家没有制定出一个比较符合国内数据库发展状况的真正有价值的规范体系,因此这些项目的承担者仍是各自为政,数据库之间并不能兼容,不可能形成技术“合力”。再从所取得的社会效益或说实际使用价值来看,也不尽人意。因为至今为止建立的各种数据库仍人为地设置许多障碍,无法使它们实现较大的使用价值。数据库由国家投资,收益自然应该归国家,或者成为不收费的公益数据库,但目前收益既不归国家,又未能成为公益数据库,这不能不说是个极大的遗憾。实际上,数据库制作者无偿利用国家投资进行了开发,制作完成后却获得相当丰厚的收益,使人感到有“国家投资,个别单位图利”的印象。笔者不反对交纳一定使用费用,但收费单位一定应该说明收费后去向,绝不允许产生国家投资而由个别单位乃至某些个人得利的情况。
其二,开发商嗜利忘义,数据库错误严重。除上述由国家投资开发的古典文献数据库外,还有一些有一定技术实力的软件开发商加入到古典文献数据库的开发中来了。比较而言,各科研机构、大专院校及各地图书馆建立的古典文献数据库质量较高,而开发商则很少关注数据库中的文献质量。我们承认确有少量开发商制作的数据库质量较高,如迪志公司开发的《四库全书》之类,然而象《四库全书》这样的数据库确实凤毛麟角,难以寻觅。我们发现,甚至有些开发商仅仅是把文本进行文字扫描导入,疏于校对,因此文本错误百出,难以卒读。由于利益驱使,绝大多数开发商都以“独自开发”为己任,数据库设计相互保密,互不兼容,使用户深感不便。这些问题已严重地影响到古典文献数据库的正常发展了。
其三,热门文献数据重复,冷门文献数据罕见。虽说目前数据库品种繁多,但由于考虑到使用者对文献内容的需求,因此许多开发者热衷于开发那些热门数据,而一些比较冷门的文献则鲜有人问津。实际上,冷门的文献并非是没有学术价值的文献,只是使用人较少而已。因而,目前不但数据库中文献内容重复现象极为普遍,甚至同名同姓的数据库也有不少,如《四库全书》就出现了武汉大学版、上海人民出版社版等数种不同版本。且不说那些数量繁多、质量也不甚高的数据库浪费了多少人力物力,其实也使用户陷入无可适从、欲舍不能的境地。用户往往为了某些少量文献内容不得不购买和安装整个数据库操作系统,而且这些庞大的数据库大量占据硬盘空间,导致计算机运行速度大为减慢。而那些允许网上检索的文献数据库又往往容量极大,上网检索者多,导致“交通阻塞”!
其四,技术关卡重重,难以互相兼容。各开发者既鉴于不同开发目的与技术条件,又为防止他人解密,因此在开发过程中在数据库某些程序中人为设置技术障碍,以保障自己利益不受损害。自然,开发者需要投入大量人力物力,保障本身利益不受损害是无可非议的。然而也由于人为地设置了障碍,却使各种文献数据库之间不能兼容,无法形成合力,先进的技术反而成为技术壁垒。实际上,这一情况大大浪费了宝贵的人力资源与财力,对古典文献的开发与利用有百害而无一利。另外,由于技术壁垒,在古典文献数据库的文字方面更导致许多问题。我国古籍常用汉字大约为4万余个,这还不包括超过2万个异体字及数千甲骨文、金文等古文字。然而我国目前在计算机上采纳的国标字库(GB)和扩展字库(GBK),两者相加也只有27000余字,这与我国古籍常用汉字数量相比,实在差距太大。因此,如此小的字库与需求相比确实是捉襟见肘。为了弥补这一缺陷,一些软件设计者就采取在自定义区自造字(乃至占据字库中扩展B的位置)、有些也用图片方式来填字。而这些自造字、图片字,拷贝到WORD文本之后,由于内码位置的差异就变成其它字了,从而导致文本错误。
其五,功能单调,难以真正为科研服务。建立较早的古典文献数据库功能比较单调,只能做些简单检索、拷贝,没有更为先进的功能,不能适应学术研究的需要。后来的一些古典文献数据库也存在类似问题,例如《四库全书》的检索功能,虽说可以采用添加“作者”、“书名”等限定条件,但检索结果只是罗列一排出处,无法直观地了解检索到的具体内容。而且《四库全书》也没有提供更多的功能给用户,因此这一巨大的工程仍远远不能满足用户的需求。况且这一数据库目前已经“定型”,不再继续开发,使用户对此深感遗憾。而其它古典文献数据库设计者的思维大多仍停留在“文本之争”当中,重复着原来设计思想的错误,没有更多地开发为科研服务的有效功能,因此在笔者看来,这一做法显然不可能真正摆脱古典文献数据库目前面临着的困境。
其六,学术圈地,使人心有余而力难用。解放后,一些国家级出版社化费了极大的精力,组织专家点校了不少重要古籍,为学术研究的发展作出了极大贡献。然而时至计算机时代的来临,却出现了“版权”的问题。一些制作者忽视了国家有关版权法规,直接利用了一些出版社的成果来牟取经济利益,理所当然地会产生版权纠纷。笔者以为,保护版权是每个学者乃至每个公民应尽的责任,根本毫无讨价还价的余地。然而问题是,现在一些出版社由于各种原因,没有对自己已出版的点校过的古籍进行开发,而愿意开发这些古籍资源者却无法涉入其中,导致他们处于既想开发这一宝藏又无法回避版权问题的尴尬境地,这就使众多需要使用者望洋兴叹。如果有关出版社不愿授权,那么想要开发这些古籍者只能返回到没有标点的原始文本中去。这种情况确实使每一个希望使用古典文献数据库的用户感到极其失望,而且严重影响了古典整理与研究的现代化进度。
上述种种现实情况,已经是制约计算机技术对古典文献整理与研究支持的瓶颈了,如果不解决这些问题,计算机技术即使再发达,恐怕也难以对古典文献整理与研究予以真正意义上的支持与帮助。
三、如何解决古典文献数据库存在的问题
古典文献数据库存在的问题是十分明显的,那么如何解决这些问题,以利学术研究(当然包括文献研究)的迅速发展?笔者以为现在应该设计和开发出新一代文献数据库的软件。按照笔者设想,这代软件应该以建立能自由升级的公共古典文献数据库为目的,是一种以提供强大功能为主、彻底解决版权问题的数据库,实际上是建立一个规模巨大的功能相对完善的学术研究资源库。所谓公共古典文献数据库是综合性数据库,只能由国家有关部门作为主要规划者,它应该尽可能地包罗我国传世古典文献、碑刻资料和出土文献等。在此基础上允许建立适应每个研究者研究范围的个性化的文献检索服务系统。个性化的文献检索服务系统是指每个具体研究者所拥有的安装在各自计算机上的文献检索服务系统,它拥有一定数量的适合自己研究的范围的古典文献文本。其实,各个研究者并不需要一个“包罗万象”的规模极其巨大的数据库,即使象占据6至7个G硬盘的《四库全书》,具体到一个研究者真正需要的内容并不是全部,而是其中一部分内容。
问题的关键在于公共古典文献数据库与个性化文献检索服务系统两者之间的技术“契合”,即两者互相兼容的程度。公共古典文献数据库应该与个性化文献检索服务系统有所区别,公共古典文献数据库应该侧重于文献数量的完善、完备,而个性化文献检索服务系统则应该考虑其功能强大。因此,从本质上说,公共古典文献数据库应该是一个统一的设计比较周密、与其它个性化数据库在技术上能实现良好兼容的的数据库;而个性化文献检索服务系统应该是“百花齐放”式的但必须能与公共古典文献数据库兼容而非各自为政的小型数据库。两者关系是源与流的关系。鉴于此,笔者以为目前应该从两个层次上来解决问题,一是尽快建立公共古典文献数据库;一是继续开发个性化文献检索服务系统。
根据笔者近几年的实践,感到要解决这些问题并非不可能的。其实只要认真对目前计算机技术在古典文献整理与研究中存在的问题作一分析与梳理,重点突破一些瓶颈问题,应该说是能解决上述这些问题的。那么怎么才能突破上述这些瓶颈呢?笔者以为以下几个方面是值得考虑的。
其一,加强总体规划,建立公共古典文献数据库。作为一个具体单位来说,谁也没有可能建立一个包罗万象的古典文献数据库,因此,这只能由国家有关部门组织人力物力来完成。其实,就目前来说,国家投入资金并不少,但由于制度原因,只是向某些重点院校或科研单位、向重点项目投入巨资,而这些单位建立起各自为政的古典文献数据库、期刊数据库,虽然也为学术研究作了一些贡献,但不可否认的是,由于各自设计思路不同,相互之间不能兼容,已经妨碍到数据库进一步发展了。以笔者愚见,国家有关部门应该主动负起责来,加强领导,重新考虑古典文献数据库的立项问题,组织力量、投入资金,真正建立起一个规模巨大、能为绝大多数研究者利用的公共古典文献数据库。同时也应该考虑所立项的古典文献数据库与其它数据库(如现代文献数据库、当代文献数据库、期刊数据库等)之间的兼容关系,只有这样,或许若干年之后就能建立起一个价值极大的能真正为学术服务的公共古典文献数据库,乃至包罗一切文献的数据库。当然,就公共古典文献数据库来说,可以进行适量收费服务,但主要仍应该定位在“公益”上,不以“利”为主,这样才能真正建立一个有价值的公共古典文献数据库来。
其二,数据库内容与文献检索服务系统分离。这个问题与上述问题是紧密关联在一起的,如果不能真正做到数据库内容与文献检索服务系统分离,那么目前“列国纷争”的面貌是不可能真正解决的。
我们知道,一个古典文献数据库实际上是两大部分组成的,一是古典文献数据库内容,即数据库所包括的文献文本,二是对这些数据进行管理的文献检索服务系统。其实目前所见有关古典文献数据库都是“两者合一”,即既包含一些文献数据内容,又有具体的操作服务系统。事实上,这些古典文献数据库在功能上明显存在缺陷的。就目前古典文献数据库管理形式来说,一是网络管理,一是个人管理。前者是网络数据库,一般是单位所拥有的数据库,即我们所说的网络版,后者是安装在个人电脑中的个人版。就功能来说,网络版没有必要具有卡片、文本修订、书签等个性化的功能,个人版应该具有做卡片、文本修订、书签、文献管理等个性化的功能。就文献数量来说,网络版自然力求文献内容丰富,尽可能包罗文献文本,而个人版实际所需要的文献数量是根据各自研究需要而定的,因而强行“规定”使用所有文献内容并不值得肯定。就文献内容来说,网络版与个人版都应该允许不断地增加其数据库文献内容,但不同的是,网络版应该是只增不减,而个人版应该允许用户根据研究需要自由增减文献内容。
在笔者看来,应该从单纯的文本内容竞争的思维中解脱出来,进入以文献检索服务系统竞争为主,文本竟争为辅的体系,或许是解决古籍文献数据库的出路。也就是说,擅长计算机技术的开发者(开发商)应该注重文献检索服务功能的开发与完善,而具体文本的整理可由研究学术的专业人士来完成。这样,开发者就可能开发出比较成功的文献检索服务系统,而数据库中的文本也由于专业人士的加入而能大大提高文本的准确率,然后合成为一个规模较大的公共古典文献数据库。当然,输入和整理古典文献文本可以采用投标(或以申报项目形式)来确定,规定统一格式,要求保证文本的正确率达到一定比例,完成后再分别导入这一公共古典文献数据库中;经过若干年努力,最终能形成一个规模巨大、适应于学术研究的公共古典文献数据库。我想,采取这种措施不但节省了大量重复投资,真正做到人尽其才,物尽其用,而且一旦建立起这个规模巨大的公共古典文献数据库,可以解决了目前数据库泛滥、文本错误太多、重复劳动等弊病,而且真正能做到广大学者对古典资源“共享共有”。
在此基础上,各个开发商可以力求开发学者们个性化的文献检索服务系统,它无须考虑文献文本内容,但必须功能强大、操作方便,并与公共古典文献数据库完全兼容,学者们通过“购买”文本或其它方式来方便地组建自己的数据库,这样或许会给学术研究带来真正的方便。
还须补充的是,我国的古典文献中有大量表格与图片,而由于技术原因,目前所有古典文献数据库都没有导入原著的表格与图片,极个别数据库有少量图片也是不能检索,这是目前众多古典文献数据库的重大失误之一。其实只要真正化力气去探索,这个问题是不难解决的。因为笔者曾作过设计并反复试验,只要设计合理,图片与表格不但可以导入数据库,而且都是可以在数据库中进行检索。
其三,加速确定字库方案,以利数据库健康发展。当然,要真正解决公共古典文献数据库问题,还必须解决字库问题。目前,国家虽然组织专家在论证有关字库问题,然而由于进程不快,远远落后于当今计算机技术发展的需要。按照笔者的看法,应该建立一个以Unicode字库为基础的、适应汉语古籍需要的、并与国际接轨的真正有中国特色的字库。这就需要抓紧工作,迅速落实扩展字库B的内码。同时根据我国汉字的具体特点,对自定义区域的6400字的内码配置也应该有所规范,这样才能使汉语字库统一问题落实到实处。如果真能做到如此,那么就能真正解决目前古典文献数据库之间字库互不兼容问题。
与字库相关联的是字体问题。古典文献数据库应该考虑到古代文献对文字的特殊需要,笔者以为凡是古代文献数据库中的文本应该保留繁体字,以防繁简不分而导致文义偏差。就目前计算机技术来说,解决这一问题是毫无困难的。其实用繁体字输入文本早已不是问题,而扫描古籍文本再转换成文字的技术也十分成熟,如北京书同文公司的“数码翰林”OCR识别系统,应该说是极有价值的识别软件,对绝大多数繁体文字能够正确识别。如果能再进一步加以改进,使扩充字库数量并与Unicode字库兼容,那么古代文献的文字识别问题是可以得到解决的。应该强调的是,古代文献以繁体字导入数据库,但应该允许在数据库中自由进行繁简转换,换句话说,若需要使用繁体字时,文本可以保留繁体字,而需要简体时,可以十分方便地转换成简体,这样就适应用户对繁简体的不同需要了。
其四,彻底解决古典文献版权问题。这是困挠计算机古典文献数据库建设的重要难题之一。自然,这一问题要真正得到落实确实存在相当困难的,因为版权保护工作任重道远!不过,即使困难再大,古籍文献数据化的发展的潮流是不可能停止的。笔者以为,有关出版社在维护自身法定的版权权益的前提下,应该从大局出发,在收取一定数量的报酬前提下,允许制作有关古典文献的数据库,以利学术研究的发展。至于报酬多少可以也应该实事求是地酌情商定,国家有关部门应该主动与那些出版社协调,亦可将目前大量分散投入到各课题中的资金中抽出部分来补偿有关出版社,双赢互利,以求突破版权瓶颈,早日解决这一棘手的问题。
与此相关的是古典文献电子文本的版权问题,这也是个极难处理的问题。因为用户若贪图小利,版权意识不强,不愿化费代价使用电子文本,就容易产生“盗版”问题,如此就使得制作古典文献电子文本者的正当利益大受损失。按笔者设想,如果真正能够由国家有关部门主管古典文献数据库建设工作,那么就可以设想建立公共古典文献数据库规定导入数据库的文献文本都给予一个“统一编号”,没有统一编号的文献就不能直接导入公共古典文献数据库和个人使用的文献检索服务系统中,也就是说,个人使用古典文献电子文献必须化费一定的代价才能取得使用权,这样就可以保证制作古典文献电子文本者的一定收益,防止版权意识不强者侵权使用。同时由于古典文献电子文本都有了统一编号,那么也就可以防止某一具体文献文本重复录入的问题。即使有部分重复,古典文献电子文本也可以在用户选择过程中优胜劣汰。
中图分类号:TP311 文献标识码:A 文章编号:1673-9795(2013)03(b)-0172-01
计算机数据库作为现代化发展所不可或缺的计算机应用系统中重要的组成部分,在面对大量的数据及信息的处理及应用过程中,不但有效的减少了人力操作,还科学的实现了大量数据信息的及时存储与共享调用,为多项工作的开展提供准确的数据支持及更为广泛的信息来源,计算机数据库技术的高效应用与发展,为现代化建设工作的开展,尤其是推动信息化建设的进程,具有重要的技术支持性作用。
1 计算机数据库的发展概述
在20世纪60年代,数据库技术作为计算机领域一项重要的数据管理技术,其产生及发展使多项由人工操作完成的内容,开始逐渐由计算机操作系统来承担完成,此时的数据库相对简单,是典型的基础型网络状数据库,随着人们使用要求的提高,文件系统的相关功能已无法现实需求,而人们对数据的共享功能的需求也日益提升。为提高数据库系统的运行效率,网络状数据库系统逐渐发展成层析式数据库系统,并在之后随着集合论等相关关系概念等理论在数据库系统研发中的应用,关系型数据库系统逐渐成形,该关系型数据库系统以严格的数据逻辑关系为基础,基本结构的类型可以利用关系实施描述,构建方式易于理解且各实体间的关系清晰明了,因其具有诸多优点而成为数据库系统的典型。在之后随着面向对象技术的发展与应用,面向对象的数据库技术逐渐发展并完善,自身所具有的完备的功能逐渐取代关系型数据库系统在计算机领域内的应用,基于面向对象特征的数据库系统也为之后基于网络技术的数据库系统的产生及发展奠定了良好的基础。现在普遍使用的数据库系统是依托网络技术发展起的数据处理能力更强的系统,但现在的数据库技术已不再是单一技术,可实现与网络通讯、并行计算、人工智能等多种技术的有机结合,实现信息系统的创新发展,并在多种技术的推动下不断的完善数据库技术。
2 计算机数据库在现代化建设中的重要作用
计算机数据库在现代化建设中的应用非常广泛,就银行、大型企业等很多需要进行大量数据管理的单位、机构等众多领域,同时,数据库系统的应用已不再单纯的停留在数据信息的存储等管理层次上,从数据中提取自身需要的数据信息并进行数据挖掘的需求不断提高,中央集成式数据库系统成为数据库技术的主流,在很多单位的信息系统中都可实现该技术的嵌入式应用,为现代化建设工作的开展发挥重要作用。在多个领域学科下的相关技术的发展推动下,数据库技术已实现了与人工智能、并行处理等多种技术的高效结合,一系列诸如多媒体数据库、基于工程对象的数据库、分布式数据库等新型的数据库系统的研发与应用越来越广泛,有效推动了现代化建设事业的开展。
现代化建设事业的开展是推动社会不断发展的历程,而现有资源的高效利用,尤其是信息化资源,是现代化建设中重要的组成部分信息化建设的前提和基础,依托数据库等现代化信息技术所开展的各项管理工作,对于优化事物管理手段和途径,提升国家各个领域内各项管理工作的开展效率,具有重要的意义。现在世界范围内都已经步入了信息化时代,信息作为本时代最为重要的一类资源,与计算机数据库这一信息资源的管理工具一起,可实现大量数据信息条理性与层次性的管理,虚拟存储功能的实现与应用有效的推动计算机领域内的现代化建设的变革,从而实现了全社会范围内信息的共享及社会资源的高效调动,在国家的现代化建设及信息化发展中发挥巨大作用。在国家的经济体系中,银行体系下的数据库库系统是非常典型的计算机数据库,银行体系下涵盖着大量的信息,各银行之间就其数据管理、信息共享、安全性与保密性等多个方面都有其严格的要求,银行体系的稳健发展促进现代化建设的进程,而伴随网络技术发展起来的网上银行业务,完善的数据库系统与网络技术的完美结合,优化传统银行业务中存在的弊端并提升了业务的开展效率。中国知网、万方、维普等各大数据库系统,实现了大量论文期刊与学术文献的共享,推动了各领域科研工作的高效开展,并在各项科研成果的相互借鉴与取长补短中促进现代化建设事业的创新性发展等。
3 结语
计算机数据库技术的发展,使信息的存储、共享等管理工作的开展更加高效,人们在海量数据中挖掘出所需的信息,促进了各项现代化建设事业的开展,而伴随着数据库技术的创新与发展,它将会在现代化建设中发挥更大的作用。
参考文献
中图分类号:TP393 文献标识码:A 文章编号:1007-9599 (2013) 02-0000-02
1 计算机数据库安全的重要性及入侵检测技术
1.1 计算机数据库安全的重要性分析
目前,计算机数据库所面临的安全风险非常之多,大体上可将之归纳为两大方面:一方面是对计算机网络设备的安全威胁;另一方面则是对计算机数据库信息的威胁,无论是哪一类威胁其引发的后果都是非常严重的。数据库是计算机存储各类重要数据信息的部分,它对计算机的正常运行起着至关重要的作用,一旦数据库“瘫痪”,直接会导致计算机无法正常使用,并且数据库内大量重要的数据信息还有可能受损,这也会给用户造成不必要的损失。现阶段,对数据库安全威胁较大的除了计算机病毒之外,就是黑客入侵,全世界每年因计算机数据库遭受非法入侵造成的直接经济损失高达数亿美元,这不得不引起我们的高度重视,为此,确保计算机数据库的安全性显得尤为重要。
1.2 入侵检测技术
所谓的入侵检测技术实质上就是检测及识别针对计算机网络系统的非法攻击,或是一些违反安全策略事件的过程。它通过相关数据的采集和分析,并从找出可疑或是异常的情况,然后采取一定的措施进行拦截,以达到降低损失,确保计算机网络系统安全的目的。入侵检测本身属于一种主动防御技术,它可以提供对内部、外部以及错误操作等的实时保护,并在网络系统受到威胁时进行拦截和响应入侵,该技术极大程度地弥补了防火墙技术的不足。目前,入侵检测技术已成为计算机安全中不可或缺的重要组成部分之一,它的存在极大程度低提高计算机网络系统的安全性。
2 针对计算机数据库的主要攻击手段
目前,针对计算机数据库的攻击手段主要有以下几种:
2.1 口令破解
这是一种非常典型的攻击手段,它可以用于所有需要口令的地方,这种攻击手段大致又可分为以下两种:(1)弱口令扫描。针对较大范围内的计算机进行扫描,并借助一些常用的简单口令进行访问尝试,试图破解口令,从而达到入侵的目的。(2)暴力破解。其主要是针对于特定的计算机或是用户进行的口令破解。该手段能够有效地破解一些较为强壮的口令。
2.2 sniffer
Sniffer又被称之为嗅探,属于一种典型的被动攻击方式,借助该工具,能够对网络运行状态、数据流动情况以及网络上传输的信息进行监视,若是信息以明文的形式在网络上传输时,则可通过网络监听的方式对其进行攻击,同时将网络接口设计为监听模式,便能够窃取到网络上传输的信息。
2.3 DoS
DoS又被称为拒绝服务攻击,这类攻击手段的前提是攻击者需要控制大量的计算机作为傀儡机,然后借助这些资源向某一个网络服务器发动DoS,这样便可能造成目标服务器被淹没。较为常用的DoS攻击方式有地址欺骗攻击、POD攻击、SYNFlood攻击以及分布式拒绝服务攻击等等。
2.4 SQL注入式攻击
SQL既可以称之为攻击手段,也可以视作一种漏洞。当用户计算机程序中的变量处理不当或是对用户所提交的数据信息过滤不足,都会产生SQL漏洞,而它的攻击原理就是借助用户提交或是一些可修改的数据,将想要的SQL语句插入到系统实际的SQL语句当中,这样便能够轻松获取到各类敏感信息,甚至还能控制整个服务器。SQL注入式攻击在很多数据库中都能够实现,如Access、Sybase以及SQLServer等等。
2.5 缓冲区溢出攻击
它属于一种系统攻击手段,主要是利用向程序缓冲区写入超长的内容,引起缓冲区溢出,以此来破坏程序的堆栈,从而迫使程序执行其它的命令,这样便可以达到攻击的目的。
3 提升入侵检测技术在计算机数据库中应用效果的途径
3.1 对Apriori算法进行优化
在Apriori算法当中最为关键的环节是大项目集的调查,实际查询过程分为以下两个部分:其一,按照查询最多的k-1个项目集Lk-1,获得待选的k个项目集Ck;其二,对D数据库进行扫描和整理,使全部项目集Ck都获得应有的支持度,由此便可以获得k个项目集Lk-1。Apriori算法虽然可以将大部分的待选项目集整理好,但若是遇到综合能力较强的数据库,就会出现大量待选集需要整理的情况,全部整理完需要耗费大量的时间,所以需要在Apriori算法现有的基础上对其进行优化,具体方法如下:(1)减少数量。通过不断减少待选集中候选项目的总体数量,来提高算法的速度,并节省时间。(2)扫描控制。对数据库进行合理的扫描操作,并将其优化为可在编码上获得Apriori的算法,各个待选项都要按照数据库中的结果进行编码,假设某个项目在交易中出现便将之编码设计成1,如果不出现的就设计成0,这样便可以使算法获得进一步优化。
3.2 构建计算机数据库入侵检测系统模型
入侵检测系统的基本工作原理是先对审计数据进行检测,并判断是否发生入侵行为,然后进行报警。从系统功能实现的角度上大体可分为以下三个模块:数据采集模块、数据检测分析模块和报警响应模块。按照方法的实现又可将系统分为:(1)数据采集模块。该模块主要负责收集数据库中服务器主机日志资料,它能够充分发映出用户的历史操作行为和数据特征,从而为规则和知识库的构建奠定基础。此外,在对入侵进行检测时,需要收集服务器中的审计数据,以此来为入侵检测提供服务,这样便可以使整个系统运行变得更加顺畅。(2)数据处理模块。该模块主要负责对各种数据进行处理和集成,其作用是为下一步的数据挖掘做好准备。(3)数据挖掘模块。该模块主要是借助从处理模块中提取到的数据,再次提取出相关的规则和行为特征,以此来建立安全的数据库模式。(4)知识规则库。它具备系统模块所需要的安全模式,入侵检测系统将用户的操作行为与规则库当中存储的知识进行比较分析,若是两者相符,则表明用户行为正常,若是不符则表明是入侵行为。(5)提取特征模块。该模块所采用的技术与数据挖掘相类似,具体就是从当前用户的操作行为中提取出本次操作的特征,以供入侵检测模块进行比对分析之用。(6)入侵检测模块。它是整个系统通过入侵检测的算法,从知识规则库中提炼出相关的规则数据,检测用户的操作行为是否属于入侵行为,并按照判断结果采取相应的行动,发现是入侵的行为系统会进行报警提示,并采取措施对入侵进行拦截。
参考文献:
[1]赵敏,王红伟,张涛,等.AIB-DBIDM:一种基于人工免疫的数据库入侵检测模型[J].计算机研究与发展,2009(2).
[2]郭晓淳,马冬梅,郑波.基于数据挖掘的数据库入侵检测系统[A].第13届海峡两岸信息管理发展与策略学术研讨会论文集[C].2007(8).
[3]刘兴华.基于序列模式挖掘的数据库入侵检测技术研究与设计[J].东北师范大学计算机科学与技术学报,2009(7).
中图分类号:G623.58文献标识码: A 文章编号:
一、计算机数据库安全管理方面存在的问题
1、计算机操作系统方面的问题
一般来说,操作系统方面的问题主要就是病毒、后门以及数据库系统和操作系统的关联性引起的。
病毒方面:在操作系统中很可能有特洛伊木马程序的存在,这对操作系统来说是一个极大的威胁,这种木马程序可以将入驻的程序的密码加以修改,一旦密码更新,入侵者就会获得信息的密码,使信息内容被窃取、破坏等。
后门方面:虽然数据库系统的特征参数让数据库的管理员操作起来更加方便,可是与此同时,这些参数也为数据库服务器的主机操作系统留下了后门,所以后门也成了访问数据库的通道。
数据库系统和操作系统的关联性方面:数据库和操作系统之间的关联性非常强,操作系统中文件管理这个功能可以通过存取控制对各种文件进行续写和执行等操作,所以数据库文件也存在这方面的威胁;同时,操作系统中的监控程序也能够对数据库中的用户登录和口令鉴别进行控制。所以,数据库的安全与操作系统和硬件设备所组成的环境有很大的关系。
2、管理方面的问题
很多用户都没有真正意义上认识到网络信息安全的重要性,重视程度不够就使得实施的管理措施强度不够,就使得数据库的安全事件经常发生。因为限制数据库服务器的访问权可以减少数据库遭到攻击,所以很多用户都懒得进行补丁的修复,这就在数据库的管理上造成了严重的失误。想要数据库绝对的安全,就必须进行补丁的修复,因为经常修复补丁可以不因为很久以前没有经过修复的漏洞而遭到攻击。这类问题的主要原因就是存在没有进行修补的系统安全漏洞和所设的登录密码太过简单或者没有进行修改,所以,用户应该建立一个测试环境,进行补丁修复,然后确认补丁修复,再修复生产环境的补丁,提高网络信息安全的防范意识,加强管理措施。
3、数据库系统本身存在的问题
关系数据库这个系统已经使用了很多年了,拥有自身强大的特性,产品也非常成熟,但是在实际的应用中,其应该具有的某些特征,在操作系统和数据库系统中并没有被提供,特别是一些比较关键的安全特征。所以,很多关系数据库系统都不是很成熟,还有待改进。
二、强化计算机数据库安全管理技术的有效措施
计算机数据库的安全性是数据库发展的根本,所以,做好数据库的安全管理工作是数据库发展的需要。强化计算机数据库安全管理不仅要提高用户的网络信息安全意识,也要从管理技术方面出发,以下介绍几种常见的数据库安全管理技术:
1、安全模型
给数据库建立安全模型的主要作用就是提高对成功实现关键安全需求的理解层次,安全模型有两种:多级安全模型和多边安全模型。
⑴多级安全模型:此模型最早是用以支持军用系统以及数据库的安全保密的。一般来说密级从高到低可以分为绝密级、机密级和秘密级,这样分级的意义在于使各级的秘密只能让各级的有权限的人知道,这样可以防止高级的信息流入低级,信息所传递的范围始终在控制之内。
⑵多边安全模型:这也是保护数据库安全的重要措施之一,其主要作用是防止信息的横向泄露,尽可能的确保数据库信息的安全。
2、访问控制
访问控制主要是在计算机系统的处理功能的方面对数据库加以保护,其访问控制的对象主要是数据库内部已经进入系统的用户,对数据的安全保护形成一个自订屏障。计算机系统进行活动的对象主要就是主体进程、用户以及客体(资源和数据),而确保主体对客体的访问的合法性就是计算机安全的关键问题,通过管理数据的读出、写入以及修改、删除和执行来保证主体访问客体是被允许的,没有被允许的访问将被拒绝,这样可以确保信息的机密性以及完整和可用性。
访问控制又主要分为两种:自由访问控制和强制访问控制。
⑴自由访问控制:这种控制方法又叫做任选访问控制,被广泛得到应用。运用这种控制方式,资源的拥有者就是创建者,有权利选择可以访问其资源的用户,所以这样就使得用户和用户进程之间可以有选择的与其他的用户进行资源共享。这是对单个的用户所执行的访问控制的过程及措施,而每个用户的权限则是根据系统来确定的。
⑵强制访问控制:在这种控制方式中,系统分配给了主体和客体不一样的安全属性,而用户是不能对自身或其他的客体的安全属性进行更改的,就是不允许单个客户来确定访问权限,用户与用户组的访问权限只能是通过系统管理员来确定,系统是通过对主客体的安全属性进行比较来确定主体能否对客体进行访问。数据管理员应该提前将数据进行备份处理,在发生故障数据遭到破坏或丢失时就可以使用备份的数据使其恢复到以前的状态,这样就保证了数据的完整性与一致性。
3、安全审计
安全设计功能就是监控和记录指定用户在数据库中的操作行为,其实就是对安全方案中的功能提供持续的评估。在安全审计过程中,管理员应该掌握一组可以进行分析的数据,用来发现合适何处出现的违反安全方案的一些操作行为。通过分析安全审计的结果,及时对安全政策进行调整,修补出现的漏洞。所以,安全审计可以记录关键事件、提供容易操作的软件工具和可进行集中处理审计日志的数据形式、发现威胁时进行安全报警等多方面的功能。
三、结束语
当今社会,数据库已经是社会中各企业所发展的重要的组成部分,很大程度上促进了企业的发展,给社会带了了非常可观的价值利益,所以其安全问题应该引起高度的重视,在强化数据库安全管理技术措施的同时,企业的各方面都应该积极配合,这样才能真正意义上提高数据库的安全性。
参考文献:
[1] 马涛,秦轶翠,吴宝珠等.试论计算机数据库安全管理[J].计算机光盘软件与应用,2011,(14):153-153.
中图分类号:R2-03 文献标识码:A 文章编号:1673-7717(2011)04-0688-02
收稿日期:2010-11-10
基金项目:“十一五”国家科技重大专项资助项目(2008ZX10005-013)
作者简介:李泽庚(1962-),男,安徽桐城人,主任医师、教授,博士研究生导师,研究方向:中医药防治呼吸系统疾病和中医外感热病的基础与临床研究。
传染病(infectious disease)是由各种病原体所引起的一组具有传染性的疾病。病原体在人群中传播,常造成传染病流行,对人民的生命健康有极大危害性。传染病属于中医学中的“疫、温疫、温病、疫病”等病范畴,自古以来就有之。在漫长的历史进程中,中医对传染病治疗形成了一整套系统的理论与方法,在临床中具有较好的疗效,同时也在预防、治疗等方面积累了较多的经验,推动了中医学的发展。进入21世纪,随着人类生活方式和生存环境的改变,病原微生物的变差异,传染病构成谱也发生了巨大的变化,新发传染病正在成为威胁人类身体健康的重要疾病,面对与既往不同的新的传染病发展态势,现代医学往往存在较大的局限性,而中医药在辨证论治上有着非常大的优势,因此有必要运用多学科联合,系统地总结以往有文献记录以来的传染病疫情的发生、变化之间相关性,为传染病的防治做出贡献。大量的文献资料的分析整理需借助于计算机数据库知识,基于此建立了本数据库。并依据《中华人民共和国传染病防治法》规定之传染病病种,在“十一五”国家科技重大专项资金的资助下,凭借于互联网及大型中医药图书馆,对38种法定传染病的中西医防治经验进行系统的文献梳理和前瞻性研究,并试图通过计算机数据挖掘技术发现某些传染病的发病流行规律,以提高中医药防治重大传染病的能力。为此,我院和北京方正阿帕比技术有限公司合作,研制开发了传染病数据库系统。该系统的建立不仅解决了资料保管、统计分析使用的难题,而且使资料的储存更加科学、规范、完整、系统。另外,该系统的建立为临床科研人员的培训提供了平台,进一步推动了我院信息管理的深入发展。
1 数据库运行环境和软件系统结构
方正德赛数据加工系统硬件配置满足Windows server 2003运行要求,系统安全性、稳定性好,延续了方正在传统出版领域技术领先的优势,采用ClientServer方式,服务端使用Microsoft SQL Server数据库进行中心存储,是一款强大而可靠的数据管理产品,可以为嵌入式应用程序客户端、轻型Web应用程序以及本地数据存储区提供丰富的功能,有利于保护数据,提高性能。用户可以将自己单位相当数量的馆藏资源建设数字化,成为自有的电子资源,与方正Apabi数字资源平台、数字出版系统相配合,完全实现版权保护。
2 文献的整理及数据库的建立
对古今中医药文献中关于传染病的文献(包括著作、论文、病案等)进行系统整理、分析并汇编成册。对传染病的病因、证候、方药、治疗进行纵向分类研究,取名医经验及有代表性的文献资料,归类整理发掘,进行横向研究。在完成文献整理研究基础上,构建建国以来传染病中医药文献数据库,可以高效地实现数据的录入、查询、统计等功能,供临床教学科研查询使用,实现资源共享。运用数据挖掘技术,对中医传染病的文献信息进行整理和挖掘,按照病名、证型、症状、病因、病机、方药等进行结构化处理,提取其蕴含的多方面信息,进行多角度、多层面的分析,挖掘出建国以来传染病的发病特征和中医药防治规律,以期更好地满足中医辨证论治的需求,促进中医药事业的繁荣与发展。
3 以数据库为平台提高临床科研水平