时间:2022-07-08 19:54:39
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇积累的名言范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
少年乐相知,衰暮思故友。
不塞不流,不止不行。
锲而舍之,朽木不折;锲而不舍,金石可镂。
生活就像海洋,只有意志坚强的人,才能到达彼岸。
三军可夺帅也,匹夫不可夺志也。
重复是学习之母。
学而时习之,不亦说乎。
完成工作的方法是爱惜每一分钟。
精诚所至,金石为开。
三军可夺帅也,匹夫不可夺志也。
勿以恶小而为之,勿以善小而不为,惟贤惟德,能服于人。
人生应该如蜡烛一样,从顶燃到底,一直都是光明的。
3、天才就是无止境刻苦勤奋的能力。作者:卡莱尔 。
一、示范
每天上课前,我改变以往全体学生起立向老师问好的“老师好”为齐声诵读经典名言警句(预先由教师板书在小黑板上或教室黑板的一侧),读后要求学生抄写在日记本上。这样做的目的是示范引路,告诉学生要注意书写的工整性和名言警句来源的准确性(要求注明名言警句的出处、作者)。
二、实习
在这个阶段,我采取“名言警句值日”的方法,开展名言警句接龙――由语文科代表首先“值日”,将自己当天积累的名言警句认真誊写在“名言警句火炬簿”上后传递给下家。就这样,轮回接力,一轮下来,正好是期中,每学期可以接龙两个回合。一般来讲,每学期可积累一百则名言警句。在接龙过程中,如果有谁失职,科代表有权处罚他重新“值日”。这样,不仅可以培养学生良好的阅读、积累习惯,更重要的是能增强他们的合作意识和责任感。
三、整理
在一个学年结束之前,即“名言警句值日”达到四个回合时,我指导学生将平时积累起来的名言警句进行分类,用专门的笔记本整理出来进行展览,让同学们大饱“眼福”,相互学习、相互促进、共同提高。名言警句共分十个类别――爱心篇、立志篇、真理篇、理想篇、青春篇、修养篇、勤奋篇、毅力篇、事业篇、友谊篇。这样的分类整理,一方面可强化学生的记忆,另一方面可为学生作文提供充足的营养,从而提高他们的写作水平。
四、仿写
所谓仿写,即以名言警句的结构特点或是修辞手法等作为借鉴,运用联想、想象,写出一句具有新意的“名言警句”。仿写同样由语文科代表按前面的要求首先“值日”,先写出名言警句,再写出仿句。如:“莫等闲,白了少年头,空悲切。”(岳飞《满江红》)仿句:“勿虚度,废了黄金时,只哀叹。”
3、从垃圾中淘宝不如变垃圾为宝。 ——日本民谚
大学生创造意识和发明创造能力欠缺的原因
传统教育体制是“满堂灌”的应试教育,造就了学生跟着教师走、教师跟着标准试卷走的思维模式。在学校里,按部就班、听话的学生往往被认定是好学生,而思维活跃、具有扩散思考能力的学生经常被误认为不听话,瞎折腾。在大众观念的压力之下,学生的创造精神经常被扼杀在萌芽里。在应试教育时代,分数就是人生的全部,这种观念使得学生只学习好好要考,拿到高分就万事大吉。久而久之大部分学分都是理论修养差、知识面太窄、综合能力弱。这样的高中毕业生到了大学阶段,知识容量不够,创新意识差、发明创造能力弱,难以适应社会主义市场经济对人才素质的新要求。
激发学生的发明创造意识,营造创新创造的校园文化氛围
针对大学生创造意识和发明创造能力欠缺的原因,想要提高学生的发明创造能力,首要是营造良好的校园文化氛围,激发学生的发明创造意识。通过开展以发明创造为内容的学校主题教育和实践活动、开展大学生发明创造与科技创新竞赛活动、举办大学生发明创造与科技创新成果展,营造创新创造的校园文化氛围。
(1)开展关于发明创造的讲座,让学生认识发明创造的巨大作用。针对电气信息类的大学生,讲座选题需要侧重近代电气电子信息科技对现代生活的影响。比如说电灯的发明、电报电话的发明等等。或是最近流行的iphone的更新换代,每一次更迭都伴随着技术的革新。这些都是和大学生实际生活中息息相关的东西,肯定能点燃学生们的热情。
(2)为了让大学生和发明创造拉近距离,在讲座中举例说明一些小的创造如何改变生活。比如说最新一代的空调,装上摄像头,就可以监控室内幼儿是否踢被,实时调整空调温度,实现家居智能化。基于电学知识而发明的捕鼠器,可以帮助很多地方改善居住环境。通过生活中的小发明创造,让学生认识到发明创造人人可为,通过学习增长知识,增长才干,也可以开发自己的创造潜能。
开展创造性思维能力训练
想要提高大学生的发明创造能力,还需要对学生进行创造性思维训练。要理论学习和实践相结合,有目的、有计划、有步骤地展开,全面提高学生的创造素质。训练的形式有集体讨论训练和个人分散训练。
集中讨论训练
集中训练主要以座谈会、讨论会形式进行,开展创造性思维广度、深度和力度训练。组织学生讨论,针对电气信息类的学生,着重查找家电产品和电子信息产品存在的不足甚至危害。针对某缺点和不足,组织学生进行创新设想,各抒己见,从众多创新设想中选出最佳方案;进行创新设想时,鼓励学生思维独特新颖,与众不同;对某产品进行创新设想时,尽量向多功能的方向思考。
个人分散训练
要求学生多观察生活,分析对生活密切的电气电子类产品。把创造设想记录好,定期和同学讨论分析其可行性,大家针对某一设想提出建议和意见。对可实施的设想,组织实施。开展个人分散训练,目的在于培养创新精神,养成创新习惯。
学习发明创造方法,指导创造实践
创造技法主要有还原法、智力激励法和缺点列举法。还原法是把创造的起点回归到产品创造的原点上,它可以帮助创造者克服习惯性思维。智力激励法是利用智力激励讨论来集思广益的方法。缺点列举法是列举产品缺点,然后针对产品的不足,提出创新设想的方法。将三种方法综合运用,指导大学生从小发明创造入手,通过联想、类比、组合、移植、演变、逆向思维等方式,结合创造技巧,开拓扩展思路,产生大量创新设想,寻找更优方案。
为促进激励推进相应的保障措施
加强基础条件建设,为学生开展发明创造活动提供保障
充分利用现有实验室、创新基地,组织学生开展形式多样的科技创新活动,积极引导学生开展发明创造,鼓励学生多出成果、出好成果,为广泛开展发明创造活动奠定基础。
实施创新创业训练计划
针对有意向进行发明创造的学生,学院派专业老师组织全面的创新创业训练计划,提高专业的创新素养,逐步进行发明创造活动。
定期组织学生参加电子设计大赛
为了训练电气信息类大学生的发明创造能力,将理论和实际结合,学院每年都会组队参加广西区电子设计竞赛,优胜队伍推荐参加全国电子设计竞赛。这种参赛经历对电气信息类的学生进行发明创造活动是非常重要、可贵的。
制订鼓励大学生开展发明创造、申请专利活动的计划,组织专利申请培训
定期组织开展相关活动,做到活动情况要有记录、有档案。把创新活动纳入年度工作计划与教学工作同部署。同时,在年底考核时开展总结评比表彰活动。针对大学生中有成熟的发明创造,鼓励支持其申报专利,邀请专利公司的专家来授课、对学生和辅导老师进行培训和指导。对申报专利的学生,学校提供全程服务,积极帮助整理资料,确保专利申报的质量。
针对大学生本身的发明创造能力的激励措施
研究设置创新学分及其实施方案
设置创新学分,根据每个创新科技成果的分量等同于一定的选修课的学分。在市级创新类型活动比赛中的奖项,等同于专业选修课的2个学分。在省级创新类型活动比赛中的奖项,等同于专业选修课的3个学分。在国家级级创新类型活动比赛中的奖项,专业选修课等同于4个学分。
研究设立发明创造成果奖学金及其实施方案
为了激励大学生的发明创造,给大学生进一步进行发明创造提供一定的经济支持,设立发明创造成果奖学金。如果发明创造成果是市一级认定,奖励500元人民币。如果发明创造成果是省级认定,奖励1000元人民币。如果发明创造成果是国家级,奖励1500元人民币。
研究学生发明创造能力评估与毕业设计、就业、保送研究生挂钩的实施方案
分析发现,凡学生发明创造能力强的,毕业设计的成绩基本上在优良水平,有些毕业设计更是学校优秀。因此可以在毕业设计环节进行倾斜,比如将该生的发明创造正果直接认定是毕业设计成果,学生只需要撰写相应的论文即可,该政策对于需要时间进行创新活动的学生来说是非常有吸引力的。
在就业时,进行过发明创造的学生在简历上面的经历相对丰富,有说服力,更能打动用人单位的心。在推荐毕业生的时候,针对那些发明创造成果丰富的学生,就业指导老师可以直接推荐给相应的用人单位,为学生提供更好的就业环境。
目前,很多学生愿意进一步读研深造。为了改善研究生的生源,可以将保研政策和发明创造成果(含专利、论文、创新成果、比赛奖项)挂钩,进一步激励学生的发明创造热情,为学生读研究生提供相应的奖励政策。
研究对申报或者获得专利授权的学生奖励方案
对于申报国家专利的学生,无论专利获得授权与否,都给予100元经济补助。对于被国家知识产权局受理和授权的,除享受省、市、县相关专利补贴政策外,分别给予300元和1000元奖励;并将成绩记录于学生档案。优秀科技创新作品,优先推荐参加市以上科技创新作品评奖,并优先推荐市、自治区级科学技术奖项,同时按获奖等次予以奖励;优秀专利成果,同时在学校网络、市级主流媒体上给予宣传和推介。
针对指导学生发明创造的教师的激励措施
为了进一步辅助学生进行发明创造,需要给指导学生进行发明创造的指导老师一定的激励,加深效果。
对相应的指教老师进行物资和精神奖励
对发明创造成绩突出的指导教师,根据成果的级别高低(国家级、省级、市级),分别给予800元、500元和300元的物资奖励,并发相应的优秀指导教师荣誉证书,以资鼓励。在年终考核的时候,将学生的发明创造成果纳入指导教师的考核数据,参与学校的年终评比。
中图分类号:H04 文献标识码:A 文章编号:1673-2596(2017)01-0106-04
一、引言
Z料库(Corpus)是指为了某种研究目的,运用科学的方法进行系统收集的语言文集,即大型的书面语和口语的自然语言材料的集合。语料库拥有大量真实可靠的语言材料,能够全面且准确地代表某种语言或某个方面的语言特征,不仅为语言研究提供了广泛的言语素材,同时也促使语言研究方法发生了革命性的改变。自20世纪80年代以来,基于语料库的翻译研究在国内外已经成为了翻译研究领域中新兴的研究模式,英国学者Mona Baker在1993年发表了《语料库语言学与翻译研究:启示与应用》(Corpus Linguistics and Translation Studies: Implications and Applications),奠定了“语料库翻译学”的研究基础。语料库翻译学以翻译文本为研究对象,从大规模翻译文本或翻译语言整体着手,采用语内对比与语际对比相结合的模式,对翻译现象进行描述和解释,从而探索翻译的本质[1]。语料库为翻译学研究提供了新的工具,开拓了新的思路,拓展了翻译的研究范围。Baker把为不同研究目的设计的翻译语料库分为三类:平行语料库、多语语料库和类比语料库。Baker认为在这三种语料库中,类比语料库对翻译研究的意义最大。类比语料库是指由不同语言的文本或同一种语言不同变体的文本所构成的语料库,包括两个或两个以上的子语料库。与平行语料库不同,类比语料库的子库之间没有翻译关系,其类比性在于所采语料具有相同或相似的平衡性和代表性[2]。通过类比语料库两种文本的比较分析,研究者可以探索在特定历史、文化环境中翻译的规范,发现翻译文本的一些特殊规律,即翻译的普遍性。翻译语言的突出特征是在词汇方面,主要是翻译文本中用词常规化,并出现了新的词语组合。这种新的词语组合正体现了翻译文本中的词汇搭配特征[3]。因此,翻译文本的语言特征突出表现在词汇方面,尤其是词汇的搭配特征,搭配模式的差异能够反映出原生文本与翻译文本的差异。词汇的搭配特征体现了语言形式在语境中所实现的具体意义,真实反映了词汇在语言交际中被经常使用的、习惯性的搭配形式。
近年来,随着语料库翻译学的不断发展,国内外已经出现了开展基于语料库的翻译文本词汇的搭配特征研究,然而利用语料库对中医英译文本中词汇搭配的实证研究并不多见。中医文本在词汇方面具有很多鲜明的特点,有着大量固定的短语和搭配,因此本文作者利用语料库,对动名搭配在中医英译文本和医学英语原文文本的使用情况进行统计研究,进而对比分析得出医学文本中动名搭配的规律,旨在为中医文本的英译提供一些参考,即如何在中医文本英译中选择合适的词语进行搭配,发掘词汇搭配对中医文本解读与翻译的现实指导意义。
二、研究设计
(一)研究对象和问题
目前国内外对动名结构的研究主要是从文体、语法和语义等方面进行,本文侧重于动名结构在语义方面的研究,即如何通过词语搭配来体现医学语言的特点。
本文致力于解决以下两个问题:
1、医学语言中动名搭配有什么特点?2、英译中医文本与医学英语原文在动名搭配上有什么不同?
(二)语料与研究方法
本文的研究基于两种类型的语料库,即本族语语料库BNC(British National Corpus)和自建的小型中医英语语料库。BNC是目前网络上可直接使用的最大的语料库之一,也是目前世界上最具代表性的当代英语语料库之一,该语料库书面语与口语并用,其光盘版词次超过1亿,其中书面语语料库9千万词,口语语料库1千万词。本文作者自建的中医英语语料库选取《黄帝内经q素问》的三种英译本为翻译英语语料,分别为李照国的译本、Maoshing Ni的译本、Iliza Veith的译本。《黄帝内经》是我国现存最早具有的医学著作,反映了从上古时代至秦汉时期的主要医学成就,是最重要的中医典籍之一。《素问》是《黄帝内经》的重要组成部分,它系统详尽地论述了中医学的基础理论和临床实践,包括阴阳五行、形神关系、藏象经络、病因病理、辨证诊断、预防养生、运气学说等各个方面,直到今天,《素问》仍然是学习中医者的必读之书,也是西方国家研究我国古代文明史和医学史的重要著作。从1925年至2005年之间正式出版的《黄帝内经・素问》有11种不同的英文译本,这些丰富的英语语料为中医英语语料库的建设提供了充分的前提。本文作者选取的三种英译本在译者的背景知识结构、翻译策略以及目标读者等方面各具差异,因此能够比较全面地代表中医英译文本的语言特征。李照国的《黄帝内经》英译本是《大中华文库(汉英对照)》之一,具有学术性和权威性。译者本人以汉语为母语,英语为外语,既是医学博士也是翻译家,有着系统地中医系统理论知识和扎实的英语翻译功底,强调译文的准确性,注重保持原著古朴的风格。Maoshing Ni的《黄帝内经》英译本主要是面对一般英语读者,使用的普通英语词汇较多,语言通俗明白,篇幅也相对较长。译者出生于中医世家,幼年移居美国,长期生活在英语环境中,以汉语为母语,英语为第二语言。Maoshing Ni是在美国行医教学的临床医生,侧重译文的临床使用价值,在译文中引入了许多现代西医概念,旨在用现代的方式解读《内经》。Iliza Veith是美国约翰霍・普金斯大学医学史研究所的一名医史学家,英语是其母语。虽然Veith仅仅翻译了《素问》的前34章内容,但其译本是第一部公开出版发行的较为完整的《内经》英译本,以其译文语言流畅、可读性强而受到许多人的推崇,而且该译本目前仍然是国外许多著名大学中国医学史课程的指定读物。
研究分为三步:语料的检索与选择、语料的对比与分析、结果的对比与统计。
首先将所选的翻译英语语料经过文字扫描和格式转换为Word文档,校对后汇总成为一个小型中医英语语料库。为了便于提取研究数据,对语料库进行词性附码标注,并对标注结果做人工抽检,尽可能保证标注的准确性。然后用AntConc软件对自建的小型中医英语语料库进行统计分析,得出高频动词的使用情况,选择其中三个作为分析对象,随机各抽取200组动名搭配,并分析这三个高频动词的搭配使用情况,最后通过BNC语料库进行检索,得出这三个高频动词在不同类型文本中的搭配情况,然后借助统计软件Excel进行统计分析,找出医学英语和其它类型文本的动名搭配的不同,进而为英译中医文本的词汇搭配提供参考。
三、数据统计与分析
(一)~频的统计
词频是指某一词项或某一类词汇在语料库中出现的总频数,统计词频可以为语篇的文体或者语体特征提供某些参考信息。词语搭配研究的中心应是实词的行为,搭配研究应主要选择实词为节点词进行,功能词或语法词的行为大都已由语法学家作了详尽的描述[4]。因此,本文选择节点词的第一标准就是实词。而且在四大类实词(名词、动词、形容词和副词)中,名词和动词的搭配能力最高,因此进一步将本文研究的节点词界定为动词。英文文本库常用的统计数据包括以下几项:形符(Token)数、类符(Type)数、类符/形符比(Type/Token Ratio)、词长(Word Length)、平均词长(Average Word Length),等等。本文采用WordSmith 5.0对自建的中医英语语料库作了常用参数统计,获取总体统计信息,然后按照词形频率从高到低对该语料库的动词词形进行排列,选取前20个词,其结果见表1。
因本文研究的重点是医学英语文本的动名搭配,所以从表格中选择了其中三个与医学联系较为紧密的动词:influences, caused,treating。
(二)动名结构搭配词的提取
用AntConc软件检索自建的中医英语语料库中这三个动词(influences, caused,treating)的搭配,要求搭配词必须是名词词性,而且其充当的句子成分是做宾语。因此,研究时对不符合研究要求的搭配词予以剔除,分别为这三个动词留下符合要求的200组显著性搭配词。因为BNC自带检索数据分析功能,能够选择在不同年代不同体裁文本中的搭配,所以直接把这三个动词(influences, caused,treating)输入BNC中,选取符合研究要求的搭配文本,然后与之前的数据进行定量和定性相结合的分析。
(三)数据的分析
从表2中发现,动词influence在原生英语语料库中与sphere搭配最多,其次是与decisions搭配,而在翻译英语语料库中与factors搭配最多,其次是与range搭配;从表3中发现,动词cause在原生英语语料库中与trouble搭配最多,其次是与harm搭配,而在翻译英语语料库中cause往往以被动形式出现,与damage搭配最多,其次是与problems搭配;从表4中发现,动词treat在原生英语语料库中与patients搭配最多,其次是与symptoms搭配,而在翻译英语语料库中treating往往以进行时态出现,与disease搭配最多,其次是与pain搭配。
本文研究发现,原生英语语料库中所选的节点词的搭配数目要明显高于翻译英语语料库中的搭配数目,这表明医学英语原生文本在用词方面变化多,用到的词汇量要大于翻译文本,这一点没有超出预料,毕竟英译中医文本多是由译者完成,在用词方面没有原生英语文本丰富。在翻译文本中一些高频词汇搭配的表达方式,一旦被广泛接受,就可能进入目的语,成为多个近义表达式的翻译对应项,因此可以部分证实翻译语言倾向于词汇简化现象。
翻译文本中搭配模式的常规化指的是非典型搭配词在翻译文本中比例较小或没有。非典型搭配词指不是其基本义的,而是修辞性的、俗语的、变体的等的搭配词[5]。本文研究表明,与原生英语文本相比,翻译文本中动名搭配在整体上具有常规化的倾向。以动词“treating”为例,在原生英语文本中该词的搭配词中有不是该搭配词的基本义,而是修辞性搭配词,往往是在口语语料中出现俗语化。但是该词的修辞性搭配在翻译英语文本中未找到,在翻译语料中动词“treat”往往与名词disease的搭配,而且表现为“treating …disease with…”的固定搭配。如将中医术语“寒因寒用”译成“treating cold with cold”就比“using medicines of cold nature to treat pseudo-cold syndrome”简洁得多,而且更加符合英语的语法规则。
翻译文本中异常搭配指的是由翻译引入的外来的不符合目的语常规的搭配,即翻译文本读起来有翻译腔。目前语料库的技术手段还有限,对异常搭配的判定主要是依据人的判断、词典和语料库的查找[6]。因此,对本文选取的三个节点词的搭配是否存在异常搭配情况只能通过人脑来判定。筛查后发现,翻译文本中这三个节点词仅仅只存在少量的异常搭配,而且搭配的名词大多是在原生英语语料中没有对应词的中医术语,这些异常搭配可以不予以考虑。这一点表明,翻译中医文本时受源语影响而产生的异常搭配特征不明显。
四、结论与启示
总结起来,基于语料库的英译中医文本中动名搭配特征的类比研究发现如下:
(1)与其它文本相比,医学语言中的动名搭配更为简炼,被动形式使用较频繁,动名搭配模式相对比较固定,医学词汇的选择体现出医学语言专业性与简明性的特点,搭配结构简单,逻辑性强;
(2)英译中医文本的选词范围较医学英语原文相比有些狭窄,而且节点词对搭配词语的影响程度远远不如目标语,体现出译者翻译时受源语的影响,选词有一定的局限性,在动词使用上与目标语有差异。
语料库可以为中医文本翻译提供大量真实自然的语言数据,更加客观全面地显示中医英语的特点和内在规律。运用中医英语语料库研究词汇搭配特征,有助于探索中医英语翻译的普遍规律,把握翻译文本自身的特征,为中医英语术语标准化提供事实上的依据。同时,通过检索本族语者的语料库,探索医学英语词汇的构成规律以及习惯搭配,深入挖掘医学英语词汇涵义,可以为中医文本的英译提供新的翻译思路和翻译方法。
――――――――――
参考文献:
〔1〕王克非.语料库翻译学十五年[J].中国外语,2008(6):9-14.
〔2〕Olohan, M. Introducing Corpora in Translation Studies[M]. New York&London: Routledge, 2004:233-250.
〔3〕Toury.G. Descriptive Translation Studies and Beyond [M]. Amsterdam/Philadelphia :John Benjamins, 1995:208-209.
关键词:格萨尔 人名 词汇 音节 切分
中图分类号:G64 文献标识码:A 文章编号:1003-9082(2017)05-0132-02
《格萨尔王传》是一部具有很高的文学、美学和欣赏价值的史诗,作为世界上最长的诗篇,它既是藏族民间文化的代表,更是藏族历史中各类神话、传说、谚语和诗歌的总和。由于《格萨尔王传》在藏文化的特殊地位,向来被认为是研究藏文化的桥梁,进入二十一世纪以来,关于《格萨尔王传》相关的历史、文学、语言等各领域的研究日渐深入,但限于诗传的篇幅和各类名词含义解读的多元化,仍有诸多问题难以深入到应有的程度。我们将自身专业特点与研究人员的需求结合,尝试通过藏语信息处理技术构建格萨尔史诗知识库。由于人名音节相对其他名词更为复杂和多元,对其正确解读与否,有时甚至会影响研究人员对关键事实的判断,因此,我们将人名知识库的构建作为这项工作的首要阶段。鉴于计算机和人类思维方式之间差异性的存在,为了方便计算机识别翻译和人工检索使用,我们在录入海量人名的同时,需要对人名词汇进行基础的分类,并对其进行相关的语音切分方法研究,并将之转换为相应的符号语言,最大限度的增加计算机获取和输出信息的准确性与科学性。
目前我们暂以《格萨尔王传》中著名诗篇
等文献为基本资料,对其中人名词汇相关的分类方法和语音切分方案进行初步的探讨。由于这一工作的长期性和复杂性,我们的专业水平也存在一定的局限,在这一工作的初步展开阶段,诚挚的希望得到相关领域不同专业学者的指导与批评。
一、人名词汇的音节分类方案
《格萨尔王传》中的人名音节多样,从单个音节到十个音节的人名词汇都有不同程度的出现,对其进行合理的分类是建立计算机与人互动的必要前提。根据当前藏语信息处理技术的特点,我们将相关人名词汇按音节数量的不同,初步划分为九个子分类,并对其进行简要说明。
1.单音节人名
《格萨尔王传》中极少出现单音节人名,但其中若干姓氏用一个音节表示的情况较多,诸如:
根据我们目前的统计,尚未在格萨尔史诗中发现单音节人名。
2.双音节人名
格萨尔史诗中出现的双音节人名基本都是以单纯人名为主,并未发现任何附加在名字前后显示身份等内容的信息。
例如:
3.三音节人名
三个音节的人名多是在名字前后附加了姓和身份。例如
4.四音节人名
四音节人名在格萨尔史诗中出现较多,成为音节分类中出现数量较多的人名类型,多数是在名字的前后附加了身份等方面的信息。例如:
5.五音节人名
五音节的人名在格萨尔史诗中属于相对出现较少的类型,仅有部分人名的乳名、美名和地名信息等内容组成。例如:
6.六音节人名
六音节人名一般是在人名前后附加地名、身份、部落名等信息组合形成的称谓。诸如:
7.七音节人名
七音节的人名多数是由姓名、地名和性格等附加信息组成的称谓。例如:
8.八音节人名
八音节的人名出现较少,同于前述六、七音节的人名,这类人名也是多数由姓名、地名、尊号等信息共同构成。诸如:
9.九、十音节人名
就我们收集到的材料而言,目前尚未发现九个音节的人名,但十个音节的人名数量仍有个别出现。例如:
二、人名语音的切分方法
格萨尔史诗中的人名音节长短不一,开展人名知识库的构建工作,必须首先人工对这些人名进行正确的切音和标注。切音和标注工作的准确性将会直接影响知识库的质量,不同的语音切分,可能导致对人名和相关信息理解上的歧义。在计算机人名知识库的构建过程中,由于电脑信息处理和人脑思维方式差异性的存在,为了便于计算机高效识别与正确理解,在较长音节的人名语音切分中,我们暂以藏文“ ”和“ ”分别表示人名词汇语音切分中的单、双音节停顿,用“”和“”符号分别作为用于计算机藏文信息识别的单双音节的切分停顿符号。按照这一思路,对这些人名音节的切分方法暂列如下:
1.格萨尔史诗中几乎未出现单音节人名, 若有出现也可为单音节来切音,不会混淆于其它人名。
2.双音节的人名在格萨尔史诗中属于数量最多的类型,基本都是以双音节作为语音切分点。
3.三音节的人名多数以双、单语音切分点的形式表现,但也有个别人名以单和双的语音切分点的形式表现,大体归纳为如下:
4.四音节人名基本都以双音节为语音切分点划分,几乎没有单音节的语音切分现象。
5.五个音节的人名在格萨尔史诗出现较少,在语音切分上主流以双双单形式划分音节,也有个别人名是单双双形式的进行音节切分。
6.六音节的人名都是以双双双形式的音节语音切分。
7.七音节的人名在语音切分上没有一致的音节语音切分,相对其他分类而言规律性较弱。
8.八音节的人名都是以双音节为单位进行语音切分,目前尚未发现单音节切分点的人名出现。
9.九个或九个以上音节的人名在格萨尔史诗中只个别出现,基本除格萨尔王的别称外没有其他的人物名称。
三、结语
《格萨尔王传》中出现海量的人物形象,人物名称的音节变化多样,尤其部分人名具有多个别称,诸如格萨尔王即有十数个称谓,多是终其一生不同的友人和敌人出于各自立场对其进行褒贬,因而形成的形成各种称名,此类人名的出现,给研究者造成极大困扰。将这些人物名称进行嗜返姆掷嗪脱芯浚对于构建格萨尔知识库的工程而言有着难以估量的意义,这些工作的共同开展,又将会极大的有助于理清格萨尔史诗中诸多人物之间的相互关系,从根本上推动和提升当前关于《格萨尔王传》的研究能力和认识水平。
参考文献
[1]《仙界占卜九藏》,兰州:甘肃民族出版社,1982年。
[2]《花岭诞生六部》,成都:四川民族出版社,1980年。
中图分类号:TP301 文献标识码: A文章编号:1009-3044(2010)17-4605-03
Research on Fuzzy Cluster Method in the Division of Hi-tech Enterprises' Lifecycle
WEI Hang, Chen Qin-qun
(Information Technology College, Guangzhou University of Chinese Medicine, Guangzhou 510006, China)
Abstract: According to the features of hi-tech enterprises, the paper puts forward a clustering method based on the improved fuzzy c-means algorithm to divide their lifecycle into different stages. The FCM algorithm is improved based on the situation of initialization and exclusion of isolated points. In addition, empirical Analysis on China's 351 high-tech enterprises shows that the improved algorithm is more scientific and will offer a new thinking for the division of hi-tech enterprises' lifecycle.
Key words: hi-tech enterprise; lifecycle; fuzzy c- means clustering
1 概述
将企业的成长过程划分为若干阶段, 根据不同阶段所具有的经济学特性, 分别研究其经营管理问题并形成决策, 属于阶段理论范畴。由于其具有较强的针对性,阶段理论广泛在企业中得到应用。高新技术企业也是企业, 其存续发展也同样会具有企业阶段性特征。同时,高新技术企业又有其自身的特点,如高智力密集、高风险、高收益、高成长和高竞争等。因此,如何对高新技术企业进行分阶段性研究,是管理者及投资者越来越关心的问题。
目前,对高新技术企业成长生命周期的研究,主要集中定性分析其阶段性的特征,对企业的整个发展过程如何划分为具有不同特征的各个阶段的研究较少,一般是凭经验人为划分。有鉴于此,本文试图探讨一种非经验的方法――模糊C均值(Fuzzy C-Means)算法。大多数高新技术企业并没有严格的属性,其所处的阶段具有过渡性的性质,没有明确的界限。当利用模糊聚类引入了隶属度这一概念时,则可很好地体现这一事实。模糊聚类结果可以得出某企业属于不同阶段的隶属度,能够更有效地帮助管理人员与投资者进行分析。特别是在无法确知总体的分布函数时,采用模糊聚类可以获得较好的效果[1]。但是,在高新技术企业生命周期的划分中,考虑到FCM算法的主要缺点,本文着重从初始聚类中心的选取、孤立点数据的检测与处理两个方面进行改进,以提高聚类质量和划分的客观性。
2 模糊C-均值算法
在模糊C 均值聚类算法中,每一个数据点按照一定的模糊隶属度属于某一聚类中心。这一聚类技术作为对传统聚类技术的改进,由Jim Bezdek于1981年提出。该方法提供了一种如何将多维空间的数据点分成特定数目的群的途径。
FCM算法的目标函数为:
式中dij=vi-xj为第i个聚类中心与第j个数据点间的距离, m∈[1,∞)是一个加权指数。
模糊c均值聚类的算法思想是:迭代调整(U,V),使得目标函数最小。其中模糊聚类算法初始化聚类中心的典型的做法是从所有数据点中任取c个点。
3 FCM算法在高新技术企业生命周期划分中的改进与应用
3.1 对初始聚类中心和聚类数目c的选取
在高新技术企业生命周期的划分中,由于对考察对象认知的不完整,要确定聚类数目c是有困难的。因此,我们根据最大最小距离法[3]进行初始聚类中心的选择,这样可找到较好的聚类中心,聚类数目c也随之确定。
3.2 对孤立点数据的检测与处理
模糊C均值算法是基于距离的算法,聚类结果受数据集中孤立点影响较大。我们利用了相似系数和对孤立点数据的检测[4]和改变隶属度的约束条件对孤立点进行处理,这样可以有效降低孤立点数据对FCM算法的影响。
其中隶属度修改为:
当修改后的隶属度应用于聚类中心公式时,隶属度小的数据对象对聚类中心的影响降低了。
3.3 改进的FCM算法步骤
根据以上分析,我们可对传统的FCM算法进行改进,具体步骤如下:
1)数据的预处理:孤立点的检测、清除与数据归一化。
2)聚类中心初始化:根据最大最小距离法选择初始聚类中心V(0)={vi},(i=1,2,…,c),其中c为聚类中心个数。设置迭代计数器b=1。
3)用式(2)计算或更新划分矩阵U(b):对于任意的i,j,如果存在,则有:
(3)
若果存在i,r,使得dir(b-1)=0,则有uir(b)=1,且对j≠r,uij(b)=0
4)更新聚类中心V(b)。
5)计算价值函数。如果它相对上次价值函数值的改变量小于某个阈值,则算法停止。否则,令b =b+1,转向步骤2。
3.4 应用实例
3.4.1 样本的选取与样本特征的选取
本文主要以我国上市的297家高新技术企业(截至2009年2月28日,通过2008《高新技术企业认定管理办法》[6]的企业),以及*市*开发区的54家高新技术企业为实验数据样本。
FCM分割算法的实际划分效果与特征空间中样本的特征极其相关。文献[7]中提到聚类算法的运行效果与聚类样本的特性相关联。在特征指标的选取上,我们依据科学性、可操作性、客观性的原则, 结合高新技术企业的特点,选出能在一定程度上反映企业所处的发展阶段的指标,具体如表1所示。
企业成立的时间长短虽能在一定程度上反映企业所属发展阶段,但不足以说明问题。一般而言,在企业的不同发展阶段,企业投资额、产品销售规模、资本支出以及股利政策等均有所不同。一般来说,当企业处在创业和成长阶段时,企业的投资额通常较大,而当企业处在成熟期乃至衰退期时,由于缺乏新的技术和投资项目而资本支出相对较少;在企业的成长阶段,企业的销售一般呈增长趋势,以后期间则由增长速度放慢、零增长直到下降。因此,在企业进入成熟阶段以后,资本投入以及销售增长率这两个变量往往会趋于平缓而逐步下降。另一方面,创业期和成长期由于企业对资金的需求量大,对股利分配通常会采取低比例分配的政策。而在成熟期或衰退期时,由于资金较为宽裕或缺乏投资目标,企业可能提高分配比例。
3.4.2 实验数据的预处理
将所采集的数据做以下预处理:
1)孤立点的清除:
本文采用相似系数和的方法从351个样本中检测出2个孤立点,经分析后确定1个异常点,清除后得到有效样本企业350个。
2)归一化:
由于数据之间量纲与范围不同,为了保证各目标具有等效性,便于以后的模糊聚类算法的实现,需要对原始数据进行处理,使之无量纲化与归一化。
其中n为实验样本高新技术企业数,k为特征指标数
3.4.3 高新技术企业生命周期的划分
首先,本文采用最大最小距离法进行初始聚类中心的选取,确定了5个初始聚类中心v0(如表2 所示)。
基于企业生命周期理论,结合高新技术企业的特点[9]分析,这5个初始聚类中心分别是处于种子期、初创期、成长期、成熟期以及衰退期较具有代表性的企业的相应特征量。当聚类中心确定后,结合Bezdek等[8]的建议,在1.5~3之间采用不同的加权指数m,进行FCM 运算,经过对比m 为2.0时,聚类分割精度、迭代次数和分割速度整体效果较好。
接着,设定ε=0.001根据上文所所述改进的模糊C均值算法具体步骤,经过多次迭代并不断修正聚类中心,直至收敛为止,目标函数变化曲线如图1所示。
从图1可以看到,目标函数经12 次迭代后,很快趋于收敛,这样可以保证聚类中心的稳定性。最终获得不同阶段下的聚类中心v(如表3 所示)和隶属矩阵U。
表3 各阶段的聚类中心
最后根据已经得到的聚类中心 或隶属矩阵U,依据“择近原则”或“最大隶属度原则”,这样就完成了高新技术企业生命周期的划分。
3.4.4 结果分析
鉴于条件限制,本文采用随机抽样、分层抽样方式采取分类精度检验的样本。随机抽样用来检验所获取的高新技术企业信息的整体情况,随机采样23个;分层抽样旨在检验模型是否可以很好地适应每个生命周期阶段信息的变化,设计从所划分的结果按种子期、种子期、初创期、成长期、成熟期以及衰退期各抽取6个样本,共30个样本点。
从表3中可以看出,改进的FCM算法的效果要好于传统的FCM算法,提高了划分高新技术企业生命周期的客观性。
4 结束语
本文针对高新技术企业在各个生命周期所呈现的不同特征,提出了一种基于改进的模糊C-均值算法(FCM)的生命周期划分方法,主要是从初始聚类中心的选取与孤立点数据的检测与处理两方面对传统的FCM算法进行改进。此方法既可以避免传统FCM算法中随意选取初始模糊分类中心可能带来的失真现象,又可以排除孤立点对聚类结果的干扰,提高了聚类分析的质量与可靠性。运用其于我国351家高新技术企业的实验数据样本中,结果表明,该方法对高新技术企业生命周期的划分是可行、有效的。
参考文献:
[1] Lundy M.Cluster analysis in credit Scoring[M].Credit Scoring and Credit Control New York: Oxford University Press,1993.
[2] 董国华. 一种改进的聚类算法及其在说话人识别上的应用[J].微计算机信息,2004,33(2):133-135.
[3] 周涓,熊忠阳,张玉芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006(6).
[4] 姜灵敏.基于相似系数和检测孤立点的聚类算法[J].计算机工程,2003(11):183-185.
[5] RAMACHANDRA A R,SRINIVASV V.Regionalization of watersheds by fuzzy cluster analysis[J].Journal of Hy-drology,2006,318:57-79.
[6] 国家科学技术部办公厅关于印发《高新技术企业认定管理办法》的通知[Z].国科发火[2008] 172号.