数字图像处理综述汇总十篇

时间:2023-07-11 16:48:49

序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇数字图像处理综述范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。

数字图像处理综述

篇(1)

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2016)10-0066-01

数字图像处理技术是指应用计算机对数字图像信息进行处理,涵盖了计算机科学与技术、数学、光物理学等多个领域。数字图像可以小到电子显微镜的图像,大到遥感图像、航空照片或者天文望远镜的图像,因此在生物医学工程、工业、农牧业、国防军事、多媒体等方面都有着十分广泛的应用。物体三维重建是数字图像处理的重要内容。人眼看到的世界是三维立体的,但是传统照相机、CCD或者CMOS图像传感器获取的图像都是二维平面的,不具备深度信息。这种二维成像系统限制了人类对真实世界中复杂的物体的感知和理解的能力。计算机三维重建的出现,突破了传统二维成像系统的局限,重建后的图像直观、逼真,可任意旋转、逐层剥离以及定量分析,显著提高了人类对世界的认识理解能力。

1 计算机三维重建

计算机三维重建是利用计算机数字图像处理技术根据真实场景的数据重建出具有准确几何信息和照片真实感的三维模型,并可进行多角度显示的技术。这些精确的三维模型,不仅能用于场景可视化和虚拟漫游,还可以满足数据的存档、测量和分析等更高层次的需求,尤其适用于辅助教学、生物医学工程、医学诊断、航天、工业测量、地理信息、数字文物和古建筑、电子商务等多种领域。

计算机三维重建方法有两种:一种是利用精密的硬件设备,如激光扫描仪、深度扫描仪等,直接测量出物体表面点的三维坐标。这种方法是直接对三维物体的空间信息进行处理,精度较高,但是设备要求极高,因此极大地限制了该技术的使用。另一种是通过相机或摄像机获得二维数字图像,然后通过数学模型计算出物体的三维结构。后一种方法数字图像容易获得,但重建结果易受到其他因素的影响,本文就此方法展开研究。

2 二维数字图像的三维重建

2.1 二维数字图像的获取

二维数字图像的获取包括物体外观图像的获取和物体内部图像的获取。物体外观图像的获取通常通过2台以上照相机或摄像机从不同角度拍摄,比如3D电影的制作。物体内部图像的获取,通常为断层扫描或连续切片成像,比如计算机X射线断层扫描(CT)、激光扫描共聚焦显微镜(CLSM)成像、生物标本连续切片的显微成像等。

2.2 二维数字图像的预处理

二维数字图像通过三维成像软件来处理,不同领域有各自适用的软件,比如:3D Studio Max,适用于广告、影视、工业和建筑设计、游戏的三维成像和动画;Amira,Mimics,适用于识别生命科学和生物医学数据;Oasis montaj,适用于地球物理勘探、钻探、地球化学勘探等。软件对图像经过增强、图像定位校正和图像分割等预处理后进行三维重建。

图像增强:现在的数字成像技术,基本可以得到分辨率高、清晰度好的图像,但如果前期成像较模糊,可以通过对比度增强、Gamma校正、锐化或噪声消除等方法进行处理,以突出目饲域。

定位校正:多台相机或摄像机从不同角度拍摄的物体外观图像、生物标本连续切片的显微成像由于不能准确定位,还需进行图像定位校正。

图像分割:在对图像的研究和应用中,人们往往仅对图像中的某些特定的、具有独特性质的区域感兴趣,这些区域称为目标或前景(其他部分称为背景)。可根据灰度、颜色、纹理和形状等提取感兴趣目标,从而把图像分割成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。常用的分割方法有:基于灰度阈值的图像分割、交互式图像分割、基于活动轮廓或者形变模型的分割等等。针对不一样的图像和待分割的图像特点,可以选择不一样的分割方法。图像分割是图像处理的基本前提,同时也是一个经典难题,到目前为止还没有一种图像分割方法是通用的。

2.3 图像的三维重建

二维数字图像的三维重建技术有两种:表面绘制和体绘制。举例而言,你站在一辆汽车前,只能看到外观,但无法观察到车子内部的结构如发动机,这是表面绘制;假设汽车和车内中的结构都是半透明的,就可以同时看到所有的细节,这就是体绘制所要达到的效果,即三维透视。表面绘制是表示三维物体形状最基本的方法,可以提供三维物体形状的全面信息。它是从数字图像中抽取一系列相关表面,并用多边形拟合近似后,再通过传统的图形学算法显示出来。体绘制是依据三维体数据,将所有体细节同时展现在二维图片上,可以在一幅图像中显示多种物质的综合分布情况,并且可以通过不透明度的控制,反应等值面的情况。该方法特别适合于云雾、流体、大脑软组织、气体等无固定形状的体数据图像的生成,产生的图像真实感强。

3 面临的问题

二维数字图像的三维重建是数字图像处理技术十分活跃的研究方向,虽然这一领域的发展十分迅速,但仍有一些方面是需要进一步提高。(1)提高计算精度:图像分割是人工手动完成,然后通过数学方法来实现,这涉及到个人知识熟悉程度和计算精度,如果个人经验不足,或者计算精度不够,则图像效果不符合客观实际,不一定能够达到人眼识别的舒适度。因此,基于专业知识的图像分割标准化方面还有待进一步研究。(2)计算精度和处理速度之间的矛盾:图像处理需要巨大的数据运算,运算量远大于文本处理,所以在提高运算精度的同时还要考虑提高运算速度。(3)计算机三维重建是研究工具,必须加强交叉学科间的联合研究,才能够在推广应用上取得进步。

参考文献

[1]陈汗青,万艳玲,王国刚.数字图像处理技术研究进展[J].工业控制计算机,2013,26(1):72-74.

[2]孙宇阳.基于单幅图像的三维重建技术综述[J].北方工业大学学报,2011,23(1):9-12.

篇(2)

软件工程专业工程硕士研究生与传统的学术型研究生有所不同,前者主要面向企业人才需求和应用软件开发需求进行培养,因此在课程内容选取、授课方法设计和实验环节设计上都需要进行思考和调整,这也是北京林业大学在申请到软件工程专业的工程硕士学科后重点研究的問题。

数字图像处理课程属于图形图像应用领域的重要基础理论课,长久以来课程内容主要介绍基本的图像处理算法以及少部分图像分割和图像识别,对于图像处理在实际生活中所涉及的很多前沿科研领域介绍较少,因此很多研究生无法将课堂讲授的理论知识与其后续从事的研究课题有效地关联起来,感到课堂中讲授的很多内容看起来毫无用处,从而丧失了学习的积极性。

很多教师认为把图像处理中的算法研究透彻、把基础打好对研究生非常重要,但是这忽视了研究生是有着极强的科研探索精神和丰富想象力的年轻一代。如果将一些在生活中涉及图像处理的問题交给他们进行探索,将会激起他们浓厚的学习精神和创造力,这种没有标准答案的应用题目可以进一步锻炼他们的思考能力。

为此,在课程的教学方法和实验内容设计上,我们重点培养学生以下两方面能力。

(1)应用型研究能力,包括发现問题、分析問题和解决問题的能力;

(2)应用型技术能力,包括编程设计能力和项目合作能力。

下面笔者分别从教学大纲、教学方法设计和实验内容设计3个方面进行介绍。

1.数字图像处理课程教学大纲

我们在设定教学大纲时,重点参考了多本数字图像处理方面的经典教材,如杨枝灵和冈萨雷斯编写的教材。结合之前的教学经验,同时注意与本科生课程相区别,制订了两个原则:加强中高级图像处理算法的介绍;增加利用图像处理算法的应用案例的介绍。中高级图像处理算法主要指图像分割算法、图像特征提取方法和运动检测方法。同时我们还在课堂上给出一些应用案例,进一步帮助学生将理论知识与实践相结合。

数字图像处理课程目前作为北京林业大学研究生的专业必修课,总学时为32,其中课堂讲授24学时,实验8学时。相对于其他学校,这门课程的总学时和实验学时数不多,我们设计的教学内容如表1所示。

2.数字图像处理教学方法设计

针对培养学生应用型研究能力的目标,我们在教学方法设计上本着激发学生的学习兴趣,开阔学生眼界,给学生提供更自由的思考空间的原则,通过下面两个措施来实现我们的目标。

2.1精心选择案例

选择的案例要贴近实际生活,并与课堂上讲授的方法紧密衔接。例如,在讲解图像增强和复原这两章之后,我们引入在实际生活中常见的“图像去雾”問题,通过如下方法,培养学生研究能力。

(1)要求学生先尝试用学过的算法来解决这个問题,并在课堂进行算法讨论,给出算法结果。

(2)要求学生针对具体問题,查阅文献资料,了解别人的解决方法。通过查阅国内外的文献资料,同学们知道了如何根据关键词查询科研论文,了解哪些电子数据库中有与专业相关资料,知道了文献的级别有SCI、EI、核心期刊、一般期刊等。

(3)学生将查到的算法进行分类和总结,撰写文献综述。

(4)每位学生都需要编程实现“图像去雾”算法,这个算法是结合自己的思考、实践以及查阅文献的结果。

通过自己动手,同学们发现如果图像的清晰度不好,有噪声,或者没有归一化,结果就完全不同。通过自己动手验证,同学们会发现图像处理领域的一个最为重要的特点——任何算法主要都是针对一类图像或是针对一类問题而设计的,因此在算法的适应性上需要有所考虑。

2.2全面介绍图像处理的各个应用领域

老师在课堂上介绍几个图像处理涉及的较为重要的应用方向(如视频监控、图像检索、人脸识别、运动检测、车牌检测等)后,将同学们进行分组,每组负责查找一个应用方向的相关资料,讨论和汇报自学的结果。汇报内容主要包括:①应用方向的介绍;②涉及的主要問题;③目前的解决方法及应用成果。

通过查找文献,同学们不仅对课上学习过的经典算法有进一步了解,同时还接触到很多新算法。通过听取各组汇报,同学们在较短的时间里,了解了图像处理涉及的多个主要的应用领域。针对每个应用研究领域,老师引导学生分析该领域的难点和重点,提出問题,再让学生思考解决方案,没有标准答案,只希望能够锻炼学生的思考能力。以“人脸识别”为例,有很多经典的或较新颖的算法,老师会结合应用领域对其中常用的或比较重要的算法,如PCA方法和Adaboost算法,进行详细讲解,使学生全面了解图像处理算法的应用领域。

3.数字图像处理实验内容设计

针对培养学生的应用技术能力的目标,同时考虑到本课程实验学时数较少,我们设计了两个实验——基础性实验和综合性实验。

3.1基础性实验

目前很多经典的图像处理算法是用vC++程序实现的,我们要求大家学会读程序,能够看懂已有的算法实现程序,并在此基础上能开发新的功能。

实验一:实现对多种图像格式的支持(2学时)

实验内容:采用VC++编码实现,基于CDib类,添加支持打开,并保存多种图像格式的功能。包括JPEG和GIF。

实验要求:利用学习的图像压缩的知识,利用现有的编码解码库实现对IPEG和GIF图像的打开和保存。

实验目的:了解多种图像格式,编写针对多种图像格式的读写程序,能够进一步理解针对图像的编程的特点,同时也进一步了解开发图像应用程序的适应性問题。

老师在课程初期会向大家介绍图像处理的一个公开库——CDib类。该类很好地封装了图像的数据结构,涉及很多图像的基本操作。我们知道现实生活中的图像常常都是压缩格式的,如BMP、JPEG、PNG、GIF等。因此在讲完图像的压缩格式后,对照讲过的BMP图像结构,老师要求学生为CDib类添加能够支持多种图像格式的功能。以GIF图像为例,它不同于如JPEG、PNG等格式,GIF采用的是LZW压缩算法,使用的是无损压缩技术。GIF图像的特点是可以一次压缩多幅图像,图像颜色表控制为256色,使用渐显方式。

3.2综合性实验

针对综合性实验,我们会拟定多个题目让学生选择,如树叶提取、花朵提取、车牌识别等。

实验二:数字号码图像的识别(6学时)

实验内容:采用VC++编码实现,基于CDib类,针对数字号码图像,识别出数字,给出文本显示结果。

实验要求:将该题目进行分解,划分任务;组内每个同学负责一部分任务的编程工作;每个人针对自己负责的工作至少提供两种实现方法,并放入整个项目流程中验证这两种方法的有效性;最后总结出两种方法的异同以及适应的范围。

实验目的:考查学生对数字图像处理应用中每个步骤的掌握程度和项目合作沟通能力。

上述实验涉及以下几个步骤。

①图像的预处理;

②图像的分割;

③图像的特征提取;

④图像的分类。

组中每个学生负责一个步骤,所有步骤都需要尽心设计,这样整体的效果才可能最好。同时大家需要协商各自负责模块的人口和出口的数据结构,保证数据能够在模块之间顺利流转。这种协商和分工合作的能力是软件工程专业最需要的技术能力之一。

以“数字号码图像识别”为例,该题目可以分割成4个步骤:预处理、数字图像切分、数字图像特征提取和数字识别。在每个步骤中都有分别需要注意的問题,如在预处理阶段,需要对图像进行去噪声,增强对比度,甚至需要进行膨胀和腐蚀将图像中断裂的数字部分连通起来;在数字图像切分阶段需要制定适应性广泛的切分策略来应对各种情况,如数字排列可以呈现任意的倾斜角度,或数字字符相连等;在数字图像特征提取阶段,我们可以考察每个数字图像的自相关系数特征,或者每个数字图像的频谱特征,也可以考察数字图像的几何拓扑特征,如将数字图像分成2个洞的(8),1个洞的(4,6,9,0),没有洞的(1,2,3,5,7),针对每个类别再提取新的几何特征;在数字图像识别阶段,可以采用神经网络的分类器,或者利用制定的一些分类策略来分类,或者采用主成份分析(PCA)的方法来识别。

4.结语

两年多的教学实践表明,新的教学大纲、授课方法和实验内容有利于激发学生的兴趣,使他们带着問题去学习,从而加深了对图像处理应用领域的了解,锻炼了编写程序和协作开发的能力。下一步我们将设计更多合理有效的案例和综合性实验,力图通过这门课激发学生的创造力。

篇(3)

【中图分类号】TP391.41【文献标识码】A【文章编号】1672-5158(2013)02-0129-02

1.数字图像处理技术的内容及特点

1.1 研究内容

不管应用到哪个领域的图像处理图像数据都要输入、加工和输出图像,其研究内容:

(1)获取、表示和表现图像――把图像信号转化为计算机可以识别的形式,并把数字图像显示和表现出来。

(2)图像复原――已知图像发生退化的缘由时,对图像进行修复,关键是建立退化模型。复原是以模型和数据的图像恢复为基础,消除退化的影响。

(3)图像增强――对图像质量的常规改善。当不知道图像退化原因时,还可用此技术比较主观的改善图像。

(4)图像分割――人类视觉系统可以轻松地将观察到的对象区分开来,但计算机却很难。分割的基本问题目前是将各种方法融合使用,以此提高处理的质量。

(5)图像分析――检测和测量图像中的目标,获取其客观信息,是从图像到数据的过程。

(6)图像重建――指从数据到图像的处理。

(7)图像压缩编码――为减少数据容量、降低数据率、压缩信息量,在不影响其效果的前提下减少图像的数据量。

1.2 数字图像处理技术的特点

(1)图像再现性好――不会因为对图像的变换操作而影响到图像质量;

(2)图像处理精度高――可以将图像数字处理为任意大小的数组;

(3)适用面宽――来自不同信息源的图像被变换为数字编码形式后,都可以用数组来体现灰度图像。

(4)灵活性高――图像处理可完成线性及非线性处理。

2.应用领域

数字图像处理技术被应用到越来越多的领域中,如医疗保健、航空航天、交通通信、军事、工业、农业、林业等。下面选取几方面进行分析:

(1)试听资料证据――视听资料证据是重要的诉讼证据,在司法诉讼活动中发挥着越来越重要的作用,数字图像处理技术是视听资料证据中图像证据资料技术性司法鉴定的常用手段,是图片原始性、真伪性、相关性认定的基本方法,如名捕监控录像模糊图像处理系统,该系统是手印、足迹、枪弹痕迹、工具痕迹、印章检验、文件检验以及录像带处理等痕检、文检、视频图像处理工作的必备工具;以及实时视频降噪仪,能够实时处理现场录像流,增强视频的清晰度,该在录像安全系统中加强监视录像的清晰度,或者在警方实地调查拍摄录像后回到警署再进行降噪。

(2)电子商务――当前的电子商务中,图像处理技术也大有可为,如身份认证、产品防伪和水印技术等。

(3)军事公安领域――军事的目标是侦察、制导和警戒系统和自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、印章和人像等的处理和辨识;历史文字和图片档案的修复和管理等。而数字图像处理技术将数码摄影和图像处理技术结合起来以其独特的优势在公安领域中逐步开始担当重任,在刑事摄影、档案管理、痕迹检验、文件检验、法医、物证提取以及公安教学或宣传中发挥着巨大作用,为广大的公安人员开阔了视野、拓展了思维空间,为执法的公正性提供了有力保证,应用提高了工作效率,减少了人、财、物的消耗,大大提高了工作效率。

(4)智能交通――图像处理具有算法柔性大、适应能力强等特点,在智能交通系统中取得了广泛的应用价值,例如车牌识别(车牌定位、车牌倾抖校正与字符分割、车牌字符识别变换等)和车辆检测与跟踪系统(包括感兴趣区域提取、车辆检测、车辆跟踪等),智能车辆导航、车型识别、交通控制等。

(5)航空航天通信――包括图像传输、电视电话和视会议等,主要是进行图像压缩甚至理解基础上的压缩。

(6)遥感技术――航空航天和卫星摇撼图像获取中和获取后都要用图像处理技术进行加工处理,提取出有利用价值的信息。主要用来对地形地质、矿藏资源搜索以及农业、水利、森林和海洋等资源调查研究,对自然灾害进行预测预报、检测环境污染、处理气象卫星云图以及识别地面军事目标。

(7)生物医学领域――图像处理在医学界的应用非常广泛,图像处理首先应用于细胞分类、染色体分类和放射图像等,临床诊断和病理研究中都大量接住了图像处理技术。它的直观、安全方便、无创伤的优点受到医生和患者的青睐。

(8)工业生产中的应用――在生产线中对产品及部件进行无损检测

(9)机器人视觉――机器视觉相当于智能机器人的重要感觉器官,可以对三维景物进行理解,医院、工厂、邮政以及家庭中的智能机器人,识别和定位装配线工件,太空机器人的自动操作。

(10)视频及多媒体系统――目前,电视制作系统中广泛使用图像处理、变换和合成技术,使电视效果更佳。在多煤体系统中广泛使用静止图像和动态图像的采集、处理、存储、传输和压缩,以达到使用者的目的。

(11)科学可视化――图像处理和计算机图形学的紧密结合,使科学研究得各个领域有了更为新颖的研究工具。

(12)宇宙探测――由于探索太空的需要和太空技术的快速发展,需要用数字处理技术来处理从外太空获取的大量星体照片。

(13)地质勘探――近年来发展起来的以数字图像处理技术为基础、综合多门学科知识的地学信息处理新技术的多源地学信息综合图像处理,使用一些特定的图像处理方法,实现了多源地学信息综合图像处理,用来辅助地质填图,构造地质研究,进行寸产资源的预测和评估,成为当前地质工作者正在研究和探讨的一个问题。

由图像处理技术在以上几个领域中的应用可以看出,图像处理技术在各领域中的重要程度:计算机图像生成技术在航空航海中可以充当仿真训练系统,还可以应用到广告和动画制作,跟友人将其应用到网游中;图像传输与通信还可在多媒体教学、网络视频领域得到广泛应用;在医学上,医学图像处理和材料分析也日益重要,如超声成像、X光成像、Y光成像以及核磁共振成像,对医生工作产生了巨大的辅助;图像跟踪和光学制导在战略技术武器中发挥了重要作用。

3.发展方向

随着计算机的发展,图像处理技术将越来越成熟,对各领域的影响也越来越大,总的来说,图像处理技术的发展有以下几个趋势:

(1) 在目前的基础上,图像处理速度越来越快,分辨率越来越高,多媒体应用光来月广泛,标准化、立体化程度越来越高,并产生智能化的趋势;

(2) 在目前二维基础上将出现多维成像的趋势;

(3) 芯片广泛运用到图像处理技术中,使用起来更加方便;

(4) 将出现新的算法与理论。

图像处理技术在各个领域的应用与发展,大大降低了相应领域的工作难度,效率更高,质量也无可挑剔,使人类受益匪浅。日后图像处理技术将进一步根据人类需求,在相关科研人员的努力奋斗下而实现新的突破,在更为广阔的领域造福人类事业。

参考文献

[1] 李红俊,韩冀皖.数字图像处理技术及其应用. 计算机测量与控制,2009.

[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.

[3]杨枝灵,王开.Visual C++数字图像获取、处理及实践应用.人民邮电出版社,2003

篇(4)

中图分类号:TP391 文献标志码:A 文章编号:1009-3044(2015)13-0180-02

随着科学技术的不断发展、计算机应用领域的不断开拓,图像处理方法应运而生,目的是利用计算机设备将图像进行分类处理,用于智能分析图像信息。当今图像处理与识别的应用范围越来越广,但就目前的水平而言,计算机对外部的感知能力还比较薄弱,还需要投入大量人力、物力从事数字图像处理与识别的理论和应用的研究。于是各行各业对于数字图像处理技术的精确化与智能化有着更大的需求。这样的需求尤其体现在航空航天、生物医学工程、工业检测、机器人视觉、公安司法、文化艺术等领域。

而本文针对数字图像处理技术的特性,将其应用在普遍计算机操作行为的分析之中,实现了一种根据计算机操作过程中显现的图像色彩来智能分析其操作行为的创新功能。

1 算法简介

彩色图像的聚类分析以及K-means算法是本课题的关键。本文通过彩色图像聚类分析与K-means算法将图像转化为3类模块,分别为正常图像,渲染图像与灰度图像。对这3类模块同时进行遍历与聚类,计算出其影响行为分析判断的影响色块区间与影响深度区间,基于两类区间相互结合,最终依照阀值界限对原图像进行行为判断,得出操作行为分析结论。

图1为算法结果演示图。

2 算法实现

2.1获取计算机图像

获取当前窗体的大小,创建一个以当前窗体为模板的图象,创建一个位图Bitmap绘图图面,得到窗体的句柄和图像的句柄,复制土块的光栅操作码,调用API函数,实现窗体捕获。释放句柄,保存图像。本例中图像结果如图2。

2.2彩色图像聚类分析

根据行为分析图像・自定义颜色的色系,程序将获取的图像,统一转化为rgb格式,遍历图像的像素点,获取图像中色系种类与比例及色系的位置,统计主要颜色所在色系的权重。根据自定义的色彩模型,分析图像内容。

基于色彩图像的RGB格式,建立三维坐标图,其中R为X轴,G为Y轴,B为Z轴,坐标轴长度均为255,根据近似色的微小差别,将三通道色素划分为14个色系,即14个色彩区块,之后根据色彩区块的冷暖调与鲜明程度,与已有的操作行为图像结果进行匹配统计得出具体阀值。图4为划分的部分色系图。

根据彩色图像将所有像素点规划到14个色彩区块,之后遍历所有像素点将其编入类组,将同一类组的像素点进行渲染形成同一颜色,图3为渲染图。

通过反复试验经验积累,按照冷暖色调与色彩鲜明度提取出色彩区块中该色彩比例对行为分析判断结果造成影响的六类色区。构建一个影响色块区间,存放六类色区中最终对行为分析结果造成影响的像素点。统计这六类色区,当某一色区所占总像素比例超过指定阀值时(本阀值是在反复试验中经过大量已归类行为图片分析计算后归约出来的行为色彩区分界限),保存其色区像素比例致影响色块区间。图5为主色系所占比例。

2.2灰度图像聚类分析

本研究中对于灰度图像的聚类分析主要根据K-means算法进行聚类实现。

本研究所采用的K-Means聚类算法的优点主要集中在:算法快速、简单;对大数据集有较高的效率并且是可伸缩性的;时间复杂度近于线性,而且适合挖掘大规模数据集。

K-Means聚类算法的时间复杂度是O(nkt) ,其中n代表数据集中对象的数量,t代表着算法迭代的次数,k代表着簇的数目。

K-means算法具体流程为:

1)随机选取k个聚类质心点(cluster centroids)为[μ1,μ2,...,μk∈Rn]。

2)重复下面过程直到收敛

对于每一个样例i,计算其应该属于的类

[c(i)=argminj||x(i)-μj||2]

对于每一个类j,重新计算该类的质心

[μj:=i=1m1{c(i)=j}x(i)i=1m1{c(i)=j}]

在 K-means 算法中 K 的选取均有人工指定,而 K 值的选定是非常难以估计的。本文在对大量原始数据实验结果的基础上进行总结,得出当k值选定为5时,对于操作行为分析具有最佳精准度。

在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择不当,则可能无法得到有效的聚类结果。本研究中初始聚类中心,是根据彩色图像的比例最大的主色系的位置的中心来设定的。

3 算法效果

本文针对目前市面中出现率频繁的娱乐游戏、电影、办公软件、学习软件进行检测,本算法效果有着较强实用性。其中,深色系游戏与电影分析的效果显著,如《英雄联盟》、

《DOTA》、《哈利波特》。而浅色系游戏,在特定场景中分析效果会受到干扰,如《剑网三》当中对图片进行光晕处理后,其影像色彩区间受到波动。对此现象,经过大量的图片测试,对游戏类的图像进行了归纳,这对今后的算法修改提供了很好的数据矫正。

4 结束语

本文立足于图像处理技术的创新与应用,并将图像处理技术与计算机操作行为分析相结合,运用自编彩色图像聚类分析算法对图像色彩进行分类统计,构建影响色彩区间并对区间色彩进行操作行为匹配,划定区间阀值。以及引入K-means算法对图像进行灰度化处理,通过实验数据结果以及经验选择K值以适应行为分析计算,同时构建深度影响区间,对图像色彩深度进行分类,最终结合影响色彩区间划定行为分析界限。实现了智能分析计算机操作行为的创新,摆脱人工监控与识别行为。这对将来自动对计算机图像界面、行为模式分析的监控与统计提供了可观的价值。

参考文献:

[1] Parker J R. 图像处理与计算机视觉算法及应用[M]. 2版. 北京: 清华大学出版社, 2012.

[2] 赵春江. C#数字图像处理算法典型实例[M]. 北京: 人民邮电出版社, 2009.

篇(5)

中图分类号:F416.22 文献标识码:A

数字图像处理技术是通过电脑来去除噪声形象,提升、回收、分割、特征提取的处理方法和技术,探索石油地震勘探地球信息科学与科学之间的交叉学科,可以利用数字图像处理的一些方法进行研究。当前,图像处理技术的飞速发展提供一个新的方法来解决这些交叉科学问题。地震数据的处理过程中应采取综合研究模型,即采用合理的数学模型和信息技术,地震资料成像、地震数据的形式表达的形象,所以地震数据不仅形象直观,而且可以利用图像处理技术进行处理和分析,并改善直板的地质问题的认识。因此,边缘检测技术在地震资料储层预测将扮演一个重要的角色。

1 边缘检测

1.1 常见算子分析

边缘检测算法的比较分析在地震储层中的应用极为少见,但信息科学和图像差异对噪声有一定的抑制作用。从研究中,原始和渐变噪声图像处理效果较好,边缘检测算子更好,二阶微分算子,图像中的边缘点的顺序和精确定位的旋转不变,导致该算子容易丢失。边缘信息的一部分,导致一些离散的边缘检测方法相对适应。经典的边缘检测是应用微分形象的特点的边界点进行检测。该模型可以看出,这种方法是有效的检测,可应用于实际应用。因此,针对油藏断层、裂缝、泥岩边界,可以使用边缘检测技术对这些特定的边缘识别。

1.2 小波变换

裂纹检测和分析的图像边缘检测有很多相同之处,基于小波多尺度边缘检测理论,结合裂缝的地震波场的多尺度小波变换局部极值的模式,因为这些极端值设置没有门槛限制,检测裂缝三维地震记录的某些特征的位置,然后根据钻井、测井数据得到裂缝的总体特征的分类和分布的该区裂缝,调整模量在图像的灰度,最后自动识别裂缝发育程度。对储层砂体的识别和断口的分析,一般采用的方法是进行奇异性检测。无论是简单的边缘检测算子或多尺度小波边缘检测方法探测目标,边缘检测的结果有很大的不确定性。

2 应用

2.1 地震资料解释

地震资料解释水平地震剖面上断裂规模,因为地震资料分辨率的限制,在这种情况下,引入边缘检测算法比较,该方法能精确地识别出图像或数据放在一个水平的优势,可以很好地对具体比例的地质特征,成像识别。该技术在裂缝识别和河床边界识别,寻找图像的像素位置变换,简单说就是像素图像有用的信息,即断层和河床边界的信息,在油藏描述、河道砂、小断裂并且对预测和油气开发都有重要的意义。跟描述技术相比,边缘检测技术有其独特的优点,最大的优点是它的多尺度性。由于过错的沉积特征而使用像素来描述不同的集合像素,边缘检测技术有其独特的优势。利用图像处理的边缘检测理论,对地震资料的处理,不仅可以确定三维数据体的缺点而且对河道砂体连通性描述可靠合理的注采井网的部署和回收网络改善,具有重要的指导意义。

2.2 裂缝预测

将图像处理技术移植到地震储层预测会给裂缝性储层识别与评价的探索带来新的观念。利用边缘检测技术对地震属性处理,然后结合电阻率成像测井资料、岩性资料、测井资料和瞬间的压力数据高速预测裂缝。相比之下,国内学者的研究对更具体的边缘检测算法,提出了算法和研究对象。通过选定的振幅数据对象,利用数字图像处理的方法预测裂缝振幅值的测试,结合裂缝地震波场的多尺度特性,提出了碳酸盐岩裂缝预测的多尺度边缘检测方法。该方法的主要思想是用小波变换局部极值的模式试验三维地震记录,在裂纹特征的位置,并通过调整模量在图像的灰度、识别裂缝发育。

3 地震数据预处理方法

地震数据采集带噪声会影响地震资料的质量。因此,对地震数据预处理,图像预处理是用各种各样的数字图像处理技术来提高,这方面的研究方法很多,有自适应误差扩散算法、中值滤波等。这些方法的目的是光滑脉冲噪声,只有在通过图像预处理方法后才可以在后续的地震储层预测中取得良好效果。

3.1 滤波方法

在一些资料研究对象中,有些信息是不切合实际的应用价值,所以地震信息过滤是非常必要的。在这方面,技术的使用提高了地震剖面的信噪比的形象。其关键技术是利用光流分析技术,并计算了相应的分地震剖面上超过偏,然后使用图像积累的地震剖面进行积累技术,实现了三维地震数据体提高信噪比。该方法充分利用了三维地震信息,不仅可以改善的信噪比数据体,而且可以降低信号的能量损失,使原始信号的能量关系,使地震剖面的品质,增加明显的地震解释一个良好的基础。该方法的实现,为地震资料的处理提供了新的思想、横向分辨率图像增强,就是与相轴连续、断点清晰,以便提供更好的地震资料解释的物质。

3.2 边界处理方法

地震信息十分丰富,在这种情况下,我们必须有一个地震数据的边界处理,提出了一种基于边缘检测算法的动态误差扩散。分散的方法以及误差方向每一个像素的边缘,然后根据结果选择边缘检测的像素的动态误差四面八方扩散系数的方法,这种方法能减少误差分散过程中的误差积累。实验结果表明,该方法能有效提高造成的误差系数和分散的细节图像轮廓损失。在众多的滤波算法,提出了一种自适应反馈的误差扩散算法。该方法首先采用提出视、听知觉差的概念,并根据原始图像的灰度区域特征,自适应反馈系数的计算,将被遣送回原来的视觉形象,以弥补连续可调造成的误差扩散的不同区域的灰度损失。该算法可以显著提减弱点获得的不良影响的现象,准确地代表更多的图像细节,并表现出比传统算法更好的主观视觉效果,该方法的运用就会在地震储层的细节描述提供很好的保证。

4 展望

地震信息处理与分析是一门交叉学科,边缘检测技术依赖的地震资料、地质目标和数学方法来决定。在方法的选择,通常是经多种方法的比较分析及各种世界算法才能达到目的特殊待遇。根据技术边缘检测可以有效解决中小裂隙型储层、裂缝和砂体的边界识别,地球物理工作者建议在特定目标首先建立数学模型的实验验证了算法的权利。例如,一个差异,为代表的经典的边缘检测方法,可以通过不同的数学模型,能突出其变化信号点,重点是边缘化。但无论经典边缘检测算法或其他复杂的边缘检测方法,每一种方法的结果也不同。因此,边缘检测技术在地震资料用于问题不仅仅是简单的图像处理问题,尤其对小裂隙型储层、裂缝和砂体的边界识别和影像,首先引入到地震数据的边界滤波器,并在此基础上,对研究对象的规模水平选定合适的数学算法处理,最后达到对处理结果的空间认识和理解,并与之相配套的地质目标。最后,边缘检测技术在石油勘探开发中的应用应结合地质、物探、钻井测井数据分析。

参考文献

[1]杨文采.应用地球物理数据处理与分析[J].地学前缘,1998,5(2):231-235.

[2]王新成.高级图形处理技术[M].北京:中国科学技术出版社,2001:119-130.

篇(6)

中图分类号:TP3 文献标识码:A 文章编号:1007-9416(2014)02-0120-02

Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.

Key Words:license plate identification;DSP;algorrithm

1 引言

据公安部相关数据统计,现如今我国汽车保有量已达2.4亿辆,且每年的增长率都在15%以上,应用智能交通系统来解决随之产生的交通问题已是大势所趋。基于DSP的车牌识别方法是智能化车牌识别的有效方法。现如今,自动车牌识别技术已被广泛应用,但由于算法的复杂性与效率的矛盾,及算法于系统上的应用的困难性,对车牌识别的关键算法还有待于更深入的研究。

2 硬件系统结构

通用可编程的DSP芯片的硬件技术的发展给数字图像处理带来了飞跃性的进步。要实现车牌识别,需要数字图像处理技术中的很多复杂的算法,基于DSP的车牌识别系统也因此得到了广泛的研究与应用。为了提高整个系统的可操作性及性价比,当前应用最多的是分布式的处理模式,即联合PC机与DSP的优势共同完成车牌识别系统,其总体结构及具体结构如(图1)所示:

3 车牌识别关键算法

算法流程为图像预处理、车牌定位、车牌分割,最后字符识别。图像预处理为提高摄像机摄取的图像质量,便于后续处理。利用DSP技术在处理车牌识别关键算法中的车牌的定位与字符分割方面优势显著。

3.1 车牌定位

基于灰度图像的定位技术日趋成熟,但彩色图像包含了图像的更多信息特征,加之车牌的底色是有规律可循的,所以基于彩色图像的定位技术越来越成为在发展定位技术上的突破点。本文定位的思路为:

(1)图像从RGB空间转换到HSI空间,其算法为(以蓝底白色车牌为例):

(3)对二值图像进行水平投影[1],从车牌固有的矩形特征中的高度特征提取车牌图像,如图3所示。再使用特征颜色边缘检测法,检测车牌正确位置,如图4所示。

(4)根据车牌固有的矩形特征中的宽度特征,使用垂直投影法提取车牌图像,如(图5)所示:

3.2 字符分割

字符分割是字符识别的关键前提。在2013年新交通法规中规定,对故意遮挡、污损、不安规定安装车牌的扣12分的处罚,这项规定的出台,也间接降低了算法的复杂性。本文采用车牌字符间隔的特征在垂直投影中的规律来进行字符分割。

其算法原理为:

(1)设垂直投影值为T,阈值为V,在确定前还要充分考虑字符粘连、断裂及“1”字符的特殊性。当时,T=0。

(2)设数组为从左向右扫描的投影值,当扫描的数组的值时,字符的宽度设为。根据规律[2],单个字符的宽度约为45mm,除第2、3字符的间隔为34mm,其它字符的间隔均为12mm。由此,得出以下3中情况:

(1)时,为字符粘连,取为单个字符的宽度;

(2)且后面的字符也如此时,为字符断裂,合并这两个字符;

(3)且不满足字符断裂,此字符为数字“1”。

实验结果如(图6)所示:

4 结语

本文在以DSP处理器TMS320DM6437嵌入式系统上对以上两大关键算法进行实验研究,在150张不同类型的车牌进行识别后,测试结果的正确率92.3%,且处理的速度达到实时处理的需求。为以后在智能交通控制系统中的车牌识别技术的提高和发展提供了参考基础。

参考文献

篇(7)

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2013)11-0110-02

计算机人脸识别技术是利用计算机分析图像,进而从中提取有效的人脸特征息。随着成像设备的不断发展,计算机运行速度的大幅提高,为人脸识别提供了可靠的硬件基础。而人脸识别首先要完成的就是人脸检测,可靠稳定的人脸检测是完成人脸识别功能的基本条件。

1 人脸检测系统的设计

人脸检测系统主要有5部分构成,流程图如图1所示。

(1)获取图像:从输入设备中获取将要处理的图像。

(2)预处理:将获取到的图像进行预处理,处理成适合特征提取的图像。

(3)特征提取:对预处理后的图像提取人脸检测所需特征。

(4)人脸检测:根据所提取到的特征来判定是否为人脸。

(5)输出检测的结果。

2 Adaboost算法的基本原理

Adaboost算法是由Viola和Jones与2001年提出来的一种基于统计理论的方法。该算法主要分为分类器训练和模式识别两大部分。人脸检测通过训练,可以从一个很大的特征集当中提取出很小的一部分特征作为关键特征,进而产生一个极其有效的分类器。在以后的人脸检测当中就使用这个分类器将人脸与其他背景区分开来,最终确定人脸的大小和位置。

a.寻找使得权重为的错误最小的分类器.

b.求,这儿,如果最小错误满足,则继续;否则退出。

c.设置的权重这里的是

步骤2b中的最小错误。

d.更新数据点权重:这里的将所有数据点权重归一化。

如果在2b步骤找不到小于50%错误

率的分类器,则停止,表面可能需要更好的特征。

训练算法结束之后,最后的强分类器接受输入向量 x,使用所有的弱分类器的加权来进行分类。

这里符号函数将所有的正数变为1,所有的负数变为-1。

通过该算法我们构建了一个高检测率低拒绝率的多层树分类器,具有如下创新特征:

它使用类Haar输入特征:对矩形图像区域的和或者差进行阈值化。

它的积分图像加速了矩形图像区域45度旋转值的计算。

使用统计来创建两类问题(人脸与非人脸)的分类器节点(高通过率、低拒绝率)。

将弱分类器节点组成筛选式级联。也就是说:第一组分类器最为简单,能够通过包含物体的图像区域,同时允许一些不包含物体的图像通过;第二组分类器为次优分类器,也有较低的拒绝率;以此类推。在测试模式下,只要图像区域通过了整个级联器,就认为里面有物体。如图2所示。

3 人脸检测的实现

4 结语

经过实验验证,本文所阐述的方法能够有效的进行人脸检测。但同时也会因为光照,人脸方向转变而发生一些误判,对此,还需要对应不同的情况进行特殊的预处理来保持检测的准确性。

参考文献

[1],林学訚.数字图像处理.北京:电子工业出版社.2011.

篇(8)

中图分类号:TQ533 文献标识码:A 文章编号:1674-098X(2014)01(a)-0005-02

在我国的电力供应中,有很大一部分来自火力发电。火力发电对煤炭资源的需求最大,因此提高煤的燃烧效率变得十分重要。煤的燃烧特征是煤的颗粒越小,越容易燃烧殆尽,而且在其燃烧过程中所产生的硫化气体等污染物也会相对较少。所以通过一种有效的办法对煤堆进行颗粒粒度识别具有重要意义。颗粒物识别检测通常采用的方法为筛析法、重量沉降法、激光散射分析等,这些方法中存在人为操作量大,重复性不好,且不能给出颗粒的相关参数特性等缺点[1]。该文运用数字图像处理技术对煤颗粒进行处理分析,可避免上述方法的不足,提升测量速度节省时间,增强测量准度和精度。并提出结合分形理论,对煤堆颗粒作分形分析。图像处理方法作为对煤堆特性分析方法可利用软件得到相关的煤堆颗粒粒度参数、进而可以选择相应适合的条件对煤堆进行颗粒过滤,从而满足工业要求。

1 图像处理技术

1.1 数字图象处理的特点

随着计算机科学的发展与工控程度的提高,图像处理技术被越来越广泛的运用。在颗粒检测识别领域,图像处理技术有着得天独厚的优势。它减少了单纯的人工操作量,降低了测量过程中的粗糙性。提供了对复杂细微颗粒处理的可行性,加快了分析处理速度并且可以直接或间接的获取人们所需要的信息。实现过程的实时监测和控制。

1.2 煤堆颗粒的图像识别系统框架

图像识别系统主要包括图像采集和图像处理两部分。图像采集主要由图像传感器来完成,图像处理主要由计算机和相应的系统软件来完成。框架如图1。

在煤堆里取样,用粉碎机磨制好煤粒粗样后得到煤的颗粒样本如图2。然后通过CCD图像传感器采集到图像,进行数字化处理后存入计算机,获取煤粒原始图像。再利用软件对数字图像进行相应处理得到相关图像参数,最后根据所得参数数据分析得出煤粒特性结论。

这里选用CCD传感器来获取数字图像如图3所示。CCD图像传感器是一种特殊的半导体材料又名电荷耦合器[2]。它由大量按矩阵排列的独立光敏元件构成。可直接将光信号转换为电信号,然后电信号经放大和模数转换后,实现图像的获取、存储、传输、处理和复现等操作。由CCD摄像设备采集的光学图像转成模拟信号经图像模数转换器进行数字化后,得到数字图像交由计算机处理。它最显著的优点是噪声低、响应速度快、像素分辨率高等。

1.3 煤堆颗粒图像的数字化处理

在计算机中利用软件对原始颗粒图像(图4)进行预处理。对于一张图像来说,往往需要提取目标物,所以先作灰度变换减少图像噪声,保证图像质量。每一副图像相当于一个矩阵,矩阵的行和定图像中的每一个点,矩阵中的元素值对应该点的灰度级。图像矩阵中的每个元素就是像素。颗粒本体灰度值与背景图层灰度值较为均匀,进行灰度变化后效果较好,灰度图有无明显的双峰。灰度变换不足以达到最终效果,需要对图像作二值化处理。手动改变图像阈值,颗粒图像二值化效果发生改变,当观测图像变化效果最为理想时停止改变,确定一个最佳的门限阈值。二值化处理后颗粒如图5。另外也可以选择自适应阈值分割,但是无法同步观察变化过程,且计算量相对较大耗时长,无法达到背景图层与颗粒本体二值化图像最佳效果。

2 煤堆颗粒特性分析

2.1 颗粒的形态描述

从颗粒的形态学切入,分析颗粒粒度及形状。粒度是颗粒在空间范围所占大小的线性尺度。通常表面光滑的球体颗粒的粒度用直径表示,立方体颗粒的粒度用边长表示。对不规则的矿物颗粒,可将与矿物颗粒有相同行为的某一球体直径作为该颗粒的等效直径。对许多取向混乱的颗粒按一定方向测量平均线度的统计作为当量径。由于获取的是颗粒投影图像,则可按二维投影规则对煤粒度进行定义[3]。

2.2 煤堆颗粒粒度相关参数

颗粒面积的计算,通过对图像像素点的统计得到。统计获得颗粒像素的个数后,还需要用一个标准单位来标定。通过比例换算得到目标颗粒实际面积大小。采用逐行扫描的方式对图像中每一个颗粒进行标号确定单个颗粒参数。这样每一个目标颗粒的参数都有一个归属,不容易产生混乱。

颗粒周长的计算可以通过对二值图像中目标物的边缘像素计算获得。依然可以采用顺序逐行扫描的方式对图像进行扫描。对图像边缘像素跟踪累加,统计像素个数可得周长。因此颗粒的当量直径可以根据颗粒粒度定义由面积和周长求得。此外还可以利用计算机图像系统对颗粒进行自定义多方向扫描,获取每一个方向上的粒径值再进行平均。用该平均值对粒径大小作粗估计值,这里并没有对此种方法加以详细证明。

这样就可以根据不同粒径的颗粒物在颗粒总体中所含的百分比来确定粒度分布。此外还可以根据颗粒粒度来进行颗粒分级,明确颗粒的层次关系。

3 煤堆颗粒与分形理论

3.1 分形理论的定义

分形理论是时下非常流行的新理论。分形理论的最基本特点是用分形分维的数学工具来描述研究客观事物。它跳出了一维的线、二维的面、三维的立体乃至四维时空的传统藩篱[4],更加接近客观事物和复杂系统的真实属性。

3.2 颗粒粒度的分形分析

在颗粒的形态特征中,主要讨论了分形分维的方法。把分形维数作为颗粒形态描述的一个重要角度。分形维数在一定程度上体现了颗粒的某些化学物理特性。实际测定分维的办法有很多,如根据尺度、测度关系、相关函数等。针对颗粒的不同特征可以建立不同的分形模型。对于无规颗粒具有如下分形特征式:

①根据边缘进行分形分析,颗粒的无归边缘曲线可利用盒维数[5]计算得分形维数。与边缘线相交的正方形个数记为盒子数N(如图6盒子数为16),盒子大小为k*k,k即盒子的边长。存在推导关系式:-;D记为分形维数,B为常数。通过推导关系计算拟合数据可得到分形维数D。在对k取值时,k值越小所能取到的盒子数也越多,边缘分形结果越精确。理论上颗粒边缘复杂程度越大,分形维数值越大。边缘分形维数体现颗粒的轮廓曲线特点。这里取了4个不同颗粒样本进行了图像处理后,经过计算分别得出4个样本的分形维数,进行比较。

从表1中可以看出颗粒边缘分形维数变化不是特别明显,原因可能与所取的盒子边长k有关。还需要结合其他形状参数来进行特征描述。说明仅仅利用颗粒边缘分形分维作为煤粉颗粒特性标准描述有待改进。

②根据颗粒粒径分形有关系式:-。是粒径分布分形维数,R是粒径大小,为粒径大于R的颗粒数。同样可以通过拟合数据计算得到颗粒粒径分布分形维数。在选取了3组颗粒图像进行了颗粒粒径分布分形维数计算后得到相关参数如表2。

从表2来看,粒径分布分形很大程度上与颗粒数目有关。分形维数是根据统计粒径R以及对应的颗粒数目N进行拟合后得到的直线斜率。尽可能的选取较多的颗粒图进行计算,分形维数越准确粒径分布分形偏差越小。颗粒粒径与分布分形维数呈负相关关系,粒径越小分布分形维数越大,粒径分布随粒径减小呈现的分形特征越明显,反映煤堆颗粒粒径分布越复杂。

5 结语

对于煤堆颗粒的识别,采用数字图象处理技术能够提高识别检测的速度,同时还可以减小大量人为干预造成的误差,避免检测重复性低等缺点。对于煤炭行业提高燃煤利用率和降低污染有着重要的意义。本文主要通过图像灰度变换、图像分割等方法对煤粒图像做处理。同时结合分形理论进行分析,得到煤堆颗粒粒径分布分形等参数,说明了颗粒分形的可行性并对煤的颗粒分形特征进行描述。但是在粒度形态识别中只是对二维投影图颗粒粒径做了说明,还可以从形状因子等参数考虑,综合描述颗粒特征。对颗粒分布分形也不完善,需要做进一步研究。此外,如何更好的提取颗粒的边缘轮廓,找到颗粒新的参考特性以及分形与工业分析之间的关系是下一步探讨的方向。

参考文献

[1] 苗春卫,李玉祥,王克家,等.基于数字图像处理的煤粉颗粒检测[J].应用科技,2003(2):1-3.

[2] 青.基于分形理论的大气悬浮颗粒物图像识别[D].武汉:武汉理工大学,2006.

篇(9)

1 引言

近年来,人们提出了许多方法用于检测和跟踪序列图像中的运动目标,但是由于受到计算机速度和算法复杂度的限制,使得在检测和跟踪运动目标的实时性和鲁棒性方面总是不太理想。同时在设备不断小型化、集成化、网络化的今天,FPGA由于其可编程的特点成为嵌入式开发的最佳平台。因此,本设计核心模块为Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心处理器,以提高系统的整体的性能。[1]

2 系统工作流程和原理

系统主要由一体化摄像机、高速数字云台、视频解码器SAA7113H、图像存储器SRAM,FPGA控制器、以太网模块、监视器、报警模块等部分构成。

该跟踪系统的工作过程为:系统开机后FPGA加载程序,然后根据算法对采集到的图像进行处理,获得控制云台的参数并传递给云台控制器,从而跟踪目标运动。具体实现过程:摄像头安装在跟踪转台上,摄像头输出的电视制式的信号(含有图像和同步、行场消隐信号)一路送到监视器上进行实时监视,另一路经过视频预处理,经过SAA7113变换后送入图像处理单元FPGA进行图像处理,图像处理单元首先形成一个检测(波门)窗口,然后在窗口中检测、识别、提取出目标图像信号,确定出目标在当前帧观测图像中的精确坐标,经计算得到相对于摄像头瞄准线的偏差量,送至伺服机构,云台输出控制信号控制步进电机转动,带动云台上的摄像头转动,使目标始终处于视场中心,从而达到跟踪的目的[2]。通过以太网上传目标坐标数据,用于进一步分析。

3 装置硬件的具体实现

本装置对核心处理器、视频解码芯片,以太网模块等器件的选择关系到整个装置的性能和价格,即选择性能价格比高且能满足设计需要的器件。

3.1核心处理器选择

处理器需要根据算法及实际被测目标对处理能力的要求来选择。目前的处理器主要有单片机、ARM、DSP、FPGA等等。本装置核心模块主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,该芯片有149760个逻辑单元,RAM 635520 bit, 8个锁相环,用户I/O 508个,芯片具有很高的性价比,还支持SOPC ,从而完成各模块功能,并协调整个系统工做。芯片功能很强大,为以后系统升级,算法改进,数据量增大提供很大空间。

3.2 视频解码芯片SAA7113 和以太网W5100配置

为了使视频解码芯片SAA7113H可以按照预想的方式工作,需要对其进行初始化,视频解码芯片为I2C串行总线,在上电后首先修改SAA7113H的内部寄存器的数值,进行正确初始化[3]。

W5100是一款多功能的单片网络接口芯片,内部集成10/100以太网控制器,内部集成为全硬件形式,且具有经过多年市场验证的TCP/ IP协议栈,太网介质传输层MAC和物理层PHY 硬件,TCP/IP等协议已经在很多领域经过多年验证[4]~[5]。

W5100内部集成有16KB的存储器用于数据传输,使用W5100不需要考虑以太网的控制,只要进行简单的端口SOCKET编程。此外,其接口非常简单,可选择SPI接口。

对上述两个模块的设计采用SOPC方法,SOPC是一种用于嵌入式开发的片上可编程系统,设计灵活,可剪裁,可升级软硬件在系统可编程的功能,运用FPGA 的NIOS II 对 I2C,对SPI口配置过程为:运行QUARTUS II 软件中的SOPC BUILDER 添加I2C,SPI 模块,从而构成功能强大的32位NIOS嵌入式系统。

4 目标的跟踪定位

确定目标位置的方法分两类,即波门跟踪和相关跟踪算法。本文采用形心跟踪算法,该算法对跟踪窗内的数字图像处理得到一阈值,再从跟踪窗内的数字图像中分割出目标像元,然后根据分割出的全体目标像元位置数据和目标像元的点数,计算出目标的形心,目标的形心相对于视场中心的位置数据则作为目标偏差数据[6]。

5 结论

本文介绍了一种移动目标跟踪装置。该装置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N为核心处理器。通过以太网上传的跟踪信息来看,看该系统取得了较好的跟踪效果,实验结果证明该装置能够很好的适应目标检测和跟踪算法,该装置对运动目标监视和跟踪产品有一定的参考意义。

参考文献

[1]杨宜禾,周维真.成像跟踪技术导论[M].西安电子科技大学出版社,1992.

[2]王栓,艾海舟,何克忠.基于差分图像的多运动目标检测与跟踪[J].中国图形图像学报,1994(6).

[3]郝迎吉,刘青,徐凌志.基于EPP和FPGA的CMOS图像传感器的数据采集[J].电子设计应用,2002(01).

[4]黄钉劲,阮照军,王刚,郭小莉.基于FPGA的图像采集与远程传输系统设计[J].西安工业大学学报,2008.

[5]放璐,杨天怡,牟万军.数字图像远程监控系统的组网方式[J].电子产品世界,2002(21).

篇(10)

[2]/swt/[OL]

[3]Steve Northover,Mike Wilson.SWT:The Standard Widget Toolkit,Volume 1[M].Pearson,2004,7:2

[4]Rob Warner.The Definitive Guide to SWT and JFACE[M].Pearson,2006

[5]戴歆.Java Swing程序开发[J].软件导刊,2007,17

[6]争雄,刘特,童C.利用Java Swing轻量级组件开发的网络流量账务系统[J].计算机工程,2002,12

[7]钟声,赵荣彩.JAVA语言中的本地方法[J].计算机应用,2000,2

免责声明以上文章内容均来源于本站老师原创或网友上传,不代表本站观点,与本站立场无关,仅供学习和参考。本站不是任何杂志的官方网站,直投稿件和出版请联系出版社。

上一篇: 生态环境的特点 下一篇: 工业节能方法
相关精选
相关期刊
期刊推荐 润色服务 范文咨询 杂志订阅