没有登录 用户中心
您的当前位置:通信工程 > 图像视频分类检索系统的研究现状

图像视频分类检索系统的研究现状

随着互联网技术的飞速发展,互联网用户可以通过网络获得大量的信息。为了更快更好的获取信息、利用信息,常常需要对信息进行预处理加工,其中一项非常重要的加工预处理方法是图像分类技术。图像分类技术起源于上世纪70年代,由于数据库技术和计算机显示技术的快速发展,使得大规模的图像检索过程得以实现,这个时候便出现了图像分类技术[1]。比较早期的图像分类技术是基于文本的,但是在信息快速膨胀的时代,基于文本的信息无法随时更新所有图像信息,因此变得不再适用于当前的技术。随着基于图像自身内容的分类系统的快速发展,使得这项技术成为图像分类技术中的主流技术,并出现了一系列的算法。

上世纪70年代,图像分类主要依靠人工标注的方法,使用的是基于文本的图像分类模式。但是伴随着信息的快速膨胀,视频、图像资源迅速增加,这个时候人工标注每一个资源已经变得不太可能,因此对图像库进行复杂检索和操作成为当今研究领域的重要课题。很显然这种基于文本的图像检索系统不能很好的实现检索的要求,因为不同的人对相同的内容有不同的描述,即使同一个人在不同的时期也可能因为检索的目的不同而对相同的内容有不同的描述。正是因为基于文本的图像信息检索技术已经不再适用于当今时代,人们才开始逐渐将研究的重点转移到基于图像内容分析的自动分类研究上。

基于内容的图像分类系统,克服了传统基于文本图像分类技术的局限性,它利用图像本身的颜色、形状、纹理等视觉特征代替传统的手工添加关键字信息进行分类的技术,直接对图像内容进行分析,抽取特征和语义,利用这些特征和语义进行分类并建立索引,进行检索[2]。目前人们已经将研究重点转移到从图像的视觉内容中自动提取图像特征用于分类及检索上,并且已经开发出了各类基于内容的图像视频分类检索系统。

图像分类是多媒体图像检索的重要步骤,现在典型的分类方法有以下几种

(1)贝叶斯分类方法

这种分类方法主要思想是:先计算每个训练集的类分布,把这种分布当作每个类别的概率分布,然后利用数理统计学以及概率论中的贝叶斯定理来估算某个特定的样本属于哪个类的概率。贝叶斯方法可以分为贝叶斯信念网络和朴素贝叶斯方法两类。在目前的大规模数据分类问题中,应用较多的贝叶斯分类方法是贝叶斯信念网络,但是这种方法的训练比较复杂,评估函数较难选,这是需要研究解决的[6]

(2)神经网络分类方法

神经网络是模仿人脑由一系列基本单元组成,每个单元关联一个权值。在训练阶段,改变权值可以猜测样本的正确类标号。由于神经网络的复杂,需要长时间的训练,因而更适合于有足够长练时间的应用。它的大量的参数主要靠经验来确定。神经网络是模拟人脑神经元结构的基础上建立的三大类神经网络模型:前馈式网络、反馈式网络、自组织网络。以函数型网络为代表的前馈式网络,用于预测、模式识别等方面;以连续模型为代表的反馈式网络,分别用于优化计算[7]

(3)支持向量机方法

源于统计学习最优化理论的支持向量机主要研究如何构造学习机,如何实现分类的问题,它的思想就是根据风险最小化原则构造最优超平面使得分类间隔。SVM就是选择合适的VC维,在适当数量的样本情况下,在经验风险和置信范围达到一个折衷,使每一类别数据之间的分类间隔最大,从而使实际风险变小。对于线性不可分的数据,按照Cover定理,将低维空间不可分数据映射到高维空间中。由于支持向量机算法是关于求最优化的问题,所以求得局部最优解也就得到全局最优解,这是其优于其它学习算法的地方。SVM一开始是研究解决两类问题的,但现在人们碰到的很多都是多类问题,因此前SVM研究热点的如何构造多类分类器[8]

(4)粗糙集分类方法

粗糙集理论是上世纪八十年代:协由Paw]ak.Z针对边界域思想提出的n0。,它引入代数学中的等价关系来解读知识,从新的角度定义了知识。粗糙集理论精髓是在保证准确分类的前提之下,通过对知识的加工处理,从而更好的获得对分类的方法。由于粗糙集理论的研究与应用局限于由数据所给出的这些知识问题进行处理,所以对于图像分类处理的问题还是新的研究课题。但是随着随机集理论在图像处理中的成功应用,以糙集理论与随机集理论结合的研究也有望在图像处理中得到应用。分类方法各有其优缺点,但基于统计学习理论的支持向量机分类方法是图像[9]


相关阅读

图文聚焦

新闻评论