未来智库 > 人工智能论文 > 【语义图像检索中人工智能的应用】
    [关键词]人工智能 图像语义检索 人工神经网络 遗传算法模糊逻辑
    中图分类号:TP3文献标识码:A 文章编号:1671-7597 (2008) 0220006-01
    
    语义图像检索是一种在互联网上进行图像检索的新方法,它是根据图像的逻辑特征和抽象属性进行检索,使计算机检索图像的能力接近人的理解水平的检索技术,但如何来提取语义特征,目前还处于研究和探索阶段,所以本文利用人工智能方法来解决图像检索的语义特征提取的问题。
    根据模糊逻辑、遗传算法和人工神经网络的特点:人工神经网络具有学习、联想、容错等能力,擅长于直接从数据中进行学习;模糊系统具有较强的推理能力,擅长于描述和利用学科领域的知识;遗传算法具有自组织、自适应和自学习等智能特性,擅长于求解全局最优问题。本文将三者融合在一起,用以进行语义图像检索中语义特征的提取。
    
    一、利用遗传算法进行图像的分割,以便有效地获取图像的语义信息
    
    图像分割是从背景中将感兴趣的目标分割出来,将各像素分类,分类所依据的特性可以是像素的灰度值、目标的面积、速度、颜色及空间,纹理特性等,这里可以利用多特征参数编码基因串进行优化分割。在遗传算法中,染色体的长度是根据所解决问题的需要定的,并根据每个子串所代表的意义作相应的解码,从而通过遗传算法找到全局最优值。
    
    (一)建立由字符串组成的初始群体
    图像分割中,设定人口数为2O,繁衍代数为4O,由于分割电平的灰度值在0~255之间,可把每个染色体成员编码为8位0,l符号的二进制串,它代表某个门限值。这些门限的初始值是随机的,相应的适应度也各有高低。紧接着遗传算法对染色体解码,并求其适应度值。由适应度值进行染色体优胜劣汰的选择,被选中的染色体作为父代。经过不断进化,到最后一代,染色体已基本收敛,其适应度也达到最佳值,这时就得到了最佳门限。
    
    (二)适应度函数的设计
    适应度函数相当于现实世界中生物进化的环境。环境的好坏直接影响到生物进化的结果。这里我们采用otsu 法进行图像分割时的适应度函数公式:f=w0(u0-v)2+w1(u1-v)2,其中w0和w1分别表示其灰度值小于门限k和大于门限k的概率和;u0和u1分别表示上面2个区间的平均灰度值;v表示整幅图像的平均灰度。f的值越大,则表示分割的质量越好。
    
    (三)根据遗传概率,利用下述操作产生新群体
    这里包括3个操作器。即复制,单点交叉互换和位变异。其中操作器的参数设置为交叉互换率0.65,位变异率为0.008,而操作数的负载,即人口数设为20。交叉互换是用下述方式重新组合两个父体以形成两个子体。它允许有利的新特征迅速组合。互换操作是按一定概率进行的,互换率越大,互换操作的可能性也就越大。
    
    二、利用模拟系统和神经网络的融合来使图像的语义进行自动标注
    
    一般说来,用户在检索一幅图像时,比较关心的是图像的语义特征。其训练方法是基于预先给定的评价函数的极小化,其本质也是用形式和数目预先确定的多个函数(即隐层单元的输出函数)的组合去逼近建立样本和其类别的映射。用经过上节利用遗传算法分割出的样本为初始样本,然后用样本数据本身来逼近它在空间的分布状况,并以此为依据来构造神经网络。用其神经元覆盖区域的组合近似“勾勒”出各类样本的几何区域。而当判断一个新的样本属于哪一类时,只需分别计算该样本对各几何区域的隶属度,隶属度大的区域对应的类别就是答案。
    我们引入关键词来描述一幅图像的意义,而同一幅图像可以用许多意义相近的关键词来描述,这给关键词匹配和管理都带来了困难。为此,用两个层次上的关键词来描述一幅图像。首先,用图像的分类信息来表示它的第一层语义,对于系统中某些语义不明确的图像,可以将其分为很多类,并用多个关键词来描述第一层语义。第一层所用到的关键词可以采用一些大家广为接受的分类目录,这样可以限制该层分类词的数目。在语义描述的第二层,用户就可以用各式各样的关键词对该图像加以描述。采取这样的策略在一定程度上克服了由同义词以及其它原因造成的关键词的多样性。
    
    (一)为了获得图像的语义信息,根据用户的反馈来修改图像对应的关键词及其权重
    其过程为:
    (1)系统初始时,将每幅图像所关联的关键词的权重都设置为“1”,表明与该图相关的所有关键词的重要性都一样。
    (2)每次用户查询和反馈后,收集好用户给出的查询关键词和正负反馈图像。
    (3)对于每个用户提交的查询关键词,先查看系统关键词数据库,是否有对应的词,如果没有,则在关键词数据库中建立相应的项和对应的链接。
    (4)对于所有正反馈的图像,先查看与每幅图像所关联的关键词中是否存在用户提交的查询关键词,如果有,则将该关键词对应的权重加“l”,否则,就将查询关键词加入该图像库中,并给该词赋予权重“l”。
    
    (二)为新图像添加语义标注策略
    (1)将未进行标注的新图像都存放在一个特定的目录中,当新图像通过用户反馈后获得语义信息以后,就将该图从目录中移出,这样做可以直观地了解图像库中新图像语义标注的情况。
    (2)对该目录中的每一幅新图像,首先计算它与图像库中每幅图像的视觉特征相似度,然后统计前n幅相似图像的关键词,并把前面的关键词作为新图像的关键词并赋予权重大项目0.5。
    (3)在每次反馈的过程中,检查新图像的关键词权重,如果某个关键词的权重超过了给定的限值,则将该关键词作为图像确定的关键词,并删除(2)中估计出的其它关键词,同时将该图像从新图像目录中挪到指定的分类目录中。
    
    三、利用模糊逻辑、人工神经网络和遗传算法三者的融合来提取图像的语义特征
    
    模糊逻辑在处理不确定的模糊信息方面具有极强的推理能力并能揭示人类的经验和常识。神经网络具有强大的学习能力,以上两者的融合就可构成既具有模糊逻辑推理的强大结构性知识表达能力,又具备神经网络强大学习能力的神经模糊网络。遗传算法由于其自身的特性可采用随机且有向的搜索机理来获取全局最优解,因而在神经模糊网络的结构中遗传算法可起到强大的促进作用。因此本文提出的三者融合可实现语义图像检索的语义特征提取,使建立的系统具有动态扩充图像语义检索知识并具主动获取图像语义特征的能力。
    
    参考文献:
    [1]王惠锋、孙正兴、王箭,语义图像检索研究进展[J].计算机研究与发展,2002,39(5):513523.
    [2]王毅.人工智能技术在仪器与测量中的应用[J1.西安交通大学学报,2002,36(3):318321.
    [3]张磊,林福宗,张钹,基于前向神经网络的图像检索相关反馈算法设计[J].计算机学报,2002,25(7):673680.
    作者简介:
    杨潇,女,九江学院信息科学与技术学院,研究图形图像,人工智能方向。

转载请注明来源。原文地址:https://www.7428.cn/vipzj17170/
 与本篇相关的热门内容: