当前位置:起点学习辅导网学习辅导毕业论文毕业论文提纲本体支持的视频语义概念探测

本体支持的视频语义概念探测

01-01 20:12:54浏览次数:402栏目:毕业论文提纲
标签:论文提纲格式,毕业论文提纲范文,暂无联系方式 本体支持的视频语义概念探测,

1 引言视频语义内容分析的目标是抽取视频包含的高层语义内容,为用户提供语义概念的视频浏览、检索服务,语义概念探测是实现这一目标的核心步骤,并成为近期视频语义内容分析领域的重要研究方向。

  以往的视频概念探测主要采用基于内容的方法,即通过抽取概念具有的低层特征,学习某种关联模型(基于规则的或是基于统计机器学习的),直接的、独立的建立低层特征与概念之间的关联,探测视频概念。

  基于规则的方法是在抽取特征的基础上,对特征进行简单或者复杂的阈值判定。这种关联模型的缺点是阈值确定难、算法不鲁棒,并且简单的阈值判断难以有效的表征概念具有的特征多样性。因此,目前采用较多的是基于统计机器学习的关联模型,即通过某个机器学习模型学习标注的样本数据中低层特征与视频概念之间的统计概率关联模式,然后采用训练好的机器学习模型对新的样本进行识别,探测视频概念。目前的研究表明,支持向量。

  和最大熵模型(Maximum Entropy Model,简称MEM)是两类较为有效的用于概念探测的机器学习模型。

  但是,由于语义鸿沟的存在,低层特征和高层语义的关联并不是一一对应。不同的视频概念可能具有相似的低层特征,相同的视频概念也可能具有完全不同的低层特征,基于内容的独立概念探测方法难以克服这个问题。另一方面,视频中的概念并不是独立出现的,不同的概念总是同时出现在视频帧序列中。显然,不同概念的共现性将增加低层特征模式的复杂性,进而影响独立的概念探测性能。但是,从另外一个角度思考,不同概念间的关系信息也为概念探测提供了重要的上下文信息,例如:包含“汽车”概念的视频片段,具有很大的可能包含有“道路”概念。重要的是如何有效的建模和利用这些信息。

  针对语义概念探测存在的困难,本文提出了本体支持的视频语义概念探测方法。一方面通过定义中层语义以减小语义鸿沟,建立低层特征与高层语义关联的桥梁;另一方面利用概念间的关系和上下文语境,在概念探测中加入语义线索,提高概念探测器的语义识别能力。查看更多网络营销毕业论文。

  而本体作为合适的知识建模工具可以有效的描述视频语义内容和建模领域知识,因此利用本体增强概念探测的语义表达和识别能力是必需的也是可行的。

  2 本体支持的概念探测框架视频内容跨越了低层感知特征、感知特征模式、简单语义概念、复杂语义概念诸多层次,并不是简单的特征层和语义层就能表示的;更为重要的是,这种层次结构建立了视频内容从低层特征到高层语义的内在关联过程,为跨越语义鸿沟提供了有效途径。另一方面,视频语义内容分析的本质就是各个层次内容的分析抽取和各个层次之间关联的建立。

  基于以上分析,定义感知概念和语义概念如下:

  定义 1 感知概念 (Perception Concept)感知概念是视频中特征相似、反复出现的感知特征模式的抽象。这里的低层感知特征模式指视频流中具有相同视觉或听觉特征模式的时序或空间分割,例如:具有相同颜色特征的区域、具有相同音频特征的视频片段等,是语义概念在低层感知特征空间中最基本的表征。

  定义 2 语义概念 (Semantic Concept)语义概念对应视频中的特定时间片段或空间区域。语义概念是用户分析视频内容时关心的基本概念;从低层特征上看,语义概念具有明显的、容易区别的低层感知特征模式,能够表现为一个感知概念或多个感知概念和其关系的组合。

  在上述概念定义的基础上,提出视频领域知识本体和视频概念扩展本体建模上下文信息和视频低层特征与高层概念的关联关系。

  定义视频领域知识本体(Video Knowledge Ontology,简称VKO)为一个二元组,表示视频领域知识中的概念的集合和概念间关系的集合。概念表示为一个五元组:名称、标签、关系集、同义词集、描述文本;概念间语义关系包括四类:Kind ? of 关系、Instance ? of关系、Part ? of 关系、Attribute ? of 关系。需要指出的是,在实际知识建模过程中,概念间的关系不限于上述定义几种基本关系,可以根据目标领域的具体情况定义相应的关系。

  其中,VLO (Video Linguistic Ontology),表示视频概念扩展本体中的语言层本体,即视频内容中的语言级概念和概念间关系的集合。这里的语言级概念对应于视频内容层次结构模型中定义的视频概念。 www.qidian55.com哦

  VPO(Video Perception Ontology),表示视频概念扩展本体中的感知概念层本体,即视频内容中感知特征层中蕴含的感知特征模式和其关系的集合。

  语义概念的探测应该从两个方面进行考虑。一方面是发现概念具有的低层特征模型,称为特征匹配。感知概念的抽象和定义建立了低层特征和视频概念两个层次之间的中间语义,避免直接建立低层特征和视频概念间的关联,减小语义鸿沟问题带来的影响。从低层特征角度看感知概念是低层特征模式的抽象,具有特征稳定性和一致性;从高层语义角度看,视频概念总是表现为若干感知概念的组合,因此感知概念也具有一定的语义。因此,首先抽取视频概念关联的感知概念,然后从感知概念中抽取低层特征训练统计机器学习模型,识别语义概念。

  另一方面是建模并利用上下文信息增强概念探测方法的语义理解和识别能力,称为上下文信息匹配。提出的视频概念扩展本体的语言层定义了概念之间的关系,同时“概念描述”、“同义词集”、“关联概念”等概念描述属性完整、准确的描述了概念包含的上下文信息。

  同时,利用VOCR 和语音识别技术可以从视频片段中抽取文本信息,这些文本信息中出现的概念术语为语义概念探测提供了语义线索,能够增强概念探测的准确率。本文提出的本体支持的概念探测方法。

  视频概念探测主要分为三个部分:上下文信息匹配、特征匹配和匹配结果融合。在上下文信息匹配中,一方面通过VOCR 和语音识别技术从视频片段提取文本信息,另一方面通过视频概念扩展本体的定义获取待探测概念的描述和与其关联的概念,则二者的相关程度暗示了待探测概念出现的可能,上下文信息匹配将定量计算这种相关程度。特征匹配根据低层感知特征相似性计算视频片段中包含视频概念的可能性,首先通过视频概念扩展本体的定义获取待探测概念包含的感知概念,然后抽取视觉对象特征训练概念分类器,计算视觉对象匹配程度,同时统计视频片段包含其他感知概念的情况,计算其他感知概念匹配结果。最后,通过一种融和策略,对匹配结果进行融合,融合结果表示概念探测结果。

  3 上下文信息匹配语义概念具有的上下文信息包括两个方面,一是概念本身的描述所蕴含的上下文信息。

  本文在视频概念扩展本体中定义概念描述包括两个部分,一是对概念的内在性质、外在属性的详细阐述,可以帮助人们更好的理解概念;二是概念具有的同义词集,即表达同一概念的不同语言术语。例如可以将概念“爆炸”描述为:在巨大响声过后出现火光和浓烟。根据上述概念描述,如果在文本信息中探测到响声、烟、火等术语,则表明很可能该段文本对应的视频片段包含有“爆炸”概念。又如概念“美国总统”可以使用不同的语言术语表达,如“乔治.布什”、“美国国家元首”等等,如果在文本信息中探测到某个概念具有的同义词术语,则表明该段文本对应的视频可能包含有该概念,而且同义词出现的数量和频度在一定程度上反映出该概念出现的可能性大小。

  另一方面的上下文信息表现为概念间的关系。视频概念扩展本体中定义了两类概念间关系,一类是语义关系,主要包括Kind-of,Instance-of 和Part-of 三类父子层次关系;另一类是概念共现关系,定义为不同的概念在视频中同时出现的概率大小。容易理解,具有强共现关系的概念趋向于同时出现,因此一个概念的出现可以作为另一个概念探测的有力线索;语义关系表征的是概念间的语义相关性,而从自然语言的特点来看,语义相关的概念的出现具有集中性,因此概念语义关系为概念探测提供有用的上下文信息。

  3.1 文本匹配文本匹配通过计算概念描述文本与视频片段包含的文本之间的相似性来判断视频片段包含该概念的可能性大小。

[1] [2] [3]  下一页

,本体支持的视频语义概念探测
《本体支持的视频语义概念探测》相关文章
给资讯打分:
网友评论: