搜索视频的"内心"

2007-06-05 | 作者:微软亚洲研究院

 文:《互联网周刊》记者 
李洋 
 
     
什么是互联网上最火爆的词汇?
答案不一而足,但“视频”一定是其中之一。随着摄像手机、DV等个人视频设备的普及,以及互联网宽带的应用,越来越多的视频内容走向互联网。视频搜索的应用已经被提到一个日程,但目前市场上的产品还并不能让人完全满意。怎么能做到精确地搜索?如何快速了解视频结果内容?《互联网周刊》记者李洋通过对微软亚洲研究院华先胜研究员的深入访谈,为大家揭开了视频搜索的“内心”。

 


   找到被忽略的“猫”

    即使是一段时长仅为五分钟的视频,也可能包含着诸多内容,比如,山水场景、人物对话,甚至还有一只卧在角落里的猫。如果这段视频的主题跟这只猫毫无相干,那么它肯定不会被人工编辑在这个视频文件的名称及说明当中。也就是说,在以文字为索引的视频搜索引擎中,是不可能搜到这只猫的。当然,很多类似的细节信息也都被“遗忘”了。 

 

 
  与文字和图片相比,视频作为一个图文、声音集合的时间序列,对搜索技术的要求更高。在目前的市场上,大部分视频搜索引擎所采用的几乎都是文本索引方式。那么,有没有更好的方法,让我们能够搜索到更多的细节呢?微软亚洲研究院研究员华先胜介绍了一种能够真正“搜索到视频里面去”的索引方式。

 

    这种基于“内容”的索引方式,会首先教搜索引擎“认识”一只猫的形象,并把其“翻译”为文本,以此建立索引。这样,当某个视频文件内出现猫时,它便能够自动识别。与此类似的,想要搜索一场体育比赛中的某个环节,也可以轻松实现。比如,如果要搜索棒球比赛中的“投球”(pitch
view)动作,即把“球从投球区投给击球手”的一幕,通常视频的文字不会细致到描述这一动作,而通过这种内容索引的方式则可以准确查到。

搜索视频的

   

  
 内容索引作为文字索引的有效补充,可以使搜索引擎实现更为精确的查询。而上述这些操作有个前提,即需要人为地设定一些训练数据,让搜索引擎进行“学习”,也就是说,要让其“知道”什么场景才是“投球”。据微软的专家介绍,未来将可能完全脱离训练数据,让搜索引擎直接通过网络进行智能学习。

 

    剪辑式呈现

    当你得到搜索引擎列出的一大堆杂乱无章的结果后,另一个问题出现了:“究竟哪个才是我想要的?”在实现了精确的查找后,未来的视频搜索引擎要做的另一件事情就是良好的呈现——要让用户快速地了解一段视频完整的内容。

 

    现实中,你在使用视频搜索时往往会碰到这样的情况,明明搜索的是“足球(Soccer)”,但除了你想要的一些精彩比赛片段外,系统可能还列出了有周星驰的《少林足球》,甚至是“小贝”的娱乐视频新闻。针对这种情况,微软亚洲研究院在搜索结果中实现了类别细分的功能,可以按照时长(duration)、类型(genre)、格式(format)等分类标准进行过滤。每个标准下包含几个细分的类别,比如,选择“类型”后,可以按照“体育”、“电影”、“新闻”等类别细分。这样一来,杂乱的结果就变得清晰了。

 

    由于网上的很多视频是基于HTTP协议的,这意味着每播放一次视频,都要重新下载、从头播放,即只能顺序播放,无法实现跳转。而微软亚洲研究院目前有一项技术可以实现HTTP下的自由跳转。

 

   
据华先胜研究员介绍,视频呈现中的关键点是视频摘要技术,目前微软亚洲研究院共研究出了
5种视频搜索结果呈现方式,不仅能够动态定位到关键字所在的那一关键帧,而且能让你在该页面下进行1030秒的播放预览。其中,有一种列表呈现方式,除了提供一个“动态略缩图”外,还像DVD的播前浏览功能那样,把每个视频分为可独立播放的五个章节。这样一来,用户就可以大致了解这个视频文件的内容了。而使用该技术所提供的可伸缩呈现方式,则可以实现个性化的片断细分,比如,当你选择按“×4”方式呈现时,原视频即被分为32个剪辑片断呈现出来。

 

    这并不是全部。这种未来的搜索引擎还加入了Web2.0元素—用户可以对一段视频中的某(几)段剪辑,建立个性化注释标签(Tag),并可收藏及分享。这种功能将大幅改善现有视频共享社区的用户体验、增加用户粘性。

 


    改良版视频广告

   “锵锵三人行,广告之后见。”观众们总是很想知道,说完这句话后,窦文涛和嘉宾们到底聊了些什么——电视台是严格按照时间来插播广告的,即当节目播到一个固定的时间点,就要插播广告,而且其内容是面向所有用户的,不一定与节目直接相关。

 

    互联网为视频广告提供了更为灵活、个性化的条件。作为最主要的盈利手段,它将直接影响在线视频的发展。但由于受到技术发展的限制,目前市场上的产品还只能做到在一段视频的头、尾位置插入广告,无法做到与视频内容相匹配、智能插入。

 

    为此,微软亚洲研究院正在研发一种结合搜索的视频广告平台,可以突破现有的按时间插入的广告模式,从用户体验和广告主利益两个角度出发,实时地在一段视频内容中合适的位置处插播合适的广告。此外,视频广告在环绕文字及场景替换方面也有待进一步的研究。

 

搜索视频的

标签