页面的手机瘦身术

2007-07-16 | 作者:微软亚洲研究院

   
在移动搜索时,如何让那些为PC设计的万维网页在手机上良好地显示?这或许是现在几乎人手一机的移动时代里,大家都非常关心的一个话题。针对这一问题,《互联网周刊》记者李洋采访了微软亚洲研究院互联网搜索与数据挖掘组的谢幸和辛国茂两位研究员,看看他们对页面在手机上的显示究竟做了哪些“整容”研究?

    
                                                                                                            摘自《互联网周刊》记者
李洋

 

  你是不是也曾经对着手机上那些挤做一团的网页皱过眉头?我们在手机上搜索万维网页时,常常会碰到这样的麻烦。搜索列表通常可以正常显示,但是当离开搜索引擎页面,点进其中一条链接时,你花时间和流量所下载的页面,却常常无法正常观看——要么横向的滚动条被拉得很长,要么页面被挤成一团。

页面的手机瘦身术

  (谢幸研究员在微软技术节上给观众做演示)

 

   
这是因为,一般的网页都是按照PC屏幕分辨率设计的,所以无法自动适应手机的小屏幕。为了解决这个难题,很多公司想出了不同的做法。比如,Opera公司正在研究一种自动缩放页面大小的浏览器;还有一些公司在页面设计上下功夫,让代码能够识别用户的上网设备从而有针对性地显示,但这无疑对其网站代码的编写提升了难度;而专为手机而推出的移动域名.mobi,则必须以无线互联网的内容极大丰富为前提。

 

  在未来,手机有望取代计算机而成为人们接入互联网的首选设备。但是在此之前,上述的难题必须要获得很好的解决。目前,微软亚洲研究院有一项移动搜索(Mobile
Search)研究成果,已经可以实现手机上大页面的正确显示。谢幸研究员和辛国茂研究员向《互联网周刊》介绍了这项已经在微软的英文移动搜索平台上获得的应用技术。

 

  当你在手机上使用微软的Live移动搜索时,在结果列表页面点击其中的某条链接后,系统会先对其进行一系列的分析—将其拆分成为若干块,自动判别并显示该页面中最重要的一块内容(比如,头条新闻),其余部分均以链接形式放在页面底端,供用户查看。比如,当你访问CNN时,系统会把其当日的一个最突出的新闻显示在手机上,并将其余的新闻内容、导航条和广告等内容分别以带有关键字的链接形式放在该条新闻的底端。通常的新闻网页会被拆分为几块至十几块,网页包含的内容越多,其所分的块数也随之增多。

 

  将某一大的页面重新组织并显示到手机上时,系统将保证内容不做横向滚动,以提高阅读体验。与那些将网页转成纯文本形式再显示的方式不同,这一技术仍可保留原页面的元素,比如导航、广告等。被拆分的各个块都有简介,用户可以根据其介绍有选择性地进行查看。

 

  这项技术中最大的难点在于领会原页面编写者的意图,以判断将页面分成几个板块,并将每一块按照新规则显示出来。尽管各个网页看上去都不太相同,但是在导航条和广告方面的设计,视觉上大都存在着共性。

 

  因此,这项技术采用了视觉和内容相结合的方法。首先,要根据用户阅读习惯,从视觉上分析一个网页可分为几块。它的原理是,先通过人工标注一些具有特征的块,比如内容块、广告块等等,作为训练样本,然后让机器学习,最后可获得一些模型。当分析某个网页时,便将其各个部分与模型进行比对,看它像哪个块。

 

  从视觉上分好块之后,还要实现内容上的再构造。每个网页的HTML代码都可以看作一个树状结构,树上带有各个节点的信息,比如颜色等。系统要先将一个网页在内存中迅速构造为一个树状结构,但并不输出显示,而是根据需要有选择地将其重新显示在手机屏幕上。实际上,把一个网页构造成一个树状结构的工作量并不亚于一个普通浏览器的解析过程。目前,这项技术已实现几个毫秒处理一个网页,这个速度还是很可观的。

 

  当然,这项研究也存在着有待进一步研究的方向,比如,对于一些带有JavaScript脚本、Flash和Word等复杂页面的支持。此外,将来还有可能将这一技术集成到手机浏览器的后端服务器中,以便实现直接的网页访问,而不用再像现在这样在搜索列表里访问页面。

 

  
 想了解该技术的更多内容,请登陆
http://m.live.com


 

标签