|
|
|
语义智能搜索时代来临http://www.sina.com.cn 2007年11月26日10:24 青年参考
编译刁海鹏
当人们在电脑搜索框中输入“苹果”两个字,汹涌而来的各色信息让我们头晕脑胀:“苹果示范园”,“吃苹果的七 大好处”,“苹果中国人事大变动”,“苹果单车的店铺”……在所有这些反馈的信息中,只有一小部分是你想要的。如果你 是数码产品发烧友,你期待看见的可能是苹果手机、苹果电脑;如果你是水果批发商,你会对“苹果示范园”感兴趣;如果是 想美容的女士,就会看看“吃苹果的七大好处”。
你要的 是哪个“苹果”? 目前的网络搜索,仅仅能够反馈给用户夹杂着各种噪音和无用信息的“信息大包裹”,用户得人工分拣出有用信息。 但随着一种新软件Twine的出现,这种情况有可能彻底改观。 位于美国芝加哥的RadarNetwork公司正在开发一种新软件,有望大大提高人们的搜索效率。 人们所要做的,就是登陆Twine网站,把自己的日常资料一股脑地“倾倒”进这个软件,之后就可以轻松离开, Twine会用一眨眼的工夫帮你把一切资料贴上电子标签,分门别类地收藏起来,包括你浏览过的网页、收发的电子邮件, 长长的小说和深奥的文件。 Twine会按照特定的主题,比如人物、地点、组织、企业等指标分类保存,一旦用户需要查找某个信息,它就能 很快地按类别搜出这个资料。当你要查找“苹果”时,它通过收藏的资料判断出您最近打算购买苹果公司生产的iPhone 手机,于是它会“聪明”地列出这款手机的价格和供货商信息。
“语义网络” 潜力无限 在这款软件背后,是互联网发展的一个巨大新潮流:语义网络(SemanticWeb)。 所谓的语义网络,就是为各种信息加注智能标签,再把各种信息通过标签联系起来,而网络用户本身的信息也被贴上 了标签,与虚拟世界相连。当一个数码发烧友在搜索框中输入“苹果”时,电脑“明白”他需要的不是“苹果示范园”和“吃 苹果的七大好处”之类风马牛不相及的信息。这就是Twine所做的——充当个人资料的“电子保姆”,并在此基础上进行 “个性化”搜索。 Twine并非第一个语义网络的产品或工具。多年以来,很多公司都已使用了可以自动将信息分类和检索的数据库 软件。当前网络上最热的博客功能,也使用了语义网络的原理:人们在自己的博文里添加若干标签,这样在数据库里就能检索 到博客的主要内容了。 纽约大学“交互式远程通讯”项目的克雷?舍基教授憧憬道:“语义网络的潜力无可限量,表面上看,语义网络只不 过是一场给信息加上标签以利于检索的时尚运动,可实际上,这一运动将给机器智能带来一场翻天覆地的革命。”
机器帮你 总结文章内容 据RadarNetwork公司创始人兼CEO斯皮沃克说,Twine的编制遵循了由国际组织万维网协会(W3C) 建立的语义网络标准草案,这就意味着,Twine符合某种规范,也正因为如此,它可与其他语义网络应用程序兼容并共享 信息。这大大地扩展了Twine的搜索范围。 除此之外,Twine还使用先进的机器学习程序和自然语言处理程序理解语义,这使它的认知能力远远超过了仅仅 通过手工添加的标签进行搜索的系统。斯皮沃克介绍说,自然语言分析能力能帮助系统迅速“理解”含义模糊的词组——它可 根据上下文来判断J.P.摩根是人名还是一家公司的名字。更令人叫绝的是,给Twine一段文字,它能利用机器学习能 力,在维基百科一类的词海中寻找匹配的信息,总结出这段文字的主题甚至概括中心思想。对此,斯皮沃克信心满满地说:“ 我们(的软件)会用全新的方式和手段去理解一段文字。”
我们 没有夸大其辞 斯皮沃克说,人们研究了几十年的“人工智能”、“人类语言处理技术”,而今天,人们把这些研究成果运用在语义 网络上,让这张网变成智能网络,能“看明白”人类的自然语言。 然而,并不是所有的人都对Twine的前景乐观。托尼?肖“语义世界”的领导人。他认为现在就断定Twine 是否能够赢得客户还为时过早。仅仅是技术上的可行并不意味着成功,还要引导消费者提升对先进技术的期望值,告诉人们“ 我们没有夸大其辞”。 斯皮沃克介绍说,今后几个月,这款软件将会接受更多用户的测试。2008年夏季,Twine可能会完全开放。 另外,Twine还会建立一个开发平台,允许程序员开发基于这个平台的程序,例如可视化软件。这样,用户可以从不同的 视角搜索信息。“不过首先,我们必须从最基本的开始。”斯皮沃克说。 (::美国《科技评论》杂志)
【发表评论 】
不支持Flash
|