实测证明Google仍是搜索之王 雅虎"牛皮"吹破
据海外媒体报道,雅虎搜索产品部门总监Tim Mayer于8月8日向外界宣布,雅虎提供更大的索引,包括192亿份网络文档,16亿幅图片和超过5000万个视频和音频的文件。
然而Google的工程师们在分析了雅虎的报告后,提出了异议,认为雅虎的研究报告无法支持它的结论。
两名美国伊利诺大学的学生Matthew Cheney 和Mike Perry,为美国超级计算应用中心(NCSA)设计了一个测试,比较Google和雅虎谁的索引量(Index)更大。Cheney表示,这是一项独立的分析,以判断雅虎的结论是否是正确的。
研究人员从一个标准的英语词汇表自动地组合任意的两个单词作为关键字,自动向Google和雅虎查询。在10,012次搜索中,雅虎所找到的结果只是Google的37.4%。而且Cheney表示,在这10,000多次中。96-97%的情况是Google比雅虎搜索到更多的结果。
事实上,用于这次测试的一些词汇有点含糊不清。这是导致Google比雅虎搜索到更多索引的原因。 Cheney认为一个好的测试,应当包括所有可能的搜索。并且这种对于含糊不清的事物的搜索将决定一个搜索引擎的好坏。
这个测试包含了两个假设:
第一,雅虎和Google都返回所有与关键字匹配的结果,并且除了去掉重复的索引,不进行任何的筛选。
第二,如果雅虎的索引数量是Google的两倍,美国超级计算应用中心的测试结果也应该是雅虎的索引数量是Google的两倍。
但是搜索引擎观察(Search Engine Watch)的新闻编辑Gary Price认为,这些仅仅是猜测而已。因为不知道雅虎和Google搜索的标准,这样的比较是很困难的。
Brad Hill,已发表多部网络搜索的著作。他认为索引的大小对于大多数人都是无关紧要的。因为他们很少查看第一页以后或者两条结果以后的内容,更不会找到那些含糊不清的网络文档。
但是Hill不同意任何的查询都是无关紧要的。他认为无论用户的查询是多么的含糊不清,用户都应该得到一个有用的答案。
Brian Bowman,InfoSpace产品和市场部的副总经理,认为检索的深度是非常重要的。在Dogpile.com的搜索中,大约50%的查询结果在一个月中是唯一的,只有很小的一部分在一个星期中会出现重复的结果,有相当大的查询结果是新的而且是不同的。
Dogpile.com让用户能够同时搜索4个最著名的搜索引擎,并返回Google,雅虎,Ask Jeeves和MSN的全部结果。匹兹堡大学和宾州州立大学的研究人员对Dogpile.com的研究发现,不同的搜索引擎得到的结果并没有太多的重复内容。
宾州州立大学的研究人员对这4个搜索引擎进行了12,570个不同的查询,他们发现在这4个搜索引擎所返回结果的第一页中,只有1.1%的结果是这4个搜索引擎都相同的,而84.9%是不同的。
当大小成为可以吹嘘的资本的时候,关键不是这个索引有多大,而是在于每个公司用什么样的标准去计算这个索引。所以我们需要一些公认的标准和方法去衡量,否则类似这样的争论会不断的重复。
|