中午饭后无事,想想这些天一直在blog上书写和google相关的东西,百度那边对我这小地方是如何收录的呢? 于是便来到baidu.com 键入site:twototoo.com,看看它收录了多少页面,不查不知道,一查吓一跳!乖乖!居然有二千多页!额滴神阿!见下图1

baidu果然“厉害”!可是转念一想,不对阿,我没有这么多页面,怎么可能给它收录了这么多?!于是就点击页面下方,看看后面那些收录的是什么,直接点第十页,奇怪的事情发生鸟。。。百度重新又检索生成了一次,这回就没有超过十页那么多,只有七页而已,而且相关网页那项降为了两百多,这还比较make sense。

这回问题来了,看结果的话,虽然两次落差很大,可是后一次生成的合理多了,那么第一次得到的那个相关网页数字是什么呢?显示实力还是忽悠人的?
相比来说Google的搜索结果就靠谱些,不管搜索多少次,也不会出现如baidu那般如“飞流直下三千尺”的结果。

各位看官也可以自己试试,不过有个小建议:不要去site:非常著名的站点,因为搜索引擎收录它们的页面太多,你很难浏览到它收录的最后一页列表上。一般大小的博客网站是比较合适做这个有趣的测试的。
百度一直以来都存在这样的问题…
baidu对非简洁网址的收录还是不行,所以会比google少400多项。
百度很会忽悠的,呵呵
不过说实话,百度在中文分词的技术上还是比google要强很多,相对来说智能化不少。