Google 专利揭示博客搜索结果排名机制

2007年3月21日 Post by 散人 in Google 搜索引擎

Google 博客搜索结果除了可以按照日期排序,还可以像网页搜索那样按照相关度排序。对于前者很好理解,而对于相关度排名,Google 是按照什么指标来衡量的呢?在Google 的一份专利(Ranking blog documents )中,我们可以看出其中包含了许多因素。

影响博客排名的积极因素有:
反向链接数,尤其是高质量或高信任度的反向链接数;
你的博客链接被包含于在邮件或聊天内容中;
给访问者提供tags 标签归类功能;
PageRank值
feed 的订阅数;
博客文章在搜索结果里的点击率……

影响博客排名的消极因素有:
文章数在短时间内大量增加或规律性地增加,即文章更新频率的问题;
Feed 和网站本身的内容不相符;
重复性内容的数量;
内容中包含大量spam 博客常用的关键词;
各个页面大小一样;
只链接到某个网页或网站;
网页上有大量的广告;
广告的放置方式……

以上因素综合起来,就得到了Google 在专利中所阐述的IR 值,通过这个IR 值来对博客搜索结果进行排名。
博客搜索作为垂直搜索的一种,排名机制相对来说要简单些,但有理由相信,这些因素在Google 的网页搜索中同样会运用到,因此这对于我们研究网页搜索排名同样具有参考价值。
(via Ionut Alex / SER)
版权所有,转载请务必注明本文链接地址和标题。
链接地址 http://www.eryi.org/SearchEngines/google-blog-search-ranking-principle.html

相关文章:

发表评论: