原创的苦恼——从文章被转载看搜索引擎对原创内容的识别

2006年11月13日 Post by 散人 in 其他搜索引擎

也许是我不善于经营网站,我在博客上和《搜索引擎周边》里写的大量的原创文章,经过别人转载之后,转眼间就变成了“抄袭”的了。因为被转载之后,我的文章在搜索引擎里的排名往往在转载站的后面。

其中,除了跟自己网站本身的排名和在搜索引擎里的信任指数有关外,更重要的是转载者无视文章末尾的版权声明。转载之后,不仅不注明原文链接,还索性在文章末尾加上一个“本站原创”。这样一来,结果可想而知了。

以之前写的一篇《雅虎新邮箱中文测试版全面推出》为例,在Google、Yahoo和百度里分别以这篇文章的文章标题加引号作为关键词进行搜索。得出的结果惨不忍睹:

在Google里返回了1160个结果,一眼扫过去,果然没有一个是我的。一直翻到第3页才发现了自己的文章。一个奇怪的现象是:从第一页的第6个条目开始的搜索结果,已经被Google列为补充材料了。而我的这篇文章没有被列为补充材料,却排在它们的后面。谁能告诉我为什么?在百度的887个条目中,也是在第3页才找到了这篇文章的链接。表现最好的就是雅虎了,排在第二的就是出我的了。

看来,对于原创性内容的识别,搜索引擎目前还不能很好地判断。即使可以判断出最原始出处,它们还是会在排名上作一定的调整。对于此,能拥有一个像Zac这样的心态就够了。
链接地址 http://www.eryi.org/SearchEngines/search-engine-recognize-authorship.html

相关文章:

    • 回复该留言 1.侃侃 http://www.marktip.com/blog
    • 2006-11-29 10:58:32
    • 加上版权只是举手之劳,不明白总有些人非要把别人的成果说成是自己的。

      支持楼主!

发表评论: