什么是重复的内容
重复内容是指与其他网站或同一网站不同页面上的内容相似或完全相同的内容。网站上有大量重复内容会对谷歌排名产生负面影响。
也就是说,重复内容是指与另一页上出现的内容逐字相同的内容。
但“重复内容”也适用于与其他内容类似的内容……即使它被稍微重写。
重复的内容是如何影响SEO的?
一般来说,谷歌不会对内容重复的页面进行排名。
事实上,谷歌表示:
“谷歌努力为页面编制索引并显示不同的信息”。
因此,如果你的网站上的页面没有不一样的信息,这可能会损害你的搜索引擎排名。
具体来说,以下是具有大量重复内容的网站遇到的三个主要问题。
自然搜索流量少:Google不会对重复的内容进行排名
(包括您自己网站上的页面)
例如,假设您的网站上有三个内容相似的页面。
谷歌不确定哪一页是“原创”。所以这三页都很难排名。
惩罚(极其罕见):谷歌曾表示,重复内容可能会导致惩罚或网站完全去索引。
然而,这是非常罕见的。只有在某个站点故意从其他站点抓取或复制内容的情况下,才能执行此操作。
因此,如果您的网站上有大量重复页面,您可能不需要担心“重复内容惩罚”
更少的索引页面:这对于拥有大量页面的网站(如电子商务网站)尤为重要。
有时谷歌不只是降低重复内容的排名。它实际上拒绝索引它。
所以,如果你的网站上有页面没有被索引,这可能是因为你的爬行预算浪费在重复内容上。
重复内容SEO优化最佳实践
注意不同URL上的相同内容
这是出现重复内容问题的最常见原因。
例如,假设你经营一个电子商务网站。
你有一个销售t恤的产品页面。
如果一切都设置正确,那件t恤的每一个尺寸和颜色都会在同一个URL上。
但有时你会发现,你的网站会为你的产品的每个SKU创建一个新的URL……这会导致成千上万的重复内容页面。
另一个例子:
如果您的网站具有搜索功能,那么这些搜索结果页面也可以被索引。同样,这可以很容易地为您的网站添
1000+个页面。所有这些都包含重复的内容。
检查索引页
查找重复内容的最简单方法之一是查看站点中在Google中索引的页面数量。
您可以通过搜索站点来做到这一点:site:example.com
或者在Google搜索控制台中查看您的索引页面。
无论哪种方式,这个数字都应该与您手动创建的页面数量一致。
例如,我们有112页索引:
这是我们制作的页数。
如果这个数字是16000或160000,我们就会知道很多页面是自动添加的。这些页面可能包含大量重复内容。
确保站点正确重定向
有时,你不只是拥有同一页面的多个版本……而是拥有同一网站的多个。
当您的网站的“WWW”版本没有重定向到“非WWW”版时,就会出现此问题。
(反之亦然)
如果您将站点切换到HTTPS…并且没有重定向HTTP站点,也会发生这种情况。
简而言之:你的网站的所有不同版本都应该在同一个地方。
使用301重定向
301重定向是修复站点上重复内容问题的最简单方法。
(除删除全部页面外)
因此,如果您在网站上发现了大量重复的内容页面,请将它们重定向回原始页面。
一旦Googlebot停下来,它将处理重定向并只对原始内容进行索引。
(这可以帮助原始页面开始排名)
密切关注类似内容
重复内容不仅仅意味着从其他地方逐字复制的内容。
事实上,谷歌将重复内容定义为:
因此,即使您的内容在技术上与现有内容不同,您仍可能遇到重复内容问题。
这对大多数网站来说都不是问题。大多数网站都有几十页。他们为每一页写下独特的东西。
但在某些情况下,可能会出现“类似”的内容。
例如,假设你经营一个网站,教人们如何说法语。
你服务于波士顿地区。
你可能有一个围绕关键词优化的服务页面:“Learn French Boston”。
还有一个页面试图排名为“Learn French Cambridge”。
有时内容在技术上会有所不同。例如,一个页面列出了波士顿位置的位置。另一页是剑桥地址。
但大部分内容都非常相似。
这是技术上的重复内容。
为网站上的每个页面编写独特的内容是不是很痛苦?是的。但如果你真的要对网站上的每个页面进行排名,那就必须这样做。
使用Canonical标签
rel=canonical标签告诉搜索引擎:
“是的,我们有一堆内容重复的页面。但此页面是原始页面。您可以忽略其他页面”。
谷歌曾表示,规范标签比阻止具有重复内容的页面被爬取要好。
(例如,使用robots.txt或在网页HTML中使用noindex标记阻止Googlebot)
因此,如果您在网站上发现一堆内容重复的页面,您可以选择:
- 删除它们
- 重定向它们
- 使用canonical标签
使用工具查重
有一些SEO工具具有专门用于发现重复内容的功能。
例如,Siteliner扫描您的网站以查找包含大量重复内容的页面。
合并页面
正如我所提到的,如果你有很多直接重复内容的页面,你可能希望将它们重定向到一个页面。
(或使用canonical标记)
但是如果你有类似内容的页面呢?
你可以为每一页打磨出独特的内容……或者将它们整合成一个超大的页面。
例如,假设您的网站上有3篇技术上不同的博客文章……但内容几乎相同。
你可以将这三篇文章组合成一篇100%独特的博客文章。
因为您从站点中删除了一些重复的内容,所以该页面的排名应该比其他3个页面加起来的排名更好。
Noindex WordPress标签或类目
如果你使用WordPress,你可能已经注意到它会自动生成标签和类目。
这些页面是大量重复内容的来源。
所以它们对用户很有用,我建议在这些页面中添加“noindex”标记。这样,它们就可以在没有搜索引擎索引的情况下存在。
你也可以在WordPress中设置内容,这样这些页面就不会被生成了。