作为一个网站所有者,当你发现自己的高质量内容被别人未经许可地盗用并用于获利时,这种情况会让人极为沮丧。
在本文中,我们将探讨博客内容抓取是什么,如何减少和防止内容抓取,甚至如何利用内容抓取者为自己谋利。
什么是WordPress博客内容抓取?
博客内容抓取是指从多个来源获取内容,然后在另一个网站上重新发布。通常,这种操作通过你博客的RSS源自动进行。
不幸的是,以这种方式盗取WordPress博客内容非常容易且常见。如果你遇到过这种情况,就会明白有多么令人沮丧和压力大。
有时候,你的内容会被直接复制粘贴到另一个网站上,包括你的格式、图片、视频等。其他时候,虽然你的内容被转载并附上了署名和链接,但并未获得你的许可。尽管这可能有助于你的SEO,但你可能希望仅在自己的网站上托管原创内容。
内容抓取者为什么要偷内容?
一些用户询问我们,为什么抓取者要偷内容。通常,内容盗窃的主要动机是通过你的辛勤劳动获利:
- 联盟佣金:不诚实的联盟营销者可能会使用你的内容通过搜索引擎带来流量,以推广其相关产品。
- 潜在客户生成:律师和房地产经纪人可能会支付他人添加内容,并在他们的社区中建立权威,毫不知情地从其他来源抓取内容。
- 广告收入:博客所有者可能会抓取内容,以创建某一特定领域的知识中心“为社区的利益”,然后在网站上布满广告。
是否有可能完全防止内容抓取?
在本文中,我们将向你展示一些减少和防止内容抓取的步骤。但不幸的是,完全阻止一个决定性的盗贼是不可能的。
这就是为什么我们在本文的最后留出了一个部分,介绍如何利用内容抓取者。尽管你不能总是阻止小偷,但你可能能够通过他们窃取的内容获得一些流量和收入。
发现有人抓取你的内容时你应该怎么做?
由于无法完全阻止抓取者,有一天你可能会发现有人使用偷来的你博客的内容。那时你可能会想该怎么办。
以下是一些处理内容抓取者的方法:
- 什么都不做:你可以花费大量时间对抗抓取者,因此一些流行的博主选择什么都不做。谷歌已经将知名网站视为权威,但对于较小的网站却不是如此。所以这种方法在我们看来并不总是最佳选择。
- 下架:你可以联系抓取者要求他们下架内容。如果他们拒绝,那么你可以提交下架通知。
- 利用:虽然我们积极致力于下架从我们那里抓取的内容,但我们也使用一些技术从抓取者那里获取流量和赚钱。
接下来,我们来看看如何在WordPress中防止博客抓取。由于这是一个全面的指南,我们提供了内容目录以便于导航:
- 版权或商标保护你的博客名称和标志
- 使你的RSS源更难以抓取
- 禁用Trackbacks和Pingbacks
- 阻止抓取者访问你的WordPress网站
- 防止图片被盗
- 劝阻手动复制你的内容
- 利用内容抓取者
1. 版权或商标保护你的博客名称和标志
商标和版权法律保护你的知识产权、品牌和业务免受许多法律挑战。这包括对你受版权保护的材料或品牌名称和标志的非法使用。
你应该清楚地在你的网站上显示一个版权声明。虽然你的网站内容自动受到版权法的保护,显示声明会告诉别人你的内容是受版权保护的,他们不能用于商业用途。
2. 使你的RSS源更难以抓取
让我们看看你可以对RSS源做的一些有用的更改。
在你的WordPress RSS源中不包含全部文章内容
你可以在RSS源中只包含每篇文章的摘要,而不是全部内容。这包括摘要以及日期、作者和分类等元数据。
在博客社区中确实对是否提供完整的RSS源或摘要源存在争议。我们现在不讨论这个问题,除非说只提供摘要有助于防止内容抓取。
优化你的RSS源以防抓取
还有其他方法可以优化你的WordPress RSS源来保护你的内容,获取更多反向链接,增加你的网络流量。
3. 禁用Trackbacks、Pingbacks和REST API
博客早期,trackbacks和pingbacks被引入作为博客之间通知链接的方式。当有人链接到你博客上的文章时,他们的网站会自动发送ping到你的博客。
这种pingback会出现在你博客的评论审核队列中,并带有他们网站的链接。如果你批准了,他们就会从你的网站获得反向链接和提及。
禁用WordPress REST API
除了trackbacks和pingbacks外,我们还建议禁用WordPress REST API,因为它可以使垃圾邮件发送者更容易抓取你的内容。
4. 阻止抓取者访问你的WordPress网站
一种阻止抓取者偷取你内容的方法是阻止他们访问你的网站。你可以通过手动阻止他们的IP地址来做到这一点,但大多数用户会发现使用安全插件更容易比如网络应用防火墙。
通过安全插件阻止抓取者(推荐)
手动阻止抓取者是很棘手且工作量很大。特别是许多黑客尝试和攻击是使用一系列随机的全球IP地址进行的,几乎不可能跟上所有这些随机IP地址。
手动阻止或重定向抓取者的IP地址
高级用户可能还希望手动阻止抓取者的IP地址。这需要更多工作,但一旦你知道抓取者的地址,你可以专门针对这个IP地址。
5. 防止WordPress图片被盗
你不仅需要保护你的书面内容,还应防止WordPress图片被盗。
像文字一样,没有完全阻止人们偷窃你图片的方法,但有很多方法可以在WordPress网站上阻止图片被盗。
6. 劝阻手动复制你的内容
虽然大多数抓取者使用自动工具,但一些内容窃贼可能会尝试手动复制全部或部分内容。
一种使这种行为更加困难的方法是防止他们复制和粘贴你的文字。
7. 利用内容抓取者
随着你的博客规模扩大,几乎不可能阻止或追踪所有内容抓取者。我们仍然会发出DMCA投诉,但我们知道有大量其他网站在偷窃我们的内容,无法一一跟进。
相反,我们的方法是试图利用内容抓取者。当你看到你从被盗内容中赚钱或从抓取者的网站获得大量流量时,这并不坏。
- 通过内部链接从抓取者处获得流量和反向链接
- 自动链接关键词与联盟链接从抓取者那里赚钱
- 在RSS源底部推广你的网站