链接数据研究合集

链接数据研究合集

基于数百万数据点的链接与排名研究:从相关性分析到链接腐烂,用数据指导链接建设决策


引言:数据驱动的链接认知

图:Ahrefs Site Explorer概览面板,展示DR91网站的外链数据与自然搜索排名关键指标关联分析 图:Ahrefs Site Explorer概览面板,展示DR91网站的外链数据与自然搜索排名关键指标关联分析

在 SEO 领域,关于链接的讨论往往充满主观意见和过时认知。有人说链接已死,有人说链接为王,有人恐惧”有毒外链”,有人追求锚文本精确匹配。

真相是什么?

Ahrefs 作为拥有最大反向链接数据库之一的公司,持续进行基于数据的研究,用事实而非猜测来回答这些问题。本文汇集了 Ahrefs 发布的多项重磅链接研究,涵盖:

  • 链接与排名的相关性研究(100万+ SERP)
  • 链接增长模式研究
  • 链接腐烂研究(66.5% 外链失效)
  • 锚文本研究(384,614 个网页)
  • 互惠链接研究
  • Nofollow 属性研究
  • 有毒外链真相
  • 有流量页面外链研究

每项研究都基于海量数据,帮助你建立正确的链接认知框架。


第一章:链接与排名的关系研究

图:Ahrefs外链概况报告,展示域名评级、2700万反向链接及8万引荐域名数据分布 图:Ahrefs外链概况报告,展示域名评级、2700万反向链接及8万引荐域名数据分布

1.1 100万 SERP 研究:链接重要性略有下降但仍关键

Google 多次暗示链接的重要性在下降。2024年,Ahrefs 对 100万个最高搜索量的关键词 进行了研究,计算引荐域名数量与排名之间的 Spearman 相关系数。

核心发现:

引荐域名数量与排名的 Spearman 相关系数为 0.255

这意味着什么?

  • 相关性是正向的(更多链接 ≈ 更好排名)
  • 相关性是中等强度的(不是决定性因素,但很重要)
  • 与之前的研究相比,相关性略有下降

与历史数据对比:

年份 相关系数
2020 ~0.30
2024 0.255

下降约 15%,但仍然显著。

1.2 不同查询类型的链接相关性差异

并非所有查询都一样——链接在不同类型的搜索中重要性不同。

按查询类型的相关性:

查询类型 链接相关性 原因分析
本地查询 最高 本地商家依赖引用和链接建立信任
信息查询 较高 权威内容需要外部验证
商业查询 中等 用户信号和转化数据更重要
导航查询 最低 用户已知道想找什么

实际应用:

  • 如果你的主要流量来自信息查询,链接建设投资回报更高
  • 本地 SEO 不要忽视链接建设
  • 电商站点可以相对减少链接投入,更关注用户体验

1.3 Disavow 测试:禁用外链后流量下降的实证

为了验证链接是否真的影响排名,Ahrefs 进行了一项大胆的实验。

实验设计:

  1. 选择三篇有稳定流量的博客文章
  2. 将指向这些页面的所有链接(共 3,476 条)添加到 disavow 文件
  3. 观察一个月
  4. 移除 disavow,恢复链接价值
  5. 再观察一个月

实验结果:

Disavow 后(8月17日 - 9月14日):

  • 三篇文章的流量和排名均出现下降
  • 部分关键词排名下降 3-5 位

恢复后(9月14日后):

  • 流量逐渐回升
  • 排名恢复到接近原来水平

结论: 链接确实影响排名。不是间接影响,是直接影响。


第二章:链接增长模式研究

图:另一站点引荐域名增长曲线,展示波动性较大的链接获取模式与增长对比分析 图:另一站点引荐域名增长曲线,展示波动性较大的链接获取模式与增长对比分析

图:引荐域名长期增长趋势图,呈现2013至2018年持续稳健的链接增长模式 图:引荐域名长期增长趋势图,呈现2013至2018年持续稳健的链接增长模式

2.1 排名前3结果获取新链接速度明显快于其他位置

这是一个关于 SEO 正循环(或恶性循环)的研究。

研究问题: 高排名页面是因为有很多链接才排名高,还是排名高了才获得更多链接?

数据发现:

排名前3的页面,新链接获取速度显著快于排名4-10的页面。

排名位置 月均新链接增长率
#1 +5% 到 +14.5%
#2-3 +3% 到 +8%
#4-10 +1% 到 +3%
#11+ 接近持平或下降

2.2 SEO 正循环理论

为什么高排名会带来更多链接?

曝光效应:

  • 排名第一的页面获得 ~27.6% 的点击
  • 第十名只获得 ~2.4% 的点击
  • 更多人看到 = 更多人可能链接

可信度效应:

  • 排名高的内容被认为更权威
  • 人们更倾向于引用”第一名”的来源
  • 这进一步巩固排名优势

内容发现效应:

  • 作者研究主题时通常从 Google 搜索开始
  • 他们找到的是排名靠前的内容
  • 然后在自己的文章中引用这些内容

2.3 对新网站的启示

这个研究对新网站来说可能听起来悲观——强者愈强。但也有积极的一面:

突破口策略:

  1. 长尾关键词: 竞争小的词更容易获得初始排名
  2. 内容差异化: 排名第一不是唯一被链接的原因,独特角度也会吸引链接
  3. 主动链接建设: 不依赖自然链接增长,主动获取初始链接
  4. 持续更新: 让旧内容保持新鲜,增加被发现的机会

第三章:链接腐烂研究

图:404错误页面展示链接腐烂现象,引用最高法院案例说明互联网链接内容消失的普遍性 图:404错误页面展示链接腐烂现象,引用最高法院案例说明互联网链接内容消失的普遍性

3.1 66.5% 外链已失效的惊人数据

这是 Ahrefs 最令人震惊的研究之一。

研究范围:

  • 时间跨度:2013年1月至今(约9年)
  • 样本量:2,062,173 个网站
  • 链接数量:数十亿条

核心发现:

至少 66.5% 的链接已经失效(rotted)。

加上临时错误(6.45%)和其他问题(1.55%),总计 74.5% 的链接被视为丢失

3.2 链接丢失原因分布

为什么链接会失效?

原因 占比 说明
页面被移除 47.7% 整个页面不再存在
链接被删除 34.2% 页面在但链接被移除
抓取错误 6.45% 临时性技术问题
其他问题 11.65% 重定向、noindex等

3.3 大型网站链接腐烂比例更高

一个反直觉的发现:网站越大,链接腐烂比例越高

可能原因:

  • 大型网站更频繁地重组内容
  • URL 结构变更更常见
  • 旧内容被删除或合并

案例: 一个被美国最高法院判决书引用的网站,其页面后来被删除。域名被他人购买后,用于展示完全不相关的内容。

3.4 链接回收与断链建设的机会

链接腐烂是问题,也是机会。

链接回收策略:

  1. 使用 Ahrefs 的 Lost Links 报告监控丢失链接
  2. 联系网站所有者,请求恢复或更新链接
  3. 为已删除的页面设置 301 重定向到相关页面

断链建设策略:

  1. 找到竞品或行业网站的失效页面
  2. 分析有多少网站链接到这个失效页面
  3. 创建替代内容
  4. 联系链接者,推荐你的内容作为替代

机会规模: 如果 66.5% 的链接已失效,这意味着几乎每个行业都有大量断链建设机会等待挖掘。


第四章:锚文本研究

图:Ahrefs功能需求——按引荐页自然流量筛选外链,助力识别失效与低质量链接 图:Ahrefs功能需求——按引荐页自然流量筛选外链,助力识别失效与低质量链接

4.1 384,614 个网页的锚文本数据分析

关于锚文本,SEO 圈子流传着很多说法:

  • “需要一定比例的精确匹配锚文本”
  • “锚文本必须包含关键词”
  • “过多精确匹配会导致惩罚”

Ahrefs 分析了 384,614 个网页 的锚文本数据,看看数据怎么说。

4.2 精确匹配锚文本与排名的弱相关性

发现:精确匹配锚文本与排名的相关性很弱(0.14-0.19)。

这意味着:

  • 精确匹配锚文本不是排名的关键因素
  • 刻意构建关键词锚文本意义不大
  • 自然的锚文本分布更重要

锚文本类型分布(自然链接):

锚文本类型 典型占比
品牌名称 25-40%
裸 URL 15-25%
通用词(”点击这里”) 10-20%
部分匹配关键词 10-20%
精确匹配关键词 5-15%

4.3 Google 使用链接周围文本理解页面主题

John Mueller 确认,Google 使用锚文本来理解被链接页面的上下文。但更重要的是,Google 还会分析链接周围的文本

实际意义:

  • 锚文本本身没那么重要
  • 链接所在的整个段落都提供上下文
  • 相关性不仅看锚文本,还看整个链接环境

4.4 结论:不建议刻意构建关键词丰富的锚文本

最佳实践:

  1. 让锚文本自然形成
  2. 外展时不要强制要求特定锚文本
  3. 关注链接来源的相关性而非锚文本
  4. 避免过度优化(大量精确匹配看起来很不自然)

第五章:互惠链接研究

5.1 73.6% 的域名存在互惠链接

互惠链接(你链接我,我链接你)长期被认为是”有风险”的做法。但数据显示,互惠链接极其普遍

研究发现:

  • 73.6% 的域名至少有一个互惠链接关系
  • 这些是自然产生的,不是刻意的链接交换

5.2 43.7% 的排名靠前页面有互惠链接

更重要的是:排名靠前的页面中,有大量存在互惠链接

这表明 Google 并没有因为互惠链接而惩罚这些页面。

5.3 自然互链不违反 Google 指南

为什么互惠链接如此普遍?

自然产生的场景:

  • 行业伙伴互相引用对方的研究
  • 客座文章中引用主站内容,主站也引用客座作者
  • 长期合作关系中的自然互链
  • 采访文章中双方互相链接

Google 反对的是:

  • 大规模的链接交换计划
  • “你链接我,我链接你”的直接交易
  • 链接农场和链接圈

可以接受的是:

  • 自然产生的内容引用
  • 相关性强的互惠链接
  • 不是以链接为主要目的的关系

5.4 实际建议

不要因为害怕互惠链接而拒绝所有链接机会。

判断标准:

  • 链接是否对用户有价值?
  • 是否是自然的内容引用?
  • 是否会存在即使没有链接交换?

如果答案是”是”,那这个互惠链接是健康的。


第六章:Nofollow 与链接属性研究

6.1 10.6% 的反向链接使用 nofollow 属性

2019年,Google 改变了 nofollow 的处理方式,同时引入了两个新属性:ugc(用户生成内容)和 sponsored(赞助内容)。

Ahrefs 的研究发现:

属性 使用比例
dofollow(默认) ~89.4%
nofollow 10.6%
ugc <0.02%
sponsored <0.02%

6.2 UGC 和 Sponsored 采用率极低

尽管 Google 在 2019 年就推出了新属性,但几乎没有网站采用。

原因分析:

  • 不是强制要求
  • 技术实施需要成本
  • 现有 nofollow 已经够用
  • 很多网站不了解这些新属性

6.3 Google 将 nofollow 视为提示而非指令

这是一个重要的变化。

之前: nofollow = Google 完全忽略这个链接 现在: nofollow = Google 可能会考虑,也可能不会

实际意义:

  • nofollow 链接可能仍有 SEO 价值
  • 不要拒绝所有 nofollow 链接
  • 来自权威网站的 nofollow 链接仍值得获取
  • nofollow 链接至少有品牌曝光和流量价值

第七章:有毒外链真相

图:否认'有毒外链'后自然流量下降7.1%,数据证明盲目拒绝外链可能适得其反 图:否认’有毒外链’后自然流量下降7.1%,数据证明盲目拒绝外链可能适得其反

7.1 Disavow “有毒外链”实验:基本无效果

很多 SEO 工具会标记某些链接为”有毒”(toxic),暗示你应该 disavow 它们。

Ahrefs 进行了一项实验来验证这个说法。

实验设计:

  1. 使用某知名工具导出三篇博客文章的所有”有毒”和”潜在有毒”链接
  2. 共 129 条 URL
  3. 在 Google Search Console 中 disavow 这些链接
  4. 观察 20 天

结果:流量下降了 7.1%

disavow 所谓的”有毒链接”不仅没有帮助,反而产生了负面影响。

7.2 Google Penguin 4.0 后的链接处理机制

2016年,Google 发布了 Penguin 4.0 算法更新,根本性地改变了垃圾链接的处理方式。

之前: 垃圾链接会导致惩罚 之后: 垃圾链接被自动忽略(devalued)

John Mueller 明确表示:

“Google 没有’有毒链接’的概念。”

7.3 何时真正需要使用 Disavow 工具

需要考虑 disavow 的情况:

  1. 你收到了 Google 的手动处罚通知(Manual Action)
  2. 你曾主动参与大规模链接购买计划
  3. 你的网站遭受了明显的负面 SEO 攻击

不需要 disavow 的情况:

  • 某个工具说你有”有毒链接”
  • 你的竞品有指向你的垃圾链接
  • 你发现了一些来自低质量网站的自然链接

最佳实践: 把花在 disavow 上的时间用来建设高质量链接。Google 已经能够自动处理垃圾链接了。


第八章:有流量页面外链研究

图:Ahrefs Site Explorer展示Zapier博客外链概况,33.8万外链中潜藏大量链接腐烂风险 图:Ahrefs Site Explorer展示Zapier博客外链概况,33.8万外链中潜藏大量链接腐烂风险

8.1 URL Rating 与排名相关性最强

在所有链接相关指标中,URL Rating(UR) 与排名的相关性最强。

什么是 URL Rating: UR 衡量的是单个页面的链接强度,考虑了:

  • 指向该页面的链接数量
  • 这些链接来源页面的质量
  • 链接的 dofollow/nofollow 状态

为什么 UR 比 DR 更相关:

  • 排名是页面级别的,不是域名级别
  • 一个高 DR 网站的弱页面不一定排名好
  • 链接直接指向目标页面的影响更直接

8.2 约 1/5 首页结果没有来自有流量页面的外链

一个有趣的发现:约 20% 排名首页的结果,没有来自有自然流量页面的外链

这意味着:

  • 来自有流量页面的链接不是必需的
  • 但有这类链接的页面排名往往更好
  • 质量和数量都很重要

8.3 优先获取策略建议

基于数据的链接优先级:

优先级 链接特征 原因
最高 高 UR + 有流量 + 相关 全面优质
高 UR + 相关 权威且相关
有流量 + 相关 可能带来直接流量
仅有流量 不相关的流量价值有限
最低 低质量 + 不相关 可能没有任何价值

实际应用: 在做外展时,优先联系那些:

  • 页面本身有排名和流量
  • 与你的内容高度相关
  • 域名有一定权威度

第九章:研究方法论说明

9.1 相关性不等于因果关系

所有这些研究都是相关性研究,不是因果关系证明。

例如: 链接多的页面排名高,可能是因为:

  • 链接帮助了排名(链接 → 排名)
  • 排名带来了更多链接(排名 → 链接)
  • 某个第三因素同时影响了两者

9.2 数据有滞后性

Ahrefs 的数据基于爬虫抓取,存在一定滞后:

  • 新链接可能需要几周才能被发现
  • 丢失的链接可能需要一段时间才能确认
  • 排名数据每周或每月更新

9.3 研究的局限性

样本偏差: 研究通常基于高搜索量关键词,可能不适用于长尾词 时间限制: 大多数研究是横截面研究,不是长期追踪 工具限制: 基于 Ahrefs 自己的数据,可能与 Google 实际数据有差异


结语:让数据指导链接建设决策

基于这些研究,我们可以得出一些核心认知:

链接仍然重要

  • Spearman 相关系数 0.255 证明链接与排名正相关
  • Disavow 实验证明移除链接会导致排名下降
  • 不同查询类型的链接重要性不同

质量优于数量

  • URL Rating 与排名相关性强于单纯的链接数量
  • 来自有流量页面的链接可能更有价值
  • 相关性是关键因素

不要过度担心

  • 66.5% 的链接腐烂是正常现象
  • 互惠链接很普遍,自然的互链不是问题
  • “有毒链接”大多是工具创造的概念,Google 会自动忽略垃圾链接

锚文本没那么重要

  • 精确匹配锚文本与排名弱相关
  • Google 分析整个链接上下文,不只是锚文本
  • 自然的锚文本分布比刻意优化更好

关注可控因素

  • 创建值得链接的内容
  • 主动进行有策略的外展
  • 监控和回收丢失的链接
  • 持续建设而非一次性冲刺

最终建议: 用数据而非猜测来指导你的链接建设策略。不要被”有毒链接”恐吓,不要过度追求锚文本优化,专注于获取高质量、相关的链接。这才是长期有效的策略。


参考来源

  1. Google Says “Links Matter Less”—We Looked at 1,000,000 SERPs to See if It’s True - https://ahrefs.com/blog/links-matter-less-but-still-matter/
  2. How Many New Backlinks Do Top-ranking Pages Get Over Time - https://ahrefs.com/blog/backlink-growth-study/
  3. At Least 66.5% of Links to Sites in the Last 9 Years Are Dead - https://ahrefs.com/blog/link-rot-study/
  4. Anchor Text: A Data-Driven Guide (384,614 Web Pages Studied) - https://ahrefs.com/blog/anchor-text/
  5. Reciprocal Links: Will They Hurt Your SEO? (A Study by Ahrefs) - https://ahrefs.com/blog/reciprocal-links/
  6. The State of Nofollow, UGC, & Sponsored Link Attributes in 2020 - https://ahrefs.com/blog/nofollow-ugc-sponsored/
  7. Toxic Backlinks: SEO Woe or a Load of Baloney? - https://ahrefs.com/blog/toxic-backlinks/
  8. I Disavowed “Toxic Backlinks”: Here’s What Happened - https://ahrefs.com/blog/toxic-backlink-disavowal/
  9. Do Links Still Matter for Rankings? A Study by Ahrefs - https://ahrefs.com/blog/impact-of-links/
  10. Do Links From Pages With Traffic Help You Rank Higher? - https://ahrefs.com/blog/links-with-traffic-study/