链接数据研究合集
链接数据研究合集
基于数百万数据点的链接与排名研究:从相关性分析到链接腐烂,用数据指导链接建设决策
引言:数据驱动的链接认知
图:Ahrefs Site Explorer概览面板,展示DR91网站的外链数据与自然搜索排名关键指标关联分析
在 SEO 领域,关于链接的讨论往往充满主观意见和过时认知。有人说链接已死,有人说链接为王,有人恐惧”有毒外链”,有人追求锚文本精确匹配。
真相是什么?
Ahrefs 作为拥有最大反向链接数据库之一的公司,持续进行基于数据的研究,用事实而非猜测来回答这些问题。本文汇集了 Ahrefs 发布的多项重磅链接研究,涵盖:
- 链接与排名的相关性研究(100万+ SERP)
- 链接增长模式研究
- 链接腐烂研究(66.5% 外链失效)
- 锚文本研究(384,614 个网页)
- 互惠链接研究
- Nofollow 属性研究
- 有毒外链真相
- 有流量页面外链研究
每项研究都基于海量数据,帮助你建立正确的链接认知框架。
第一章:链接与排名的关系研究
图:Ahrefs外链概况报告,展示域名评级、2700万反向链接及8万引荐域名数据分布
1.1 100万 SERP 研究:链接重要性略有下降但仍关键
Google 多次暗示链接的重要性在下降。2024年,Ahrefs 对 100万个最高搜索量的关键词 进行了研究,计算引荐域名数量与排名之间的 Spearman 相关系数。
核心发现:
引荐域名数量与排名的 Spearman 相关系数为 0.255。
这意味着什么?
- 相关性是正向的(更多链接 ≈ 更好排名)
- 相关性是中等强度的(不是决定性因素,但很重要)
- 与之前的研究相比,相关性略有下降
与历史数据对比:
| 年份 | 相关系数 |
|---|---|
| 2020 | ~0.30 |
| 2024 | 0.255 |
下降约 15%,但仍然显著。
1.2 不同查询类型的链接相关性差异
并非所有查询都一样——链接在不同类型的搜索中重要性不同。
按查询类型的相关性:
| 查询类型 | 链接相关性 | 原因分析 |
|---|---|---|
| 本地查询 | 最高 | 本地商家依赖引用和链接建立信任 |
| 信息查询 | 较高 | 权威内容需要外部验证 |
| 商业查询 | 中等 | 用户信号和转化数据更重要 |
| 导航查询 | 最低 | 用户已知道想找什么 |
实际应用:
- 如果你的主要流量来自信息查询,链接建设投资回报更高
- 本地 SEO 不要忽视链接建设
- 电商站点可以相对减少链接投入,更关注用户体验
1.3 Disavow 测试:禁用外链后流量下降的实证
为了验证链接是否真的影响排名,Ahrefs 进行了一项大胆的实验。
实验设计:
- 选择三篇有稳定流量的博客文章
- 将指向这些页面的所有链接(共 3,476 条)添加到 disavow 文件
- 观察一个月
- 移除 disavow,恢复链接价值
- 再观察一个月
实验结果:
Disavow 后(8月17日 - 9月14日):
- 三篇文章的流量和排名均出现下降
- 部分关键词排名下降 3-5 位
恢复后(9月14日后):
- 流量逐渐回升
- 排名恢复到接近原来水平
结论: 链接确实影响排名。不是间接影响,是直接影响。
第二章:链接增长模式研究
图:另一站点引荐域名增长曲线,展示波动性较大的链接获取模式与增长对比分析
图:引荐域名长期增长趋势图,呈现2013至2018年持续稳健的链接增长模式
2.1 排名前3结果获取新链接速度明显快于其他位置
这是一个关于 SEO 正循环(或恶性循环)的研究。
研究问题: 高排名页面是因为有很多链接才排名高,还是排名高了才获得更多链接?
数据发现:
排名前3的页面,新链接获取速度显著快于排名4-10的页面。
| 排名位置 | 月均新链接增长率 |
|---|---|
| #1 | +5% 到 +14.5% |
| #2-3 | +3% 到 +8% |
| #4-10 | +1% 到 +3% |
| #11+ | 接近持平或下降 |
2.2 SEO 正循环理论
为什么高排名会带来更多链接?
曝光效应:
- 排名第一的页面获得 ~27.6% 的点击
- 第十名只获得 ~2.4% 的点击
- 更多人看到 = 更多人可能链接
可信度效应:
- 排名高的内容被认为更权威
- 人们更倾向于引用”第一名”的来源
- 这进一步巩固排名优势
内容发现效应:
- 作者研究主题时通常从 Google 搜索开始
- 他们找到的是排名靠前的内容
- 然后在自己的文章中引用这些内容
2.3 对新网站的启示
这个研究对新网站来说可能听起来悲观——强者愈强。但也有积极的一面:
突破口策略:
- 长尾关键词: 竞争小的词更容易获得初始排名
- 内容差异化: 排名第一不是唯一被链接的原因,独特角度也会吸引链接
- 主动链接建设: 不依赖自然链接增长,主动获取初始链接
- 持续更新: 让旧内容保持新鲜,增加被发现的机会
第三章:链接腐烂研究
图:404错误页面展示链接腐烂现象,引用最高法院案例说明互联网链接内容消失的普遍性
3.1 66.5% 外链已失效的惊人数据
这是 Ahrefs 最令人震惊的研究之一。
研究范围:
- 时间跨度:2013年1月至今(约9年)
- 样本量:2,062,173 个网站
- 链接数量:数十亿条
核心发现:
至少 66.5% 的链接已经失效(rotted)。
加上临时错误(6.45%)和其他问题(1.55%),总计 74.5% 的链接被视为丢失。
3.2 链接丢失原因分布
为什么链接会失效?
| 原因 | 占比 | 说明 |
|---|---|---|
| 页面被移除 | 47.7% | 整个页面不再存在 |
| 链接被删除 | 34.2% | 页面在但链接被移除 |
| 抓取错误 | 6.45% | 临时性技术问题 |
| 其他问题 | 11.65% | 重定向、noindex等 |
3.3 大型网站链接腐烂比例更高
一个反直觉的发现:网站越大,链接腐烂比例越高。
可能原因:
- 大型网站更频繁地重组内容
- URL 结构变更更常见
- 旧内容被删除或合并
案例: 一个被美国最高法院判决书引用的网站,其页面后来被删除。域名被他人购买后,用于展示完全不相关的内容。
3.4 链接回收与断链建设的机会
链接腐烂是问题,也是机会。
链接回收策略:
- 使用 Ahrefs 的 Lost Links 报告监控丢失链接
- 联系网站所有者,请求恢复或更新链接
- 为已删除的页面设置 301 重定向到相关页面
断链建设策略:
- 找到竞品或行业网站的失效页面
- 分析有多少网站链接到这个失效页面
- 创建替代内容
- 联系链接者,推荐你的内容作为替代
机会规模: 如果 66.5% 的链接已失效,这意味着几乎每个行业都有大量断链建设机会等待挖掘。
第四章:锚文本研究
图:Ahrefs功能需求——按引荐页自然流量筛选外链,助力识别失效与低质量链接
4.1 384,614 个网页的锚文本数据分析
关于锚文本,SEO 圈子流传着很多说法:
- “需要一定比例的精确匹配锚文本”
- “锚文本必须包含关键词”
- “过多精确匹配会导致惩罚”
Ahrefs 分析了 384,614 个网页 的锚文本数据,看看数据怎么说。
4.2 精确匹配锚文本与排名的弱相关性
发现:精确匹配锚文本与排名的相关性很弱(0.14-0.19)。
这意味着:
- 精确匹配锚文本不是排名的关键因素
- 刻意构建关键词锚文本意义不大
- 自然的锚文本分布更重要
锚文本类型分布(自然链接):
| 锚文本类型 | 典型占比 |
|---|---|
| 品牌名称 | 25-40% |
| 裸 URL | 15-25% |
| 通用词(”点击这里”) | 10-20% |
| 部分匹配关键词 | 10-20% |
| 精确匹配关键词 | 5-15% |
4.3 Google 使用链接周围文本理解页面主题
John Mueller 确认,Google 使用锚文本来理解被链接页面的上下文。但更重要的是,Google 还会分析链接周围的文本。
实际意义:
- 锚文本本身没那么重要
- 链接所在的整个段落都提供上下文
- 相关性不仅看锚文本,还看整个链接环境
4.4 结论:不建议刻意构建关键词丰富的锚文本
最佳实践:
- 让锚文本自然形成
- 外展时不要强制要求特定锚文本
- 关注链接来源的相关性而非锚文本
- 避免过度优化(大量精确匹配看起来很不自然)
第五章:互惠链接研究
5.1 73.6% 的域名存在互惠链接
互惠链接(你链接我,我链接你)长期被认为是”有风险”的做法。但数据显示,互惠链接极其普遍。
研究发现:
- 73.6% 的域名至少有一个互惠链接关系
- 这些是自然产生的,不是刻意的链接交换
5.2 43.7% 的排名靠前页面有互惠链接
更重要的是:排名靠前的页面中,有大量存在互惠链接。
这表明 Google 并没有因为互惠链接而惩罚这些页面。
5.3 自然互链不违反 Google 指南
为什么互惠链接如此普遍?
自然产生的场景:
- 行业伙伴互相引用对方的研究
- 客座文章中引用主站内容,主站也引用客座作者
- 长期合作关系中的自然互链
- 采访文章中双方互相链接
Google 反对的是:
- 大规模的链接交换计划
- “你链接我,我链接你”的直接交易
- 链接农场和链接圈
可以接受的是:
- 自然产生的内容引用
- 相关性强的互惠链接
- 不是以链接为主要目的的关系
5.4 实际建议
不要因为害怕互惠链接而拒绝所有链接机会。
判断标准:
- 链接是否对用户有价值?
- 是否是自然的内容引用?
- 是否会存在即使没有链接交换?
如果答案是”是”,那这个互惠链接是健康的。
第六章:Nofollow 与链接属性研究
6.1 10.6% 的反向链接使用 nofollow 属性
2019年,Google 改变了 nofollow 的处理方式,同时引入了两个新属性:ugc(用户生成内容)和 sponsored(赞助内容)。
Ahrefs 的研究发现:
| 属性 | 使用比例 |
|---|---|
| dofollow(默认) | ~89.4% |
| nofollow | 10.6% |
| ugc | <0.02% |
| sponsored | <0.02% |
6.2 UGC 和 Sponsored 采用率极低
尽管 Google 在 2019 年就推出了新属性,但几乎没有网站采用。
原因分析:
- 不是强制要求
- 技术实施需要成本
- 现有 nofollow 已经够用
- 很多网站不了解这些新属性
6.3 Google 将 nofollow 视为提示而非指令
这是一个重要的变化。
之前: nofollow = Google 完全忽略这个链接 现在: nofollow = Google 可能会考虑,也可能不会
实际意义:
- nofollow 链接可能仍有 SEO 价值
- 不要拒绝所有 nofollow 链接
- 来自权威网站的 nofollow 链接仍值得获取
- nofollow 链接至少有品牌曝光和流量价值
第七章:有毒外链真相
图:否认’有毒外链’后自然流量下降7.1%,数据证明盲目拒绝外链可能适得其反
7.1 Disavow “有毒外链”实验:基本无效果
很多 SEO 工具会标记某些链接为”有毒”(toxic),暗示你应该 disavow 它们。
Ahrefs 进行了一项实验来验证这个说法。
实验设计:
- 使用某知名工具导出三篇博客文章的所有”有毒”和”潜在有毒”链接
- 共 129 条 URL
- 在 Google Search Console 中 disavow 这些链接
- 观察 20 天
结果:流量下降了 7.1%
disavow 所谓的”有毒链接”不仅没有帮助,反而产生了负面影响。
7.2 Google Penguin 4.0 后的链接处理机制
2016年,Google 发布了 Penguin 4.0 算法更新,根本性地改变了垃圾链接的处理方式。
之前: 垃圾链接会导致惩罚 之后: 垃圾链接被自动忽略(devalued)
John Mueller 明确表示:
“Google 没有’有毒链接’的概念。”
7.3 何时真正需要使用 Disavow 工具
需要考虑 disavow 的情况:
- 你收到了 Google 的手动处罚通知(Manual Action)
- 你曾主动参与大规模链接购买计划
- 你的网站遭受了明显的负面 SEO 攻击
不需要 disavow 的情况:
- 某个工具说你有”有毒链接”
- 你的竞品有指向你的垃圾链接
- 你发现了一些来自低质量网站的自然链接
最佳实践: 把花在 disavow 上的时间用来建设高质量链接。Google 已经能够自动处理垃圾链接了。
第八章:有流量页面外链研究
图:Ahrefs Site Explorer展示Zapier博客外链概况,33.8万外链中潜藏大量链接腐烂风险
8.1 URL Rating 与排名相关性最强
在所有链接相关指标中,URL Rating(UR) 与排名的相关性最强。
什么是 URL Rating: UR 衡量的是单个页面的链接强度,考虑了:
- 指向该页面的链接数量
- 这些链接来源页面的质量
- 链接的 dofollow/nofollow 状态
为什么 UR 比 DR 更相关:
- 排名是页面级别的,不是域名级别
- 一个高 DR 网站的弱页面不一定排名好
- 链接直接指向目标页面的影响更直接
8.2 约 1/5 首页结果没有来自有流量页面的外链
一个有趣的发现:约 20% 排名首页的结果,没有来自有自然流量页面的外链。
这意味着:
- 来自有流量页面的链接不是必需的
- 但有这类链接的页面排名往往更好
- 质量和数量都很重要
8.3 优先获取策略建议
基于数据的链接优先级:
| 优先级 | 链接特征 | 原因 |
|---|---|---|
| 最高 | 高 UR + 有流量 + 相关 | 全面优质 |
| 高 | 高 UR + 相关 | 权威且相关 |
| 中 | 有流量 + 相关 | 可能带来直接流量 |
| 低 | 仅有流量 | 不相关的流量价值有限 |
| 最低 | 低质量 + 不相关 | 可能没有任何价值 |
实际应用: 在做外展时,优先联系那些:
- 页面本身有排名和流量
- 与你的内容高度相关
- 域名有一定权威度
第九章:研究方法论说明
9.1 相关性不等于因果关系
所有这些研究都是相关性研究,不是因果关系证明。
例如: 链接多的页面排名高,可能是因为:
- 链接帮助了排名(链接 → 排名)
- 排名带来了更多链接(排名 → 链接)
- 某个第三因素同时影响了两者
9.2 数据有滞后性
Ahrefs 的数据基于爬虫抓取,存在一定滞后:
- 新链接可能需要几周才能被发现
- 丢失的链接可能需要一段时间才能确认
- 排名数据每周或每月更新
9.3 研究的局限性
样本偏差: 研究通常基于高搜索量关键词,可能不适用于长尾词 时间限制: 大多数研究是横截面研究,不是长期追踪 工具限制: 基于 Ahrefs 自己的数据,可能与 Google 实际数据有差异
结语:让数据指导链接建设决策
基于这些研究,我们可以得出一些核心认知:
链接仍然重要
- Spearman 相关系数 0.255 证明链接与排名正相关
- Disavow 实验证明移除链接会导致排名下降
- 不同查询类型的链接重要性不同
质量优于数量
- URL Rating 与排名相关性强于单纯的链接数量
- 来自有流量页面的链接可能更有价值
- 相关性是关键因素
不要过度担心
- 66.5% 的链接腐烂是正常现象
- 互惠链接很普遍,自然的互链不是问题
- “有毒链接”大多是工具创造的概念,Google 会自动忽略垃圾链接
锚文本没那么重要
- 精确匹配锚文本与排名弱相关
- Google 分析整个链接上下文,不只是锚文本
- 自然的锚文本分布比刻意优化更好
关注可控因素
- 创建值得链接的内容
- 主动进行有策略的外展
- 监控和回收丢失的链接
- 持续建设而非一次性冲刺
最终建议: 用数据而非猜测来指导你的链接建设策略。不要被”有毒链接”恐吓,不要过度追求锚文本优化,专注于获取高质量、相关的链接。这才是长期有效的策略。
参考来源
- Google Says “Links Matter Less”—We Looked at 1,000,000 SERPs to See if It’s True - https://ahrefs.com/blog/links-matter-less-but-still-matter/
- How Many New Backlinks Do Top-ranking Pages Get Over Time - https://ahrefs.com/blog/backlink-growth-study/
- At Least 66.5% of Links to Sites in the Last 9 Years Are Dead - https://ahrefs.com/blog/link-rot-study/
- Anchor Text: A Data-Driven Guide (384,614 Web Pages Studied) - https://ahrefs.com/blog/anchor-text/
- Reciprocal Links: Will They Hurt Your SEO? (A Study by Ahrefs) - https://ahrefs.com/blog/reciprocal-links/
- The State of Nofollow, UGC, & Sponsored Link Attributes in 2020 - https://ahrefs.com/blog/nofollow-ugc-sponsored/
- Toxic Backlinks: SEO Woe or a Load of Baloney? - https://ahrefs.com/blog/toxic-backlinks/
- I Disavowed “Toxic Backlinks”: Here’s What Happened - https://ahrefs.com/blog/toxic-backlink-disavowal/
- Do Links Still Matter for Rankings? A Study by Ahrefs - https://ahrefs.com/blog/impact-of-links/
- Do Links From Pages With Traffic Help You Rank Higher? - https://ahrefs.com/blog/links-with-traffic-study/