谷歌搜索排名机制分析

Mario Fischer是SEO和在线营销方面的专家,他最新发布文章How Google Search ranking works,对谷歌搜索引擎的搜索排名机制进行了较为深入的分析和探讨。

How Google Search ranking works
Author: Mario Fischer
1. 谷歌排名系统的复杂性

谷歌的排名系统极其复杂,由于算法和机器学习模型的多层次结构,即使是谷歌的工程师也常常无法完全解释为什么某些页面排名更高。这种复杂性因为机器学习的加入而变得更加难以预测和理解。对于任何参与SEO的人来说,理解这种复杂性至关重要。

2. 内容索引和SERP创建
  • Tangram(或Tetris)系统:该系统负责优化搜索结果在搜索引擎结果页面(SERP)上的显示方式。尽管内部文档中名称可能不同(Tangram与Tetris),但其核心功能是相同的:以空间效率高的方式组织搜索结果的布局。
  • Alexandria 索引系统:名为Alexandria的系统在谷歌的索引过程中发挥了关键作用。互联网上的每一份内容都被分配了一个唯一的文档ID(DocID),作为中心参考点。值得注意的是,谷歌区分了URL和文档,认识到多个URL可能指向相似的内容,这些被视为同一文档的一部分,所有相关URL的信号共同影响被认为是“规范版本”的内容的排名。索引过程还包括处理重复内容,谷歌决定哪个版本的内容被视为原始版本并相应地进行排名。
3. 初步排名与筛选
  • QBST:当用户进行搜索查询时,QBST(基于查询的搜索词)启动,分析关键词。例如,当用户搜索“铅笔”时,相关的术语被识别并与谷歌的倒排索引匹配,该系统将关键词与其关联的DocID一起索引。此过程涉及由RankBrain、BERT(双向编码器表示)和RankEmbeddedBERT等系统驱动的复杂词重机制。
  • Mustang系统:该系统通过应用各种过滤器和算法来优化潜在结果列表(最初最多1000个DocID)。它使用SimHash检测并消除重复内容,并评估每个文档的质量和原创性。目标是将列表缩小到最终的10个结果,通常被称为“蓝色链接”或“蓝色环”。
4. Twiddlers:实时过滤器和调整
  • PreDoc 和 Lazy Twiddlers:Twiddlers是专门的过滤器,用于根据各种标准调整文档的排名。PreDoc Twiddlers快速处理整个DocID集,应用基本的过滤器如新鲜度或多样性。相反,Lazy Twiddlers需要更详细的数据,并且处理时间更长,因为它们访问存储在PerDocData等系统中的更深层信息。
  • Twiddlers的功能:Twiddlers可以改变文档的信息检索(IR)分数,直接影响其排名。例如,某个Twiddler可能会提高新文档的IR分数,以便它们更有机会获得更高的排名。另一个Twiddler可能通过降低内容相似的文档的价值来促进多样性,确保搜索结果提供多种观点。这对于维持一个平衡和多样化的搜索结果集尤为重要。
5. NavBoost 和点击数据的作用
  • NavBoost系统:尽管谷歌公开声称点击数据不会影响排名,但内部文件和监管听证会揭示了事实并非如此。NavBoost是一个基于用户互动数据(如点击率)调整排名的系统。如果某个搜索结果比预期获得更多点击,NavBoost可能会提升其排名。相反,如果某个结果表现不佳,可能会被降级。该系统帮助谷歌根据实时用户反馈微调SERP。
  • Chrome数据的使用:文件表明,谷歌通过Chrome浏览器收集大量用户互动数据,这些数据提供了用户如何浏览和互动搜索结果的见解。这些数据被汇总并分析,以改进排名算法,确保显示最相关的结果。
6. 质量评估人员与机器学习的作用
  • 质量评估人员:谷歌雇佣了全球的质量评估人员,依据预定义的标准评估特定搜索结果。他们的反馈有助于训练机器学习模型识别高质量内容。例如,评估人员可能会评估内容是否由专家撰写,是否可信,或者是否符合用户期望。
  • 机器学习的影响:评估人员的评估贡献于“信息满意度”分数,机器学习算法使用这一分数来优化排名信号。通过这种方式,谷歌能够识别与高质量内容相关的模式,并将这些模式整合到排名算法中。随着时间的推移,机器学习模型变得更善于预测哪些内容能够满足用户,从而生成更准确和相关的搜索结果。
7. 动态调整与排名波动
  • 实时调整:谷歌搜索具备根据当前事件和用户行为变化进行实时排名调整的能力。像FreshnessNode和InstantNavBoost这样的系统可以快速响应搜索兴趣的激增,例如重大新闻事件发生时。这些系统临时调整排名,以优先显示最相关的内容,即使这意味着降级先前排名较高的页面。
  • 外部因素的影响:谷歌的排名系统具有动态性,这意味着由于网站所有者无法控制的因素,排名可能会波动。例如,用户行为的突然变化或其他文档的新信号的出现,可能导致先前排名良好的页面下降。该分析文章强调理解这些外部影响并相应调整SEO策略的重要性。
8. 关键的SEO策略与建议
  • 多元化流量来源:确保你的网站流量来自多个来源,而不仅仅是搜索引擎。来自社交媒体等不太显眼渠道的流量也是有价值的。即使Google的爬虫无法访问某些页面,Google仍然可以通过Chrome或直接URL跟踪有多少访问者来到你的网站。
  • 建立品牌和域名认知度:始终致力于加强品牌或域名的认知度。人们对你的名称越熟悉,他们在搜索结果中点击你网站的可能性就越大。针对许多长尾关键词进行排名也能提升你域名的可见度。有消息透露,“网站权威性”是一个排名信号,因此提升品牌声誉有助于改善你的搜索排名。
  • 理解搜索意图:为了更好地满足访客需求,试图理解他们的搜索意图和路径。使用Semrush或SimilarWeb等工具查看访客来自哪里,离开你的网站后又去了哪里。分析这些域名——它们是否提供了你的着陆页所缺乏的信息?逐步添加这些缺失的内容,使你成为访客搜索之旅的“最终目的地”。记住,Google会跟踪相关的搜索会话,并确切地知道搜索者在寻找什么以及他们曾经搜索过什么。
  • 优化标题和描述以提高CTR:首先审查当前的点击率(CTR),并进行调整以增强点击吸引力。将几个重要词汇大写可以让它们在视觉上更突出,从而可能提升CTR;测试此方法看看是否对你有效。标题在决定页面是否能很好地针对某个搜索短语进行排名方面起着至关重要的作用,因此优化标题应是首要任务。
  • 评估隐藏内容:如果你使用手风琴式菜单“隐藏”需要点击才能显示的重要内容,检查这些页面的跳出率是否高于平均水平。当搜索者无法立即看到他们是否在正确的位置并需要多次点击时,负面点击信号的可能性就会增加。
  • 移除表现不佳的页面:如果某些页面没有访客访问(通过网络分析)或在较长时间内未能取得良好排名,必要时应将其移除。负面信号还会传递到相邻页面!如果你在“糟糕”的页面群发布新文档,新页面几乎没有机会取得好成绩。“deltaPageQuality”似乎实际上测量了域名或页面群内各个文档之间的质量差异。
  • 增强页面结构:清晰的页面结构、易于导航和良好的第一印象对于获得顶级排名至关重要,这通常得益于导航提升(NavBoost)。
  • 最大化用户参与度:访客在你网站上停留的时间越长,你的域名发送的信号越好,这对你的所有子页面都有利。目标是成为最终目的地,通过提供他们所需的所有信息,让访客无需去其他地方寻找。
  • 扩展现有内容而非不断创建新内容:更新和增强现有内容可能更有效。内容努力分数(ContentEffortScore)衡量了创建文档所投入的努力,诸如高质量的图片、视频、工具和独特内容等因素都对这一重要信号有所贡献。
  • 使标题与所引入的内容一致:确保(中间)标题准确反映后续的文本块。与纯粹的词汇方法相比,使用嵌入(文本向量化)等技术的主题分析更有效地识别标题和内容是否匹配。
  • 利用网络分析工具:Google Analytics等工具可以让你有效跟踪访客的参与度,并识别和解决任何缺口。特别注意着陆页的跳出率。如果跳出率过高,调查潜在原因并采取纠正措施。记住,Google可以通过Chrome浏览器访问这些数据。
  • 瞄准竞争较小的关键词:你还可以首先专注于较少竞争的关键词排名,从而更轻松地积累正面用户信号。
  • 培养优质的反向链接:专注于来自HiveMind中存储的最近或高流量页面的链接,因为这些链接提供了更有价值的信号。来自流量或参与度较低页面的链接效果较差。此外,来自同一国家的页面和与你内容主题相关的链接更有利。请注意,“有害”的反向链接确实存在,它们会对你的分数产生负面影响,因此应避免这些链接。
  • 关注链接周围的上下文:不仅仅是锚文本本身,链接前后的文本也被考虑在排名中。确保文本在链接周围自然流畅。避免使用诸如“点击这里”之类的通用短语,这种做法在过去二十多年里一直无效。
  • 注意拒绝工具的局限性:用于无效化不良链接的拒绝工具(Disavow tool)在泄露的信息中根本没有提及。似乎算法并不考虑它,它主要是为垃圾邮件防御者提供的一种文档工具。
  • 考虑作者的专业性:如果你引用作者,请确保他们在其他网站上也受到认可并展示相关专业知识。拥有少数但高素质的作者比拥有许多不太可信的作者更好。根据一项专利,Google可以根据作者的专业性评估内容,区分专家和外行。
  • 创建独特的、有用的、全面且结构良好的内容:这对于关键页面尤为重要。展示你在该主题上的真实专业知识,并在可能的情况下提供证据。虽然只为了在页面上有内容而找人写作很容易,但在没有真正的质量和专业性时设置高排名期望可能并不现实。
9. 反向链接与链接上下文的重要性
  • 优质反向链接:反向链接仍然是一个关键的排名因素,但该分析文章强调获得来自高流量、相关页面的链接的重要性。来自低流量或不相关页面的链接效果较差,甚至可能有害。该分析文章还建议监控“有害”的反向链接,这些链接可能会损害你的排名。
  • 上下文相关性:链接周围的文本与锚文本本身一样重要。谷歌在确定链接的价值时,会考虑链接出现的上下文。因此,确保链接自然地嵌入在相关内容中至关重要。
10. SEO工具与策略的局限性
  • Disavow工具的局限性:用于无效化不良链接的Disavow工具可能没有许多人认为的那么有效。谷歌的算法可能不考虑这个工具在排名计算中的作用,其影响主要限于管理或文档记录用途。
  • 作者专业性:内容的作者应在其他网站上也受到认可并展示相关专业知识。具有更少但高素质作者的内容比拥有许多不太可信的作者的内容更容易获得良好排名。这与谷歌关注内容质量和权威性相符,专业性和可信度是关键因素。
11. SEO策略的最终思考
  • 全面的内容:创建结构良好、全面的内容,展示真实的专业知识非常重要。仅仅为了在页面上填充内容而写作是不够的;内容必须达到高标准的质量才能获得良好的排名。
  • 适应动态系统:结论重申了SEO需要采用广泛且适应性的策略。仅优化关键词或反向链接是远远不够的;全面理解内容与用户意图的匹配程度、内容的结构,以及谷歌各种系统的理解方式对于长期成功至关重要。
12. 排名动态的示例
  • 该分析文章提供了一个涉及“铅笔”搜索词的假设场景,展示了谷歌排名过程中的不同系统和过滤器如何相互作用,以确定最终的排名位置。这个示例显示了即使是微小的调整或外部影响(例如因电视节目引发的搜索兴趣激增),也能实时显著改变排名。
13. 关键要点总结
  • 多元化与品牌建设:该分析文章重申了多元化流量来源和加强品牌认知的重要性。
  • 内容优化:重点放在优化标题、描述和内容结构上,以提高点击率和用户参与度。
  • 理解与适应搜索意图:强调理解和适应用户搜索意图的必要性,鼓励内容创建者认真考虑用户在寻找什么以及如何有效地满足这些需求。
14. 新鲜度与搜索行为
  • FreshnessNode与搜索意图的适应:该分析文章解释了谷歌的系统,如FreshnessNode,如何适应搜索行为的实时变化。这不仅仅是展示新内容,还涉及理解用户搜索需求的变化。例如,如果因为重大事件或媒体报道突然改变了人们的搜索内容,谷歌会调整排名以反映这种新的意图,优先展示更符合当前搜索行为的内容。
  • 长期数据分析:谷歌不仅依赖短期数据,还会考虑长期模式。点击率(CTR)等指标会在13个月内进行评估,以确保排名反映用户的持续偏好。这意味着短期内的搜索兴趣激增可能会暂时提升某个页面的排名,但持续的用户参与度才是保持高排名的关键。
15. 搜索会话与跨域行为
  • 搜索会话数据:谷歌会跟踪整个搜索会话,而不仅仅是孤立的查询。如果用户点击某个结果,迅速返回搜索结果,并点击另一个链接,这一序列会被分析以评估内容的质量和相关性。这种行为用于优化不仅是个别页面,还包括相关内容群的排名。
  • 跨域影响:该分析文章还提到了谷歌如何追踪用户在域与域之间的行为。如果用户离开一个网站,在另一个网站上找到了他们正在寻找的信息,后者在未来的排名中可能会受益,尤其是当这种模式在许多用户中重复出现时。
16. PageRank与最近种子版本
  • PageRank计算:该分析文章详细描述了谷歌的基础算法PageRank如何应用。然而,它还指出使用“最近种子版本”(NearestSeedVersion)指标,该指标临时将相关性较高的页面的PageRank值分配给新的或知名度较低的页面,直到它们积累足够的数据来计算自己的PageRank。这种方法帮助新内容在初期获得可见度,即使它们还没有显著的流量或反向链接。
  • 继承的信号:新页面可以继承“父”页面或邻近页面的信号。这种继承的PageRank可以帮助这些新页面在排名中上升,尤其是当它们属于一个在整体排名上有强势表现的域名时。
17. 神经网络与机器学习的影响
  • 预测模型:该分析文章解释了谷歌越来越依赖神经网络和机器学习模型来预测用户想在搜索结果中看到的内容。这些模型有时比传统的排名因素(如用户历史或偏好)更有效,因为它们能够识别整个网络中用户行为的广泛模式。
  • 基于用户反馈的调整:谷歌的系统不断从用户互动中学习,优化预测并相应地调整排名。这意味着即使是用户行为的微小变化,也可能导致搜索排名的显著变化,因为系统会根据新数据做出调整。
18. 维护排名的挑战
  • 短暂的排名变化:该分析文章警告说,高排名可能是暂时的,尤其是如果是由短期事件或趋势推动的。当用户兴趣消退时,排名可能会下降,除非内容继续吸引点击和参与度。这强调了持续进行内容优化和用户参与策略的重要性。
  • 全面的SEO理解:分析的最后强调了SEO需要一个全面的理解和策略。仅优化技术(如提高页面速度或修复损坏的链接)是重要的,但它们必须与深刻理解用户行为、内容质量和谷歌的动态排名算法相结合,才能保持和提升搜索表现。
19. 总结

该分析文章重申了SEO策略需要广泛且适应性的理念。虽然技术优化(如提高页面速度或修复损坏的链接)很重要,但它们必须与深刻理解用户行为、内容质量和谷歌的动态排名算法相结合,才能保持和提升搜索表现。归根结底,最成功的SEO策略是优先考虑用户满意度。通过持续提供高质量、相关性强和具有吸引力的内容,网站更有可能在搜索排名中表现良好,无论算法如何变化。

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注