FavoriteLoading
0

2019 相关性关键是Semantic SEO, 是语义不是关键词

Semantic SEO 强调的是语义不是关键字。了解搜寻引擎操作需要经常观察搜寻排名结果。最近你可有发现一些搜寻排名最前的SERP 愈来愈多内容中并没有直接提及搜寻关键字?这表示Google 已经可以进一步掌握语义分析,对一些常见主题查询,无需太依赖关键字的出现来判断相关性。当然,对一些长尾关键字,关键字的出现仍然起主导排名作用。

过去二十年,我们被迫迁就一个没有语义分析能力的搜寻引擎,将原来日常用语的查询约化为关键字。随着语音搜寻Voice Search 普及和深度学习人工智能deep learning AI 的突破,几年前搜寻引擎计算排名时已经引入语义分析。现在普及到中文内容。

Table of Contents

知识图Knowledge Graph

要进行语义分析要先建立对世界观的语义数据库。语义数据库愈大愈完整,分析能力愈大。就像初生婴儿要先了解“妈妈”、“爸爸” 才能理解“妈妈去找爸爸” 这句话的意思。Google 在2010 年收购了Metaweb, 一家专门从事建立结构化数据库Freebase 的公司,其中的技术和数据库溶入了Google 知识图Knowledge Graph (KG) 中。过去几年知识图数据库的条目大幅倍增,2016 年5 月已能够回答Google 处理的每月大约1000亿次搜寻中的三分之一。

知识图

知识图是关于实体Entity 和实体之间的关系。当实体数据库大幅增大语义分析才变得可能。搜寻输入内容是搜寻用户作出的一个提问。例如输入“网上推广” 可以是问:

  • 如何做网上推广?更确切是互联网(实体)上有那些文章(实体) 介绍网上推广方法(实体) 。
  • 什么是网上推广?更确切是网上推(实体) 的定义(属性) 是什么?
  • 哪些网站关于网上推广服务?更确切是那些公司(实体) 提供(关系) 网上推广服务(实体) ?

Google最近一个专利文件,利用人工智能在用户查询同传统搜寻结果中间介入,利用人工智能将用户输入转变为不同的搜寻查询(术语和概念),再发放到传统搜寻引擎作查询,利用人工智能再判断哪一个返回来了结果为最优,什致乎整合不同的返回回结果。这种机制很可能已经应用在RankBrain中。


Word2Vec 概念

传统相关性理论是关键字TF -IDF。但这种方法未能考虑词汇与词汇中间的关系。例如爸爸、妈妈看独立的词汇。词汇(例如:爸爸和妈妈)的相关性需要能被计算,才能利用计算机进行逻辑推理。这是人工智能中利用Word2Vec就是利用作分析词义找出词汇相关性的新技术,是AI learning的一种。

想像每一个网页都系有一组词汇组成。谷歌使用是Word2Vec,为一群用来产生词向量的相关模型,用来训练以重新建构语言学之词文本。训练完成之后,Word2Vec 模型可用来映射每个词到一个向量,可用来表示词对词之间的关系。词向量的建立是可以透过输入大量数据培训(train) 出来。Google 提供一个以300兆词词文本培训出的3佰万词向量的vector, 免费下载,用于编程。

就是一个向量形式表示每一个字。例如:母亲、女人、男人、爸爸词汇可以有关

母亲爸爸女人男人
生育0.990.990.50.5
婚姻0.90.90.40.4
男性化0.010.990.010.99
女性化0.990.010.990.01
年纪0.60.60.40.4

女人和母亲向量差异(Vector difference) 在“生育” 和“婚姻”。男人和父亲向量差异在“生育” 和“婚姻”。因此:

母亲– 女人+ 男人= 父亲

更多请参阅:The amazing power of word vectors .


专题权威Topical Authority

传统搜寻引擎解答以上问题的做法是依赖关键字匹配Keyword Matching。多年前搜寻引擎公司已经知道关键字匹配有很多盲点。最好方法是了解输入查询所指向的实体,实体属性attribute 和实体与实体之间的关系relationship。再加上了解用户搜寻意图Search Intention 找出最适合的答案。

例如:以搜寻输入“网上推广公司” 为例。以前是以内容中出现“网上推广公司” 这个关键字。现在通过语义分析,现在可以找出两个实体,一个是“网上推广”,一个是“公司”,并理解为:

“公司” → “提供服务” → “网上推广”

而满足为“公司” 实体的又会包含实体属性如:”联络地址”、”联络电话”、”网站”、”提供服务”。所以SERP 根本无需包含“公司” 词汇。”公司网站” 也是“公司” 的其中一个属性。只要搜寻结果所列出的网站在一“公司” 实体之下可以。

从以上推断:什么样的网页能在查询“网上推广公司” 取得高排名?搜寻引擎评估“公司” 实体会喜欢:

  • 属于公司网站的网页优于公司的独立网志、优于公司的Facebook 粉丝专页。
  • 网公司站中包含大多数公司属性、如“联络电话”、”联络地址”、”代表人物” 等等。
  • 网公司站提到所提供服务,如: “网上推广”。网站内愈多网页提及此服务表示该服务对该公司愈重要(Weight Factor)。换句话说,网站具有专题权威。
  • Google My Business 很可能被搜寻引擎用于判断公司的属性。

从Google 专利文件可以看到评估实体一些准则。除相关性Relevance外,包括知名度Notability (又是关于反向结连),Contribution评分, Price奖项等。

但是两个网站同样拥有公司属性,同样提供网上推广服务,Google 要判断那一个更好?需要考虑搜寻引擎如何评估 “网上推广” 实体?网上推广的属性(或相关服务) 可以是“Facebook 推广”,”SEO”, “SEM”, “Adwords 广告”, “YouTube 推广”,”百度SEO” , Yahoo, Bing 等等。当网页的其他评分相等,就需要单从内容判断高下。所以愈多属性出现,相关性愈高。这是共被引用Co-citation 概念。


短句,不复杂结构

搜寻引擎优化不喜欢单薄内容shallow content。从语义分析角度来看,网页中能够被理解的句子就是内容,不能被理解的就可能只能视为杂讯noise。一个网页中杂讯越多,就越接近被评定为单薄的内容。网页中具有相同含义但不同类型的措辞将被视为重复内容 duplicated content。语义分析了解短句系比较了解长句和复杂句子容易,所以短句被评定分析为什杂讯机会是较低。最简单的结论就是语义分析时候短句简单句法更适合搜寻引擎优化。另一个角度语音搜寻SERP统计结果亦确认语音搜寻所提供的答案都是来自较短较简单和直接内容。


长尾关键字排名

长尾关键字由于实体并未建立或者不能轻易识别实体之间的关系,所以长尾关键字的出现仍然起主导排名作用。通过保留强化语义来排名,成功自然可以为多个关键字获得良好排名。更多关于我们提供的SEO免费课程

尼尼博客,关注网上兼职赚钱和互联网创业。博客地址:www.imnini.com,扫描下面二维码添加微信:网上赚钱项目和经验分享,电子书、网赚视频,各种付费视频分享
网络兼职赚钱