第一部分:内容的SEO化
广义上的“SEO化”如何理解:
- SEO化的优势1:流量的精准性
- SEO化的时候2:长尾效应
- SEO化的时候3:跨平台应用
- SEO化如何下手:了解tf-idf和textRank算法
第一种杠杆是大家熟悉但却很多时候不知道如何去应用的SEO。我特别想分享的一点是,我们要以更广义上的角度来看待SEO的策略,它并不一定是百度、谷歌等综合搜索平台。譬如说,实物商品领域有淘宝天猫的搜索;服务领域有美团点评的搜索;信息服务有知乎、小红书、头条的搜索;视频领域有抖音、爱优腾的搜索…
事实上,几乎任何一个体量规模较大的平台,都一定会配备搜索引擎。因为尽管以推荐算法逻辑为主的信息分发模式,可以更好的覆盖尽可能多的用户需求,但对于有明确需求、明确意向的用户,推荐的及时性、准确性都无法做到足够的高效。因此,对于这些需求明确的用户而言,搜索是让他们找到自己的目标商品 / 服务 / 信息的最佳交互方式,一个有趣的例子是女生逛淘宝70%靠推荐,20%点分类,男生逛淘宝直冲目标解决需求,80%靠搜索。这就是搜索模式的特点,而在可以看见的未来里,这一点永不会变。
那么我们的内容,如果能够适配SEO的一些规律,就可以在几乎不增加任何额外的成本的情况下,获取更多的流量,我把这种模式称为“内容的SEO化”。具体来说,内容的SEO化有两大好处:
1.更加精准和高转化的流量。和我们直接发布公众号、发布知乎、百家号、小红书……等平台不同,内容SEO化带来的额外流量与曝光是基于搜索的。因此,搜索流量的大小,取决于“成功获取排名的关键词”的搜索量多少、以及“成功覆盖有排名的关键词”的数量,而搜索流量精准程度,不同的关键词有较大的差距,但总体而言,搜索流量是普通推荐算法的10倍以上。我们可以通过官网的SEO长尾词转化数据,以及观察知乎等支持外链跳转的浏览数据 -> 跳转到官网后的留资注册数据可以发现这一点。
2.SEO具有显著的时间长尾效应,能够持续积累价值。在通常的搜索引擎算法中,用户行为数据的积累具有很大的影响,简单的说如果我们发布一篇内容,并陆陆续续获得了用户的赞同、互动或者分享等,那么他积累的点击、阅读、互动、分享等等行为,都会让这个内容获得更好的站内搜索(如知乎、小红书)或者站外搜索(如百度、360、谷歌)更好的排名,从而进行滚雪球的效应。此外,在确定性的需求下,用户的搜索词通常不会发生太快的变化,随着时间的递增,内容能够稳定的持续积累浏览、曝光和可能的转化。这是如PR稿、公众号推文、社群发布文章等渠道所不具备的优势。
小总结一下,几乎任何渠道、任何内容都可以进行SEO化,从而持续积累获取到更多流量、更精准的流量。那么纯内容营销的SEO化,和我们熟知的官网SEO的区别又在哪里呢?我们如何去实现它?这是接下来我们要回答的重点问题。
首先,关于官网SEO和内容营销SEO化的区别,官网的SEO至少有50%依赖网站架构和链接关系,比如html的标签设计、整体URL的结构、内部链接关系和外部链接关系等等,这就意味着脱离了html网站之外这些规则就没有了意义;而内容的SEO化基本只依赖内容本身,这使得内容营销的SEO化可以跨平台、跨行业来产生价值。一篇内容,如果发布10个渠道,那么SEO化带来的额外流量,就可以乘以10倍。
其次,如何去实现内容的SEO化,我分享并解析两个核心的算法。值得注意的是,这里的算法只是简化版,是帮助大家理解搜索引擎的工作方式,是“定性”而非“定量”的,内容营销SEO化“定量”的部分,总体上需要依靠大量的经验来完成。
1.TF – IDF算法。这个算法我建议大家必须掌握。尽管目前的搜索引擎已经更加倾向用概率模型来做语义理解和内容的关联度匹配,但从实际经验验证的效果来看,TF-IDF算法是一个简单可行易理解,并且总体上接近真实结果的模型,对于许多简单一些的搜索引擎如某乎某书某信和垂直论坛来说更加接近。
TF – IDF算法简单的理解为:重要的关键词出现多次(TF就是词频),这个逻辑比较简单,SEO里也经常听到“词频”的概念,虽然有绝对词频和相对词频的区分,但这里不展开;重点说说IDF值,IDF值对出现的关键词进行一个基于语料库的权重调整,从信息含量上来说,越多的篇幅提到的关键词,意义越小。想象一下:每篇文章都会出现的“我”“你”“好”“坏”或者“营销”“互联网”,很难表达到具体的意义,而一篇文章如果出现了“脱氧核糖核苷酸”那么它的领域就更加的具体了。
因此,在所有的文档(语料库,如网页、文章)中出现越多次的关键词,IDF值越低,越少见的词(如品牌词,只有自己官网和PR稿有)IDF值则越高。
TF – IDF的算法就是把每一个词的词频,乘以IDF的值,得出一个分数。总分数越高的关键词,排名越靠前。举个例子:「小红书成为品牌方口碑营销根据地」,我们把他改成「小红书品牌营销成为了品牌方营销的根据地」。看起来差不多,但第一个句子品牌、口碑、营销各出现一次,第二个句子品牌、营销出现了2次。如果在简单的搜索引擎中,「品牌营销」的搜索结果,将会优先出现第2个句子而非第1个句子。
这里还需要提一下,在实际的应用中,BM25 模型会更多,和TF -IDF的差异在于有很多因子可以调节:文章的长短递减参数(文章越长、词频叠加分数递减)、各种经验参数的平滑等等,因此千万不要死杠数值,而是要理解逻辑和积累经验。
2.TextRank算法。想象一下这样的一个段落:「1月20日下午,赵老师与加玮在数字营销方面展开了讨论,赵老师面色红润,讨论得十分开心。这次关于数字营销的讨论结束后,赵老师还给群友发了红包。」 如果按照TF – IDF来计算,这段里面提取的重点词是赵老师(出现了3次),其次是讨论(出现3次)。
显而易见,用这两个关键词很难说全面的代表了段落的主题。如果按照TextRank的算法,数字营销将会成为最为关联的关键词。这是因为词频最高的关键词「赵老师」和「讨论」的紧密的上下文中,出现了2次「数字营销」。我们理解这个例子的意思即可,也就是说,如果我们希望“数字营销”的排名分数更高,不仅仅要有比较高的数字营销的词频(IDF值无法控制),还要在其他的主题,比如在例句中是“赵老师”和“讨论”,让这些主题词的词频也比较高,然后将数字营销的词,与“赵老师”这样的词,形成一个上下文关系。
【图:tf-idf 和textRank算法在内容SEO化中的应用】
1.我们核心的业务关键词或者需求词,多重复几遍。可以多次充当宾语或者主语,来自然的加强词频,尽管有时候可能看起来有一点啰嗦,但是有用。—— tf idf
2.注意上下文关系,如果一个内容频繁的出现,比如是某次峰会或者沙龙的主题,那我们的核心关键词就要在这个频繁出现的关键词的上下文(词语的前后、句子的前后)中尽可能多出现几次。- textRank
那么这两个算法要如何应用呢?定性的说。
1.我们核心的业务关键词或者需求词,多重复几遍。可以多次充当宾语或者主语,来自然的加强词频,尽管有时候可能看起来有一点啰嗦,但是有用。
2.注意上下文关系,如果一个内容频繁的出现,比如是某次峰会或者沙龙的主题,那我们的核心关键词就要在这个频繁出现的关键词的上下文(词语的前后、句子的前后)中尽可能多出现几次。
定性的部分就到这里了,具体出现几次?哪个位置才算上下文?关键词的分词应该怎么处理?可以在实战中通过积累经验去持续提升。限于时间原因就不展开了。
三、利用社交货币和平台特性第二部分:社交媒体杠杆
- 社交媒体重点不在”媒体“在“社交”
- 你让ta分享,考虑过ta分享的动机吗?
- 如何利用好5种社交货币
- 如何把内容适配不同的社交平台
我们都知道社交媒体的裂变、分享对于内容的传播有很大的价值。然而我们在执行过程中,往往没有把社交媒体的杠杆用好。比如许多以KA客户为主的市场内容团队,非常重视客户案例,在官网发案例、公众号发案例、知乎发案例、百家号发案例…朋友圈还是发案例。这就是我们只看到了媒体的一面,即“多渠道多平台同步发内容可以让曝光最大化”,但没有看到“社交”的一面。
把“社交媒体”作为内容杠杆放大的重点有两个。第一个是《疯传》里面提到的“社交货币”的概念,它决定了一个内容究竟能走多远:别人会分享它吗?会哪儿,多少次?他的朋友看到了会再次分享吗?如果用一个指标来衡量,在公众号的后台,“分享阅读占比”能否超过30%甚至是50%?