很多站长都试图通过SEO为自己的网站获得一个良好排名,于是在网络上搜索各种不同的SEO技术。网络上虽说有各种各样的SEO技术,但这些技术可以说是五花八门,没有一个标准,甚至经常会看到各种观点是相对的,有时更是一个公说公有理,婆说婆有理的,搞得我们很多站长不知听哪个得好,只得把自己的站当作小白鼠一样来做实验,最很往往弄得得不偿失!其实我们做SEO时最好要了解一些基本的知识,这些就如一座大厦的基石一样,你看到的只有高楼,但没有基石,高楼是立不稳的~!今天我们就来谈谈搜索引擎排行的基石之一:分词技术。

相信大部分站长都听过个种技术,有些也有相当的了解。其实分词技术并不高深,它虽在操作上有些抽像,但他应该是比较好理解的。分词就是把一串字符序列切分成一个一个单独的词。分词包括英文分词,中文分词等,我们这里主要讲的是中文分词(Chinese Word Segmentation)。中文分词应用很广,特别是在搜索引擎中,它的主要目的是为了对一段文字进行文本挖掘,以达到让电脑自动识别语句的含义。这样我们就不难理解,为什么我们在百度,GOOGLE这些搜索引擎中输入一些文字,它们就能提供出相似的一些结果出来让我们来参考选择。其实这些引擎也是能过分词技术把你所输的信息分词,以达到理解你所要信息的真正含义。虽说有时电脑得出的结果并非你所要的,但这是无法避免的,有时可能是你的表达有误,有时可能是这些搜索引擎的分词并不完美。

在分词技术中,有一种开发人员常用的指标方法叫TF-IDF是一种用于信息搜索和信息挖掘的常用加权技术.其中TF词频(Term Frequency)指的是某一个给定的词语在该文件中出现的次数,而IDF是反文档频率(Inverse Document Frequency)的主要思想是:如果包含词条的文档越少,IDF越大,则说明词条具有很好的类别区分能力。使用TF*IDF可以计算某个关键字在某篇文章里面的重要性,因而识别这篇文章的主要含义,实现计算机读懂文章的功能。这种技术说直白一点就用这些指标来判断一段信息中某个词的重要性到底如何?在搜索引擎中也是通过这些指标来排列您所要找的资料。

 

我们作为SEOer,反过来逆推,就能得知,如果我们能对分词技术有一定理解的话,在设置关键词,描述,文章,标签时,就能结合普通人的搜索习惯,分词权重,再科学地组织这些关键词,或者是描述等等。以达到你的这些词的布局正是这个行业里搜索引擎所关注的,网友朋友使用得最多的一些搜索关键词。这样,你的设置就会发挥出最大的功效!

 

  分词的概念,中文分词,指的是将一个较长的汉语,词语切分成一个一个单独的词语,按照一定规则从新组合成一定词序的过程,也被中文的切词,举一个例子,深圳搬家公司,我们可以怎么来分呢,可能我们心里就会想,这里有三个词,深圳一个词,搬家一个词,公司一个词,其实这个是我们平时的一个了解,但是搜索引擎不认为他这里只有三个词。那么搜索引擎会认为他有几个词呢?我们来看一下,深圳搬家公司,深圳,搬家,公司,搜索引擎还认为,深圳搬家他是一个词,搬家公司他是一个词,深圳公司他是一个词,然后深圳搬家公司,他会认为这是七个词,搜索引擎会有一个词库,在这里切词。既然搜索引擎会这么认为的话,他会不会认为这个圳搬或者家公是一个次呢?他是不会认为是一个词的,因为他的词库里没有这个词,到底是怎么切词的。
外贸网站SEO关键词分词排名技术-外贸seo阿君免费指导
  我们下面了解一下他的分词方式,会有几种。第一种是基于字典的匹配去分词,就像刚才说到的,百度他会有一个库,这个库有非常多的词、字、语去拆分。第二个是基于统计的匹配方法,基于统计的可能大家现在比较的难理解一点。第三种是理解匹配,就是赋予搜索引擎一个思考的能力,让他去想,这些词是这样匹配吗,比如说深圳搬,那深圳搬是词吗?能出现吗?他就会去思考。基于字典匹配是根据词和字典中已有的词去匹配处理。我们去读一段话的时候,他会分为正向匹配和逆向匹配,根据扫描的方向不同会正向的去匹配这个词和逆向匹配这个词,等下我们再详细讲解一下。按照扫描方向可以分为正向最大匹配和逆向最大匹配的。还有一个是混合匹配。可能大家听到这里的时候会有一头雾水的感觉,感觉这个好像比较难理解,接下来会有一些演示。
  正向匹配和逆向匹配的案例,我们和服务员工作在一起,正常人的思维,一看就能看出这个句子的意思是什么,那我们来看下搜索引擎是怎么读的,他会从左向右读,正向匹配,我们、和服、务员(不是一个词,务单独),务、员工、作、在一起。然后他会在逆向匹配一次,看用户最终需要的是哪一种结果。再看下最大正向和最大逆向的原理,一寸光阴一寸金。还有一个混合匹配,深圳蚂蚁搬家公司,虽然包含了深圳搬家,他会把深圳、搬家、公司拆分出来,在看下基于统计是指分析大量的数据样本扫描计算出字、词、句出现的统计概率,几个字相邻出现越多,就越能形成一个词,同样的可以形成句。我们看下最新苹果价格,我们思考下,这个怎么理解,是搜索苹果装个水果呢,还是苹果这个手机呢,他会有一个水果或者手机,这个时候搜索引擎就会去思考,回去根据之前抓的那些数据做一个统计,去统计一下,搜索最新苹果价格的,这个人的人群,如果有90%都是搜手机的话,那么可能第一页显示的都是手机,如果70%以上这个词都是搜水果的话,那么第一页或者大部分结果都会出现水果的词。如果我们加一个苹果4,毫无疑问最后的结果都是手机。
外贸网站SEO关键词分词排名技术-外贸seo阿君免费指导
  由于汉语的博大精深,目前的搜索引擎还是很难做到记忆理解的,所以搜索引擎目前也在不断的去进化,去理解去模仿人的思维。