实例分析搜索引擎如何进行"中文切词"分析?

     我们通过百度搜索一个关键词的时候,通常百度会返回一些页面给我们,那搜索引擎是如何知道要返回什么界面给我们的呢?这个就要用到搜索引擎的“中文切词”的方法了。同样的我们习惯用大量的实例去分析百度的中文切词的习性。

     

首先我们现在百度搜索关键词“福州网站设计”出来的是我们的另一个网站的排名



我们可以很清楚的看到搜索引擎进行切词了,因为我整个网站的文章里面没有含有福州网站设计的字眼

     福州网站 网站设计  这就是搜索引擎他进行分词了,我们学过中文的都知道,搜索引擎把词义分为几大类型,一:名词,二:动词,三:形容词。福州网站设计可以化为一个名词,但是为了其他词的密度不在降低,所以我用了切词法,福州网站作为名词,网站设计作为动词,搜索引擎会会根据大概的词频来定位你网站的属性。
 


我们可以看到福州网站整个文档里包含了18个



网站设计的词频达到30个,搜索引擎就会认为你的重点在网站设计
     
     中文切词含有很大的学问,小生也是研究了点,希望大家可以多交流交流。

内容版权声明:除非注明,否则皆为本站原创文章。