分词技术就是搜索引擎针对用户提交查询的关键字符串进行查询处理后根据用户的关键词串用各种匹配方法进行分析的一种技术。那么百度分词技术与关键词排名之间的关系有哪些呢?下面具体分析分析。
查询处理
当用户向搜索引擎提交查询后,搜索隐藏接收到用户的信息要做一系列的处理,首先要到数据库里面索引相关的信息。
反向匹配法:如果用户提交的字符串没有超过3个的中文字,就直接到数据库索引词汇。超过4个中文字的,优先用分隔符比如空格,标点符号,将查询串分割成若干子查询字符串,
接着检查这些查询字符串有没有重复,如果有,则认为是同一个词汇。
接下来检查用户提交的字符串有没有字母和数字。如果有,就把字母和数字认为一个词。这就是搜索引擎的查询处理。
百度作为中国成熟的搜索引擎,那么它的分词技术又是怎样的呢?
1.字符串匹配的分词方法
种是常用的分词法,百度就是用此种分词。字符串匹配的分词方法,他又分为3中分词方法。
1.正向大匹配法:就是把一个词从左至右来分词。
举个例子。
“不知道你在说什么”
这句话采用正向大匹配法是如何分的呢?“不知道,你,在,说什么”与正向大匹配法相对应的是反向大匹配发。这是第二种分词方法。
2.反向大匹配法 来分上面我举的例子是如何分的呢 “不知道你在说什么”。反向大匹配法来分上面这段是如何分的。“不,知道,你在,说,什么”,这个就分的比较多了,反向大匹配法就是从右至左。
3.就是短路径分词法。
这个什么理解呢 ,就是说 我一段话里面要求切出的词数是少的。还是上面哪句话
“不知道你在说什么”短路径分词法就是指,我把上面哪句话分成的词要是少的。不知道,你在,说什么,这就是短路径分词法,分出来就只有3个词了。好了,当然还有上面三种可以相互结合组成一些分词方法。比如正向大匹配法和反向大匹配法组合起来就可以叫做双向大匹配法。
2.词义分词法。
进行句法、语义分析,利用句法信息和语义信息来处理歧义现象来分词,这种分词方法,现在还不成熟。
3.统计分此法。
根据词组的统计,就会发现两个相邻的字出现的频率多,那么这个词就很重要。就可以作为用户提供字符串中的分隔符。这样来分词。比如,“我的,你的,许多的,这里,这一,那里”。等等,这些词出现的比较多,就从这些词里面分开来。
关键词排名
分出来的长尾词能够获取一定的排名,也能够推动站点的目标关键词获取很好的排名。
正向大匹配,反向大匹配,双向大匹配,短链接匹配。
大家只有预测出百度分词技术,才能更好的发挥出google推广的优势,提高网站关键词排名。
原文来自:http://www.goo***
百度分词技术与关键词排名之间的关系
广州网站/软件服务相关信息
13小时前
13小时前
13小时前
13小时前
1天前
1天前
1天前
1天前
1天前