◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
什么是分词技术
| 发布:008 | 发布时间: 2009年4月9日 | 浏览: | 评论:1 |
今天爱煮饭同学在我的网络营销实战交流群(598007)里要求我讲讲“分词技术”,由于在忙所以没有回答他的问题,所以忙完后抽了点时间在网上收集了一些资料,希望能够通过自己的理解通俗的表达出来。
今天先简单的讲两个问题:第一,什么是分词技术?第二,分词技术在SEO里的应用。
一、 什么是分词技术?
搜索引擎最早是有老外开发的,老外只懂英文,而且由于英文的书写方式单词与单词之间是空格隔开的,所以计算机很容易把一句英文句子分个成一个一个的单词,但是中文是以字为单位的,一个一个分开就失去了他的意义,举个简单的例子:英文句子I am a student,中文的意思是“我是一个学生”,通过空格搜索引擎能够很容易的知道student是一个单词,但是无法知道需要学和生合起来才表达一个意思,如何让搜索引擎从一个句子中分割出有意义的词,这就叫做中文分词技术。
百度为什么一开始就这么强大?就是因为他的中文分词技术,而让搜索更精确,用户喜欢,自然强大。至于搜索引擎到底怎么分的,我就没有研究这么深了,如果我都懂,我就是分词专家了,小李子就要来请我吃饭了。常用的几种机械分词方法如下:
- 正向最大匹配法(由左到右的方向);
- 逆向最大匹配法(由右到左的方向);
- 最少切分(使每一句中切出的词数最小)。
举个简单的例子:宁波哪里有好吃的?
1.宁波 /哪里 / 有 / 好吃 /的
2.宁波 /哪里 /有 /好 /吃的
3.宁波 /哪里 / 有 / 好吃 /的
搜索引擎不会单纯的用一种方法,很多时候都是综合考虑的,这样用户获得的信息才能更加准确。关于什么是分词技术如果你还想了解更多就去百度一下吧,到时候不要忘了跟我分享一下学习成果。
二、分词技术在SEO里的应用
一般情况下我会在两个地方用到分词技术,head标签里的title 和 description,文章的title设计,其他地方我几乎用的很少。要掌握这个技巧其实很简单,只要你经常使用搜索引擎,经常观察排在前面的几个网站,然后通过自己的网站实践,这样才能把所学的融会贯通,变成自己的SEO思维一部分,做网站或者添加内容的时候不要刻意去想,而是情不自禁会去这么做。
下面举几个例子:
大学生如何创业 通过我们理解的分词技术,这个可以分为 大学生 如何 创业 三个词,看百度是如何处理这三个词的,看下图:

百度的这种关键词红色显示十分有助于你对分词技术的理解和学习,看上面三条,聪明的人应该能够看出来,文章title如何设计更有效果了。另外举一个我在做的例子:
这个客户要我做 宁波中央空调,宁波中央空调安装,宁波中央空调维修,宁波中央空调清洗这四个关键词,如果我把这四个关键词全部放到首页title上去或许会效果不错,但是我的SEO理念是,做网站SEO不是做给搜索引擎看的,而是把网站做到用户喜欢,符合用户浏览效果,所以我设计了下图的首页title:

网站首页title干净清爽,只要我把网站做强,这几个词的排名不在话下。最近太忙也没去好好弄这个网站,排名有点掉了,至今没有一个词排到百度首页,客户会着急,有些激进的人也不喜欢这种手段,但是虽然慢,我还是喜欢稳一点,这样做上去后期我可以非常轻松,甚至不用找链接,不用更新内容,可以看一下我前几天写的一篇文章:懒人SEO五步曲。
今天简单讲了什么是分词技术,分词技术在SEO中的应用,可能过于简单,如果你对分词有更深的了解,希望能够加我QQ940874,或者加我们的QQ群598007,一起交流分享。
参考资料:
中文搜索引擎技术揭密:中文分词 http://www.stlchina.org/twiki/bin/view.pl/Main/SESegment
数学之美 系列二 -- 谈谈中文分词 http://www.googlechinablog.com/2006/04/blog-post_10.html
出处:思忆猫宁波SEM团队 - SEO/网站推广交流咨询群:598007
原文链接:http://www.semnb.com/SEO-Knowledge/156.html
版权所有,转载请以链接形式注明作者及原始出处。
网站建设服务
网站策划服务
网站SEO服务
企业SEO培训