搜(sou)索引(yin)擎(qing)工作过(guo)(guo)程非常复杂,今天我们简(jian)单介绍搜(sou)索引(yin)擎(qing)是怎样实(shi)现(xian)网页排名的(de)。这里介绍的(de)内容相对(dui)于(yu)真正的(de)搜(sou)索引(yin)擎(qing)技(ji)术来说只是皮(pi)毛,不过(guo)(guo)对(dui)SEO人员已经足够用了。希望对(dui)咱们新疆(jiang)的(de)SEOER有所(suo)帮助(zhu)。
搜索引擎的工作过程大体上(shang)可以分成三个(ge)阶段。。
(1)爬行和抓取:搜(sou)索引擎蜘(zhi)蛛通过(guo)跟踪链(lian)接访问网页,获得页面HTML代码存入数据库。
(2)预处理:索(suo)(suo)引程序对抓取(qu)来的页(ye)面数(shu)据进行文字提(ti)取(qu)、中文分词、索(suo)(suo)引等处理,以(yi)备排名程序调用。
(3)排(pai)名(ming):用户输入关(guan)键词后,排(pai)名(ming)程序调(diao)用索引库(ku)数据,计算相关(guan)性,然后按一定格式生成(cheng)搜索结果页(ye)面。