利用搜索引擎的分析系统来做好网站优化

古柏广告设计
助力企业品牌成长
围观:754次

目前主流的搜索引擎按照其功能大致可以分为可划分为下载、分析、索引、查询4大系统。其中分析系统在搜索引擎的架构中主要承担了网页结构化、网页消重、文本分词及网页重要性的计算(例如谷歌的PR)这四项基本任务。可以说,搜索引擎的分析系统在网站排名等方面起着决定性的作用,通过分析搜索引擎的分析系统,可以更好的指导我们进行网站的优化工作,在这里,笔者根据自己的一些见解。

  首先,笔者对搜索引擎的分析系统的工作步骤做了简单的介绍:

  第一.读取Page库中下载系统通过爬虫下载到的原始网页。

  第二.通过建立标签树并从网页中抽取有价值的属性,完成从原始网页打包成一个网页对象的过程,即网页结构化的过程。

  第三.丢弃冗余的页面,仅保留一个相似或相同的网页传给分词模块,实现网页消重。

  第四.文本分词模块将网页的正文切分成企业官网设计以词汇为单位的集合。

  第五.最后将分析的结果发往索引模块,进行索引入库。

  了解到了搜索引擎的分析系统的工作流程,那么,笔者认为,我们应该针对搜索引擎的分析系统做好以下的优化工作。

  1.从分析系统的第一步和第二部过程,告诉我们要明确需要保留的信息

  网页是有HTML语言编写而成是一个半结构化的对象,要将其中有价值的信息,例如标题和正文保留下来,而将无用的信息丢弃,例如HTML标签,主要是通过网页结构化,一般来说,TITLE标签,MEAT标签,H标签是搜索引擎认为最重要的网页信息。搜索引擎,比如,针对TITLE标签,在搜索引擎蜘蛛爬行的过程中,与之间的内容往往是蜘蛛们第一个获取到网页的文字内容。除此之外,锚文本,网页正文都是有价值的信息,要加以保留和重视。

  2.从分析系统的第三步来看,告诉我们要重视网页的内容建设

  网络中的网页数以亿计,对海量网页进行存储和处理是一项艰巨的任务,而且这些网页中又包含很多相同或者类似的页面。所以搜索引擎的分析系统在正式对网页进行分析之前首先要做的工作就是网页消重。搜索引擎中把这4种页面看做是相同或相似的,两个网页的内容和格式上完全相同、两个网页的内容完全相同,但格式不同、两个网页有部分重要的内容相同并且格式相同、两个网页有部分重要的内容相同,但格式不同。从搜索引擎的分析系统看网站优化,可见网页内容的独特性很重要,所以做好原创是有企业官网设计意义的。

  3.从网页重要性的计算,也就是分析系统的第四五部来看,做好网页的权重是很有意义的

  在这里,拿谷歌的PR值举例,它是Google用来标识网页的等级/重要性。百度也有类似的系统,所以我们应该根据它们的算法,做好提高网页重要性的工作,比如导入高质量的链接,写一些高质量的软文带上网页链接并发布到大型网站,比如提供有价值的网页内容,这些都可以提高网页的权重,具体的做法,站长朋友都知道,这里不再详述。

版权声明:以上文章信息来源于网络,等仅代表原作者本人的观点。除了已经标注原创的文章外,其它文章版权和文责属于原作者。文章中出现的商标、专利和其他版权所有的信息,其版权属于其合法持有人。对可以提供充分证据的侵权信息, 我们将在确认后的1小时内删除。


本网站之声明以及其修改权、更新权和最终解释权均属广州古柏广告策划有限公司所有。

(注:古柏广告-版权所有-转载请注明出处。)

品牌全案策划、设计、执行一站式服务,
助力企业品牌成长!

扫一扫关注古柏

GOOBAI AD.

Brand Whole Case Design


4000-882-993

www.goobai.com

微信加好友咨询


广州古柏广告策划有限公司

地址:广州市天河区东圃长盛商务大厦B213-215

Copyright©2004-2020 GOOBAI Inc.All rights reserved

粤公网安备: 44010602001481号

备案号:粤ICP备09222445号

GOOBAIAD

服务热线:020-3160-9080

业务总监:136-3149-2728(Mr.罗)

Q Q/微信:212210324

与古柏对话

关注古柏