什么都分享
以及,记录自己的故事
正在载入当前位置天气信息……

网站SEO基础教程——搜索引擎

搜索引擎的定义

搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。

搜索引擎工作原理

全文搜索引擎的网络机器人或网络蜘蛛是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。 和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。所有这些收录的站点同样被存放在一个“索引数据库”中。用户在查询信息时,可以选择按照关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟全文搜索引擎一样,也是根据信息关联程度排列网站。需要注意的是,分类目录的关键词查询只能在网站的名称、网址、简介等内容中进行,它的查询结果也只是被收录网站首页的URL地址,而不是具体的页面。分类目录就像一个电话号码薄一样,按照各个网站的性质,把其网址分门别类排在一起,大类下面套着小类,一直到各个网站的详细地址,一般还会提供各个网站的内容简介,用户不使用关键词也可进行查询,只要找到相关目录,就完全可以找到相关的网站(注意:是相关的网站,而不是这个网站上某个网页的内容,某一目录中网站的排名一般是按照标题字母的先后顺序或者收录的时间顺序决定的)。 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。 现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的内容,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如”恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦”指向这个网页A,那么用户搜索“恶魔撒旦”时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 1.从互联网上抓取网页:利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。 2.建立索引数据库:由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。 3.在索引数据库中搜索排序: 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。 搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。

互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。

 

搜索过程中的常见问题注意事项

  1. 如何清除搜索框中的历史记录?

搜索内容多了,想清除搜索框内的历史记录,选择:工具-internet选项-内容-自动完成-清除表单-确定,如果希望以后不再记录输入搜索框的关键词,在“自动完成”里把“表单”前的勾去掉即可。

如想清除特定某条关键字记录,鼠标左键单击搜索空白栏框,弹出所有关键字记录。选择要清除的关键字,按Delete键删除。

  1. 为什么我找不到资料?

用户找不到资料的两个最常见原因,一是输入的词语中含有错别字,二是使用过于冗长的关键词搜索。

搜索引擎并不理解网页上的内容,只会找出含有您输入的全部关键词的网页。

 

  1. 简体和繁体有无影响?

只要是标准编码,就没有影响。无论是是繁体中文或简体中文,都可以同时搜到繁体中文和简体中文网页,并且,搜索结果中的繁体网页摘要信息会自动转成简体中文,方便阅读。

 

  1. 英文字母大小写有无影响?

搜索引擎对英文字符大小写不敏感。所有的字母均当做小写处理。例如:输入“WANGQIANG”,或“wangqiang”结果都是一样的。

 

5、搜索到的链接无法打开怎么办?

链接无法打开的原因很多,比如网站当机,或者页面已经死掉等等,可以查看在服务器上的网页缓存。不过,如果该页面是被当地ISP过滤的话,服务器缓存还是无法打开。唯一的办法在于利用代理服务器,然后在URL栏内输入链接的IP地址。

搜索要着重注意几点问题:

1、搜索的核心问题就是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。

2、改进自己的搜索提问。大家经常在第一次搜索时,没有返回自己想要的结果,就放弃了继续搜索下去的想法,而不是去改进自己的提问。经常是一次搜索并不能很准确的给你想要的东西,但是返回的结果当中,总有一点相关的内容,这个时候要充分利用那一点相关的内容,作为引子给自己以启发,然后组成一个新的提问去继续搜索。通过这种环环相扣的递进搜索,你肯定能找到你想要的文章,重要的是要有那个信念。还有一点,如果你输入一个关键词,返回结果上万项,而前两页都没有你想要的东西,这个时候好的办法是增加关键词重新搜索,而不是继续往下去翻页。现在大家经常面对的情况是返回的结果太多,一般而言,当你用的关键词数量使得搜索引擎返回给你的结果条目数是1000项左右的时候,你很容易在前两页的的条目中找到跟你需求很吻合的内容。

3、适可而止,不要迷失。网上的信息很杂,许多小文章、图片都很有趣,许多地方充满了诱惑的字眼;当在网上找信息的时候,经常找着找着就忘了当初的出发点是什么了,然后在信息的海洋当中迷失;所以上网的时候需要时不时的提醒一下自己不要偏离主题太远。在搜索之前,有个大概的计划,然后只搜索和看跟自己的主题最相关的内容,其它内容要学会视而不见。

4、最后一点,平时做个有心人,对类似问题多总结,多记忆,搜索技能就会慢慢熟练。通过一次搜索就达到目的通常会有些困难,但多次试验,总会构建出一个非常好的搜索关键词。经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。

 

搜索引擎相关工具

⒈关键词工具

关键词研究工具:适当深入地进行关键字研究,为你的网站进行栏目划分及规范关键词部署做准备。

关键词密度:一个关键字、词在页面出现的个数及所占文本的比率。

竞争对手分析:可以分析目标关键词的竞争对手是谁,并分析竞争对手用过的关键词。

⒉链接工具

链接广度:跟踪反向链接的总数,并返回哪些网站链回了你及锚文本是哪些。

C级IP地址检查::对链接伙伴进行IP地址分布检查,而不至于被同一类IP地址的链接所惩罚。

蜘蛛模拟器:可以获知网页外观与搜索引擎蜘蛛索引的区别。

⒊可用性工具

浏览器分辨率测试:在不同屏幕分辨率、不同操作系统、不同浏览器下网页的显示效果。

4.搜索引擎优化检测工具

(1) Google链接广泛度检测器(Google Backlink Checker)

(2)搜索引擎抓取内容模拟器(Search Engine Spider Simulator)

(3) 搜索引擎抓取页面数量统计器(Search Engine Saturation)

(4) 链接广泛度检测器(Link Popularity Check)

(5)Google排名监测工具(Free Monitor for Google)

(6) 相似页面检测器(Similar Page Checker)

 

5.其他搜索引擎工具

PageRank预测:包括未来预测及当前PR值。

流量排名:网站的流量走势及搜索引擎分析。

搜索引擎饱和度:搜索引擎索引网站网页的数量。

作为搜索引擎优化工具的搜索引擎有哪些作用?

以搜索引擎google为例,通过google,至少可以获得一个网站搜索引擎优化相关的如下基本问题:

(1)有多少个网页被google收录;

(2)在被收录的网页中,有多大比例属于低质量网页(关于被搜索引擎视为低质量网页及其成因的说明 );

(3)被搜索引擎认为是低质量网页的原因(通过逐个分析或者抽样分析来判断);

(4)网站被多少个外部网站链接,以及这些链接的URL;

(5)在用设定的关键词进行检索时,某个网站在搜索结果中的排名状况如何;

(6)在用同一关键词检索时,同行中竞争者的网站的表现如何;

(7)通过对竞争者和行业领先者的网站在搜索引擎检索结果中的表现,获得竞争者和行业领先者的搜索引擎优化状况;

(8)通过检索结果中的摘要信息判断搜索引擎收录网页的原则和规律。

打赏
本文遵守创作共享 BY-NC-ND 4.0协议,转载前请先联系作者。绯末博客 » 网站SEO基础教程——搜索引擎
分享到: 更多 (0)

评论 抢沙发

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏