seo是指搜索引擎优化(seo之搜索引擎的原理)515


SEO入门者必须知道的搜索引擎工作原理



不管是国内的头条搜索、还是国外的谷歌搜索,搜索引擎的本质是一种应答机制。它们的存在是为了发现、理解和组织互联网内容,以便为用户提出的问题提供最相关的结果。因此,理解了搜索引擎的工作原理,就有助于自己网站的SEO优化。




搜索引擎主要通过三个功能来帮用户获取网页内容:


爬虫:在互联网上爬取内容,查看它们找到的每个 URL 的代码、内容。


索引:存储和组织在爬取过程中发现的内容。一旦页面在索引中,它就会在搜索中显示相关查询的结果。


排名:提供最能回答查询者所查询的内容,这意味着搜索结果按最相关到最不相关的顺序排列。





爬虫


爬虫是搜索引擎派出的机器人(也叫蜘蛛),用来查找网站的内容和更新的内容。这些内容可以是网页、图像、视频、PDF 等——但无论格式如何,内容都是通过爬虫发现的。


爬虫会首先爬取几个网页,然后按照网页上的链接查找新网址。通过沿着这条链接路径跳跃,爬虫能够找到新内容并将其添加到名为 Caffeine 的索引中。用户寻找该 URL 上的内容时,在索引的帮助下,相关的搜索结果则很容易匹配。


索引


索引可以理解为是一个巨大的数据库,用于储存和组织爬虫所找到的信息和内容。以便足以为用户提供服务。


排名


当有用户输入关键词搜索时,搜索引擎会在其索引中搜索高度相关的内容,然后对该内容进行排序,以期解决用户的查询。这种按相关性对搜索结果进行的排序称为排名。一般可以认为网站排名越高,搜索引擎认为该网站与查询的相关性就越高。




简单的了解搜索引擎的工作原理以后,相信有不少朋友已经有了关于自己网站的SEO优化的线索。您可以从自己的网站中设置阻止爬虫来爬取部分或者全部的信息,避免将这些页面信息存储在其索引中。而对于外贸网站推广来说,当然是希望用户能找到自己的网站,因此要首先确保爬虫是否能访问并爬取自己网站的内容以编入索引。否则,自己的网站对于搜索引擎来说,就像是一个隐形的存在,那么搜索引擎的用户自然无法看到自己的网站,网站的流量也就寥寥无几了。




在 SEO 中,并非所有搜索引擎都是平等的


大多数人都知道谷歌拥有最大的市场份额,但有必要针对必应、雅虎等进行搜索优化吗? 实际上,尽管全球目前存在 30 多个主要的在线搜索引擎,但 SEO行业确实只关注 Google。 因为谷歌是绝大多数人在线搜索的地方。 如果我们在做推广时包括了谷歌图片、谷歌地图和 YouTube,获取的流量将会是必应和雅虎加起来的 20 倍以上。


SEO必看,搜索引擎的工作原理及优化



一、搜索引擎工作原理



搜索引擎的工作分为三个阶段,即爬行,索引和检索


1.爬行


搜索引擎具有网络爬虫或蜘蛛来执行爬网,每次抓取工具访问网页时,它都会复制该网页并将其网址添加到索引中。


在“蜘蛛”抓取网页内容,提炼关键词的这个过程中,就存在一个问题:“蜘蛛”能否看懂。如果网站内容是 flash 和 js,那么它是看不懂的。


相应的,如果网站内容是它的语言,那么它便能看懂,它的语言即 SEO


2.索引


此阶段,爬网程序会创建搜索引擎的索引。索引就像一本巨大的书,其中包含爬虫找到的每个网页的副本。如果任何网页发生更改,则抓取工具会使用新内容更新图书


3.检索


这是搜索引擎以特定顺序提供最有用和最相关答案的最后阶段。


二、SEO 简介



1.SEO 的分类


A.白帽 SEO:起到了改良和规范网站设计的作用,使网站对搜索引擎和用户更加友好,并从搜索引擎中获取合理的流量


B.黑帽 SEO:利用和放大搜索引擎政策缺陷来获取更多用户的访问量


2.白帽 SEO 的使用


a.对网站的标题、关键字、描述精心设置,反映网站的定位,让搜索引擎明白网站是做什么的;


b.网站内容优化:内容与关键字的对应,增加关键字的密度;


c.在网站上合理设置 Robot.txt 文件;


d.生成针对搜索引擎友好的网站地图;


e.增加外部链接,到各个网站上宣传;


三、SEO 优化



通过网站的结构布局设计和网页代码优化,使前端页面既能让浏览器用户能够看懂,也能让“蜘蛛”看懂。


1.网站结构布局优化


A.控制首页链接数量


对于中小型企业网站,建议首页链接在100个以内,链接的性质可以包含页面导航、底部导航、锚文字链接等


B.扁平化的目录层次


尽量让“蜘蛛”只跳转3次,就能到达网站内的任何一个内页


C.导航优化


导航应该尽量采用文字方式,也可以搭配图片导航,但<img>标签务必添加“alt”和“title”属性,告诉搜索引擎导航的定位




其次,在每一个网页上应该加上面包屑导航




对用户而言,可以让用户了解当前所处的位置,形成更好的位置感,并方便用户操作;


对蜘蛛而言,能够清楚的了解网站结构,同时还增加了大量的内部链接,方便抓取,降低跳出率。


D.结构布局的规范优化


a.页面头部:logo 及主导航,以及用户的信息


b.页面主体:左边面包屑导航及正文;右边放热门文章及相关文章,既增强了页面相关性,也增强页面的权重


c.页面底部:版权信息和友情链接


注意:分页导航推荐写法:“1 2 3 4 5 6 7 8 9 10 下拉框/输入框”,这样“蜘蛛”能够根据相应页码直接跳转,下拉框直接选择页面跳转




E.控制页面的大小


一个页面最好不要超过100k,太大,页面加载速度慢,用户体验不好,并且一旦超时,“蜘蛛”也会离开。


2.网页代码优化


a.<title>


标题,强调重点即可,尽量做到每个页面的 <title> 标题内容不重复




b.<meta keywords>


关键词,列举出几个页面的重要关键字即可




c.<meta description>


网页描述,高度概括网页内容的关键词,每个页面也要有所不同




d.标签语义化


比如:h1-h6是用于标题类的,<nav>标签是用来设置页面主导航的等


e.<a>标签


页内链接,要加“title” 属性加以说明,让访客和 “蜘蛛” 知道;


外部链接,链接到其他网站的,则需要加上 el="nofollow" 属性,避免“蜘蛛”爬了外部链接之后,就不回了


f.正文标题要用 <h1> 标签


“蜘蛛” 认为它最重要,若不喜欢<h1>的默认样式可以通过CSS设置


g.<br>


只用于文本内容的换行




h.<caption>


表格应该使用 <caption> 表格标题标签


i.<img> 应使用 “alt” 属性加以说明


j.<strong> 和 <em> : 需要强调时使用


<strong>标签在搜索引擎中能突出关键词


<em>标签强调效果仅次于 <strong>


而 <b>、<i>标签: 只是用于显示效果时使用,在 SEO 中不起效果


k.避免使用 和 ©


空格符 应用 CSS 进行设置


版权符 © 可以直接使用输入法打“©”


l.少用 iframe 框架,因为“蜘蛛”一般不会读取其中的内容


m.少用 display: none;


对于不想显示的文字内容,应当设置 z-index 或设置到浏览器显示器之外。因为搜索引擎会过滤掉 display:none 中的内容

2022-12-05


上一篇:如何做seo整站优化(网站seo注意事项)

下一篇:如何快速做一个网站(新网站使用seo的具体方法)