61阅读

搜索引擎如何抓取网页-网站如何在搜索引擎中获得更高的权重

发布时间:2018-05-06 所属栏目:网上如何人肉搜索

一 : 网站如何在搜索引擎中获得更高的权重

  A5创业项目春季招商 好项目招代理无忧

  网站如何在搜索引擎中获得更高的权重呢?今天有一个朋友问我,搜索引擎排名的关键词一方面是不是靠疯狂的交换外部连接呢?

  我今天仔细了想了想,告诉他的答案是三个字“每一点”!之后他又问我是那些地点,我该怎么做,我便细心的为他做了一个详细的解释,事后我觉得这些东西会有很多朋友需要,所以今天我决定写关于网站如何在搜索引擎中获得更高的权重的文章,因此这篇文章就诞生了。

  现在,我们来说一下可以影响网站权重的内容。

  一、网站服务器稳定性

  我想服务器稳定性放在影响网站权重的第一位,这是大家都不可否认的吧?虽然我们很多东西都做到优秀,但是如果把网站放在一个不稳定的服务器上,仍然会对网站权重造成很不好的影响,设想你访问一个网站时,这个网站的服务器总是荡机,或者打开一个页面慢的要死,那么你也肯定不会愿意浏览这样的内容,如果有同样的网站出现在你面前,而速度远远快过这个网站,服务器很稳定,从来不出现荡机的情况,我想你也会选择后者。

  二、良好的网站栏目结构

  作为一个网站,他的栏目结构,构架形式在他的网站权重中占具着很重要的地位,栏目的关联性,内部栏目的层次、地址层次、地址的合理化,这些对于一个网站的优化都十分重要,如果你的栏目分布混乱,用户从娱乐的栏目中看到很多相关于社会政治问题的内容,那么用户也会迷茫,也会不明白。所以要将栏目合理化设计,逐个按照层次等级分布,做出合理的树型结构图,可以帮助你更好的设计你的网站。

  三、网站页面的静态化

  我们来说一下静态化的问题,我想每个做优化的朋友都会明白静态化是十分关键的,不过在这里还是要强调这个问题,其实静态化有几个原因:

  第一,同样内容的静态页面,会比动态页面打开速度快,这原因是静态页面是已经生成的内容,而动态页面则要在数据库中提取再生成,所以在速度上静态页面占有一定的访问优势,因此搜索引擎会将静态页面的权重设置的很高,更愿意收录和将静态页排在前面;

  第二,静态页面的格式更加规范,搜索引擎更好识别,因为静态页面的后缀是规范化的,一般都是以html、htm结尾,所以相对搜索引擎更容易识别这些内容,因为搜索引擎毕竟是机器,而不是人,你让机器去识别一些东西时,他们是按照事先定义好的规范识别的,所以以标准内容收尾的页面权重更高,比如jsp、php、asp、aspx、xml这些后缀的权重也一样比较高。

  所以从上面的内容看来,我们把页面生成静态页会更有利于网站内容获得排名,当然如果有些朋友觉得生成静态页会占用大量资源,或者您的相关程序不支持生成静态页面的话,我们考虑伪静态内容也是可以的,在这里要给一些初学的朋友解释一下,伪静态就是我们通过程序将动态页面伪装成为静态页面的地址,可实际这些页面并不是真正生成存在的,而也是通过程序在数据库里调用出来,再伪装成静态页面。

  四、规范的页面代码

  网上做优化的朋友会有一些人提到过这个问题,但是他们没有具体的说明代码规范的原因,我在这里为大家简单的解释一下,规范的页面代码,会更有利于搜索引擎的爬行蜘蛛(有的地方也叫搜索机器人)抓取页面,搜索引擎和人是一样的,他们看内容也是有一定的规范的,就如同我们看内容会从上到下,从左到右浏览,搜索引擎也是如此,他们除了会有人们阅读文章时的一些习惯内容,其中还对一些代码有着特殊的感官效应,他们会对一些代码中添加的内容更加重视,比如经常有人提到文章中的一些少量的加粗文字或者变色文字都会受到格外关注,所以从这里我们可以看出,搜索引擎对页面代码也是十分看重的,我们想提高对搜索引擎的友好度,代码的规范也是非常必要的。

  再想,如果你的页面代码中有某些错误,那么会造成你的页面打开速度缓慢或者影响一些其他功能,造成页面浏览时的一些不好影响,那么浏览者肯定会对你的友好度有所下降,由此,搜索引擎也会同样降低你页面的权中。

  五、标准的网站title、keywords、description写法

  这个我在《标准的网站title、keywords、description写法》中已经说过了,规范的填写内容更方便了用户和搜索引擎蜘蛛的浏览,便于用户和搜索引擎分辨页面的层次和获取更多本页面的相关信息,因此在title、keywords、description的编写中,我们要注重这些规范化的内容。以帮助用户更好的获取信息,使得搜索引擎可以将页面的权重提高,将您网站中的内容推出去,达到依靠搜索引擎推广的目的。

  六、完整的网站内部优化功能

  这里我们要将内容分为几点说明,因为这些内部功能是所有的大网站中都包含的,而小网站、个人网站或者网络CMS、论坛系统的开发者们还未完成这些十分重要的功能。为了帮助大家更加合理的了解内部优化。我会在下一篇文章中详细的说明这些。

  七、网站内容原创文章数量与网站更新速度

  我们跳过完整的网站内部优化功能,来说这些司空见惯但是却十分重要的话题,望站的更新频率与原创文章数量,那么我就要简单的解释一下了,如果前面的六点都是网站优化结构的骨架的话,那么网站的内容更新速度和网站原创文章度就是网站的血肉和灵魂,没有骨架我们就缺乏的基础,没有了血肉我们就无法生存,这就像那些的人们所说的,骨骼惊奇的人们在修炼武功时事半功倍,而悟性极高的武术家学习能力更是超强,如果我们将惊奇的骨骼和超高的悟性合于己身,那么会出现什么样的情况呢?对,就是百年不见的武学奇才,而网站也是如此,为什么搜狐、新浪的内容会排在我们的前面,为什么腾讯、网易的内容会更快的收录,除了本来的超高权中和域名时间长短外,我们还差些什么?

  我们差的就将我们的骨架和血肉相结合,让我们的网站构造和内容同步发展。因此发展网站的原创内容就将是网站发展的一个重点。

  懂得搜索引擎的人都会知道,原创内容更容易被搜索引擎收录,也更容易在搜索引擎中获得排名,所以我们想获得排名,就要增加网站的原创内容。

  但是一个网站好几个栏目,甚至十几个栏目,几十个栏目,我们又如何能够有这么大量的原创内容呢,如果我们只是每天更新一两篇原创内容,我们又如何获得大量流量呢,这里就网站原创内容的比率问题了。

  其实网站里的内容如果全是原创的文章,几乎是不可能,就算是个人博客也是如此,那么我们就要将比率掌控在一定之中,笔者建议,网站内容原创度控制在5%左右,这样如果你的网站有100篇文章,你基本要发5篇原创内容,你的网站有10000篇文章,就是500篇原创,实际原创的内容也是很大量的,但是基本可以保证两三天一篇原创的增长速度,累计久了,网站也会有大量的流量。

  继续说更新的话题,网站的更新速度也是有一定要求的,如果你的首页长期不更新,或者你的栏目页长期不更新,那么搜索引擎会对你的页面逐渐降权,而最终将页面在搜索引擎中去除下去,那么之后你再想让搜索引擎收录他,就要比之前新站初建时耗费更大的精力了,所以穆杰建议您,在网站保证原创文章数量的情况下,同样要保证网站的更新速度,建议网站首页的更新率在40%以上,而各栏目页的更新率最低要保证在10%,如果可以最好是栏目页的更新速度也保证在30%左右,那样是可以给您的网站带来更好的流量的。

  不过在这里切忌使用采集系统,因为人工采集出的内容是会做小量编辑修改的,而程序采集过来的内容基本是照猫画虎,完全复制,那么时间久了,网站内容在网络中重复度越来越高,仍然无法获得好的权中。

  八、网站的外部优化

  其实网站的外部优化也就是我们常用的外部推广方法,一般分为几类,具体方法我也会在之后的文章中慢慢介绍,这里说一些常用的,一个是外部连接,这是大家都知道的,但是穆杰建议您慎加,不要海量的增加这东西,否则肯定会被沙盒效应搞的你头疼。另一个就是软文推广,这个东西也是如此,如果您随便写些内容就能带来流量的话没,我想靠软文生存的朋友就不用在市面上混了,不过软文也是穆杰我的弱项,这个到之后我找其他的朋友把一些关键的内容写出来,让大家了解就是了。再就是一些论坛、博客的内容发布、回复加入连接,这个推广方法要有度,因为据穆杰的一个做搜索引擎优化的朋友得到的可靠消息,百度和GOOGLE现在都开始针对群发软件疯狂制造外连的内容进行一定的惩罚了,所以很有可能会在您使用这些方法时没有提高您网站的权重,而去降低网站的权中。

  作者:穆杰

  网名:花田穆

  2009-03-13

二 : 教你如何解决网站被搜索引擎拔毛

  SEO专题推荐:

  网站被搜索引擎拔毛处理,无疑对于每个站长而言都是致命的打击,然而无论是降权也好,拔毛也罢,在这样的情况之下往往都是有所原因的,否则搜索引擎 也不会平白无故的K你站,所以说我们要对这些导致我们网站被拔毛的原因进行分析并且改正,只有这样才能够让搜索引擎将我们的网站重新收录的。首先笔者认为我们需要先进行了解是哪些原因导致我们站点被拔毛的,笔者在这里给大家总结一些常见的原因以及解决方案供各位站长参考。

  步骤/方法

  网站过度采集内容。

  现在的个人站长手头都是四五个站点,有些甚至多达几十个,当然一个人肯定是没有足够的精力去一一进行维护,所以很多站长在网上买了一些采集插件进行大 量的采集其他站点内容,或许刚开始效果还是不错的,特别是对于收录而言是很强大的,因为笔者之前也搞过一个采集站点,所以蛮了解的。但是经过一段时间之 后,百度开始对其网站采集的内容收录慢慢变少,直至不在收录,在到网站被K、被拔毛处理。

  对于上面此情况笔者建议大家,可以进行少量的采集,并且最好在买一些采集插件的时候在买一些伪原创的程序来进行伪原创一下,这样搜索引擎会友好一些,当然如果时间充裕的站长,笔者还是建议自己原创,毕竟蜘蛛喜欢新鲜的食物。

  网站内部优化过度。

  随着这几年SEO优化的盛行,每位站长多多少少都是懂一些优化知识的,但是在这些人当中不缺乏一些对优化错误理解的站长,对其网站大量的进行优化工 作,导致网站优化过度,被搜索引擎降权、被K、拔毛处理,这些都是挺常见的。一般情况下,主要是很多站长大量的在网站内部做一些内链,导致内链优化过多而 被搜索引擎视为作弊进行处理的。

  解决方案:针对自身网站,定制合理的优化计划,良好的掌握网站关键词密度,日常良好的内容更新,并且重新去百度网站登录处进行提交,方可重新收录。

  网站外部优化过度。

  对于网站外部优化过度这一说法而言,往往是对于新站而言的。因为一个新站上线,我们需要发一些外链来进行吸引蜘蛛爬行抓取,从而快速的收录我们的站 点。然而往往越忽略了它是“新站”这一说。大量的去发布一些外链来进行吸引蜘蛛,当蜘蛛大量的爬行我们站点的时候,搜索引擎都是会进行记录的,对于一个新 站而言会有这么多入口进入,无疑会被搜索引擎视为作弊进行处理,特别是对于一些利用群发软件发外链的站长更是如此了。

  解决方案:良好的规划外链发布数量以及质量,新站切勿使用群发软件进行发外链,否则后果不堪设想,尽可能多做一些优质的外链,不要太注重于数量。慢慢的增加每天发布外链的数量,同样的去搜索引擎提交,通常这样的情况一般一个星期内就可以重新回复收录的。

  网站被黑挂木马。

  无论对于任何CMS而言,都不敢保证没有漏洞,最为常见的就是DEDECMS,漏洞可谓相当的多。所以很多网站被黑挂木马,都是挺常见的事。特别是一 些病毒,通常我们游览者在正常的游览情况下是看不出来的,另外还有就是网站被挂黑链,这些我们从表面都是看不出来的,但是在蜘蛛抓取的时候是可以抓取到 的,这无疑会导致我们的网站被降权的,就比如说我手下的一个网站前几天就因为漏洞问题被黑客挂了跳转直接跳转到了一些非法的站点,并且对此没有及时的进行处理,导致网站如今已经被搜索引擎降权,可谓悲剧的很啊.

  解决方案:笔者认为首先一定要做好网站服务器安全措施,另外就是对网站本身的CMS程序进行一些权限设定,并且多多关注官网发布的一些漏洞补丁及时的更新。当 然毕竟没有不透风的墙,所以我们要定期的利用一些站长工具来进行检测自己的网站是否有异常的情况,并且经常的去自己服务器查看网站日志,观察蜘蛛已经自己 服务器登录一些状态,及时的发现及时的进行处理.

  关键词优化专题:网站关键词优化没效果?来这里学习最实用的关键词优化技巧!

  内链优化专题:最能提升网站权重的内链部署优化技巧与方法

  外链建设专题:高质量自然外链怎么做?读完这些你将质的飞跃

  网站降权专题:2015年最有用的网站降权、被K、被黑、被攻击的解决方法

  用户体验专题:学习完这些,作为站长的你可以秒懂如何做网站用户体验

  行业网站专题:优化行业网站的“葵花宝典”看完后无优化压力

三 : 网页上的搜索框并非必须 如何合理配置浅析

  现在很多站长表示,如果自己的网站上不增加一个搜索框,那么就不能够显示自己网站非常强大,具有一定的科技感。所以无论什么类型的网站都引入了这个搜索框功能,以为这样能够引导用户的搜索,并能够帮助用户快速的寻找到自己的内容。

  而且为了让用户快速找到这个搜索内容,往往会将该搜索框放在相对比较显眼的位置。那么这种做法是不是科学呢?是不是所有的网站都有必要增设这个功能呢?很多人从用户体验的角度上来分析,认为最好要加上,但是笔者认为,搜索框并非全部都合适加,而是需要结合网站的形式来进行科学选择。

  第一,如果是单页网站,且内容相对较少。这类网站就完全没有必要引入这个搜索框功能。对于单页网站而言,本身的网页空间就非常宝贵,一方面需要留有一定的空间来美化网页,另一方面还要尽可能的显示一些重要的内容,那么在显眼的位置上增加一个相对显眼的搜索框,此时并不能够起到提升用户体验的作用,因为对于单页网站,用户能够非常迅速的找到相关的内容,搜素框的利用率极低,而且搜素框本身也不够好看,还会影响到用户的视觉体验。

  第二,搜索框并非一定要设在首页上。很多网站将搜索框都设在相应的首页,这样用户就能够一登陆网站,就可以使用该搜素框来搜索相应的内容。可是当用户还没有了解你网站是干什么的时候,显然不会使用该搜素框,因为还没有找到合适他们的关键词和内容。所以在首页上应该尽可能的设置一些导航页面,再加上一些栏目页,同时布置一些相关栏目的重点内容和推荐内容,这样让用户能够有个非常深刻的印象。事实上大家看看门户网站的首页,就没有相应的搜索页,而是将这些搜索页放在相对内容集中的板块中。

  第三,搜索框可以布置在内容集中的板块。之所以这么布置是为了让用户迅速找到相关的内容,因为有的网站栏目需要设置大量的内容,比如一些论坛网站,往往某个栏目一天的帖子上千个,还有一些专业性的网站,其专业内容更新速度较快,那么在这个背景下,用户想要找前一天或者更久一点的内容帖子就会变得较为困难,此时用户就可以通过记忆来搜索相应的内容,进而达到缩短内容查找的时间,从而提升用户的使用体验度。

  第四,搜索页的设计也需要进行优化,尽可能的使用一些活泼性的词汇,比如谷歌就有一个手气不错的按钮,通过这种相对拟人化的引导,再加上搜索框和整个页面的设计风格融为一体,这样还能够有效提升网页的视觉体验,从而达到提升网站页面优化的效果。从这点来看搜索框的设计并不是简单的在首页的显眼位置上进行布置。

  总而言之,搜索框对于网站而言,并不一定就是一个必须品,而是需要结合网站的类型,以及相关的内容丰富度来进行选择,如果能够放置在内页上就尽可能的布置在内页上,但是对于某些垂直行业的电商网站而言,如果将搜索框放在首页,就比较有利于用户的搜索,就相对合适。所以搜索框的布置需要因地制宜才能够充分发挥其重要效果。本文来源于DJ嗨嗨网http://www.djye.com/,转载请保留作者链接,谢谢。

四 : 搜索引擎如何处理收集到的网页数据

  搜索引擎原理中,搜索引擎工作流程从大的方面有三点:数据采集、数据预处理、查询服务,这里和大家分享一下数据预处理,提亲说明的是,其中涉及一些专业的词汇,在我博客是加了锚文本的,这里没有,看不懂的可以去看原文。

  

 

  在我们所述的“数据预处理”就是主要包含四个方面:关键词提取,“镜像网页”以及“转载网页”的消除,链接分析和网页重要程度的计算。

  关键词提取:

  1)在每一章网页,包含了大量的和主题内容无关的内容,像版权说明等等,关键词提取的任务,就是要提取出网页源文件的内容部分所含的关键词。提取的方法:一般类似与切词,将内容切成多个词组成的数组,再取出“在”“的”等无意义的词组,确定最终的关键词。(博主联想:关键词密度,关键词加粗,定向锚文本就是更具这一原因出现,方便搜索引擎更加简单的判断关键词)

  在后面的章节也会提到的DocView模型中会有更加详细的讲解,在关键词提取之前还有网页净化等多个步骤,出于书籍的编辑顺序考虑,在这里不详解,感兴趣的可以点击链接跳转查看:DocView模型,网页净化;

  重复或转载网页的消除:

  1)天网的2003统计发现:网页的平均重复率为4,到目前的2015年,这个数字肯定已经破10。对于网名来说,拥有了更多访问有用信息的机会,对搜索引擎来说,浪费了大量的搜集网页的时间,以及网络宽带资源。具体实现方法,以后再讲。

  链接分析:

  1)链接分析中有提到两个概念,词频(TF):该关键词在关键词提取之后的关键词集合中的出现频率;

  2)文件频率(DF):该关键词在所有文件中的出现频率,在所有文件中,该关键词在多少文件中出现;

  3)搜索引擎可以通过HTML文本标签,来确定关键词的重要性(博主联想:

  标签的使用就是通过这个得来);指向其他文件的链接,来判断(博主联想:定向锚文本的使用)

  网页重要程度的计算:

  1)搜索引擎需要将用户索引的结果,以列表的形式,展示给客户,并且在展示中满足用户的搜索需求,因此“网页重要程度”的概念出现了。

  2)判定重要性的方法:人们通过参考文献重要性的评估方式,其核心就是–“被引用的最多的就是最重要的”。这种方式,恰好在HTML中超文本链接完美体现,谷歌的PR值(引用该页面的页面概述和引用该页面的页面重要程度)就是完美展现(博主联想:发外链就是该算法的完美体现)。(PageRank算法)

  3)和第二点出现的不同的地方在于,某些页面是被大量的指向其他页面,某些页面被其他页面大量引用,形成对偶的关系,于是HITS算法出现。(HITS算法)

  

 

  部分名词介绍:

  “倒排文字:利用文档(已经采集到的网页)中所包含的关键词作为索引,文档则作为索引的着陆页(目标文档),常见的,就像纸质书籍中,索引就是文章关键词,书籍的具体内容或者说页面就是索引目标页。

  镜像网页:网页内容一模一样的,未做任何的修改

  转载网页:主要内容基本相同,但是多了少量的编辑信息

  HITS算法:简单介绍,在HITS算法中,存在两种页面Authority(权威)页面和Hub(目录)页面,对于Authority页面A,指向A页面的Hub页面H页面越多,那么A页面的质量越高,同样的Hub页面H指向的Authority页面A的数量越多,质量越高,则H页面的质量也就越高。

  陈晨在最后总结一下,在搜索引擎原理这一本书,在介绍数据预处理这一块,包含的四个方面,在陈晨来看,链接分析就是用来判断网页重要程度的,所以可以划分为一类,合起来就是三个方面,一句话来说:重复或转载页面首先消除,然后提取关键词,加以DF,TF,链接,和算法来判断出网页重要程度。

  原文出处链接:

五 : 网站如何设置让搜索引擎更喜欢呢?

  当你的网站开始被搜索引擎收录了,那么你就要开始通过对网站内容或结构进行优化来提升网站关键词排名,具体要怎么做呢,个人觉得代码的优化是其中非常重要而又非常容易被忽视的一环,今天就和大家谈谈我自己在代码优化方面的一些心得,希望对大家看完能有所收获

  一、title中加入你要做的关键词,如果你要是做百度的搜索引擎排名的话用“_”分隔关键字,如果做谷歌排名的话用“,”分隔关键字,一般做搜索引擎排名也就是这两家比较的搜索引擎供应商了,标题要尽量的简洁、精练。

  二、keywords和description的书写。一般的SEO会把keywords的内容直接复制到description中,其实这样是非常错误的做法,因为如果你把这两项内容设置成一样的,那么蜘蛛在抓取时会认为这条信息是重复的,因而不会收录,呵呵,最重要的是,本来这两个地方用好了会对优化有着非常的作用,但是现在却只能发挥其中一项作用,这不是赔本买卖么,太不划算了是吧,所以keywords和description中的内容不要设为一样,而且一定要认真填写,keyword里面添加你要做的关键词,description里面就对这些关键词进行一些描述和包装,这样做是蜘蛛最喜欢的,也会把信息带会服务器。

  三、在body下加入h1标签,每个h1标签只要嵌入一个关键词,然后加入超链接就可以了,从优化角度来讲,每个页面有且只能有一个h1标签。

  四、alt内容撰写。在body下都会有一些图片,如果出现图片的话请加入alt属性,然后里面加入关键字,每一个alt加入一个关键词即可,不宜多加,否则会被蜘蛛视为关键词堆砌,后果......呵呵......

  五、nofollow标签的使用。在我们的网站中,都会有一些类似于在线客服啊、QQ在线等之类的一些链接,这些链接是可以进行权重的传递的,这就需要我们对其进行控制,这时就需要用到nofollow标签了,在这些链接后面加上nofollw标签后,这些链接是仍然可以正常使用的,但是却不会再往外传递权重了,这样对我们网站的权重的提升是不是就有了一定的帮助呢

  当然,新站在上线之初需要呵护的地方还有众多,如导航的设置、内外链的建设等这些都会对我们的关键词排名有影响,但只要大家在操作的过程中重视细节的把握,采取正规合理的优化办法,网站都能够很快的收录并得到不赖的名次的。

  以上所讲几点都是本人亲身经历体验过,而且确实也有效果,在此发下我自己优化的网站供大家参考 http://www.gaokongcar.com/

本文标题:搜索引擎如何抓取网页-网站如何在搜索引擎中获得更高的权重
本文地址: http://www.61k.com/1179625.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1