做为一个SEOer,肯定会经常查询网页的快照,直接的了解近期网站页面被搜索引擎抓取的情况,当然也会有一些小伙伴们习惯通过网站日志去了解网站页面被蜘蛛爬取的情况。不过最近在SEO相关的一些论坛,经常会看到关于网页快照显示不完整的一些问题被讨论,网页快照显示不完整到底是否影响SEO以及如何处理这方面的问题,小伙伴们讨论的结果也是参差不齐,小编针对这种情况,查阅了官方的说法,整理出了这篇文章,分享给至今还有疑问的站长朋友。
一、网页快照显示不全是否影响SEO
根据站长平台提供的官方说法,可以把疑问拆解成几个小问题,并且院长对应都做了解答,也算是对站长的疑问,有了针对性的反馈。问答如下:
第一个问题:百度对网页内容多少大小有限制吗?
院长答:对内容文字多少没有限制,但源码大小上有一定的限制,过长的话,会提取前面一部分,所以,源码还是越简洁越好
第二个问题:如果快照显示网页不完整,是不是说明BaiduSpider没有完整收录网页?
院长答:不是的,快照的生成涉及很多环节,显示不完整的原因有很多,不能简单地认为没有收录完整。
第三个问题:使用平台抓取断工具也不能完整显示,是不是就可以认为没有收录完整了?
院长答:不是的,工具只展示前200K。我们设计工具的时候对网页做过调研,一般来说展示前100K就够用了。
第四个问题:百度是否要求网页上不能有什么特殊字符?
院长答:没有这个限制。
从院长这一问一答可以总结出,网页快照是否完整并不能直接反馈出影响网站页面的收录问题,对SEO是否影响也没有明确的答案,这符合官方的书面性解答,但是从问答的只言片语中,不难解析出按照平台的规范去策划页面、部署内容以及撰写代码会对搜索引擎更加友好,搜索引擎对符合他们标准的网站会倾斜更多高质量的资源,即使没有正面回复,但是小编认为,网页快照显示不完整对SEO多少都会有影响,既然有此猜测,就需要SEOer能够根据官方建议去完善SEO。
二、如果避免解决网页快照显示不全的问题
上面提到网页快照显示不完整多少会对SEO有影响,这个时候可能会有站长朋友拿那些大的权重比较高的网站来反驳,小编也明白,通过查询这些大型网站,他们的快照内容同样显示不完整,而且是普遍现象,但是万事均要考虑实际情况,你不是它,所以你变不成它,做为一个SEOer要有甄别判断的能力,当你没有达到那种高度的时候,就要选择依附遵循平台制定的规则,向有利于SEO的方向去实施SEO。小编也是苦口婆心,针对网页快照显示不完整的问题,总结一些方法,拿出来与站长朋友共享!
1、精简源代码
从第一个问题不难看出,百度对源码的大小有一定的限制,对内容大小并没有限制,所以要求前端设计人员要严格按照SEO规范,来精简代码,避免页面出现过多的冗余代码,增加服务器的压力和干扰蜘蛛的抓取效率,具体只要是从事SEO的朋友多多少少都会和代码打过交道,CSS和JS封装是基本的,HTML的层级结构越简单越好,否则就浪费了DIV+CSS这种撰页面代码的好处。
2、对图片做压缩处理
虽然这次和院长的问答,没有涉及到页面加载速度相关问题是否会影响到网页快照完整性,但是实践出真知,采用分布式技术处理的网站,你会发现页面快照的某些位置,总是显示不完整,这直接可以反馈出页面中内容的加载速度是可以影响到网页被抓取情况的。所以对页面中的图片内容在保证清晰度的情况下做压缩处理,同样对于解决快照展示不完整问题是有帮助的。
3、网站做CDN加速
如果网站的带宽没有问题,页面的加载速度顺畅,可以忽略这一点,之所以要说这一点,我想大部分的网站很少有能力负担起一台独立服务器的成本把,所以网站做CDN对于网站来说还是非常有必要的,至于CDN缓存技术在百度的官方文档中也是首推站长使用的,既然是院长推荐的总归是对
一、网页快照显示不全是否影响SEO
根据站长平台提供的官方说法,可以把疑问拆解成几个小问题,并且院长对应都做了解答,也算是对站长的疑问,有了针对性的反馈。问答如下:
第一个问题:百度对网页内容多少大小有限制吗?
院长答:对内容文字多少没有限制,但源码大小上有一定的限制,过长的话,会提取前面一部分,所以,源码还是越简洁越好
第二个问题:如果快照显示网页不完整,是不是说明BaiduSpider没有完整收录网页?
院长答:不是的,快照的生成涉及很多环节,显示不完整的原因有很多,不能简单地认为没有收录完整。
第三个问题:使用平台抓取断工具也不能完整显示,是不是就可以认为没有收录完整了?
院长答:不是的,工具只展示前200K。我们设计工具的时候对网页做过调研,一般来说展示前100K就够用了。
第四个问题:百度是否要求网页上不能有什么特殊字符?
院长答:没有这个限制。
从院长这一问一答可以总结出,网页快照是否完整并不能直接反馈出影响网站页面的收录问题,对SEO是否影响也没有明确的答案,这符合官方的书面性解答,但是从问答的只言片语中,不难解析出按照平台的规范去策划页面、部署内容以及撰写代码会对搜索引擎更加友好,搜索引擎对符合他们标准的网站会倾斜更多高质量的资源,即使没有正面回复,但是小编认为,网页快照显示不完整对SEO多少都会有影响,既然有此猜测,就需要SEOer能够根据官方建议去完善SEO。
二、如果避免解决网页快照显示不全的问题
上面提到网页快照显示不完整多少会对SEO有影响,这个时候可能会有站长朋友拿那些大的权重比较高的网站来反驳,小编也明白,通过查询这些大型网站,他们的快照内容同样显示不完整,而且是普遍现象,但是万事均要考虑实际情况,你不是它,所以你变不成它,做为一个SEOer要有甄别判断的能力,当你没有达到那种高度的时候,就要选择依附遵循平台制定的规则,向有利于SEO的方向去实施SEO。小编也是苦口婆心,针对网页快照显示不完整的问题,总结一些方法,拿出来与站长朋友共享!
1、精简源代码
从第一个问题不难看出,百度对源码的大小有一定的限制,对内容大小并没有限制,所以要求前端设计人员要严格按照SEO规范,来精简代码,避免页面出现过多的冗余代码,增加服务器的压力和干扰蜘蛛的抓取效率,具体只要是从事SEO的朋友多多少少都会和代码打过交道,CSS和JS封装是基本的,HTML的层级结构越简单越好,否则就浪费了DIV+CSS这种撰页面代码的好处。
2、对图片做压缩处理
虽然这次和院长的问答,没有涉及到页面加载速度相关问题是否会影响到网页快照完整性,但是实践出真知,采用分布式技术处理的网站,你会发现页面快照的某些位置,总是显示不完整,这直接可以反馈出页面中内容的加载速度是可以影响到网页被抓取情况的。所以对页面中的图片内容在保证清晰度的情况下做压缩处理,同样对于解决快照展示不完整问题是有帮助的。
3、网站做CDN加速
如果网站的带宽没有问题,页面的加载速度顺畅,可以忽略这一点,之所以要说这一点,我想大部分的网站很少有能力负担起一台独立服务器的成本把,所以网站做CDN对于网站来说还是非常有必要的,至于CDN缓存技术在百度的官方文档中也是首推站长使用的,既然是院长推荐的总归是对