对于seo们清楚掌握主流搜索引擎的爬虫名称十分的关键,因为当分析网站日志的时候来分析爬取情况,以及如果为了保护站点内容的时候的需要屏蔽搜索引擎爬取,这两者都要基于清楚的了解搜索引擎对应的名称才能实现。掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;作者搜集了各大搜索引擎的蜘蛛爬虫UA,便于你需要时查看。
百度蜘蛛:BaiduSpider
百度公司还有其它几个蜘蛛:Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)、Baiduspider-mobile(抓取wap),都不常见。
百度蜘蛛爬虫UA:
PC端:Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
移动端:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
图片:“Baiduspider-image+(+http://www.baidu.com/search/spider.htm)”
谷歌蜘蛛:Googlebot
有人说谷歌蜘蛛是GoogleBot,官方谷歌蜘蛛最新名称为Googlebot,还发现了Googlebot-Mobile,看名字是应该是抓取wap内容的。谷歌蜘蛛爬虫UA:“Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”,图片:“Googlebot-Image/1.0”。
360蜘蛛:360Spider
它是一个十分“勤奋抓爬”的蜘蛛。360蜘蛛爬虫UA:Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0);
搜狗蜘蛛:Sogou News Spider
搜狗公司还有其它几个蜘蛛:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou Orion spider。搜狗蜘蛛爬虫UA:“Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)”
必应蜘蛛:bingbot
必应蜘蛛爬虫UA:“Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)”
关注公众号“SEO_Study”回复“爬虫名大全”获取
另外还发现了如:YandexBot、AhrefsBot和ezooms.bot这些国外蜘蛛,如果我们的用户不在国外那么对中文网站用处很小,那是完全可以也是应该屏蔽的。因为,各大搜索引擎蜘蛛(机器人)来我们网站抓取下载内容,是非常耗费我们的网站资源的。所以作为站长,需要根据用户选择对我们的流量有利的几个常用的允许抓取,其余的都可以通过robots来加以屏蔽其抓取。
但是对于蜘蛛的屏蔽建议用黑名单也就是屏蔽不希望被你抓取的搜索引擎,不推荐使用白名单的方法来设置robots因为我们不排除,搜索引擎的蜘蛛不会改名字,如果不能及时的发现,那么对于网站的影响还是超级大。