查看一个 IP 是否属于搜索引擎的方法(针对 windows 系统)。
第一步:按组合键【win】+r,快速打开运行窗口
第二步:输入 cmd,进去命令行窗口
第三步:输入 nslookup(若提示无法识别这个命令,需先安装。安装很简单,自行百度。)
最后一步:直接输入 IP 地址,如果是百度的 IP,会返回类似的结果:baiduspider-220-181-108-88.crawl.baidu.com
在进行网站日志分析的时候,常见到很多不同 IP 段的百度蜘蛛,为了方便大家更好的进行日志分析,下面列举了百度不同 IP 段常见蜘蛛的一些详情情况:
121.14.89.*,此 ip 段为新站考察蜘蛛,通常有它光顾的时候,网站基本上是没有排名的。
123.125.66.*:代表百度蜘蛛 IP 拜访,预备抓取你工具。
123.125.68.*:这个蜘蛛每天都来,另外其它的来的少,示意网站大概要进入沙盒了,或被者降权。
123.125.71.*,此 ip 段为低权重蜘蛛,可作为收录判定。
123.125.71.*:抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是首创或收罗文章。
125.90.88.*:广东茂名市电信也属于百度蜘蛛 IP 重要形成身分,是新上线站较多,另有运用过站长东西,或 SEO 综合检测形成的。
203.208.60.*:此 ip 段为异常蜘蛛,通常由于网站服务器问题或其他违规行为会引起它来爬取。
210.72.225.*,此 ip 段为日常巡逻蜘蛛,只要网站没有问题,没有违规操作就行。
220.181.68.*:每天这个 IP 段只增不减很有大概进沙盒或 K 站。
220.181.7.*:代表百度蜘蛛 IP 拜访,预备抓取你工具。
220.181.108.*,此 ip 段为权重蜘蛛,如果此蜘蛛频繁光顾,那么网站收录会有提高。如果频繁光顾网站却不收录,那么要注意是否网站质量不高,内容是否很差。
220.181.108.95:这个是百度抓取首页的公用 IP,如是 220.181.108 段的话,根本来说你的网站会每天隔夜快照
220.181.108.92:同上 98%抓取首页,大概还会抓取其他(不是指内页)220.181 段属于权重 IP 段此段爬过的文章或首页根本 24 小时放出来。
220.181.108.91:属于综合的,重要抓取首页和内页或其他,属于权重 IP 段,爬过的文章或首页根本 24 小时放出来。
220.181.108.75:重点抓取更新文章的内页到达 90%,8%抓取首页,2%其他。权重 IP 段,爬过的文章或首页根本 24 小时放出来。
220.181.108.86:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.89:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.94:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.97:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.80:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.77:公用抓首页 IP 权重段,普通前往代码是 30400 代表未更新。
220.181.108.83:公用抓取首页 IP 权重段,普通前往代码是 30400 代表未更新。
下面的百度蜘蛛 IP 造访,准备抓取你东西,抓取网页的百度蜘蛛。
60.172.229.61
61.129.45.72
61.135.162.*
百度竞价蜘蛛
61.135.165.134
117.34.74.66
118.122.188.194
119.63.196.9
125.39.78.185
(百度联盟爬虫)百度统计。
61.135.186.*
站长工具模仿的百度蜘蛛。
61.147.98.146
61.188.39.16
113.98.254.245
117.21.220.245
117.28.255.42
114 站长工具箱(这个是你的网站不稳定时常来的)
119.147.114.213
121.10.141.*
百度图片爬虫
123.15.**.**
——————————————
Google 蜘蛛 IP 地址
216.239.33.*
216.239.35.*
216.239.37.*
216.239.39.*
216.239.51.*
216.239.53.*
216.239.55.*
216.239.57.*
216.239.59.*
64.233.161.*
64.233.189.*
66.102.11.*
66.102.7.*
66.102.9.*
66.249.64.*
66.249.65.*
66.249.66.*
66.249.71.*
66.249.72.*
72.14.207.*
谷歌蜘蛛 IP 段解析
202.101.43.*、222.73.247.*、66.249.65.*这三个 ip 段是最为常规出现的
66.249.16.*出现的站点均为新站或站点出现无法访问情况后再次出现的 ip 段
210.72.225.*这个 ip 段不间断巡逻各站
203.208.60.*这个 ip 段出现在新站及站点有不正常现象后
360 蜘蛛 IP 段
101.226.166.*(101.226.166.195~101.226.166.254,共 60 个)
101.226.167.*(101.226.167.195~101.226.167.254,共 60 个)
101.226.168.*(101.226.168.195~101.226.168.254,共 60 个)
101.226.169.*(101.226.169.195~101.226.169.230,共 36 个)
180.153.236.*(180.153.236.11~26;180.153.236.35~180.153.236.74;180.153.236.101~180.153.236.196,共 152 个)
182.118.20.*(182.118.20.201~182.118.20.254,共 39 个)
182.118.21.*(182.118.21.201~182.118.21.*254,共 54 个)
182.118.22.*(182.118.22.141~182.118.22.149;182.118.22.211~182.118.22.250,共 64 个)
182.118.25.*(182.118.25.131~182.118.25.245;)
182.118.28.*
61.55.185.*
101.199.*.*
220.181.126.*
182.118.26.110~182.118.26.239(时效性 UAIP 段,主要针对网站内容更新的爬取)
360 蜘蛛 IP 段解析
220.181.126.*、101.199.*.*据说为 360 举报 IP。也就是说,假如你的网站日志出现这个 IP 段,你的网站被举报了。如果是违法站,那就自求多福吧。
搜狗蜘蛛 IP 段
123.126.113.79-123.126.113.191
220.181.89.190
220.181.89.189
218.30.103.155
61.135.189.75
220.181.94.228
61.135.189.74
220.181.89.157
220.181.89.165
220.181.89.183
220.181.89.194
218.30.103.80
180.153.232.*
180.153.234.*
180.153.236.*
180.163.220.*
42.236.101.*
42.236.102.*
42.236.103.*
42.236.10.*
42.236.12.*
42.236.13.*
42.236.14.*
42.236.15.*
42.236.16.*
42.236.17.*
42.236.46.*
42.236.48.*
42.236.49.*
42.236.50.*
42.236.51.*
42.236.52.*
42.236.53.*
42.236.54.*
42.236.55.*
42.236.99.*
神马搜索引擎 UA 和 IP 段
神马蜘蛛 UA 标识:YisouSpider 真是简单明了,IP 端也很简单,及时 UC 带来的流量,所以 IP 端也是从阿里云来的:
神马蜘蛛 User_agent:
Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 YisouSpider/5.0 Safari/537.36
对应 IP 段:
42.156.136.*-42.156.139.*
42.120.160.*42.120.161.*
Mozilla/5.0 (iPhone; CPU iPhone OS 10_3 like Mac OS X) AppleWebKit/602.1.50 (KHTML, like Gecko) CriOS/56.0.2924.75 Mobile/14E5239e YisouSpider/5.0 Safari/602.1
对应 IP 段:106.11.15*.*
最新整理的一批神马搜索蜘蛛 IP 段
42.156.136.0/24
42.156.137.0/24
42.156.138.0/24
42.156.139.0/24
42.120.160.0/24
42.120.161.0/24
42.156.254.0/24
42.120.234.0/24
42.120.235.0/24
42.120.236.0/24
106.11.152.0/24
106.11.153.0/24
106.11.154.0/24
106.11.155.0/24
106.11.156.0/24
106.11.157.0/24
106.11.158.0/24
106.11.159.0/24
头条搜索的 ip 字段总共涉及 10 个 ip,具体字段如下:
110.249.201.0/24
110.249.202.0/24
111.225.148.0/24
111.225.149.0/24
220.243.135.0/24
220.243.136.0/24
220.243.188.0/24
220.243.189.0/24
60.8.123.0/24
60.8.151.0/24
头条搜索的爬虫 UA 为“Bytespider”首写字母为大写,例如:
PC
Mozilla/5.0 (compatible; Bytespider; https://zhanzhang.toutiao.com/) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.0.0 Safari/537.36
Android
Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; https://zhanzhang.toutiao.com/)
iOS
Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2 like Mac OS X) AppleWebKit/537.36 (KHTML, like Gecko) Version/7.0 Mobile Safari/537.36 (compatible; Bytespider; https://zhanzhang.toutiao.com/)