让物料处理更简单
全国咨询热线:

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

发布时间: 人气: 来源:

你当然可以爬12306。

要不携程飞猪去哪网这些的数据是哪来的。

这种爬虫反而给12306省流量。

因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。

而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。

不过你要是一天爬它几亿次,就别怪晶哥抓你了。

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
返回列表 相关新闻
编程语言 MoonBit 发布 Beta 版,正式进入企业场景应用,会带来哪些影响?
商业史上有哪些降维打击的经典案例?
有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?

在线留言

看不清?点击更换看不清?
在线客服
联系方式

热线电话

上班时间

周一到周五

公司电话

二维码
线