当业务需要大量IP的时候,该如何操作?每天产生IP量:w级,Easy

当业务需要对外大量爬取数据的时候,往往会碰到被目标网站限流或者直接封堵。这时候就要进行层层应对,代码要被改造成模拟人的行为浏览器访问目标网站,这中操作,当需要获取目标网站数据量不大,时间充裕的情况下,足够了。但当我们需要短时间内大并发爬取内容的时候,这只从代码上进行改造往往达不到效果;这个时候就需要进行大量的IP配合。

大量IP架构V1


在各地机房部署ADSL线路,利用定时任务不停调用ADSL重拨,从而刷新IP。

程序任务下载中心把任务程序包下发到各个节点,节点上任务运行爬取数据的工作。

缺点:

由于投入各地的机房,有些甚至私人机房,不太稳定,机器出问题的时候,投入太多人力处理。

ADSL申请监管加大,不好申请。

成本高。

爬取内容增大,这种布线方式不利于扩容。

大量IP架构V2

本版因为考虑到快速扩容引入容器,并搭配K8S进行集群管理。

本版本丢弃ADSL,选用×××进行IP变化,可以是收费×××、免费×××等。

SQUID:用于为服务提供请求代理。

队列:用于接受重连×××指令,重连一次×××则IP会重新更换。

监控程序:1.接受指令,重连×××;2.监控×××网络的连通性,如果掉线则重连。

×××-Client:×××客户端。

任务集群:上面跑着各需求的程序,当需要进行爬取数据时候通过链接squid代理进行对外访问。

实施遇到的一些问题:

容器权限问题

在yaml部署文件中需要为容器提供管理员权限:securityContext: {privileged: true}

内核问题

×××需要一些系统内核支持,所以,需要进行相应挂载。

volumeMounts:

        - {mountPath: /lib/modules, name: modules}

通过该命令进行判断:cat /dev/net/tun

返回结果为cat: /dev/net/tun: File descriptor in bad state:就表示该系统支持。

现已跑一段时间,情况稳定。

现情况如下:

并发在线容器:几百+。年内预计会增长到k+

现每天产生IP量:10几w 很轻松。

更多文章,请关注×××公众号:轻量运维。

原文地址:http://blog.51cto.com/qdywsky/2175376

时间: 2024-10-11 02:43:17

当业务需要大量IP的时候,该如何操作?每天产生IP量:w级,Easy的相关文章

U-Mail邮件系统切换IP地址后该如何操作?

问:新安装的U-Mail邮件系统,已能正常运行.因与老系统切换,需要改变安装有U-Mail邮件系统软件的 服务器IP地址,我试了一下,只简单地修改服务器的IP地址后还不能正常使用,在浏览器上只能看到IIS的画面,请问还有那些地方需要修改. 我记得安装U-Mail邮件系统时是需要填写IP地址的,要是变更服务器的IP地址不会要我重新安装U-Mail吧. 答: 1.如果只是更换服务器本机的IP.公网IP没有改变. 只需要找到IIS 管理器--- u-mail的webmail网站,右键属性,点击网站--

Linux网卡多IP和bond实现多网卡使用同一IP

一.一个网卡可以根据网络环境选择不同的IP 有时我们会遇到这样一种情况,在参加公司某个项目时,所在的网络环境没有DHCP服务,IP配置必须手动指定,而当我们下班回家继续工作时,必须更改IP配置才能正常上网.在windows和Linux中其实都支持备份IP的配置,即当主配置无法通过DHCP获得IP时,启用手动配置的备份IP.值得一提的是,只有当主IP配置使用DHCP时才能使用备用配置且备用配置必须手动指定. 这个配置非常的简单,只需创建一个/etc/sysconf/network-scripts/

【IP限制】验证是否限制了境外IP访问权限

为啥要限制境外IP访问咱们的网站或者服务呢?怕泄漏了"机密"(好像都是我们在山寨别人,哪儿TM有机密,那叫"鸡贼") 好像国外的网站也没有限制咱大陆客去访问,反而是咱自己的XX机构在限制咱大陆客访问GOOGLE.YOUTUBE.FACEBOOK.TWITTER这些国外牛逼到爆的网站(仅仅说"网站"太狭隘,应该叫做"闪亮的思想和无私的智慧") 当咱们的网站或服务设置了境外IP限制,那么当境外IP的设备访问到这些网站或服务的时候,

TCP/IP协议原理与应用笔记17:IP编址之 IP地址简介(重点)

1. IP地址(通用标识符) 对于同一个网络设备(主机或路由器)的不同网络连接,需要不同的IP地址进行标识 2. 主机标识符 主要有下面三种方式的主机标识方式: (1)Name:是什么,可读性强(了解主机的属性或者用途) (2)Address:在哪里,软件效率高. (3)Route(路由的标识):怎样到达 3. IP地址结构 (1)32 bit二进制地址 它模拟物理网的编址机制,如下示意图: (2)IP地址分类,如下: TCP/IP协议原理与应用笔记03:IP地址分类

无法启动INTERNET连接共享。一个已经用IP地址配置的LAN连接需要自动IP地址

提问者采纳 很简单 只要把你要共享的连接 192.168.0.1 0改成1 然后就可以共享了 共享后再改回来 就能上了 但是会出现IP冲突的~ 无法启动INTERNET连接共享.一个已经用IP地址配置的LAN连接需要自动IP地址

分享几个ip的方法吧,包括正则验证ip

/// <summary> /// 正规则试验IP地址 /// </summary> /// <param name="IP"></param> /// <returns></returns> public bool IPCheck(string IP) { string num = "(25[0-5]|2[0-4]\\d|[0-1]\\d{2}|[1-9]?\\d)"; return Rege

Linux--记录每个用户登录后的IP信息,还有其它的操作信息

#Linux--记录每个用户登录后的IP信息,还有其它的操作信息,追加 vim /etc/profile PS1="`whoami`@`hostname`:"'[$PWD]' (Linux系统提示符是用系统变量PS1来定义的) history (who -u am i 会显示系统中登陆进来的用户及登陆从哪个IP登陆进来的,这里后面过滤了就取值一个登陆进来的IP) USER_IP=`who -u am i 2>/dev/null| awk '{print $NF}'|sed -e 

TCP/IP详解学习笔记(3)IP协议ARP协议和RARP协议

把这三个协议放到一起学习是因为这三个协议处于同一层,ARP协议用来找到目标主机的Ethernet网卡Mac地址,IP则承载要发送的消息.数据链路层可以从ARP得到数据的传送信息,而从IP得到要传输的数据信息. 1.IP协议 IP协议是TCP/IP协议的核心,所有的TCP,UDP,IMCP,IGCP的数据都以IP数据格式传输.要注意的是,IP不是可靠的协议,这是说,IP协议没有提供一种数据未传达以后的处理机制--这被认为是上层协议--TCP或UDP要做的事情.所以这也就出现了TCP是一个可靠的协议

TCP/IP详解 卷一(第三章 IP:网际协议)

IP是TCP/IP协议族中最为核心的协议.所有的TCP.UDP.ICMP及IGMP数据都以IP数据报格式传输. IP提供不可靠.无连接的数据报传送服务. 1.不可靠:就是它不能保证IP数据报能成功地到达目的地.IP仅提供最好的传输服务. 2.无连接:每个数据报的处理都是相互独立的,IP数据报可以不按发送顺序接收. 1.IP首部 其中TTL(time-to-live)生存时间字段设置了数据报可以经过的最多路由器数. 一旦经过一个处理它的路由器,它的值就减去1.当该字段的值为0时,数据报就被丢弃.

通过路由器的IP映射来解决,两个不同IP地址的PC机之间的从LAN口到WAN口的单向通讯问题

1.问题假设: 在B机中IP地址与子网掩码都固定,网关是路由器的LAN口的IP地址,我们希望通过路由器来实现B机与A机之间的单向通讯问题,也就是说B可以ping通A且可以访问A提供的FTP站点. 2.解决方法: 下面看路由器的配置: WAN口的配置: WAN口的IP地址设置为与A机同网段的IP地址,网关为A机的IP地址. LAN口的配置: DHCP服务器关闭,禁止动态分配IP. 之后我们在B机上就可以ping到A机... 同样的也可以访问A机提供的ftp站点... 3.注意: 需要注意的是,A机