netstat监控大量ESTABLISHED连接数和TIME_WAIT连接数题解决

查看网络连接数:

netstat -an |wc -l

netstat -an |grep xx |wc -l        查看某个/特定ip的连接数

netstat -an |grep TIME_WAIT|wc -l    查看连接数等待time_wait状态连接数

netstat -an |grep ESTABLISHED |wc -l    查看建立稳定连接数量

查看不同状态的连接数数量

[[email protected] ~]# netstat -an | awk ‘/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}‘

LISTEN 8

ESTABLISHED 2400

FIN_WAIT1 2

TIME_WAIT 6000

查看每个ip跟服务器建立的连接数

[[email protected] ~]# netstat -nat|awk ‘{print$5}‘|awk -F : ‘{print$1}‘|sort|uniq -c|sort -rn

31 45.116.147.178

20 45.116.147.186

12 23.234.45.34

11 103.56.195.17

(PS:正则解析:显示第5列,-F : 以:分割,显示列,sort 排序,uniq -c统计排序过程中的重复行,sort -rn 按纯数字进行逆序排序)

查看每个ip建立的ESTABLISHED/TIME_OUT状态的连接数

[[email protected] ~]# netstat -nat|grep ESTABLISHED|awk ‘{print$5}‘|awk -F : ‘{print$1}‘|sort|uniq -c|sort -rn

24 103.56.195.17

19 45.116.147.186

18 103.56.195.18

17 45.116.147.178

问题1:解决time_wait连接数大量问题

查询到time_wait连接数过多情况下,调整内核参数:/etc/sysctl.conf

vim /etc/sysctl.conf

添加以下配置文件:

net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 300

/sbin/sysctl.conf 让参数生效,调优完成

参数详解:

1.net.ipv4.tcp_syncookies = 1 表示开启 syn cookies 。当出现 syn 等待队列溢出时,启用 cookies 来处理,可防范少量 syn 攻击,默认为 0 ,表示关闭;

2.net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将 time-wait sockets 重新用于新的 tcp 连接,默认为 0 ,表示关闭;
3.net.ipv4.tcp_tw_recycle = 1 表示开启 tcp 连接中 time-wait sockets 的快速回收,默认为 0 ,表示关闭。
4.net.ipv4.tcp_fin_timeout 修改系靳默认的 timeout 时间

如果以上配置调优后性能还不理想,可继续修改一下配置:

vi /etc/sysctl.conf

net.ipv4.tcp_keepalive_time = 1200 #表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。

net.ipv4.ip_local_port_range = 1024 65000 #表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。

net.ipv4.tcp_max_syn_backlog = 8192 #表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。

net.ipv4.tcp_max_tw_buckets = 5000 #表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。
默认为180000,改为5000。
对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。

问题2:ESTABLISHED连接数过大问题

怎么解决请求结束后依然存在大量ESTABLISHED没有被释放

初步推断是tomcat服务器回收session时出了问题,这个一般都跟服务器的Timeout设置有联系。

查看tomcat的配置文件 server.xml

<Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" URIEncoding="UTF-8" />*****

检查配置得出20000毫秒的时候acceptCount=”100” ,明显不合理,最大连接数也太小了吧。

所以进一步优化:

connectionTimeout="20000" 改为 connectionTimeout="100"

acceptCount="100"改为acceptCount="5000"

优化完毕,继续压测...

系统响应能力节节攀升,之前LoadRunner报错问题直到压倒***并发也再也没有出现。

Action.c(380): 错误 -26608: 对于“http://www.cnlogs.com/javame”,HTTP 状态代码=504 (Gateway Time-out)
时间: 2024-11-03 21:06:58

netstat监控大量ESTABLISHED连接数和TIME_WAIT连接数题解决的相关文章

netstat监控大量ESTABLISHED连接与Time_Wait连接问题

问题描述: 在不考虑系统负载.CPU.内存等情况下,netstat监控大量ESTABLISHED连接与Time_Wait连接. # netstat -n | awk '/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}' CLOSE_WAIT 348 ESTABLISHED 1240 TIME_WAIT 5621 监控Apache与tomcat之间的链接端口 #netstat -n | grep 8009 | wc -l 7198 问题1:怎么解决

服务器性能调优(netstat监控大量ESTABLISHED连接与Time_Wait连接问题)

netstat监控大量ESTABLISHED连接与Time_Wait连接问题 问题描述: 在不考虑系统负载.CPU.内存等情况下,netstat监控大量ESTABLISHED连接与Time_Wait连接. # netstat -n | awk '/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}' CLOSE_WAIT 348 ESTABLISHED 1240 TIME_WAIT 5621 监控Apache与tomcat之间的链接端口 #netst

使用SwingBench测试连接数以及修改连接数和pga

使用SwingBench工具对oracle环境进行压力测试,100个用户,就提示连接数不够: 后台日志报错: ? 1 2 3 4 5 Errors in file /oracle/admin/dbcc/bdump/dbcc_smon_3317.trc: ORA-00018: maximum number of sessions exceeded Thu May 29 09:14:50 2014 Adjusting the default value of parameter parallel_m

MySQL查看当前连接数、连接数和最大连接数

MySQL查看当前所有连接的详细资料: mysqladmin -u root -p processlist MySQL查看当前连接数(Threads为连接数) mysqladmin -u root -p status Uptime: 1047464  Threads: 22  Questions: 1494780  Slow queries: 0  Opens: 31357  Flush tables: 1  Open tables: 1981  Queries per second avg:

linux TIME_WAIT过多的解决方法

查看TCP状态:netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'查看SOCKET状态:cat /proc/net/sockstatTIME_WAIT状态的socket一般需要等到2msl时间后,socket才会被回收.修改(添加)系统内核参数:/etc/sysctl.conf #改系統默认的TIMEOUT时间net.ipv4.tcp_fin_timeout=2 #启重用,允许将TIME-WAIT socket

TIME_WAIT太多解决思路和方法

问题描述环境是SLB+2台ECS实例,在ECS实例上跑的是的LNMP服务,在某一天下午三点中app包加载数据很慢,平时可能一两秒就能加载完成js,css等样式 解决方法1.找到加载慢的域名和URL访问后端数据库,看获取数据情况,访问数据正常. 2.查看操作系统CPU.内存.负载.网络情况查看CPU命令:top查看内存命令:free -m服务器负载:uptime网络:ping 域名 检测完后都没有问题 3.查看nginx访问日志通过 tail -f 日志文件 查看,访问url地址,状态码都是200

nagios监控内出错NRPE: Unable to read output 解决!

 nagios监控内出错NRPE: Unable to read output 解决! 由于编写check_mem监控脚本,在监控机报警:NRPE: Unable to read output,其他监控项目正常 初步认定是nagios没有权限去实行check_mem脚本: 1.在监控主机监控客户机内存,遇到NRPE: Unable to read output # /usr/local/nagios/libexec/check_nrpe -H 1192.168.1.10 -c check_mem

使用netstat命令统计established状态的连接数

netstat -an|awk -F "[ :]+" '/ESTAB/ {S[$(NF-3)]++}END{for(k in S) print S[k],k}'|sort -rn|head  62 10.19.168.86 15 180.168.234.23 10 10.10.78.165 6 10.9.145.144 2 10.9.119.253 1 127.0.0.1 1 10.9.190.18 1 106.75.53.12 1 10.19.60.128 1 10.19.161.2

zabbix监控linux和windows的tcp连接数

linux: 在linux上手动获得tcp连接数的命令为: netstat -an|awk '/^tcp/{++S[$NF]}END{for(a in S) print a,S[a]}' #ESTABLISHED       socket已经建立连接   #CLOSED            socket没有被使用,无连接   #CLOSING           服务器端和客户端都同时关闭连接   #CLOSE_WAIT        等待关闭连接   #TIME_WAIT         表