小问题不简单,一个无线故障的排查过程

本文不是为了说明解决了多难的问题,而是提供了查找app连接服务端的问题的几种解决问题的思路和方法

研发人员反映有个手机app业务在3G网络下刷新不了,是连接的测试环境的服务,通过办公网和wifi正常。

研发认为可能是在3G网络或者是服务器所在IDC机房问题,问题出现有一段时间了。

真这么神奇?专治疑难杂症30年的我得查查~

找来一台andriod手机,root过的,安装ssh终端模拟器app,希望直接连接网络进行测试。

发现能ping ,说明网络是通的,不能telnet服务端口。

想通过curl模拟请求时,发现手机全键盘输入长长的命令,太痛苦了。

还找同事借个蓝牙键盘来输入呢,发现还真是可行,只是人家办公用的键盘,不能长时间借我。

和一同事聊起,反正是测试网络,不如用手机作为移动热点,电脑通过手机上网,也是3G呀。

其实也可以用3G上网卡,我有一个,只是放家里了,没法测试。

成功连接热点,用实体键盘操作爽太多了。

ping 3000多ms,慢,丢包,超时,办公室的3G网络质量确实不佳呀,不会是网络质量或速度问题引起的吧?

tracert ,16hop,断断续续,多点超时,但能通。

只有祭出tcpdump了

光盯端口是不行的,噪音太大,通过IP才能干净准确,如何找到手机的的IP呢?

访问IP查询网站,如www.ip138.com这类网站是一种方法,页面会显示本机的IP。还好上面是电脑连接热点上的网,浏览器也可以使用。

另一种稳妥的方法是,先连接到服务器一个无人使用的端口,服务器tcpdump 端口,找到IP。

我两种都用了,发现网页方法查到的也是正确的。

找到IP就好办多了,tcpdump  host IP and port 端口 抓包,发现跟服务的3次握手没完成,只收到SYN,没有ACK。

再tcpdump host ip and port 80,能正常完成3次握手

难道是服务程序的问题,网络连接处理有问题?要不然让开发调试一下?

转念一想不对,只有SYN,没有ACK更有可能服务器拒绝引起的,可能是防火墙的问题。

马上检查了iptables配置,发现确实有几条针对服务器端口的accept和一条drop

规则是允许内网和办公网访问,刚才找到那IP不是办公网IP,所以肯定是不能访问的。

去掉drop规则,测试访问OK,问题解决了~

原来防火墙规则是研发想要保证测试环境的安全加上的,没想到3G网络连接测试时会出问题

研发人员提出为什么wifi又可以呢,嘿嘿,wifi出口也用的办公网出口IP

上面提到的几种思路和方法:

1、终端模拟器app

2、蓝牙键盘

3、3G热点或3G上网卡测试网络问题

4、IP查找方法

5、tcpdump分析网络操作过程

6、告诉大家了wifi出口IP的情况

顺便提下

终端模拟器可以支持很多命令哦,

真是一个mini linux

进入/system/bin/ ls一下

能看到能支持的命令

小问题不简单,一个无线故障的排查过程,布布扣,bubuko.com

时间: 2024-08-10 02:25:58

小问题不简单,一个无线故障的排查过程的相关文章

记一个程序oom的排查过程

一,背景 收到应用服务报警,然后登录上服务器查看原因,发现进程不再了. 二,问题分析 1,那么判断进程被干掉的原因如下: (1),机器重启了 通过uptime看机器并未重启 (2),程序有bug自动退出了 通过查询程序的error log,并未发现异常 (3),被别人干掉了 由于程序比较消耗内存,故猜想是不是oom了,被系统给干掉了.所以查messages日志,发现的确是oom了: Jul 27 13:29:54 kernel: Out of memory: Kill process 17982

如何排查无线AP在使用过程中的故障?

无线网络技术的飞速发展致使无线AP已渐渐融入我们的生活并与之密不可分.无线AP主要运用于企业.商场超市.酒店餐厅.学校工厂.展览展会等场所,为其构建WLAN并提供WiFi覆盖.很多终端用户觉得使用无线AP构建的商用WiFi的用户体验并不好,实际上快速好用的商用WiFi不仅要有好的无线AP设备做硬件支持,商户也应该对环境特点.最大用户数.产品特性.安装布局等多方位因素有个整体的了解,否则很可能选不到合适的WiFi覆盖方案或者即使有了可行度比较高的WiFi覆盖方案,在使用过程中出现一点小问题就手足无

蓝的成长记——追逐DBA(18):小机上WAS集群故障,由一次更换IP引起

原创作品.出自 "深蓝的blog" 博客,欢迎转载,转载时请务必注明出处.否则追究版权法律责任. 深蓝的blog:http://blog.csdn.net/huangyanlong/article/details/47720043 [简单介绍] 个人在oracle路上的成长记录,当中以蓝自喻.分享成长中的情感.眼界与技术的变化与成长.敏感信息均以其他形式去掉,不会泄露不论什么企业机密,纯为技术分享. 创作灵感源于对自己的自省和记录.若能对刚刚起步的库友起到些许的帮助或共鸣,欣慰不已.

开机故障中的MBR引导故障的排查

接下来给大家介绍开机故障中的MBR引导故障的排查首先创建一个磁盘(这里创建的过程参见http://blog.51cto.com/13659301/2103901)重启后查看创建好的磁盘然后我们对sdb这个磁盘进行分区操作分好区之后需要进行格式化才可以进行挂载操作格式化之后,要现在根目录下创建一个挂载点,然后将sdb1挂载上去,df –h查看当前挂载 进行备份,dd复制 从sda盘里复制一次大小是512k的内容到backup里创建一个名为sda.mbr.bak的备份文件 备份好之后我们模拟破坏sd

Linux SSH远程管理故障如何排查?

Linux SSH远程管理故障如何排查? SSH远程管理故障排查方案: 1.检测两个机器是否畅通 两个机器之间是否畅通,查看物理链路是否有问题(网线网卡.IP是否正确) 第1步:物理链路是否畅通,比喻为"高速公路是否畅通" ping 排查客户端到服务端的线路问题,ping是常用的网络连通性检查工具 tracert -d 路由追踪命令,-d是不进行反向解析 C:\Users\Administrator>ping 10.0.0.8 正在Ping 10.0.0.8 具有32 字节的数据

记一次erlang 节点CPU严重波动排查过程

新服务上线后观察到,CPU在10 ~ 70%间波动严重,但从每秒业务计数器看业务处理速度很平均. 接下来是排查步骤: 1. dstat -tam 大概每10s一个周期,网络流量开始变得很小,随后突然增大,CPU也激增. 网络流量变化和从性能计数器结果上并不符合,服务相关业务较为复杂,先找出那个业务占用网络流量. 2. iftop 找出流量最大的几个目标IP,并且周期的流量变为0随后激增. 通过IP 知道是外部http接口地址,因为接口调用是异步进行的,性能计算是执行开始记录的,而不是结束记录,因

记crond导致备份失败的排查过程

今天上班的路上收到一条短信,显示线上所有实例备份都失败了.备份失败是大事,于是到公司的第一件事儿就是排查备份失败的原因. 这两天迁移了数据库管理平台,当然涉及到数据库备份功能,备份失败肯定和平台迁移有一定关系,我们先聊聊线上备份方案: 目前线上的备份方案是: 1.有一个前端页面可以配置备份任务 2.备份任务配置好了,会自动刷新到系统的crontab定时通过ansible远程执行. 排查过程: 1.查看备份报告,显示所有的备份文件大小都是0,初步估计是备份失败了而不是元数据没有更新的问题. 2.去

解Bug之路-记一次中间件导致的慢SQL排查过程

解Bug之路-记一次中间件导致的慢SQL排查过程 前言 最近发现线上出现一个奇葩的问题,这问题让笔者定位了好长时间,期间排查问题的过程还是挺有意思的,正好博客也好久不更新了,就以此为素材写出了本篇文章. Bug现场 我们的分库分表中间件在经过一年的沉淀之后,已经到了比较稳定的阶段.而且经过线上压测的检验,单台每秒能够执行1.7W条sql.但线上情况还是有出乎我们意料的情况.有一个业务线反映,每天有几条sql有长达十几秒的超时.而且sql是主键更新或主键查询,更奇怪的是出现超时的是不同的sql,似

mysql error code '1064' 排查过程

下午自测代码,在这个update上卡了一个半小时,大大的降低了开发的生产力,把排查过程发出来,好的士兵不会掉进同一个陷阱.先把异常堆栈打出来. 2016-03-28 17:23:38.420 main DEBUG [org.springframework.beans.factory.support.DefaultListableBeanFactory:463] - Finished creating instance of bean 'Sybase' 2016-03-28 17:23:38.42