工作碰上的技术问题及处理经验（二）

续上一篇随笔： https://www.cnblogs.com/kingstarer/p/8469016.html 《工作碰上的技术问题及处理经验》

由于内容有很多空格，如果直接在正文粘贴，发表后空格会消失，导致版本看起来比较难看。

所以我把主要内容做为代码发表。

我觉得每天把工作碰上的问题做一个简单的笔记挺不错的，一来可以锻炼自己的表达能力，二来也方便自己以后复查，因为以后工作很可能再碰上同样的问题。

由于我每次记录笔记时，可能只是记录了关键字，而要发出来做为共享随笔，只有这些关键字肯定是不行的，大家看了一头雾水。

所以发表前需要二次整理，目前只整理到了20180424，还有一年多的笔记，后面会继续整理，陆续发表出来。

希望能对大家有所帮助。

20171226:
    socket被子进程close父进程还能用，但是被shutdown父进程则无法用。
    shutdown后还需要close。close计数为0时会自动shutdown。

    recv函数参数含义:
    msg_peek recv 只读数据 不取出
    msg_waitall recv 等到所有数据读取完毕才返回
    msg_confirm send 等到对方收到数据才返回
    MSG_NOSIGNAL send 对方关闭socket时不发送sigpipe信号（还是会返回出错）
    TCP_NODELAY,出现40ms延时最大的可能就是由于没有设置TCP_NODELAY 在长连接的交互中,有些时候一个发送的数据包非常的小,
    加上一个数据包的头部就会导致浪费,而且由于传输的数据多了,就可能会造成网络拥塞的情况, 在系统底层默认采用了Nagle算法,可以把连续发送的多个小包组装为一个更大的数据包然后再进行发送. 但是对于我们交互性的应用程序意义就不大了,在这种情况下我们发送一个小数据包的请求,就会立刻进行等待,不会还有后面的数据包一起发送
    下一个数据包,这个时候服务端出现了延时返回的问题.对于这个问题可以通过设置server端TCP_QUICKACK选项来解决. TCP_QUICKACK可以让服务端尽快的响应这个ack包.
    采用writev方式发送多个小数据包
    一台机器上的端口是有限，最多65535(一个unsigned char)个，在系统文件/proc/sys/net/ipv4/ip_local_port_range 　中我们一般可以看到32768 61000 的结果，这里表示这台机器可以使用的端口范围是32768到61000,
     小提示: 一般的服务模式都是服务端一个端口，客户端使用不同的端口进行连接，但是其实我们也是可以把这个过程倒过来，我们客户端只用一个端但是服务端确是不同的端口，客户端做下面的修改原有的方式　socket分配句柄-> connect　分配的句柄　改为 socket分配句柄 ->对socket设置SO_REUSEADDR选项->像服务端一样bind某个端口->connect 就可以实现
    不过这种应用相对比较少，对于像网络爬虫这种情况可能相对会比较适用，只不过6w连接已经够多了，继续增加的意义不一定那么大就是了．
    这个要根据情况来看， 一般情况connect一个不存在的ip地址，发起连接的服务需要等待ack的返回，由于ip地址不存在，不会有返回，这个时候会一直等到超时才返回。如果连接的是一个存在的ip，但是相应的端口没有服务，这个时候会马上得到返回，收到一个ECONNREFUSED（Connection refused）的结果。
    但是在我们的网络会存在一些有限制的路由器，比如我们一些机器不允许访问外网，这个时候如果访问的ip是一个外网ip(无论是否存在），这个时候也会马上返回得到一个Network is unreachable的错误，不需要等待。

20180108:
    g_trash_stack_push会破坏存到栈里面的内容

20180110:
    经验:多磁盘系统可能出现热点磁盘，可以考虑使用条带化使得文件系统均匀分布

20180112:
    Linux堆栈是向下扩展的，所以如果出现数组写越界，破坏数组变量之前定义的一个变量的内容。（但是同一个结构体里面则是按声明顺序从小到大分配空间）

20180115:
    网络编程时，服务器接收数据需要防止客户端发送数据不完整。最好让客户端在发送数据前先发送包长度。

20180116:
    linux下，select函数超时后会修改入参struct timeval参数，需要重置成需要的超时时间

    读取文件尾部: if (0 > (fd = open(strLogFile, O_APPEND | O_WRONLY | O_CREAT | O_TEXT, 0644)))

20180201:
    如果出现退格键不能删除字符，终端显示不全等问题，一般可以观察是否stty参数设置异常:stty -a

20180228:
    最近定位了系统传输给P9的数据出现入库失败的问题。
    先说一下背景:
    我们数据库字符编码是GBK，P9数据库编码是UTF8。每天我们系统有一些数据需要导出成文件，传给他们系统入库。
    我们做法是先导出GBK编码的文件再通过iconv转换成UTF8格式文件传给他们。
    约定文件列分隔符是"|@|"
    出现的问题:
    由于某个库表有个字段长度不足，我们入库时需要先substr再入库，导致有些数据出现半个中文问题。
    这种数据导出到文件再用iconv转换成utf8格式时会把后面的竖线与半个中文合并成一个新的中文。
    结果会导致转换后的数据缺失一列，对方系统入库失败。
    解决方法:
    字段导出时就转换成UTF8格式，如果碰上转换异常的字符忽略。

20180301:
    今天一个网友系统短信验证码被刷了，虽然控制了ip和手机号码发送频率，但是还是被人用n多肉鸡攻击。
    当初项目上线为了用户体验，没有先验证图文验证码就直接发短信造成的祸端。

20180310:
    everything默认不搜索c盘，需要强制它搜索。工具->选项->索引->文件夹新增需要搜索的用户目录。

20180312:
    sqlplus的set term off可以不显示sql执行结果（） 脚本

20180316:
    vim打开混合编码的文件，容易出现中文乱码的情况。可以强制vim把文件当成utf8格式打开:e ++enc=utf-8

20180318:
    今天编译代码时报错，提示error C2065: “HANDLE_TIMEOUT”: 未声明的标识符。
但我明明在前面有定义HANDLE_TIMEOUT宏:#define HANDLE_TIMEOUT()
    原以为是编译器有bug，后来发现原来要用宏函数的写法才对:HANDLE_TIMEOUT()，我原来直接写了HANDLE_TIMEOUT

20180318:
    今天用plsql同时执行多条insert语句时报错:ora-0091  无效字符
后来我把语句前后厍上BEGIN和END;就可以了

20180319:
    select返回可读，但recv返回0，这种情况一般是因为对方关闭socket

20180322:
    sourceinsight在括号前双击可以快速跳转到对应的另一个括号位置。

20180408:
    release版本 gdb看不出来 加上-g重新编译

20180410:
    今天发现一个命令ss，据说比netstat快很多。netstat -anp <=> ss -tanp

    ue高亮单词的方法: shift + 双击单词

20180411:
    今天有同事说突然登录不了oracle，使用sqlplus user/[email protected]报错:“ora-12154: tns:could not resolve the connect identifier specified”，让我帮他看一下。
    我过去他机器执行tnsping dbname，提示"tns-12533: tns:illegal address parameters"，感觉是tns没配置好。但是查看tns配置${ORACLE_HOME}/network/admin/tnsnames.ora，里面的配置没问题。
    后来才发现昨天有人在.profile设置了TNS_ADMIN，把tns配置指向了另一个目录，那里面tns配置错了。我之前没检查这个变量，查看了默认目录${ORACLE_HOME}/network/admin/，所以没找出原因。

20180412:
    今天用sftp上传文件时报错"fail to upload failure"，以为是文件有问题，查了半天没发现。后来发现原来是目标机器硬盘空间满了。

    今天有gdb调试程序，学习了几个技巧: 1 调试机器源码目录与编译机器源码目录不同，可以用set substitutes-path /xxa /xxb指示gdb到指定目录找源码文件。
    .gdbinit set auto-load safe-path /
     print命令可以修改变量值，用法: print x=4
    使用watch命令可以让gdb在变量被修改时自动断点:watch *(char *)addr2line

20180413:
    今天发现有同事在.h里面修改了结构体定义，但没有相应的编译所有.c。导致运行时出现内存越界。
把程序make clean后重新编译就好了。
    这个问题确实比较难解决，因为写makefile时不好确定每个.c依赖于哪些.h

    今天写了一个将/proc下面程序环境变量文件转成export语句的脚本
    cat environ | tr ‘\0‘ ‘\n‘ | awk -F ‘=‘ ‘{
    printf("export %s=%c%s%c\n", $1, 39, $2, 39);
}‘ #39是单引号的asscii码

20180414:
    后来发现原来delete * from tab;也会造成高水位。之前以为只是有条件的delete会造成高水位。
oracle对于每个数据段（可以简单理解为每个表）都有一个高水位(hwm)标记使用空间上限。hwm默认情况只会增大，不会减少。
所以如果出现插入大量数据，然后又删除大量数据的表，会出现高水位远超过实际数据占用空间的情况。
而数据库做全表扫描时会扫描高水位下面所有数据，这就会导致有时表的数据很少，但查询起来仍然很慢的情况。

20180416:
    http常见标准错误400  由于语法格式有误，服务器无法理解此请求。404 Web 服务器找不到您所请求的文件或脚本。

20180417:
    今天使用windows上的awk程序输出中文到屏幕时发现问题:
    1 使用print输出字符串时，如果字符串有中文，会报错fatal: print to "standard output" failed (Invalid argument)
    2 使用printf输出字符串时，如果字符串有中文，会报错fatal: printf to "standard output" failed (Bad file descriptor)
    解决方法是不直接把awk运行结果输出到屏幕，使用重定向输出到txt文本，就不会报错了。

20180419:
    vs2015编译有utf8的源码时，需要在文件头添加BOM，否则会报错

20180424:
    C语言某些宏在宏里面写死了变量名，导致无法使用不同名称的变量调用该宏
例如下面这个宏，强制要求使用变量名称txnJnl，如果想使用变量名txnJnl_realName则会调用失败
#define XML_TO_JNL(IDX) do {     nRc = XmlIpc2St(&txnJnl, X2S(IDX));    if (nRc) return nRc;} while(0)
    对于这种情况c++可以使用引用改变变量名，在c则可以使用下面的编码技巧曲线救国
#define  txnJnl txnJnl_realName
    REQ_XML_TO_JNL(X2S_REVERSALAUTHREQ2ONLJNL);
#undef txnJnl
    但最好还是推荐在写宏时参数带上变量名
#define REQ_XML_TO_JNL(txnJnl，IDX) do {     nRc = XmlIpc2St(&txnJnl, X2S(IDX));    if (nRc) return nRc;} while(0)
    这样才符合高内聚低耦合的设计原则。

原文地址：https://www.cnblogs.com/kingstarer/p/11031121.html

时间： 2024-10-09 09:12:33

工作碰上的技术问题及处理经验（二）的相关文章

工作碰上的技术问题及处理经验（三）

续上一篇随笔: https://www.cnblogs.com/kingstarer/p/8469016.html <工作碰上的技术问题及处理经验>(二) 我这人记忆力比较差,经常出现有些知识学了不久后就忘了,或者有些问题花了很多时间百度解决后,再过一段时间碰上时只有模糊印象,却忘了具体解决方法. 最近几年工作时我开始有意识地把登记每天工作碰上的技术问题做个简单笔记. 一般上班时间比较忙,只能草草记了一两句话.等过一段时间,我会把这个笔记整理一下,把问题和处理经验整理通顺,以加深自己的印象.

成为成功技术领导的十条经验

编者按:InfoQ开设新栏目“品味书香”,精选技术书籍的精彩章节,以及分享看完书留下的思考和收获,欢迎大家关注.本文节选自软件领域著名专家Gerald M. Weinberg著<成为技术领导者:掌握全面解决问题的途径>中的章节“激励他人的第二大障碍”,讨论了成功技术领导的一些经验. 如果你带领的团队必须完成某个任务,而任务现在面临困境,你愿意: a．优先考虑任务 b．优先考虑人 c．平衡人和任务 d．逃避 e．上述无一可选择上面的问题出自一本管理教科书.简单来说,它代表了领导的常见困境:任务

AJAX 概念优势发展前景工作原理底层技术状态缺点框架

1. 概念 Ajax asynchronous JavaScript and XML , 异步js和xml. 这种解释已经过时了, 现在ajax就是, 允许浏览器和服务器通信, 而无需刷新当前页面的技术. 它本来是微软的技术, 是Google 在 google earth.google suggest以及gmail等对ajax技术的广泛应用,催生了ajax的流行.事实上google目前在ajax技术方面的领先是微软所无法达到的 2. 发展前景 Gmail在收发邮件的时候已经和Outlook Ex

空格App亿元A轮融资背后：云上多场景技术架构实践与经验

直播视频: (点击图片观看) 幻灯片下载地址:https://oss.aliyuncs.com/yqfiles/382bc642fc0b621a9368138a74d8fd36.pdf 3月16日云栖社区在线实时分享顺利结束,本次由空格APP技术合伙人刘博分享了空格利用阿里云服务在搜索.推荐和数据挖掘业务场景下的探索实践.本次视频直播的整理文章.视频整理完毕,如下内容. 阿里云在空格图一空格服务端整体架构在空格初始创业阶段,人员十分缺乏,但依靠着阿里云,空格两周便实现APP上线.空格服务端

【程序人生】那些工作之外的技术挣钱方式

那些工作之外的技术挣钱方式更多精彩请直接访问SkySeraph个人站点:www.skyseraph.com Overview 挣钱,左边是手,意味着你需要用双手去辛苦劳动获取报酬: 赚钱,左边是贝,意味着你可以通过钱再生钱. 本文先为大家推荐一些技术挣钱方式. 私活线上(海外).freelancer,odesk,elance等. 线上(国内).CSTO, 码市,智城外包,实现网,猪八戒(泛)等. 熟人介绍,个人影响力,QQ群等. 写作写博客.个人博客经营. 文章投稿.如InfoQ投稿(稿费

《大型网站技术架构》读书笔记二：大型网站架构模式

一.分层最常见的架构模式,将系统在横向维度上切分成几个部分,每个部分单一职责.网站一般分为三个层次:应用层.服务层和数据层,其具体结构如下图所示: 通过分层,一个庞大系统切分成不同部分,便于分工合作和维护. 但是,分层架构也有一些挑战:①必须合理规划层次边界和接口:②禁止跨层次的调用及逆向调用. 二.分割分割是在纵向方面对软件进行切分->将不同的功能和服务分割开来,包装成高内聚低耦合的模块单元,有助于软件开发和维护,还便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力. 三.分布

百万级运维经验二：Redis和Memcached的选择

看到很多人推荐使用Redis代替Memcached,我觉得这两个是不一样的东西,它们的关系应该是共存而不是替代. Memcached是个纯内存型的缓存系统,支持数据类型单一,单个缓存数据有限制,支持分布式,我觉得这是个很理想的缓存系统. Redis是个简单的NOSQL数据库,支持几种简单的数据类型,支持主从复制,支持持久化,可以看作是个内存型数据库. 由此可见,Memcached是正宗的缓存系统,Redis是个可以做缓存系统的内存型数据库. 由于Redis的数据可以设置过期时间,支持多种数据类型

公开运维技术分享的一些经验

技术分享三条实战经验: ● 良好的逻辑性 ● 自己真实经验总结 ● 多练习首先,说明下,我不是技术分享高手,分享了次数比较多,有点心得:另外,听的分享多了,对好坏也有一些感受. 还有,在此特别感谢下西山居的运维开发架构师,<Puppet实战>的作者刘宇,我的许多分享经验来自于宇哥,并且得到了宇哥多次的,一对一贴身的,手把手的指点. 一什么是成功的技术分享判断分享是否成功,关键是看自己要传递的想法,有没有被听众理解和接受,技术分享不是川普竞选,不追求热闹的效果,也不追求所有人都能听懂,一次

如何更有效使用 Rational AppScan 扫描大型网站，第 1 部分: 工作原理及技术分析

Rational AppScan 工作原理 Rational AppScan(简称 AppScan)其实是一个产品家族,包括众多的应用安全扫描产品,从开发阶段的源代码扫描的 AppScan source edition,到针对 Web 应用进行快速扫描的 AppScan standard edition,以及进行安全管理和汇总整合的 AppScan enterprise Edition 等.我们经常说的 AppScan 就是指的桌面版本的 AppScan,即 AppScan standard e