项目运维问题总结

问题1:情况是这这样:使用外网在中台上传图片文件,上传的文件100k以内没问题,上传超过了100k,没有返回(也就是没有成功)。

但是使用内网上传,不管是多大都没问题,都能成功。这样对比下,无非外网比内网多走了一个nginx。

再次复现上面使用外网上传大图片不成功的情况,因为这个中台是通过一个nginx映射来使外网访问的。所以同时查看这个nginx报错的信息:

从上面的报错很明显是权限的问题。

解决办法:1.ps -ef|grep nginx   (看使用的用户)2.tomcat 各程序的用户 3.就是/home/ths/nginx/目录下各目录的用户(这里有时会出现很多nobody用户)。这几个用户要一致,且都有执行权限。然后重启nginx服务。再用外网上传大文件,ok了。

问题2:使用filews程序自测,在浏览器上上传文件失败。没有返回,就是失败。(如下图)

,查看filews程序的日志文件:

显示FDFS文件写入错误。

开始排查问题:首先查看了filews和fdfs的服务和进程,端口都开启了。查看磁盘还有10%可使用,然后使用fastdfs命令上传文件测试是否能成功:# /usr/local/bin/fdfs_test /etc/fdfs/client.conf upload /tmp/1.txt

最后测试不成功,返回的是:no space left on  device (磁盘满了)

看到报错,然后就删除cms,hexinifs等tomcat程序中没用的日志。再查看下空间剩余量,这回是剩余17%空间,可能开始的10%剩余空间是虚假的。之后再命令测试,成功。filews浏览器上传文件测试成功。

问题3:有时候访问中台出现这种情况,

Nginx做反向代理,后端是Tomcat,通过浏览器访问时部分文件加载失败,提示:


1

ERR_CONTENT_LENGTH_MISMATCH

经检查原来是Nginx的工作进程对大文件做了缓存,这个缓存在 %nginx%/proxy_temp 目录下,主进程在读取缓存的时候由于权限问题而无法访问,从而导致以上异常。

1、查看Nginx运行进程,确认运行用户为ths;


1

ps –ef|grep nginx

2、检查proxy_temp目录所属用户,设置用户为ths。和tomcat用户一致

3、停止nginx并将nginx目录权限设置为“ths

4.重启

时间: 2024-10-25 21:56:14

项目运维问题总结的相关文章

Python学习总结 paramiko 项目运维

在实际的开发中,每次更新模块的jar包时,都需要使用 ps -ef | grep java, 查看模块的进程号,然后使用使用命令 kill -9 进程号,处理掉进程,然后重新启动 模块. 下面尝试使用python脚本来代替手工输入代码. 1 启动模块 # -*- coding: utf-8 -*- import paramiko ssh = paramiko.SSHClient() ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())

某银行MIS项目运维札记

1.关于生产环境的吓人的事情. (1)该银行由三个环境,开发环境.测试环境.生产环境.其中,开发环境和测试环境用的是一个库(之前是两个库),生产环境单独一个库. (2)开发人员在开发或修改完报表之后会做一些测试,然后在同生产环境对比,这时显示结果可能不一样. 原因:1.报表开发过程中出错; 2.两个环境的数据不一样. 所以,一般我们会指定一个测试的点,把该点的数据从生产环境复制到测试环境.比如说,先将测试环境2016年3月3号的dept表中的数据删除, 在将生产环境的该天数据复制到测试环境,确保

浅谈运维规模化可持续构建实战

如今的互联网时代,运维早已不再是被动的那一方.过去的运维,由于种种限制,工作繁重.复杂,效率低下,很难适应目前互联网产品快速的迭代节奏.而如今,随着虚拟化.容器技术以及持续构建技术的成熟,运维工作的模式有了很大的变化,通过自动化技术的应用使得更少的人为参与,有更高的效率.为了确保项目高质量的快速迭代,必须构建一套高效的可持续构建的运维管理体系. 互联网项目最大的特点是版本迭代节奏快(同一个系统一天上线数次都有可能),需求变化频繁,且每天可能都有项目新增.服务维护.运维架构调整等需求.而常见的运维

【数据库运维】数据库(服务器)的时区设置及世界主要地区的时区

[时区设置不当会有什么问题] 当进行海外项目运维的时候,经常会遇到时区设置的问题,如果时区设置不当 或者 相同项目的服务器之间的时区不一致,都会有导致项目的数据异常的风险. 如果数据表的字段使用了date类型的字段,字段的默认值是sysdate,并且程序插入记录的时候使用了字段的默认值,那么就有可能导致数据异常.在修改数据库服务器的时区时,也是需要谨慎操作的. [服务器时间同步的方法] # 时间同步服务器请修改为要求的地址(建议使用Windows的地址,因为世界上大部分个人电脑使用的是Windo

MySQL,Oracle,PostgreSQL通过web方式管理维护, 提高开发及运维效率

在开发及项目运维中,对数据库的操作大家目前都是使用客户端工具进行操作,例如MySQL的客户端工具navicat,Oracle的客户端工具 PL/SQL Developer, MSSQL的客户端工具查询分析器等.目前大家使用的大都是C/S单机版的客户端工具,要连数据库的电脑都要安装客户端工具, navicat还比较好安装,而Oracle客户端工具安装就比较麻烦了. 当对远程服务器的数据库进行访问管理时,特别是Linux服务器,都要开启相应端口,这样也增加了服务器的安全隐患,增加了工作量. 如果有基

华南运维论坛 2015-07-25

这次的运维技术大会是由UCloud公司独家赞助组织的,非常难得是在广州举行,因为公司本地企业对这种类型的技术交流氛围还不够好. 不过自从上次阿里UC在广州组织过的一次技术分享大会之后,应该会有越来越多的互联网企业跟进,毕竟这种会议的组织者对整个圈子的氛围推进和口碑传播都有非常好的正效果. 阿里移动技术峰会的一些体会 2015-07-04 好吧,回到这次的会议主题部分,主要有3个分享,分别是: 腾讯游戏DBA关于游戏数据库的运维经验的分享,介绍了三个QQ游戏 DB分布和设计经验,还有一些日常和开发

无最新的一些云技术及私有云运维标题文章

云运维的优势与传统的运维服务相比,基于云计算运维服务实现了三大转变.首先它变被动为主动.基于云计算的运维服务以及各种监控.警告.日志.报告服务工具为依托,通过全面的网络式监控可以及早发现故障隐患,从而可以建立起主动式运维.其次,它大幅度降低了运维成本.云计算运维服务把数据乃至应用程序全部集中到云端,也就是数据中心的服务器上.对于运维来说,这意味着大量在本地的运维工作转移到云服务器,运维的总体工作量大大减少,运维成本也就大幅度降低. 云运维已是不可阻挡的趋势,明晚九点就由我们的特邀嘉宾,运维圈大佬

[运维] 第二篇:数据中心运维IT运维项目建设之我见

运维项目千千万,今天重点讲一下IT服务管理的项目,也是在过去几年各个企业数据中心都在建设的东东:ITIL.综合监控和运维自动化.先看ITIL逻辑架构图:         这是根据ITIL最佳实践理论和企业运维实际结合的ITIL逻辑架构图.最底层是基础架构管理层,在架构管理层运维人员通过人肉或工具对IT环境进行管理.综合监控平台的建设基本上在这一层,综合监控平台的目标是"全监控和全覆盖"(关心综合监控的朋友可以看我其他的监控帖子).监控的核心是什么?综合监控管理平台.通过综合监控管理平台

【项目动态】PIGOSS 助力湖南省国家税务总局IT运维

客户所属行业:政府 项目实施时间:2016年 客户背景: 湖南省国家税务总局为湖南省主管国税工作的国家税务总局直属机构(正厅级).在发展社会主义市场经济的过程中,税收承担着组织财政收入.调控经济.调节社会分配的职能.目前,湖南省每年财政收入的大部分来自国税收入,其地位和作用越来越重要. 早 在去年的两会上,李克强总理便提出了"互联网+政务"的计划.此举便是希望通过云计算.大数据技术推动政府搭建智慧城市平台,让百姓享受信息技术带来的便 捷服务.湖南省国家税务总局为响应总理号召,提高工作效