Cloudstack 问题记录

安装CloudStack时,会创建3个库cloud、cloud_usage、cloudbridge。但分析后发现只有cloud库是我们需要的。

CloudStack中常用库表:

1、vm_instance 虚拟机实例表

2、nics 网卡表

3、volumes 硬盘表

4、vm_template 模板表

5、configuration 参数配置;

二、可以同样的在数据库中查找这个VM ;存不存在这个模板;

mysql> SELECT * FROM host WHERE name like ‘%s-1-VM%‘\G     //主机信息中的系统虚机信息

mysql> SELECT * FROM vm_instance WHERE name like ‘%s-1-VM%‘\G    //虚拟机实例中的系统虚机信息,

看来这两个状态;(state 数据库表结构状态)

了解这两个虚拟机的朋友都知道,这是个很强大的虚拟机,删除之后能够重建,一般这两个虚拟机出现了故障,也是通过删除,重建解决的,既然UI界面上面无法删除,那就在数据库中修改相应字段,将其状态置为Destroyed即可。

(根据状态可以更换成其他的   running ;不过不轻易操作、因为系统VM 是表现当前的状态、所以一定要排查的到问题的所在才能解决的)

UPDATE vm_instance SET state=‘Destroyed‘ WHERE name=‘s-1-VM‘;

UPDATE vm_instance SET state=‘Destroyed‘ WHERE name=‘v-2-VM‘;

某kvm host主机挂掉后重新上线,云系统找不到cloudstack-agent,

打开数据库vm_instance表检查各虚拟机的运行状态(state字段)是否跟实际有出入(比如明明应是Stopped的,说它Running),

把错误的地方修改保存后重启cloudstack-management。

cloudstack 安装

常见问题

日志:(使用看在cloudstack启用的时候出现异常)

tail  -f/var/log/cloudstack/management/catalina.out

日志:

cd /var/log/cloudstack/management

setupManagement.log

management-server.log

catalina.out

3、如果是报的权限问题:

chown cloud /var/log/cloudstack/ -R

5、如果登陆无法访问管理服务器pid进程问题

[[email protected] ~]#rm /var/run/cloudstack-management.pid

再次重启测试登录;

6、查看java进程;
 ps -ef  |grep java

系统VM 是用于管理cloudstack自带的专用虚拟机;用来管理二级存储和远程终端;

修改主机名

/etc/hosts

/etc/sysconfig/network

1、登陆问题

或是数据库导入时候有误;(初始化数据)

cloudstack-setup-databases cloud:[email protected] --deploy-as=root:密码 -i (内网IP)

2、不能添加主存储或二级存储

查看 /etc/sysconfig/nfs  配置文件开放的端口

8、查看虚拟路由表 kvm连接本地地址;

nat对应 公网和内网转换的IP

iptables -t nat -nL
# iptables  -t  nat  -nL

ssh 连接linux  (系统虚拟机)

在kvm的宿主机上连接这个ip地址

ssh-i /root/.ssh/id_rsa.cloud -p 3922 [email protected]  (本地链接地址

执行/usr/local/cloud/systemvm/ssvm-check.sh

会有提示java 未运行;

然后执行;

[email protected]:/usr/local/cloud/systemvm# sh run.sh

**********

Error occurred during initialization of VM

Could not reserve enough space for objectheap

Could not create the Java virtual machine.

查看什么问题、、这个提示的就是空间不足;

我这个机器的问题是java启动不了,原因为机器的内存不足,手动更改内存;

export _JAVA_OPTIONS="-Xmx256M"

或者 export _JAVA_OPTIONS="-Xms256M -Xmx256M"

然后执行/usr/local/cloud/systemvm/run.sh

出现无法写入路由表:

Resource [DataCenter:1] is unreachable:Unable to apply save password entry on router

多有可能是虚拟路由表的问题;

通过连接地址进入虚拟路由表;查看内存进程;

或者是一些日志占用较大 (文件查看)

 du-sh * | sort -n  (文件大小排序)

或者]# ls -lhs

连接跟踪(CONNTRACK),顾名思义,就是跟踪并且记录连接状态;

Conntrackd提供了一个用户控件守护进程用来追踪iptables连接状态信息。守护进程在几个防火墙间同步网络连接的状态信息。因此conntrackd是实现高可用防火墙不可缺少的组件。

全局设置:

secstorage.allowed.internal.sites 改为10.10.10.0/24(实际存储网段)

management.network.cidr 改为10.10.10.0/24 (实际管理网段)

其它要关注的一些全局参数:

expunge 删除实例弥留时间相关参数

ha.tag 高可用标签

ha.workers 高可用守护线程数

overprovisioning 系统资源超配相关参数

(如果超配不起作用,看看数据库cluster_detail和vm_template_details表)

snapshot 快照相关参数

kvm.snapshot.enabled 使用kvm作为宿主机这个参数必须设置为true

allocated.capacity 资源分配阀值相关参数,超过阀值将无法创建和运行虚拟机。

network.throttling.rate 网络带宽,默认值是200Mbps

vm.network.throttling.rate 网络带宽,默认值是200Mbps

expunge.delay=30

expunge.interval=30

secstorage.allowed.internal.sites=0.0.0.0/0

//模板下载web所在的网段

system.vm.use.local.storage=true

//启用本地存储

host=172.16.0.20

// 主机地址

management.network.cidr=172.16.0.0/24

模板地址下载的网段

全局设置的虚拟机管理程序;

对于虚拟机平台都有最大 来宾数的限制;

host无法正常加入系统,反复断开

cloudstack-agent日志报错如下:

Connected to 10.10.10.15:8250

Proccess agent startup answer, agent id = 0

Set agent id 0

Startup Response Received: agent id = 0

Connected to the server

Lost connection to the server. Dealing withthe remaining commands...

注意看manage的日志中的host id 和cloudstack-agent日志中的agent id,是不是对应不上,是的话删除这个host重新添加。

如果删不掉,关闭manage和agent,清除数据库中host_details和host表与这个host对应的数据(如果提示其它表有关联数据也一起删除),重启manage和agent。

时间: 2024-08-04 13:31:59

Cloudstack 问题记录的相关文章

cloudstack 救援修复硬盘记录

早上一来就被通知昨晚开发的机器跳闸断电了,这都小事儿么,马上登录启动分分钟搞定.可是过了10分钟有一台就死活起不来了,觉得不好了碰上个坑了. 找问题吧,先看看控制界面有啥报错没,结果给我来个"在准备中,稍后再试."等了都10几分钟了怎么可能呢,看看吧,发现原先系统的Console Proxy VM竟然还在启动中,这都半天了啊.果断重启,然而并没什么卵用.差了下这个VM是系统自动创建的,重启不行直接干掉还会自动生成,那还留着干嘛直接删除了,分分钟就重建了,启动正常. 这些可以看到控制台了

cloudstack 记录部署中遇到的问题

1.  cloudstack 只会桥接默认路由的网卡,如果你的内网管理需要手动桥接,网络配置里需要填写具体桥接的名字,因为这个折腾了好久,具体桥接命令是,和网卡配置文件如下: brctl addbr cloudbr0 brctl addif cloudbr0 em2 [[email protected] data]# cat /etc/sysconfig/network-scripts/ifcfg-em2  DEVICE=em2 ONBOOT=yes IPADDR=192.168.1.1 NET

CloudStack核心类ApiServlet、ApiServer、ApiDispatcher、GenericDaoBase源码分析

ApiServlet 首先从整体上看下ApiServlet,Outline视图如下, 一.注意@Inject依赖的是javax.inject.jar,它和spring的@Autowired的区别在于使用它时变量不用生成相应的set方法. 二.CloudStack所有的请求都会被ApiSerlet拦截处理,进入到doGet()或者doPost()方法,然后统一交由processRequest()处理. 三.processRequestInContext()方法: 1.更多的是日志记录和异常信息处理

cloudstack(二)

以下都是自己学习整理,本着知识共享,共同进步和原则和大家共享 3.Cloudstack架构 区域--> 提供点-->群集-->多台主机-->主存储或辅助存储 通过管理服务器进行管理,通过mysql存储管理数据 3.1架构介绍 3.1.1管理服务节点(Management Server) (1)是cloudstack云管理平台的核心,接收用户和管理员的操作,包括对硬件.虚拟机和网络的全面管理操作,整个IaaS平台的工作统一汇总在管理服务节点中处理. (2)对收到的操作请求进行处理,并

CLOUDSTACK FOR HYPER-V

原文地址:http://zhu.vn/archives/1040 我这里是内网测试环境,宿主机为Server 2012R2 ,虚拟化技术为HYPER-V,域环境来的(不是域环境玩不了). 先给宿主机安装上CS的Hyper-v代理先,这是最根本的根本. 下载http://jenkins.buildacloud.org/view/4.5/job/cloudstack-4.5-hyperv-agent/lastSuccessfulBuild/artifact/bin/cloudstack-4.5-20

CloudStack环境重建之数据导出

第一.环境 软件版本 CloudStack 3.0.5+XenServer 6.0.2 硬件设备 管理节点:DELL        R420        10.30.18.2 计算节点:DELL        R720        10.30.18.9 存储节点:DELL        IBM520        10.30.18.4 3.网络环境 网段:10.30.18.0/24 网关:10.30.18.1 DNS:202.194.104.35 4.CloudStack规划 物理服务器网段

CloudStack VM运行状态的监控-Management

VM和Host的运行时刻状态,应该是所有虚拟化平台管理员最热切的关注点. 本文章介绍下CloudStack中,对于VM运行状态信息的获取和扩展. 信息获取原理 Management-Server在启动的时候,会初始化1个线程,用于定期获取定期获取运行时数据. 对于3个主流Hyperviser:KVM.XenServer.VMware,分别调用Libvirt API. XenServer RRD API和 VMware API来获取当前运行时状态. 定期获取状态之后,会上报到该线程,和之前的上报的

cloudstack下libvirtd服务无响应问题

在cloudstack4.5.2版本下,偶尔出现libvirtd服务无响应的情况,导致virsh命令无法使用,同时伴随cloudstack master丢失该slave主机连接的情况.最初怀疑是libvirtd服务或版本的问题,经过分析和排查最终确定是cloudstack-agent的问题.但是在官网上并没有找到类似的bug提交,该问题可能还存在于更高的版本,需要时间进一步从根本上分析.下面是该问题的处理过程,在此记录下,关注和使用cloudstack的朋友可以参考. 众所周知,cloudsta

(原创)基于CloudStack的平安云-云主机的生命周期

一.购买云主机1.条件筛选   涉及环境.应用系统.区域.网络.操作系统.套餐.期限.数量筛选2.校验   2.1 应用系统角色权限校验   2.2 应用系统可用配置校验   2.3 产品区域是否下架校验   2.4 网络是否下架.还有网络跟租户关系是否解除校验   2.5 套餐是否下架校验   2.6 cpu.内存是否足够校验   2.7 系统模板是否存在校验   2.8 ROOT盘容量是否足够校验3.订单生成4.日志记录5.清除购物车6.冻结系统配额 二.云主机实施1.任务生成2.获取网络模