erlang 虚机crash

现网服务,每次更新一个服务时,另外一个集群所有node 都跟着同时重启一遍,这么调皮,这是闹哪样啊。。

  看系统日志:/var/log/messages

  Oct 30 15:19:41 localhost kernel: beam.smp[21880]: segfault at 7fa300006d4b ip 00007fa300006d4b sp 00007fa3d0d7c788 error 14 in locale-archive[7fa31616f000+5e91000

  beam crash了,好吧开始回忆咱用了哪些c库, 都不应该有问题啊

  嗯,打开core dump,再复现一遍。嗯,在线上复现嗷,设计成完全不影响业务的重启还是很有用的。

  不一会dump粗来了,挂上gdb 很快找到出错堆栈:

#0 0x00007fa300006d4b in ?? ()
#1 0x00007fa3aa83dd96 in quicksort () from /data0/xxx_0.4.4/lib/hash_ring-0.1.6/priv/hash_ring_drv.so
#2 0x00007fa3aa83d026 in hash_ring_remove_node () from /data0/xxx_0.4.4/lib/hash_ring-0.1.6/priv/hash_ring_drv.so
#3 0x00007fa3aa83c295 in hash_ring_drv_output () from /data0/xxx_0.4.4/lib/hash_ring-0.1.6/priv/hash_ring_drv.so
#4 0x00000000004924ef in call_driver_output (c_p=0x7fa3b0ec8f50, flags=2064, prt=0x7fa3d8d40bc0, from=55559696966931,
list=140341277983642, refp=0x0) at beam/io.c:1768

嗯,定位到出问题位置在于c库依赖hash_ring

顺便说下服务间调用一致性hash的实现:

1. 通过gen_server 定时rpc:call 目标nodes 指定服务运行状态,并动态管理hash_ring 中动态节点。

init([Configs]) ->
    %hash_ring 需要先启动, link 需要同时重启
    link(whereis(hash_ring)),
    ets:new(?MODULE, [named_table, protected, set, {read_concurrency, true}]),
    ets:new(?ROUND_ROBIN_ETS, [named_table, public, set, {write_concurrency, true}]),
    ets:insert(?ROUND_ROBIN_ETS, {inc, 0}),
    {ok, Routes} = parse_configs(Configs),
    State = apply_routes(Routes, #state{}),
    start_check_timer(),
    {ok, State}.

  

monitor_route({Svc, Node} = Route) ->
    % monitor 无法立即返回是否成功,rpc:call 成功后再monitor
    case catch rpc:call(Node, erlang, whereis, [Svc], 3000) of
        {‘EXIT‘, Reason} ->
            {error, Reason};
        undefined ->
            {error, svc_undefined};
        Pid when is_pid(Pid) ->
            Ref = erlang:monitor(process, Route),
            {ok, Ref};
        Error ->
            {error, Error}
    end.

route_up(Name, Route, Ref, #state{mons=Mons, downs=Downs} = State) ->
    case lists:member(Route, get_all_routes(Name)) of
       true ->
           case lists:member(Route, get_routes(Name)) of
                false ->
                    ok = hash_ring:add_node({route, Name}, term_to_binary(Route)),
                    add_route(Name, Route);
                true ->
                    ok
            end,
            State#state{mons=dict:store(Ref, {Name, Route}, Mons),
                        downs=Downs -- [{Name, Route}]};
        _ ->
            catch erlang:demonitor(Ref),
            lager:info("igonre route_up:~p ~p ~p", [Name, Route, Ref]),
            State
    end.

  2. 使用自己的gen_call 替代 rpc:call 调用,节省monitor 资源消耗

route(Name, Key) ->
    case hash_ring:find_node({route, Name}, neo_util:to_binary(erlang:phash2(Key))) of
        {ok, Route} -> {ok, binary_to_term(Route)};
        Error -> Error
    end.

call(Name, Key, Req, Timeout) ->
    {ok, Dst} = route(Name, Key),
    gen_call(Dst, Req, Timeout).

%参考 whatsapp 做法
%使用场景:
%1. Process 需要被长期monitor
%2. Process 为node内常驻服务进程,不是临时进程
%3. 调用前需要先确认Process alive 状态
%优势:
%不需要monitor, 节省两次网络交互
%gen:call 需要monitor -> call -> demonitor dst node monitor 操作消耗资源
%影响:
%process down 瞬间, call 应答都会超时,但此调用返回的是timeout
%
gen_call(Process, Request) ->
    gen_call(Process, Request, 5000).

gen_call(Process, Request, Timeout) ->
    Ref = erlang:make_ref(),
    catch erlang:send(Process, {‘$gen_call‘, {self(), Ref}, Request}),
    receive
        {Ref, Reply} ->
            Reply
    after Timeout ->
            exit({timeout, {?MODULE, call, [Process, Request, Timeout]}})
    end.

  问题原因是:https://github.com/chrismoos/hash-ring/blob/master/sort.c#52

  快排算法中STACK_SIZE=1024 移除节点时,实现会对剩余节点做一次排序。节点过多时,数组就越界了。

  解决方案:

  sort.h 快排算法是有问题的,但先不急着优化排序算法。

  其实一致性hash的添加加点和删除节点也能能够做到O(1) 的,为此我提交了一个patch修复该问题。

  方案:

  1. 移除节点,每个虚拟节点保存物理节点的引用,删除时只需要将空位campact

2. 添加节点,只需要计算新加节点并做快排,而不要所有节点再次排序,做一次二路归并即可

    quicksort((void**)adds, ring->numReplicas, item_sort);
+    //ring->numNodes * ring->numReplicas
+    if(ring->items == NULL || ring-> numNodes == 1) {
+        ring->items = adds;
+    } else {
+        size_t size_new = sizeof(hash_ring_item_t*) * ring->numNodes * ring->numReplicas;
+        hash_ring_item_t **news = (hash_ring_item_t **)malloc(size_new);
+        hash_ring_item_t **olds = ring->items;
+        if(news == NULL) {
+            return HASH_RING_ERR;
+        }
+        int oldlen = (ring->numNodes - 1) * ring->numReplicas;
+        int addlen = ring->numReplicas;
+        int i=0, j=0, k=0;
+        while(1) {
+            if(i == oldlen && j == addlen) {
+                break;
+            }
+            if(j == addlen) {
+                news[k++] = olds[i++];
+                continue;
+            }
+            if(i == oldlen) {
+                news[k++] = adds[j++];
+                continue;
+            }
+            int ret = item_sort(olds[i], adds[j]);
+            if(ret == 0) {
+                news[k++] = olds[i++];
+                news[k++] = adds[j++];
+            } else if (ret < 0) {
+                news[k++] = olds[i++];
+            } else {
+                news[k++] = adds[j++];
+            }
+        };
+        free(adds);
+        free(olds);
+        ring->items = news;

  另:

  这个hash 算法其实还是不太可靠的,虚拟节点数字相同怎么办?

  一般来说所有节点添加,删除次序相同即可保证一致性,当然最好能够通过nodename 对相同虚节点做排序。

时间: 2024-11-12 03:46:39

erlang 虚机crash的相关文章

创建ubuntu14.04 KVM虚机

琢磨了一天,终于方便的手工生成了kvm虚机,分享一下: 1,创建qcow2文件: ~]# qemu-img create -f qcow2 testnode1.qcow2 30G Formatting 'testnode1.qcow2', fmt=qcow2 size=32212254720 encryption=off cluster_size=65536 2,用virt-image启动一个kvm虚机 ~]#virt-install --name=testnode1 --ram 3072 --

KVM虚机克隆脚本

#!/bin/sh ############################################# ###         Auto Clone VM                 ### ###         2014-5-9                      ### ###         Owner: YiQiang.Wei            ### ###         Lastedit: 5-11                ### ###      

PowerShell 批量创建Linux虚机

Write-Host -NoNewline -ForegroundColor Magenta '请输入要创建的虚机名称(如:VLNX******)' [String]$VM_Name = Read-Host Write-Host -NoNewline -ForegroundColor Magenta '请输入需要放在哪台宿主机上(如:PWSR******)' [String]$VM_HostName= Read-Host Write-Host -NoNewline -ForegroundColo

从头搭建Openstack运行环境(五)--虚机添加floating ip

6.虚机添加floating ip 为虚机添加floating ip的功能是在neutron网络功能中非常重要的一项,在虚机创建完成后,如果此虚机所在的网络已经加入一个与外网的router中,那这个虚机可以通过SNAT的方式直接访问外网,但外网用户无法访问进虚机.如果想让外网用户访问虚机需要为虚机分配外网的floating ip.以下是为vm4虚机分配外网ip的具体步骤: 1)fixip与floating ip对应 vm4  fixip:10.0.2.84  floating ip:10.255

OpenStack虚机相关错误

OpenStack配置起来还是挺麻烦的,特别是网络那块.虽然官方文档越来越清晰,但有时还是会出各种错.排错主要是看日志.看官方文档和google 以下就一些虚机相关常见的错误做一下总结(基于Icehouse版): 1.起虚机时报 'No valid host' 错误 个人觉得 No valid host 是比较简单的错,那几个单词的意思就已经告诉我们很多信息了,No valid host 原因有很多种 (1)nova compute服务异常,用openstack-status查看各个服务是否是a

如何用ping来测试Azure虚机网络延迟的监测工作

ping操作是大家非常熟悉的测试网络连通性和延迟的操作,之前曾经听到有客户用不能"ping"通azure虚机来说事.因为客户需要能够实现对网络延迟的监测.而在windows Azure上我们是无法使用ping从外部监测Azure上的虚拟机,也无法从Azure虚拟机监测外部延迟的.因为ping基于ICMP协议,在WindowsAzure上,所有服务的对外接口都仅支持TCP和UDP协议.其实,我们可以做到实现对网络延迟的监测.微软technet提供了一个工具叫psping.可以从这里下载h

OpenStack虚机迁移live-migration失败(error: internal error Attempt to migrate guest to the same host)

现象:执行迁移live-migration操作后,显示成功迁移,但是实际没有执行迁移动作 解决过程: 在dashboard执行虚机热迁移操作,提示操作成功,但是实际虚机没有迁移: 之前遇到过内存不足导致迁移失败,但是经过查看发现源和目的节点资源充足: 然后在nova的log看到如下内容:DestinationDiskExists_Remote: The supplied disk path (/var/lib/nova/instances/e40708e3-7f19-4f9c-8d19-3e60

Nova: 虚机的块设备总结 [Nova Instance Block Device]

和物理机一样,虚拟机包括几个重要的部分:CPU.内存.磁盘设备.网络设备等.本文将简要总结虚机磁盘设备有关知识. 1. Nova boot CLI 中有关虚机块设备的几个参数 nova boot CLI 的完整参数如下: usage: nova boot [--flavor <flavor>] [--image <image>] //boot from image with id [--image-with <key=value>] //image metadata p

vMotion fails at 14% with the error: Timed out(虚机迁移到14%无法继续)

我这里环境是VMware vsphere ESXI 5.1.0 + vCenter 5,HA环境一直都正常,热迁移可用. 在一次维护的时候,重启一台ESXI后,发现虚机不能热迁移了,一直停在14%,但是冷迁移是可以的,而且HA环境没有提示不正常,而且环境提示vMotion网络提示有问题,检查了一遍,发现vMotion环境跟之前一样,而且重建了vMotion Network亦是如此. 以下是问题报错的截图和日志: The vMotionmigrations failed because the E