linux中断源码分析 - 中断发生(三)

本文为原创，转载请注明：http://www.cnblogs.com/tolimit/

回顾

　　上篇文章linux中断源码分析 - 初始化(二)已经描述了中断描述符表和中断描述符数组的初始化，由于在初始化期间系统关闭了中断(通过设置CPU的EFLAGS寄存器的IF标志位为0)，当整个中断和异常的初始化完成后，系统会开启中断(设置CPU的EFLAGS寄存器的IF标志位为1)，此时整个系统的中断已经开始可以使用了。本篇文章我们具体研究一次典型中断发生时的运行流程。

中断产生

　　我们需要先明确一下，中断控制器与CPU相连的三种线:INTR、数据线、INTA。

　　在硬件电路中，中断的产生发生一般只有两种，分别是:电平触发方式和边沿触发方式。当一个外部设备产生中断，中断信号会沿着中断线到达中断控制器。中断控制器接收到该外部设备的中断信号后首先会检测自己的中断屏蔽寄存器是否屏蔽该中断。如果没有，则设置中断请求寄存器中中断向量号对应的位，并将INTR拉高用于通知CPU，CPU每当执行完一条指令时都会去检查INTR引脚是否有信号(这是CPU自动进行的)，如果有信号，CPU还会检查EFLAGS寄存器的IF标志位是否禁止了中断(IF = 0)，如果CPU未禁止中断，CPU会自动通过INTA信号线应答中断控制器。CPU再次通过INTA信号线通知中断控制器，此时中断控制器会把中断向量号送到数据线上，CPU读取数据线获取中断向量号。到这里实际上中断向量号已经发送给CPU了，如果中断控制器是AEIO模式，则会自动清除中断向量号对应的中断请求寄存器的位，如果是EIO模式，则等待CPU发送的EIO信号后在清除中断向量号对应的中断请求寄存器的位。

　　用步骤描述就是：

中断控制器收到中断信号
中断控制器检查中断屏蔽寄存器是否屏蔽该中断，若屏蔽直接丢弃
中断控制器设置该中断所在的中断请求寄存器位
通过INTR通知CPU
CPU收到INTR信号，检查是否屏蔽中断，若屏蔽直接无视
CPU通过INTA应答中断控制器
CPU再次通过INTA应答中断控制器，中断控制器将中断向量号放入数据线
CPU读取数据线上的中断向量号
若中断控制器为EIO模式，CPU发送EIO信号给中断控制器，中断控制器清除中断向量号对应的中断请求寄存器位

SMP系统

　　在SMP系统，也就是多核情况下，外部的中断控制器有可能会于多个CPU相连，这时候当一个中断产生时，中断控制器有两种方式将此中断送到CPU上，分别是静态分发和动态分发。区别就是静态分发设置了指定中断送往指定的一个或多个CPU上。动态分发则是由中断控制器控制中断应该发往哪个CPU或CPU组。

　　CPU已经接收到了中断信号以及中断向量号。此时CPU会自动跳转到中断描述符表地址，以中断向量号作为一个偏移量，直接访问中断向量号对应的门描述符。在门描述符中，有个特权级(DPL)，系统会先检查这个位，然后清除EFLAGS的IF标志位(这也说明了发发生中断时实际上CPU是禁止其他可屏蔽中断的)，之后转到描述符中的中断处理程序中。在上一篇文章我们知道，所有的中断门描述符的中断处理程序都被初始化成了interrupt[i]，它是一段汇编代码。

interrupt[i]

　　interrupt[i]的每个元素都相同，执行相同的汇编代码，这段汇编代码实际上很简单，它主要工作就是将中断向量号和被中断上下文(进程上下文或者中断上下文)保存到栈中，最后调用do_IRQ函数。

# 代码地址:arch/x86/kernel/entry_32.S

# 开始
1:    pushl_cfi $(~vector+0x80)    /* Note: always in signed byte range */ # 先会执行这一句，将中断向量号取反然后加上0x80压入栈中
      .if ((vector-FIRST_EXTERNAL_VECTOR)%7) <> 6
    jmp 2f                                                     # 数字定义的标号为临时标号，可以任意重复定义，例如："2f"代表正向第一次出现的标号"2:"，3b代表反向第一次出现的标号"3:"
      .endif
      .previous                                             # .previous使汇编器返回到该自定义段之前的段进行汇编，则回到上面的数据段
    .long 1b                                                 # 在数据段中执行标号1的操作
      .section .entry.text, "ax"                             # 回到代码段
vector=vector+1
    .endif
  .endr
2:    jmp common_interrupt

common_interrupt:
    ASM_CLAC
    addl $-0x80,(%esp)       # 此时栈顶是(~vector + 0x80)，这里再加上-0x80，实际就是中断向量号取反，用于区别系统调用，系统调用是正数，中断向量是负数
    SAVE_ALL                 # 保存现场，将寄存器值压入栈中
    TRACE_IRQS_OFF           # 关闭中断跟踪
    movl %esp,%eax           # 将栈指针保存到eax寄存器，供do_IRQ使用
    call do_IRQ              # 调用do_IRQ
    jmp ret_from_intr        # 跳转到ret_from_intr，进行中断返回的一些处理
ENDPROC(common_interrupt)
    CFI_ENDPROC

do_IRQ

　　这是中断处理的核心函数，来到这里时，系统已经做了两件事

系统屏蔽了所有可屏蔽中断(清除了CPU的IF标志位，由CPU自动完成)
将中断向量号和所有寄存器值保存到内核栈中

　　在do_IRQ中，首先会添加硬中断计数器，此行为导致了中断期间禁止调度发送，此后会根据中断向量号从vector_irq[]数组中获取对应的中断号，并调用handle_irq()函数出来该中断号对应的中断出来例程。

__visible unsigned int __irq_entry do_IRQ(struct pt_regs *regs)
{
    /* 将栈顶地址保存到全局变量__irq_regs中，old_regs用于保存现在的__irq_regs值，这一行代码很重要，实现了嵌套中断情况下的现场保存与还原 */
    struct pt_regs *old_regs = set_irq_regs(regs);

    /* 获取中断向量号，因为中断向量号是以取反方式保存的，这里再次取反 */
    unsigned vector = ~regs->orig_ax;
    /* 中断向量号 */
    unsigned irq;

    /* 硬中断计数器增加，硬中断计数器保存在preempt_count */
    irq_enter();
    /* 这里开始禁止调度，因为preempt_count不为0 */

    /* 退出idle进程(如果当前进程是idle进程的情况下) */
    exit_idle();

    /* 根据中断向量号获取中断号 */
    irq = __this_cpu_read(vector_irq[vector]);

    /* 主要函数是handle_irq，进行中断服务例程的处理 */
    if (!handle_irq(irq, regs)) {
        /* EIO模式的应答 */
        ack_APIC_irq();

        /* 该中断号并没有发生过多次触发 */
        if (irq != VECTOR_RETRIGGERED) {
            pr_emerg_ratelimited("%s: %d.%d No irq handler for vector (irq %d)\n",
                         __func__, smp_processor_id(),
                         vector, irq);
        } else {
            /* 将此中断向量号对应的vector_irq设置为未定义 */
            __this_cpu_write(vector_irq[vector], VECTOR_UNDEFINED);
        }
    }
    /* 硬中断计数器减少 */
    irq_exit();
    /* 这里开始允许调度 */

    /* 恢复原来的__irq_regs值 */
    set_irq_regs(old_regs);
    return 1;
}

　　do_IRQ()函数中最重要的就是handle_irq()处理了，我们看看

bool handle_irq(unsigned irq, struct pt_regs *regs)
{
    struct irq_desc *desc;
    int overflow;

    /* 检查栈是否溢出 */
    overflow = check_stack_overflow();

    /* 获取中断描述符 */
    desc = irq_to_desc(irq);
    /* 检查是否获取到中断描述符 */
    if (unlikely(!desc))
        return false;

    /* 检查使用的栈，有两种情况，如果进程的内核栈配置为8K，则使用进程的内核栈，如果为4K，系统会专门为所有中断分配一个4K的栈专门用于硬中断处理栈，一个4K专门用于软中断处理栈，还有一个4K专门用于异常处理栈 */
    if (user_mode_vm(regs) || !execute_on_irq_stack(overflow, desc, irq)) {
        if (unlikely(overflow))
            print_stack_overflow();
        /* 执行handle_irq */
        desc->handle_irq(irq, desc);
    }

    return true;
}

　　好的，最后执行中断描述符中的handle_irq指针所指函数，我们回忆一下，在初始化阶段，所有的中断描述符的handle_irq指针指向了handle_level_irq()函数，文章开头我们也说过，中断产生方式有两种：一种电平触发、一种是边沿触发。handle_level_irq()函数就是用于处理电平触发的情况，系统内建了一些handle_irq函数，具体定义在include/linux/irq.h文件中，我们罗列几种常用的：

handle_simple_irq()　　简单处理情况处理函数
handle_level_irq() 　　电平触发方式情况处理函数
handle_edge_irq() 边沿触发方式情况处理函数
handle_fasteoi_irq() 用于需要EOI回应的中断控制器
handle_percpu_irq() 此中断只需要单一CPU响应的处理函数
handle_nested_irq() 用于处理使用线程的嵌套中断

　　我们主要看看handle_level_irq()函数函数，有兴趣的朋友也可以看看其他的，因为触发方式不同，通知中断控制器、CPU屏蔽、中断状态设置的时机都不同，它们的代码都在kernel/irq/chip.c中。

/* 用于电平中断，电平中断特点:
 * 只要设备的中断请求引脚（中断线）保持在预设的触发电平，中断就会一直被请求，所以，为了避免同一中断被重复响应，必须在处理中断前先把mask irq，然后ack irq，以便复位设备的中断请求引脚，响应完成后再unmask irq
 */
void
handle_level_irq(unsigned int irq, struct irq_desc *desc)
{
    raw_spin_lock(&desc->lock);
    /* 通知中断控制器屏蔽该中断线，并设置中断描述符屏蔽该中断 */
    mask_ack_irq(desc);

    /* 检查此irq是否处于运行状态，也就是检查IRQD_IRQ_INPROGRESS标志和IRQD_WAKEUP_ARMED标志。大家可以看看，还会检查poll */
    if (!irq_may_run(desc))
        goto out_unlock;

    desc->istate &= ~(IRQS_REPLAY | IRQS_WAITING);
    /* 增加此中断号所在proc中的中断次数 */
    kstat_incr_irqs_this_cpu(irq, desc);

    /*
     * If its disabled or no action available
     * keep it masked and get out of here
     */
    /* 判断IRQ是否有中断服务例程(irqaction)和是否被系统禁用 */
    if (unlikely(!desc->action || irqd_irq_disabled(&desc->irq_data))) {
        desc->istate |= IRQS_PENDING;
        goto out_unlock;
    }

    /* 在里面执行中断服务例程 */
    handle_irq_event(desc);
    /* 通知中断控制器恢复此中断线 */
    cond_unmask_irq(desc);

out_unlock:
    raw_spin_unlock(&desc->lock);
}

　　这个函数还是比较简单，看handle_irq_event()函数：

irqreturn_t handle_irq_event(struct irq_desc *desc)
{
    struct irqaction *action = desc->action;
    irqreturn_t ret;

    desc->istate &= ~IRQS_PENDING;
    /* 设置该中断处理正在执行，设置此中断号的状态为IRQD_IRQ_INPROGRESS */
    irqd_set(&desc->irq_data, IRQD_IRQ_INPROGRESS);
    raw_spin_unlock(&desc->lock);

    /* 主要，具体看 */
    ret = handle_irq_event_percpu(desc, action);

    raw_spin_lock(&desc->lock);
    /* 取消此中断号的IRQD_IRQ_INPROGRESS状态 */
    irqd_clear(&desc->irq_data, IRQD_IRQ_INPROGRESS);
    return ret;
}

　　再看handle_irq_event_percpu()函数：

irqreturn_t
handle_irq_event_percpu(struct irq_desc *desc, struct irqaction *action)
{
    irqreturn_t retval = IRQ_NONE;
    unsigned int flags = 0, irq = desc->irq_data.irq;

    /* desc中的action是一个链表，每个节点包含一个处理函数，这个循环是遍历一次action链表，分别执行一次它们的处理函数 */
    do {
        irqreturn_t res;

        /* 用于中断跟踪 */
        trace_irq_handler_entry(irq, action);
        /* 执行处理，在驱动中定义的中断处理最后就是被赋值到中断服务例程action的handler指针上，这里就执行了驱动中定义的中断处理 */
        res = action->handler(irq, action->dev_id);
        trace_irq_handler_exit(irq, action, res);

        if (WARN_ONCE(!irqs_disabled(),"irq %u handler %pF enabled interrupts\n",
                  irq, action->handler))
            local_irq_disable();

        /* 中断返回值处理 */
        switch (res) {
        /* 需要唤醒该中断处理例程的中断线程 */
        case IRQ_WAKE_THREAD:
            /*
             * Catch drivers which return WAKE_THREAD but
             * did not set up a thread function
             */
            /* 该中断服务例程没有中断线程 */
            if (unlikely(!action->thread_fn)) {
                warn_no_thread(irq, action);
                break;
            }
            /* 唤醒线程 */
            __irq_wake_thread(desc, action);

            /* Fall through to add to randomness */
        case IRQ_HANDLED:
            flags |= action->flags;
            break;

        default:
            break;
        }

        retval |= res;
        /* 下一个中断服务例程 */
        action = action->next;
    } while (action);

    add_interrupt_randomness(irq, flags);

    /* 中断调试会使用 */
    if (!noirqdebug)
        note_interrupt(irq, desc, retval);
    return retval;
}

　　其实代码上很简单，我们需要注意几个屏蔽中断的方式：清除EFLAGS的IF标志、通知中断控制器屏蔽指定中断、设置中断描述符的状态为IRQD_IRQ_INPROGRESS。在上述代码中这三种状态都使用到了，我们具体解释一下：

清除EFLAGS的IF标志：CPU禁止中断，当CPU进入到中断处理时自动会清除EFLAGS的IF标志，也就是进入中断处理时会自动禁止中断。在SMP系统中，就是单个CPU禁止中断。
通知中断控制器屏蔽指定中断：在中断控制器处就屏蔽中断，这样该中断产生后并不会发到CPU上。在SMP系统中，效果相当于所有CPU屏蔽了此中断。系统在执行此中断的中断处理函数才会要求中断控制器屏蔽该中断，所以没必要在此中断的处理过程中中断控制器再发一次中断信号给CPU。
设置中断描述符的状态为IRQD_IRQ_INPROGRESS：在SMP系统中，同一个中断信号有可能发往多个CPU，但是中断处理只应该处理一次，所以设置状态为IRQD_IRQ_INPROGRESS，其他CPU执行此中断时都会先检查此状态(可看handle_level_irq()函数)。

　　所以在SMP系统下，对于handle_level_irq而言，一次典型的情况是:中断控制器接收到中断信号，发送给一个或多个CPU，收到的CPU会自动禁止中断，并执行中断处理函数，在中断处理函数中CPU会通知中断控制器屏蔽该中断，之后当执行中断服务例程时会设置该中断描述符的状态为IRQD_IRQ_INPROGRESS，表明其他CPU如果执行该中断就直接退出，因为本CPU已经在处理了。

时间： 2025-01-10 00:33:05

linux中断源码分析 - 中断发生(三)

回顾

中断产生

SMP系统

interrupt[i]

do_IRQ

linux中断源码分析 - 中断发生(三)的相关文章

Linux内核源码分析--内核启动之(3)Image内核启动(C语言部分)（Linux-3.0 ARMv7）【转】

ARMv8 Linux内核源码分析：__flush_dcache_all()

Linux内核源码分析--内核启动之(6)Image内核启动(do_basic_setup函数)（Linux-3.0 ARMv7）【转】

linux内存源码分析 - 内存回收(整体流程)

linux内存源码分析 - SLUB分配器概述

(转)linux内存源码分析 - 内存回收(整体流程)

linux内存源码分析 - 内存压缩(同步关系)

linux内存源码分析 - SLAB分配器概述

Linux内核源码分析--内核启动之(5)Image内核启动(rest_init函数)（Linux-3.0 ARMv7）【转】