[linux驱动][Linux内存]DMA学习笔记一

http://www.cnblogs.com/hanyan225/archive/2010/10/28/1863854.html

1,概念
DMA是一种无须CPU的参与就可以让外设与系统内存之间进行双向数据传输的硬件机制。使用DMA可以是系统CPU从实际的IO数据传输过程中摆脱出来，从而大大提供系统吞吐率。DMA方式的数据传输由DMA控制器(DMAC)控制，在传输期间，CPU可以并发地执行其他任务，当DMA结束后，DMAC通过中断通知CPU数据传输已经结束，然后由CPU执行相应的中断服务程序进行后续处理

2，DMA和cache
说到DMA，就会想到Cache，两者本身似乎是好不相关的事物,的确，假设DMA针对内存的目的地址和Cache缓存的对象没有重叠区域，DMA和Cache之间就相安无事，但是，如果有重叠呢，经过DMA操作，Cache缓存对应的内存的数据已经被修改，而CPU本身并不知道，它仍然认为Cache中的数据仍然还是内存中的数据，以后访问Cache映射的内存时，它仍然使用陈旧的Cache数据，这就会发生Cache与内存之间数据“不一致性”的错误。一旦出现这样的情况，没有处理好，驱动就将无法正常运行。那么怎样解决呢？最简单的方法是直接禁止DMA目标地址范围内内存的Cache功能，当然这是牺牲性能的，但却高可靠。不是吗，所以这两者之间究竟怎么平衡，还真不好解决。

3，DMA编程相关
在内存中用于与外设交互数据的一块区域被称作DMA缓冲区，在设备不支持scatter/gatherCSG,分散/聚集操作的情况下，DMA缓冲区必须是物理上联系的。
对于ISA设备而言，其DMA操作只能在16MB以下的内存进行，因此，在使用kmalloc()和__get_free_pages()及其类似函数申请DMA缓冲区时应使用GFP_DMA标志，这样能保证获得的内存是具备DMA能力的。
内核中定义了__get_free_pages()针对DMA的“快捷方式”__get_dma_pages(),它在申请标志中添加了GFP_DMA,如下所示：
#define __get_dma__pages(gfp_mask, order) __get_free_pages((gfp_mask) | GFP_DMA, (order)) 申请DMA的另外一个函数是dma_mem_alloc()函数，如下所示：

[cpp] view plain copy

static unsigned long dma_mem_alloc(int size)
{
int order = get_order(size); //大小->指数
return __get_dma_pages(GFP_KERNEL, order);
}

需要说明的是DMA的硬件使用总线地址而非物理地址，总线地址是从设备角度上看到的内存地址，物理地址是从CPU角度上看到的未经转换的内存地址(经过转换的那叫虚拟地址)。在PC上，对于ISA和PCI而言，总线即为物理地址，但并非每个平台都是如此。由于有时候接口总线是通过桥接电路被连接，桥接电路会将IO地址映射为不同的物理地址。例如，在PRep(PowerPC Reference Platform)系统中，物理地址0在设备端看起来是0X80000000，而0通常又被映射为虚拟地址0xC0000000,所以同一地址就具备了三重身份：物理地址0,总线地址0x80000000及虚拟地址0xC0000000,还有一些系统提供了页面映射机制，它能将任意的页面映射为连续的外设总线地址。

内核提供了如下函数用于进行简单的虚拟地址/总线地址转换：

[cpp] view plain copy

unsigned long virt_to_bus(volatile void *address);
void *bus_to_virt(unsigned long address);

需要说明的是设备不一定能在所有的内存地址上执行DMA操作，在这种情况下应该通过下列函数执行DMA地址掩码：

[cpp] view plain copy

int dma_set_mask(struct device *dev, u64 mask);

比如，对于只能在24位地址上执行DMA操作的设备而言，就应该调用dma_set_mask(dev, 0xffffffff).DMA映射包括两个方面的工作：分配一片DMA缓冲区；为这片缓冲区产生设备可访问的地址。结合前面所讲的，DMA映射必须考虑Cache一致性问题。内核中提供了一下函数用于分配一个DMA一致性的内存区域：

[cpp] view plain copy

void *dma_alloc_coherent(struct device *dev, size_t size, dma_addr_t *handle, gfp_t gfp);

这个函数的返回值为申请到的DMA缓冲区的虚拟地址。此外，该函数还通过参数handle返回DMA缓冲区的总线地址。与之对应的释放函数为：

[cpp] view plain copy

void dma_free_coherent(struct device *dev, size_t size, void *cpu_addr, dma_addr_t handle);

以下函数用于分配一个写合并(writecombinbing)的DMA缓冲区：

[cpp] view plain copy

void *dma_alloc_writecombine(struct device *dev, size_t size, dma_addr_t *handle, gfp_t gfp);

与之对应的是释放函数：dma_free_writecombine(),它其实就是dma_free_conherent,只不过是用了#define重命名而已。

相对于一致性DMA映射而言，流式DMA映射的接口较为复杂。对于单个已经分配的缓冲区而言，使用dma_map_single()可实现流式DMA映射：

[cpp] view plain copy

dma_addr_t dma_map_single(struct device *dev, void *buffer, size_t size, enum dma_data_direction direction);

如果映射成功，返回的是总线地址，否则返回NULL.最后一个参数DMA的方向，可能取DMA_TO_DEVICE, DMA_FORM_DEVICE, DMA_BIDIRECTIONAL和DMA_NONE;与之对应的反函数是：

[cpp] view plain copy

void dma_unmap_single(struct device *dev,dma_addr_t *dma_addrp,size_t size,enum dma_data_direction direction);

通常情况下，设备驱动不应该访问unmap()的流式DMA缓冲区，如果你说我就愿意这么做,我又说写什么呢，选择了权利，就选择了责任，对吧。这时可先使用如下函数获得DMA缓冲区的拥有权：
void dma_sync_single_for_cpu(struct device *dev,dma_handle_t bus_addr, size_t size, enum dma_data_direction direction);在驱动访问完DMA缓冲区后，应该将其所有权还给设备，通过下面的函数:

[cpp] view plain copy

void dma_sync_single_for_device(struct device *dev,dma_handle_t bus_addr, size_t size, enum dma_data_direction direction);

如果设备要求较大的DMA缓冲区，在其支持SG模式的情况下，申请多个不连续的，相对较小的DMA缓冲区通常是防止申请太大的连续物理空间的方法，在Linux内核中，使用如下函数映射SG:

[cpp] view plain copy

int dma_map_sg(struct device *dev,struct scatterlist *sg, int nents,enum dma_data_direction direction);

其中nents是散列表入口的数量，该函数的返回值是DMA缓冲区的数量，可能小于nents。对于scatterlist中的每个项目，dma_map_sg()为设备产生恰当的总线地址，它会合并物理上临近的内存区域。下面在给出scatterlist结构：
struct scatterlist
{
   struct page *page;
   unsigned int offset;   //偏移量
   dma_addr_t dma_address;   //总线地址
   unsigned int length;   //缓冲区长度
}
执行dma_map_sg()后，通过sg_dma_address()后可返回scatterlist对应缓冲区的总线结构，sg_dma_len()可返回scatterlist对应的缓冲区的长度，这两个函数的原型是：

[cpp] view plain copy

dma_addr_t sg_dma_address(struct scatterlist *sg); unsigned int sg_dma_len(struct scatterlist *sg);

在DMA传输结束后，可通过dma_map_sg(）的反函数dma_unmap_sg()去除DMA映射：

void dma_map_sg(struct device *dev, struct scatterlist *sg, int nents, enum dma_data_direction direction); SG映射属于流式DMA映射，与单一缓冲区情况
下流式DMA映射类似，如果设备驱动一定要访问映射情况下的SG缓冲区，应该先调用如下函数：

[cpp] view plain copy

int dma_sync_sg_for_cpu(struct device *dev,struct scatterlist *sg, int nents,enum dma_data_direction direction);

访问完后，通过下列函数将所有权返回给设备：

[cpp] view plain copy

int dma_map_device(struct device *dev,struct scatterlist *sg, int nents,enum dma_data_direction direction);

Linux系统中可以有一个相对简单的方法预先分配缓冲区，那就是同步“mem=”参数预留内存。例如，对于内存为64MB的系统，通过给其传递mem=62MB命令行参数可以使
得顶部的2MB内存被预留出来作为IO内存使用，这2MB内存可以被静态映射，也可以执行ioremap().

像使用中断一样，在使用DMA之前，设备驱动程序需要首先向系统申请DMA通道，申请DMA通道的函数如下：

[cpp] view plain copy

int request_dma(unsigned int dmanr, const char * device_id);

同样的，设备结构体指针可作为传入device_id的最佳参数。使用完DMA通道后，应该使用如下函数释放该通道：

[cpp] view plain copy

void free_dma(unsinged int dmanr);

时间： 2024-11-05 20:37:38

[linux驱动][Linux内存]DMA学习笔记一的相关文章

Linux简易APR内存池学习笔记(带源码和实例)

先给个内存池的实现代码,里面带有个应用小例子和画的流程图,方便了解运行原理,代码 GCC 编译可用.可以自己上网下APR源码,参考代码下载链接: http://pan.baidu.com/s/1hq6A20G 贴两个之前学习的时候参考的文章地址,大家可以参考: http://www.cnblogs.com/bangerlee/archive/2011/09/01/2161437.html http://blog.csdn.net/flyingfalcon/article/details/2627

Linux内存管理学习笔记转

https://yq.aliyun.com/articles/11192?spm=0.0.0.0.hq1MsD 随着要维护的服务器增多,遇到的各种稀奇古怪的问题也会增多,要想彻底解决这些“小”问题往往需要更深的Linux方面的知识.越专业.分工越细的工程师,在这方面的要求也就越高.这次,对MySQL Swap的问题的探索过程,就一不小心掉进了Linux Memory Managemant(Linux MM)的研究中去了,爬了很久才出来,这里做一个系列笔记. 笔记中很多内容都是参考<Underst

Linux内存管理学习笔记——内存寻址

最近开始想稍微深入一点地学习Linux内核,主要参考内容是<深入理解Linux内核>和<深入理解Linux内核架构>以及源码,经验有限,只能分析出有限的内容,看完这遍以后再更深入学习吧. 1,内存地址逻辑地址:包含在机器语言中用来指定一个操作数或一条指令的地址. 线性地址:一个32位无符号数,用于直接映射物理地址物理地址:片上引脚寻址级别的地址 2,逻辑地址->线性地址 2.1 段选择符与段寄存器逻辑地址:段选择符(16位)+段内偏移(32位) index:在GDT或L

C++内存管理学习笔记（7）

/****************************************************************/ /* 学习是合作和分享式的! /* Author:Atlas Email:[email protected] /* 转载请注明本文出处: * http://blog.csdn.net/wdzxl198/article/details/9178099 /************************

C++内存管理学习笔记（6）

/****************************************************************/ /* 学习是合作和分享式的! /* Author:Atlas Email:[email protected] /* 转载请注明本文出处: * http://blog.csdn.net/wdzxl198/article/details/9120635 /************************

C++内存管理学习笔记（5）

/****************************************************************/ /* 学习是合作和分享式的! /* Author:Atlas Email:[email protected] /* 转载请注明本文出处: * http://blog.csdn.net/wdzxl198/article/details/9112123 /************************

初探C++内存泄漏学习笔记

为什么要避免内存泄露呢? 分配一块内存,但是忘了释放它,这是一种很严重的错误.这样的内存将等到程序结束之后才会被释放. 如果程序运行的时间很长,并且在不断申请内存而没有释放内存,迟早会把内存消耗殆尽,导致后面无法申请内存甚至系统奔溃. 常见的内存泄漏的几种情况 new语句所返回的地址是访问这个内存块的唯一线索,同时也是delete语句把这个内存块还给系统的唯一线索. int *x; x = new int[100]; //x是唯一线索 delete [] x; x=NULL; 如果这块内存的地

Linux驱动设计——内存与IO访问

名词解释内存空间与IO空间内存空间是计算机系统里面非系统内存区域的地址空间,现在的通用X86体系提供32位地址,寻址4G字节的内存空间,但一般的计算机只安装256M字节或者更少的内存,剩下的高位内存就被用于PCI或者AGP及系统桥设备的使用上面,主机可以像访问系统内存一样访问这些高端内存,这样对于扩展的设备有更大的空间. Linux用户空间与内核空间 IO空间是X86系统上面的专用空间,现在的IO空间大小是64K字节,从0x0000到0xffff,可以供设备使用,比如南桥很多的设备就是挂在I

Linux课程第十三天学习笔记

################################ 6.shell脚本命令 ################################ ####################1.diff####################diff 参数 file1 file2 ##比较两个文件的不同 -c file1 file2 ##显示周围的行 -u file1 file2 ##按照统一输出格式生成

猜你喜欢

jenkins 多选框

背景jenkins自带的参数化不支持多选框,不过有插件支持:Extended Choice Parameter Plug-In插件地址: https://plugins.jenkins.io/exte ...

bzoj2333[SCOI2011]棘手的操作

bzoj2333[SCOI2011]棘手的操作题意: 有N个节点,M个操作:连接两个节点.单个节点的权值增加v.节点所在的连通块的所有节点的权值增加v.所有节点的权值增加v.询问节点当前的权值.询问 ...

java版餐饮管理系统

或许前面写了这么多小游戏还不足以证明我真的在Swing中花费了很多时间好吧下面上我的Swing封笔之作!在写不会傻里吧唧的写Swing程序了! 这个是一个餐饮销售系统!没有做完,因为...没有继续的 ...

注解配置的Spring MVC

基于注解配置的Spring MVC 简单的HelloWorld实例应用 2.1 问题使用注解的方式重构helloworld应用案例. 2.2 方案 1. @RequestMapping注解应用 @R ...

AngularJS自定义表单验证

<!doctype html> <html ng-app="myApp"> <head> <script src="G:\\So ...

Zookeeper场景实践：（5）分布式通知/协调

1.基本介绍通知/协调机制通常有两种方式. 系统调度模式:操作人员发送通知实际是通过控制台改变某个节点的状态,然后Zookeeper将这些变化发送给注册了这个节点的Watcher的所有客户端. 工作 ...

mysql 存储过程中使用游标中使用临时表可以替代数组效果

mysql不支持数组.但有时候需要组合几张表的数据,在存储过程中,经过比较复杂的运算获取结果直接输出给调用方,比如符合条件的几张表的某些字段的组合计算,mysql临时表可以解决这个问题.临时表:只有在 ...

CSS- 横向和纵向时间轴

时间轴在展示公司发展信息,服务流程中用的比较多,常见的注册登录有的是通过引导,一步一步的来完成,上面会通过时间轴告诉用户当前在哪一步,公司在关于我们或者发展流程的时候也特别喜欢用时间轴来展示,简单的实 ...

ljhgfewertyuoiuytr

http://weheartit.com/pvfjzxfn73393/collections/59405113-2014-12-16 http://weheartit.com/lbvjvlbp7 ...

网络接口的检测

如果没有以下命令,可以先去添加一个http://repoforge.org/use/ 的yum源. ifstat命令 ifstat可以监控网络接口,比较简单地查看网络流量 ifstat默认是不监控回环 ...

linux安装SNMP操作步骤

1.放入对应版本的光盘光盘会自动加载,如果有桌面,会在桌面上看到这样的图标如果没有,则使用命令挂载 mkdir /media/rhel mount /dev/cdrom /media/rhel 或 ...

长连接短连接长短连接争长短

其实还是这个老问题: 记一次文件下载丢包填坑之旅 http://www.cnblogs.com/syjkfind/p/5281677.html 即使现在只有haproxy-nginx-磁盘文件比较少 ...

1. LAMP----PHP开发环境搭建(Win)

LAMP=Linux+Apache+MySQL+PHP. Step1 安装Apache http://httpd.apache.org/download.cgi 1.打开上面网址->点击File ...

Hbase权威指南客户端API基础小结笔记(未完)

客户端API:基础 HBase的主要客户端接口是由org.apache.hadoop.hbase.client包中的HTable类提供的,通过这个类,用户可以完成向HBase存储和检索数据,以及删除无 ...

[小工具][JS]范围内随机数

function random(min,max){ return Math.floor(min+Math.random()*(max-min)); } 例如,生成0-9的随机数(包括0和9) rand ...

開發Android, 從Eclipse官網下載Eclipse開始,從無到有安裝一遍

自從Android Studio 1.0問世, 想要用Eclipse 來開發Android, 卻因為Android的官網Android Developer(http://developer.andro ...

2015年最棒的10个 JavaScript 框架

JavaScript是最流行的前端开发程序设计语言.它为WEB开发者提供了能够设计出具有丰富功能.干净用户界面的WEB应用的能力.JavaScript框架使得WEB应用的设计变的简单,并且它能够提供很 ...

用户管理su useradd userdel finger usermod passwd 等简述

用户管理su useradd userdel finger usermod passwd chsh chfn pwck id chage chage 影子口令: 用户:/etc/shadow 组:/e ...

安装Entity Framework（EF基础系列篇4）

Entity Framework 5.0 API是分布在两个地方:NuGet和.NET Framework中,这个.NET framework 4.0/4.5包含EF核心的API,然而通过NuGet包 ...

康拓展开-----两个排列的位置之差

#include <iostream> #include <cstring> #include <cstdio> #define LL long long usin ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.019 s.