C#基础语法中得数组,定义就是:数组是一种数据结构,包含同一个类型的多个元素。从CLR的角度来看,首先数组是引用类型,堆栈分配属于分配于堆上,其次数组在内存中是连续的存储的,所以索引速度很快,而且赋值与修改元素也很简单。可以利用偏移地址访问元素,时间复杂度为O(1);可以用折半查找法查找元素,效率高。
上面这段话初看之下很莫名奇妙,解释一下,首先基础语法定义了数组是什么,是一种数据结构,数据结构有很多种:栈,队列,列表,字典,树,图,数组也是这样一种数据结构,而且是很多其他数据结构的基本,但是数组的内的数据类型只能是一种,在一个数组中不能既存在int又存在string
数组,ArrayList,List区别
在从CLR的角度来看,CLR介绍数组时,就从其派生自System.Array,而System.Array派生自Object,所以数组是引用类型,分配于托管堆上,并且数组在托管堆上分配到的是一块连续存储的内存,可以通过索引查找,虽然查询的时间复杂度是O(1),但有个问题被忽略了,就是找的快未必就有用,数组分配在一块连续的数据空间上,因此分配空间时必须确定大小。空间的连续,也导致了存储效率低,插入和删除元素效率比较低,而且麻烦。如果,要增添一个元素,需要移动大量元素,在内存中空出一个元素的空间,然后将要增加的元素放在其中。同样,你想删除一个元素,需要移动大量元素去填补被移动的元素。这就是数组的诟病,为了解决这个问题C#又推出了ArrayList
ArrayList是.Net Framework提供的用于数据存储和检索的专用类,它是命名空间System.Collections下的一部分。它的大小是按照其中存储的数据来动态扩充与收缩的。所以,我们在声明ArrayList对象时并不需要指定它的长度。但微软又发现使用ArrayList存在一个更为致命的问题,看下面的代码
1 //初始化ArrayList 2 ArrayList list = new ArrayList(); 3 //新增数据 4 list.Add("abc"); 5 list.Add(123); 6 //插入数据 7 list.Insert(0, "在第一个位置插入一条数据"); 8 foreach (var item in list) 9 { 10 Console.WriteLine(item); 11 }
在list中,我们不仅插入了字符串"abc",而且又插入了数字123。这样在ArrayList中插入不同类型的数据是允许的。因为ArrayList会把所有插入其中的数据都当作为object类型来处理。这样,在我们使用ArrayList中的数据来处理问题的时候,很可能会报类型不匹配的错误,也就是说ArrayList不是类型安全的。既使我们保证在插入数据的时候都很小心,都有插入了同一类型的数据,但在使用的时候,我们也需要将它们转化为对应的原类型来处理。这就存在了装箱与拆箱的操作,会带来很大的性能损耗。
虽然ArrayList解决了数组长度问题,但是留下了类型安全问题,装箱和拆箱操作一直是操作程序中所努力在避免的操作,因为其对性能的损耗确实是很大的,所以C#推出了Lits集合,下面的代码是声明实现一个List的集合,可以看到List指定了类型,避免了拆箱装箱的操作,并且也无需指定元素个数。
1 List<int> list = new List<int>(); 2 //新增数据 3 list.Add(123); 4 //报错,无法从string转化成int 5 list.Add("123"); 6 foreach (var item in list) 7 { 8 Console.WriteLine(item); 9 }
事实上,List来自对ArrayList的封装,而ArrayList封装自数组,数组是ArrayList和List的底层实现,那么是不是使用List就可以完美的代替数组了呢?以后所有的代码都只需要写成List就好了,既然List是来自数组的封装,继承了数组的所有方法和行为,其实这里有一次回到了效率问题,如果是固定的并且知道其长度的数据集合用数组,而不固定长度的用List。额讲了这么多,或许就是这句话最重要吧。
创建下限非零的数组
C#中有两种数组,一种是下表从0开始的数组,一种是下标非0开始的,不推荐使用下标非0开始的,通过下面的代码就可以创建一个指定下限的多维数组
1 static void Main(string[] args) 2 { 3 // 创建和初始化多维数组字符串类型。 4 int[] myLengthsArray = new int[2] { 3, 5 }; 5 int[] myBoundsArray = new int[2] { 2, 3 }; 6 //CreateInstance 创建指定下标的数组的方法 7 //elementTypeType: System.Type要创建的 Array 的 Type。 8 //一维数组,它包含要创建的 Array 的每个维度的大小。 9 //一维数组,它包含要创建的 Array 的每个维度的下限(起始索引)。 10 Array myArray = Array.CreateInstance(typeof(String), myLengthsArray, myBoundsArray); 11 12 for (int i = myArray.GetLowerBound(0); i <= myArray.GetUpperBound(0); i++) 13 for (int j = myArray.GetLowerBound(1); j <= myArray.GetUpperBound(1); j++) 14 { 15 int[] myIndicesArray = new int[2] { i, j }; 16 myArray.SetValue(Convert.ToString(i) + j, myIndicesArray); 17 } 18 19 //显示每一个维度的上限和下限 20 Console.WriteLine("Bounds:\tLower\tUpper"); 21 for (int i = 0; i < myArray.Rank; i++) 22 Console.WriteLine("{0}:\t{1}\t{2}", i, myArray.GetLowerBound(i), myArray.GetUpperBound(i)); 23 // 显示的值的数组。 24 Console.WriteLine("The Array contains the following values:"); 25 PrintValues(myArray); 26 } 27 public static void PrintValues(Array myArr) 28 { 29 IEnumerator myEnumerator = myArr.GetEnumerator(); 30 int i = 0; 31 int cols = myArr.GetLength(myArr.Rank - 1); 32 while (myEnumerator.MoveNext()) 33 { 34 if (i < cols) 35 { 36 i++; 37 } 38 else 39 { 40 Console.WriteLine(); 41 i = 1; 42 } 43 Console.Write("\t{0}", myEnumerator.Current); 44 } 45 Console.WriteLine(); 46 }
数组的传递和返回
其实传递就是当作参数传递给函数,返回就是可以作为类型返回接收,但有个问题,数组是引用类型,开篇我们就介绍了,传递给函数,如果函数改动了数组,原数组就会跟着一起变,这肯定不是我们想要的。解决方案是可以直接复制一个数组,通过Array.Copy()方法,复制一个新的数组传递给函数体,如果不希望原数组被改动的话。
不安全的数组访问
我们每次访问一个数组中的元素时,CLR都会确保索引不会超出数组的上下限。CLR的索引检查会有一些性能方面的代价。如果大家对自己的代码有足够的信心,并且不介意使用非安全代码,则可在访问一个数组时不让CLR执行索引检查。
1 //unsafe 开启不安全访问标志 2 //需要在你的项目属性页面里面,把是否包含unsafe代码的选项选上 3 //否则会报错 4 unsafe static void main() 5 { 6 Int32[] arr = new Int32{1, 2, 3, 4, 5}; 7 //获取一个指向数组第0元素的指针 8 fixed(Int32 * element = &arr[0]) 9 { 10 for(Int32 x = 0, n = arr.Length; x < n; x++) 11 { 12 Console.WriteLine(element[x]); 13 } 14 } 15 }
小结
今天的内容理论偏多代码偏少,因为关于数组我觉得以CLR的角度看,不需要写声明,增删查,二维多维数组这些概念,还有数组的排序和复制,如果把数组的一个一个方法拿出来介绍可能并没有多少必要性,而是分析一下数组在底层是一个怎样的分配,它和ArrayList还有List是什么关系,其实数组可以说是很多数据结构的基础。