Scala学习（1）——Scala基础知识

本文要解决的问题：

Spark主要是由Scala语言编写而成的，所以要真正深入了解Spark，必须要熟悉Scala，在此结合阅读《Scala编程》这本书的情况，对Scala语言做一个基本的总结。

Scala的优势

（1）简洁

类型推断
函数创建的文法支持

（2）Java互操作性

可重用Java库
可重用Java工具
没有性能惩罚

Scala工作机制

编译成Java字节码
可在任何标准JVM上运行，甚至是一些不规范的JVM上
Scala编译器是Java编译器的作者写的

启动解释器

输入Scala，启动解释器。

C:\Users\shenbinqiang\scala
Welcome to Scala version 2.8.0.final (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_7).
Type in expressions to have them evaluated.
Type :help for more information.

scala>

表达式

scala> 1 + 1
res0: Int = 2

res0是解释器自动创建的变量名称，用来指代表达式的计算结果。它是Int类型，值为2。

Scala中（几乎）一切都是表达式。

值

你可以给一个表达式的结果起个名字赋成一个不变量（val）。

scala> val two = 1 + 1
two: Int = 2

你不能改变这个不变量的值.

变量

如果你需要修改这个名称和结果的绑定，可以选择使用var。

scala> var name = "steve"
name: java.lang.String = steve

scala> name = "marius"
name: java.lang.String = marius

还有一种val相当于Java里的final类型。

函数

你可以使用def创建函数.

scala> def addOne(m: Int): Int = m + 1
addOne: (m: Int)Int

在Scala中，你需要为函数参数指定类型签名。

scala> val three = addOne(2)
three: Int = 3

如果函数不带参数，你可以不写括号。

scala> def three() = 1 + 2
three: ()Int

scala> three()
res2: Int = 3

scala> three
res3: Int = 3

匿名函数

你可以创建匿名函数。

scala> (x: Int) => x + 1
res2: (Int) => Int = <function1>

这个函数为名为x的Int变量加1。

scala> res2(1)
res3: Int = 2

你可以传递匿名函数，或将其保存成不变量。

scala> val addOne = (x: Int) => x + 1
addOne: (Int) => Int = <function1>

scala> addOne(1)
res4: Int = 2

如果你的函数有很多表达式，可以使用{}来格式化代码，使之易读。

def timesTwo(i: Int): Int = {
  println("hello world")
  i * 2
}

对匿名函数也是这样的。

scala> { i: Int =>
  println("hello world")
  i * 2
}
res0: (Int) => Int = <function1>

在将一个匿名函数作为参数进行传递时，这个语法会经常被用到。

部分应用（Partial application）

你可以使用下划线“”部分应用一个函数，结果将得到另一个函数。Scala使用下划线表示不同上下文中的不同事物，你通常可以把它看作是一个没有命名的神奇通配符。在{ + 2 }的上下文中，它代表一个匿名参数。你可以这样使用它：

scala> def adder(m: Int, n: Int) = m + n
adder: (m: Int,n: Int)Int
scala> val add2 = adder(2, _:Int)
add2: (Int) => Int = <function1>

scala> add2(3)
res50: Int = 5

你可以部分应用参数列表中的任意参数，而不仅仅是最后一个。

柯里化函数

有时会有这样的需求：允许别人一会在你的函数上应用一些参数，然后又应用另外的一些参数。

例如一个乘法函数，在一个场景需要选择乘数，而另一个场景需要选择被乘数。

scala> def multiply(m: Int)(n: Int): Int = m * n
multiply: (m: Int)(n: Int)Int

你可以直接传入两个参数。

scala> multiply(2)(3)
res0: Int = 6

你可以填上第一个参数并且部分应用第二个参数。

scala> val timesTwo = multiply(2) _
timesTwo: (Int) => Int = <function1>

scala> timesTwo(3)
res1: Int = 6

你可以对任何多参数函数执行柯里化。例如之前的adder函数

scala> (adder _).curried
res1: (Int) => (Int) => Int = <function1>

可变长度参数

这是一个特殊的语法，可以向方法传入任意多个同类型的参数。例如要在多个字符串上执行String的capitalize函数，可以这样写：

def capitalizeAll(args: String*) = {
  args.map { arg =>
    arg.capitalize
  }
}

scala> capitalizeAll("rarity", "applejack")
res2: Seq[String] = ArrayBuffer(Rarity, Applejack)

类

scala> class Calculator {
     |   val brand: String = "HP"
     |   def add(m: Int, n: Int): Int = m + n
     | }
defined class Calculator

scala> val calc = new Calculator
calc: Calculator = Calculator@e75a11

scala> calc.add(1, 2)
res1: Int = 3

scala> calc.brand
res2: String = "HP"

上面的例子展示了如何在类中用def定义方法和用val定义字段值。方法就是可以访问类的状态的函数。

构造函数

构造函数不是特殊的方法，他们是除了类的方法定义之外的代码。让我们扩展计算器的例子，增加一个构造函数参数，并用它来初始化内部状态。

class Calculator(brand: String) {
  /**
   * A constructor.
   */
  val color: String = if (brand == "TI") {
    "blue"
  } else if (brand == "HP") {
    "black"
  } else {
    "white"
  }

  // An instance method.
  def add(m: Int, n: Int): Int = m + n
}

注意两种不同风格的注释。

你可以使用构造函数来构造一个实例：

scala> val calc = new Calculator("HP")
calc: Calculator = Calculator@1e64cc4d

scala> calc.color
res0: String = black

表达式

上文的Calculator例子说明了Scala是如何面向表达式的。颜色的值就是绑定在一个if/else表达式上的。Scala是高度面向表达式的：大多数东西都是表达式而非指令。

函数 vs 方法

函数和方法在很大程度上是可以互换的。由于函数和方法是如此的相似，你可能都不知道你调用的东西是一个函数还是一个方法。而当真正碰到的方法和函数之间的差异的时候，你可能会感到困惑。

scala> class C {
     |   var acc = 0
     |   def minc = { acc += 1 }  //方法
     |   val finc = { () => acc += 1 }  //函数
     | }
defined class C

scala> val c = new C
c: C = [email protected]1af1bd6

scala> c.minc // calls c.minc()

scala> c.finc // returns the function as a value:
res2: () => Unit = <function0>

当你可以调用一个不带括号的“函数”，但是对另一个却必须加上括号的时候，你可能会想哎呀，我还以为自己知道Scala是怎么工作的呢。也许他们有时需要括号？你可能以为自己用的是函数，但实际使用的是方法。

在实践中，即使不理解方法和函数上的区别，你也可以用Scala做伟大的事情。

以下是几点总结：

1.方法不能作为单独的表达式而存在（参数为空的方法除外），而函数可以。
2.函数必须要有参数列表，而方法可以没有参数列表
3.方法名是方法调用的，而函数名只是代表函数对象本身
4.在需要函数的地方，如果传递一个方法，会自动进行ETA展开（把方法转换为函数）
5.传名参数本质上是个方法

继承

class ScientificCalculator(brand: String) extends Calculator(brand) {
  def log(m: Double, base: Double) = math.log(m) / math.log(base)
}

参考《Programming in Scala》指出如果子类与父类实际上没有区别，类型别名是优于继承的。A Tour of Scala 详细介绍了子类化。

重载方法

class EvenMoreScientificCalculator(brand: String) extends ScientificCalculator(brand) {
  def log(m: Int): Double = log(m, math.exp(1))
}

抽象类

你可以定义一个抽象类，它定义了一些方法但没有实现它们。取而代之是由扩展抽象类的子类定义这些方法。你不能创建抽象类的实例。

scala> abstract class Shape {
     |   def getArea():Int    // subclass should define this
     | }
defined class Shape

scala> class Circle(r: Int) extends Shape {
     |   def getArea():Int = { r * r * 3 }
     | }
defined class Circle

scala> val s = new Shape
<console>:8: error: class Shape is abstract; cannot be instantiated
       val s = new Shape
               ^

scala> val c = new Circle(2)
c: Circle = [email protected]65c0035b

特质（Traits）

特质是一些字段和行为的集合，可以扩展或混入（mixin）你的类中。

trait Car {
  val brand: String
}

trait Shiny {
  val shineRefraction: Int
}
class BMW extends Car {
  val brand = "BMW"
}

通过with关键字，一个类可以扩展多个特质：

class BMW extends Car with Shiny {
  val brand = "BMW"
  val shineRefraction = 12
}

什么时候应该使用特质而不是抽象类？如果你想定义一个类似接口的类型，你可能会在特质和抽象类之间难以取舍。这两种形式都可以让你定义一个类型的一些行为，并要求继承者定义一些其他行为。一些经验法则：

优先使用特质。一个类扩展多个特质是很方便的，但却只能扩展一个抽象类。

如果你需要构造函数参数，使用抽象类。因为抽象类可以定义带参数的构造函数，而特质不行。例如，你不能说trait t(i: Int) {}，参数i是非法的。

你不是问这个问题的第一人。可以查看更全面的答案： stackoverflow: Scala特质 vs 抽象类 , 抽象类和特质的区别, and Scala编程: 用特质，还是不用特质？

类型

此前，我们定义了一个函数的参数为Int，表示输入是一个数字类型。其实函数也可以是泛型的，来适用于所有类型。当这种情况发生时，你会看到用方括号语法引入的类型参数。下面的例子展示了一个使用泛型键和值的缓存。

trait Cache[K, V] {
  def get(key: K): V
  def put(key: K, value: V)
  def delete(key: K)
}

方法也可以引入类型参数。

def remove[K](key: K)

至此，基础知识部分已经过了一大半了，后续会继续总结。

时间： 2024-12-25 03:19:40

Scala学习（1）——Scala基础知识

本文要解决的问题：

Scala的优势

（1）简洁

（2）Java互操作性

Scala工作机制

启动解释器

表达式

值

变量

函数

匿名函数

部分应用（Partial application）

柯里化函数

可变长度参数

类

构造函数

表达式

函数 vs 方法

继承

重载方法

抽象类

特质（Traits）

类型

Scala学习（1）——Scala基础知识的相关文章

Scala学习笔记--正则表达式基础知识、如何在scala内使用

Scala学习:第一张基础 - 心得

C#学习笔记（基础知识回顾）之值类型与引用类型转换（装箱和拆箱）

[Golong]学习笔记(一) 基础知识

如何学习FPGA？FPGA学习必备的基础知识

Scala学习(一)--Scala基础学习

[算法学习笔记]算法基础知识

《汇编语言》学习笔记1——基础知识

性能测试学习09_分析基础知识

Scala学习之路----基础入门