泛函编程(4)-深入Scala函数类

既然是泛函编程,多了解一下函数自然是免不了的了:

方法(Method)不等于函数(Function)

方法不是函数但可以转化成函数;可以手工转换或者由编译器(compiler)在适当的情况下自动转换。反向转换则不然;函数是无法转换到方法的。先看看下面的例子:

1 scala> def aMethod(x: Int): Int = x + 10
2 aMethod: (x: Int)Int
3
4 scala> val aFunction = (x: Int) => x + 10
5 aFunction: Int => Int = <function1>

aMethod 与 aFunction 在类型上是不同的。再看看下面:

1 scala> aFunction
2 res0: Int => Int = <function1>
3
4 scala> aMethod
5 <console>:9: error: missing arguments for method aMethod;
6 follow this method with `_‘ if you want to treat it as a partially applied function
7               aMethod

引用方法必须提供完整的参数清单,引用函数则无须。把方法转换成函数呢?在参数位置用 _ 来进行转换:

1 scala> val toFunction = aMethod _
2 toFunction: Int => Int = <function1>
3
4 scala> toFunction
5 res2: Int => Int = <function1>

aMethod转换成函数toFunctions后具备了函数的特性。

我们称函数为“头等类值”(first class value),可以当作高阶函数的参数或返回值。但方法不是“头等类值”,不能当作参数。那么怎么解释下面例子里的代码呢?

1 def main(args: Array[String]): Unit = {
2   println(formatResult("absolute value", -42, abs))
3   println(formatResult("factorial", 7, factorial))
4   println(formatResult("increment", 7, (x: Int) => x + 1))
5   println(formatResult("increment2", 7, (x) => x + 1))
6   println(formatResult("increment3", 7, x => x + 1))
7   println(formatResult("increment4", 7, _ + 1))
8   println(formatResult("increment5", 7, x => { val r = x + 1; r }))
9 }

在这里abs, factorial都是方法。传入高阶函数formatResult中能行吗?下面是运行后的结果:

1 The absolute value of -42 is 42
2 The factorial of 7 is 5040
3 The increment of 7 is 8
4 The increment2 of 7 is 8
5 The increment3 of 7 is 8
6 The increment4 of 7 is 8
7 The increment5 of 7 is 8

没出错呀。难道方法是可以当作传入参数的吗?实际上这段程序在编译的时候由编译器自动进行了转换。Scala的编译器能针对需要函数的地方把方法转换成函数。

函数就是普通的对象

下面是一个函数文本:

1 scala> (a: Int, b: Int) => a + b
2 res4: (Int, Int) => Int = <function2>

编译时编译器会把它转换成下面的代码:

1 val addThem = new Function2[Int, Int, Int] {
2   def apply(a: Int, b: Int) = a + b
3 }

这里Function2是Scala语言标准类对象,res4(1+2) ===>  addThem.apply(1,2)

多态函数

为了示范Scala的多态函数,我们先从下面的一个例子开始:从一个整数数组中找出第一个匹配数的位置:

 1  def findFirstInt(arr: Array[Int], target: Int): Int = {
 2       def loop(idx: Int): Int = idx match {
 3           case l if (l >= arr.length) => -1          //indicate not found
 4           case i if (arr(i) == target) => idx
 5           case _ => loop(idx + 1)
 6       }
 7       loop(0)
 8   }                                               //> findFirst: (arr: Array[Int], target: Int)Int
 9   findFirstInt(Array(2,4,3,9,0),3)                //> res53: Int = 2
10   findFirstInt(Array(2,4,3,9,0),7)                //> res54: Int = -1

从一个字串数组中找出第一个匹配字串的位置:

 1   def findFirstString(arr: Array[String], target: String): Int = {
 2       def loop(idx: Int): Int = idx match {
 3           case l if (l >= arr.length) => -1        //indicate not found
 4           case i if (arr(i) == target) => idx
 5           case _ => loop(idx + 1)
 6     }
 7       loop(0)
 8   }                                               //> findFirstString: (arr: Array[String], target: String)Int
 9   findFirstString(Array("Hello","My","World"),"My")
10                                                   //> res55: Int = 1
11   findFirstString(Array("Hello","My","World"),"Yours")
12                                                   //> res56: Int = -1

这个函数与上面整数数组例子有许多相似之处,或者说基本上是一致的。这样我们可以通过多态函数把共通点抽象出来:

 1 def findFirstA[A](arr: Array[A],target: A)(equ: (A,A) => Boolean): Int = {
 2         def loop(idx: Int): Int = idx match {
 3           case l if (l >= arr.length) => -1    //indicate not found
 4           case i if (equ(arr(i),target)) => idx
 5           case _ => loop(idx + 1)
 6     }
 7       loop(0)
 8
 9   }                                           //> findFirstA: [A](arr: Array[A], target: A)(equ: (A, A) => Boolean)Int
10   findFirstA[Int](Array(2,4,3,9,0),3)((x,y) => x == y)
11                                               //> res57: Int = 2
12   findFirstA[String](Array("Hello","My","World"),"My")((x,y) => x == y)
13                                               //> res58: Int = 1

findFirstA是个多态函数。A是一个类型变量。我们可以说findFirstA是个针对类型变量A的多态函数。注意我们在findFirstA增加了一个参数清单- (equ: (A,A) => Boolean)。这是因为我们还无法确定A的类型。那么我们必须提供A类型的对比函数。我们可以用findFirstA针对整数、字串进行操作。我们也可以对其它类型进行操作,只要我们能提供那种类型的比较函数。

泛函编程说的白点就是摆弄函数。把函数摆过来弄过去的就完成了编程的过程。从下面的例子可以一探端倪:

纯函数是可以部分作用(partially apply)的:对一个多入参函数可以分多次每次作用(apply)一个参数

1 def partialApply[A,B,C](a: A, f: (B,C) => C): B => C

通过函数partialApply可以把一个两个入参的函数f分分两次作用它的参数:引用partialApply是作用参数a,形成一个需要参数B的函数。

两个参数作用(apply)了其中一个,所以称为部分作用。该如何实现:

1   def partialApply[A,B,C](a: A, f: (A,B) => C): B => C = (b: B) => f(a,b)
2                                                   //> partialApply: [A, B, C](a: A, f: (A, B) => C)B => C

我们知道partialApply的结果是一个入参B返回C的函数。所以想办法从匹配类型款式上着手。可以直接用一个函数文本表达这个结果:给我一个B=b,我返回给你一个C=f(a,b);一个典型的lambda表达式。用一个实际的例子来示范:

1 def addTwoParams(a: Int, b: Int) = a + b        //> addTwoParams: (a: Int, b: Int)Int
2   addTwoParams(2,5)                               //> res59: Int = 7
3   val applyOnce = partialApply(2,addTwoParams)    //> applyOnce  : Int => Int = <function1>
4   applyOnce(5)                                    //> res60: Int = 7

addTwoParams是一个两个入参的函数,applyOnce是向addTwoParams作用了一个参数2后产生的函数,再用参数5再对applyOnce作用后结果等于7. = addTwoParams(2,5)。为什么费那么大的劲把函数变来变去呢?实际上这种函数变形在泛函编程中很普遍,是函数组合(Functional Composition)必须掌握的技巧。

函数变形在泛函编程中是常用的技巧。下面的Curry function就是把一个N个输入参数的函数变成一个参数的N次作用:

f(a,b,c,...n) = f(a)(b)(c)...(n) = a => b => c => ... => n

1 def curryTwo[A,B,C](f: (A,B) => C): A => (B => C) 

函数curryTwo把一个两个参数的函数转变成一个参数返回另一个同样是一个参数的函数。用函数文本实现curryTwo后再使用一下来示范(注意返回的类型款式):

1 def curryTwo[A,B,C](f: (A,B) => C): A => (B => C) = (a: A) => ((b: B) => f(a,b))
2                                                   //> curryTwo: [A, B, C](f: (A, B) => C)A => (B => C)
3   val curriedFunction = curry(addTwoParams)       //> curriedFunction  : Int => (Int => Int) = <function1>
4   val curryOnce = curriedFunction(2)              //> curryOnce  : Int => Int = <function1>
5   curryOnce(5)                                    //> res61: Int = 7

把addTwoParams转成curriedFunction Int=>(Int=>Int)。可以马上看到需要填写两次输入参数。我们遇到这种函数变形的问题时通常会用函数文本尝试匹配函数的结果类型款式(type signature)。

uncurry是curry的反向:把curry函数返还到多参数函数:a => b => c => ... => n  = f(a,b,c,...n)

1 def uncurry[A,B,C](f: A => B => C): (A,B) => C

结合上面的例子示范uncurry函数实现和使用:

1   def uncurry[A,B,C](f: A => B => C): (A,B) => C = (a: A, b: B) => (f(a))(b)
2                                                   //> uncurry: [A, B, C](f: A => (B => C))(A, B) => C
3   val uncurriedFunction = uncurry(curriedFunction)//> uncurriedFunction  : (Int, Int) => Int = <function2>
4   uncurriedFunction(2,5)                          //> res62: Int = 7

uncurriedFunction又变回去了。

最后,示范一个函数组合的例子:

1 def compose[A,B,C](f: B => C, g: A => B): A => C

compose是将f和g两个函数组合成另一个函数。看看下面实现和使用示范:

1 def compose[A,B,C](f: B => C, g: A => B): A => C = (a: A) => f(g(a))
2                                                   //> compose: [A, B, C](f: B => C, g: A => B)A => C
3   val fadd = (x: Int) => x + 2                    //> fadd  : Int => Int = <function1>
4   val fmul = (y: Int) => y * 5                    //> fmul  : Int => Int = <function1>
5   val mulThenAdd = compose(fadd,fmul)             //> mulThenAdd  : Int => Int = <function1>
6   mulThenAdd(2)                                   //> res63: Int = 12

把fadd,fmul组合起来形成了一个新的函数。mulThenAdd(2) = (2 * 5) + 2

如果再写的形象一点:

1   (fadd compose fmul)(2)                          //> res64: Int = 12
2   (fmul compose fadd)(2)                          //> res65: Int = 20

注意compose右边关联的(right hand associate):fadd compose fmul 中先运算fmul把结果输入fadd进行运算。设计另一个左边关联函数andThen:

1 def andThen[A,B,C](f: A => B, g: B => C): A => C = (a: A) => g(f(a))
2                                                   //> andThen: [A, B, C](f: A => B, g: B => C)A => C
3  (fadd andThen fmul)(2)                           //> res66: Int = 20

想想这里面的意义:fadd和fmul可能都是几千行代码的大函数,而我们能够很简洁地把它们连接起来,只需要把类型匹配起来就行了。

时间: 2024-12-12 04:18:41

泛函编程(4)-深入Scala函数类的相关文章

【编程题】编写String类的构造函数、拷贝构造函数、析构函数和赋值函数

[编程题]编写String类的构造函数.拷贝构造函数.析构函数和赋值函数 [题目]:请编写如下4个函数 1 class String 2 { 3 public: 4 String(const char *str = NULL);// 普通构造函数 5 String(const String &other); // 拷贝构造函数 6 ~ String(void); // 析构函数 7 String & operate =(const String &other);// 赋值函数 8

泛函编程(21)-泛函数据类型-Monoid

Monoid是数学范畴理论(category theory)中的一个特殊范畴(category).不过我并没有打算花时间从范畴理论的角度去介绍Monoid,而是希望从一个程序员的角度去分析Monoid以及它在泛函编程里的作用.从这个思路出发我们很自然得出Monoid就是一种数据类型,或者是一种在泛函编程过程中经常会遇到的数据类型:当我们针对List或者loop进行一个数值的积累操作时我们就会使用到Monoid.实际上Monoid就是List[A] => A的抽象模型.好了,我们就不要越描越黑了吧

泛函编程(9)-异常处理-Option

Option是一种新的数据类型.形象的来描述:Option就是一种特殊的List,都是把数据放在一个管子里:然后在管子内部对数据进行各种操作.所以Option的数据操作与List很相似.不同的是Option的管子内最多只能存放一个元素,在这个方面Option的数据操作就比List简单的多,因为使用者不必理会数据元素的位置.顺序.Option只有两种状态:包含一个任何类型的元素或者为空.或者这样讲:一个Option实例包含 0 或 1 个元素:None代表为空,Some(x)代表包含一个任意类型的

泛函编程(11)-延后计算-lazy evaluation

延后计算(lazy evaluation)是指将一个表达式的值计算向后拖延直到这个表达式真正被使用的时候.在讨论lazy-evaluation之前,先对泛函编程中比较特别的一个语言属性”计算时机“(strict-ness)做些介绍.strict-ness是指系统对一个表达式计算值的时间点模式:即时计算的(strict),或者延后计算的(non-strict or lazy).non-strict或者lazy的意思是在使用一个表达式时才对它进行计值.用个简单直观的例子说明吧: 1 def lazy

泛函编程(18)-泛函库设计-并行运算组件库

作为专业的编程人员,我们经常会因为工作需要建立一些工具库.所谓工具库就是针对工作上经常会遇到的一些共性问题预先编制的由一整套函数所组成的函数库.通常这些工具库的功能都是在特别定制的一些数据类型支持下由一系列函数围绕着这些数据类型进行运算而实现的.在泛函编程范畴内也不例外.但在泛函工具库里的函数则更重视函数的组合能力(functional composition):因而泛函的工具库一般称为组件库(combinator library),库内函数则被称之为组件(combinator).组件库的设计者

泛函编程(34)-泛函变量:处理状态转变-ST Monad

泛函编程的核心模式就是函数组合(compositionality).实现函数组合的必要条件之一就是参与组合的各方程序都必须是纯代码的(pure code).所谓纯代码就是程序中的所有表达式都必须是Referentially Transparent(RT,等量可替换的),它的意思是:在一段程序p中,所有的表达式e都可以用e的运算结果替代而不影响到p的运算结果,那么e就是RT等量可替换的,也就是说程序p是由纯代码组成的.但如果程序p中包含了一些变量,这些变量的状态就会影响到程序中e的运算结果,那么p

泛函编程(24)-泛函数据类型-Monad, monadic programming

在上一节我们介绍了Monad.我们知道Monad是一个高度概括的抽象模型.好像创造Monad的目的是为了抽取各种数据类型的共性组件函数汇集成一套组件库从而避免重复编码.这些能对什么是Monad提供一个明确的答案吗?我们先从上节设计的Monad组件库中的一些基本函数来加深一点对Monad的了解: 1 trait Monad[M[_]] extends Functor[M] { 2 def unit[A](a: A): M[A] 3 def flatMap[A,B](ma: M[A])(f: A =

泛函编程(17)-泛函状态-State In Action

对OOP编程人员来说,泛函状态State是一种全新的数据类型.我们在上节做了些介绍,在这节我们讨论一下State类型的应用:用一个具体的例子来示范如何使用State类型.以下是这个例子的具体描述: 模拟一个自动糖果贩售机逻辑:贩售机有两种操作方法:投入硬币和扭动出糖旋钮.贩售机可以处于锁定和放开两种状态.模拟运作跟踪贩售机内当前的糖果和硬币数量.贩售机的操作逻辑要求如下: 1.如果机内有糖的话,投入硬币贩售机从锁定状态进入放开状态 2.在放开状态下扭动旋钮贩售机放出一块糖果后自动进入锁定状态 3

泛函编程(6)-数据结构-List基础

List是一种最普通的泛函数据结构,比较直观,有良好的示范基础.List就像一个管子,里面可以装载一长条任何类型的东西.如需要对管子里的东西进行处理,则必须在管子内按直线顺序一个一个的来,这符合泛函编程的风格.与其它的泛函数据结构设计思路一样,设计List时先考虑List的两种状态:空或不为空两种类型.这两种类型可以用case class 来表现: 1 trait List[+A] {} 2 case class Cons[+A](head: A, tail: List[A]) extends