泛函编程(30)-泛函IO:Free Monad-Monad生产线

在上节我们介绍了Trampoline。它主要是为了解决堆栈溢出(StackOverflow)错误而设计的。Trampoline类型是一种数据结构,它的设计思路是以heap换stack:对应传统递归算法运行时在堆栈上寄存程序状态,用Trampoline进行递归算法时程序状态是保存在Trampoline的数据结构里的。数据结构是在heap上的,所以可以实现以heap换stack的效果。这种以数据结构代替函数调用来解决问题的方式又为泛函编程提供了更广阔的发展空间。

我们知道,任何涉及IO的运算都会面临堆栈溢出问题。这是因为IO通常针对无法预计的数据量以及重复循环操作。所以IO算法设计也会采用与Trampoline一样的数据结构。或者我们应该沿用Trampoline数据结构和算法来设计IO组件库。如此思考那么我们就必须对Trampoline进行深度抽象了。Free Monad就是Trampline的延伸。在介绍Free Monad之前我们先从一个现实的例子来展开讨论:

假设我们要编写一个银行转账的函数,我们可能先把这个函数的款式(function signature)推导出来:

1 def transfer(amount: Double, from: Account, to: Account, user: User,
2   context: Authorization with Logger with ErrorHandler with Storage): Unit

首先我们在这里采用了参数注入(parameter injection)方式:在transfer函数输入参数中注入context object。这个context object里包括了身份验证、操作跟踪、错误处理、数据存取等等。这算是传统OOP编程模式吧。对于一个泛函编程人员来讲:通过这个context object 可以进行一系列的操作。包括IO操作,也就是说可以进行一些含有副作用(side effect)的操作。那么这个函数是无法实现函数组合(function composition)。transfer函数就不是一个泛函编程人员该使用的函数了。

也许我们应该从泛函编程角度来尝试设计这个函数:用泛函编程提倡的不可蜕变(immutability)方式来设计,也就是向函数调用方返回一些东西。

比如我们可以向函数调用方返回一个描述操作的程序:一串命令(instruction):

1 def transfer(amount: Double, from: Account, to: Account, user: User): List[Instruction]

这个版本肯定是个泛函版本了。不过假如Instruction类型包括了互动操作的话就不足够了。我们先看看简单的交互的数据类型:

1 trait Interact[A] //交互数据类型
2 //提问,等待返回String类型答案
3 case class Ask(prompt: String) extends Interact[String]
4 //告知,没有返回结果
5 case class Tell(msg: String) extends Interact[Unit]

如果我们按照上面的思路返回一串命令的话:

1  val prg = List(Ask("What‘s your first name?"),
2                  Ask("What‘s your last name?"),
3                  Tell("Hello ??? ???"))

这个程序prg是有缺陷的:无法实现交互。好像如果能把Ask指令存放到一个临时变量里就可以达到目的了。那么如果我们把这个prg改写成下面这样:

1 for {
2     x <- Ask("What‘s your first name?")
3     y <- Ask("What‘s your last name?")
4     _ <- Tell(s"Hello $y $x!")
5 } yield () 

这不就是Monad款式吗?原来解决方法就是把交互类型trait Interact[A]变成Monad就行了。

不过要把Interact变成Monad就必须实现unit和flatMap两个函数,检查Interact trait,明显这是不可能的。

那我们把下面的努力都应该放在如何转变成Monad这方面了。既然我们在本篇命题里提到Free Monad是Monad生产线。那么用Free Monad能不能把Interact变成Monad呢?

我们先看看这个Free Monad类型结构:

1 trait Free[F[_],A]
2 case class Return[F[_],A](a: A) extends Free[F,A]
3 case class Bind[F[_],I,A](a: F[I], f: I => Free[F,A]) extends Free[F,A]

这个Free结果跟Trampoline简直是太相似了。如果Free是个Monad,那么我们应该必须实现它的flatMap函数:

 1 trait Free[F[_],A] {
 2  def unit(a: A) = Return(a)
 3  def flatMap[B](f: A => Free[F,B]): Free[F,B] = this match {
 4        case Return(a) => f(a)
 5 //还记得Trampoline  FlatMap(FlatMap(b,g),f) == FlatMap(b, (x: Any) => FlatMap(g(x),f))
 6        case Bind(fa,g) => Bind(fa, (x: Any) => g(x) flatMap f)
 7 //下面采用了函数组合方式。具备同样功能
 8 //   case Bind(fa,g) => Bind(fa, g andThen (_ flatMap f))
 9  }
10  def map[B](f: A => B): Free[F,B] = flatMap(a => Return(f(a)))
11
12 }
13 case class Return[F[_],A](a: A) extends Free[F,A]
14 case class Bind[F[_],I,A](a: F[I], f: I => Free[F,A]) extends Free[F,A]

我们可以用下面的lift函数来把Interact[A]升格成Free[F,A] :

1 implicit def lift[F[_],A](fa: F[A]): Free[F,A] = Bind(fa, (a: A) => Return(a))
2                                                   //> lift: [F[_], A](fa: F[A])ch13.ex6.Free[F,A]

有了lift我们可以吧prg升格成Monad:

 1 trait Interact[A] //交互数据类型
 2 //提问,等待返回String类型答案
 3 case class Ask(prompt: String) extends Interact[String]
 4 //告知,没有返回结果
 5 case class Tell(msg: String) extends Interact[Unit]
 6
 7 implicit def lift[F[_],A](fa: F[A]): Free[F,A] = Bind(fa, (a: A) => Return(a))
 8                                                   //> lift: [F[_], A](fa: F[A])ch13.ex6.Free[F,A]
 9 for {
10     x <- Ask("What‘s your first name?")
11     y <- Ask("What‘s your last name?")
12     _ <- Tell(s"Hello $y $x!")
13 } yield ()                                        //> res0: ch13.ex6.Free[ch13.ex6.Interact,Unit] = Bind(Ask(What‘s your first nam
14                                                   //| e?),<function1>)

这是因为implicit scope里的类型转换使Interact升格为Free,而Free是个Monad,所以我们可以使用for-comprehension。

好了,这个程序描述完成后应该如何运算呢?Free Monad包括了两部分功能,相互之间无关联,可以分开单独考虑。这就是所谓的关注分离(separation of concern)。Free Monad的两项功能分别是Monad,和Interpreter(解译器)。我们用Monad描述程序算法,用Interpreter解译程序形成针对特定运行环境的可运行代码。

Free Monad的Interpreter实现了算法和运算的分离考虑。Interpreter程序运算是通过一个转换函数实现的。这个函数把F[_]这样一个算法解译成G[_]这样一个针对可运行环境的Monad运行代码。这种转换就是自然转换(Natural Transformation),它的函数款式如下:

1 trait ~>[F[_],G[_]] {
2     def apply[A](fa: F[A]): G[A]
3 }

很明显,这个构建函数(constructor)把传入的F[A]解译成G[A]。

现在Interpreter运行一段算法就是对算法F[_]中的表达式进行一对一的G[_]转换。就像对List结构中元素进行处理的方式一样,我们可以用折叠算法来实现F[_]结构中表达式的转换:

1 def foldMap[G[_]: Monad](f: F ~> G): G[A] = this match {
2           case Return(a) => Monad[G].unit(a)
3           case Bind(b,g) => Monad[G].flatMap(f(b))(a => g(a).foldMap(f))
4  }

我们看到,foldMap把Free Monad F[_]中的表达式与Monad G状态进行了对应。注意Bind状态是循环递归的。

现在我们可以试试最简单的解译:F,Id转换:

 1 ype Id[A] = A
 2 implicit val idMonad: Monad[Id] = new Monad[Id] {
 3     def unit[A](a: A) = a
 4     def flatMap[A,B](fa: A)(f: A => B): B = f(fa)
 5 }                                                 //> idMonad  : ch13.ex6.Monad[ch13.ex6.Id] = [email protected]
 6                                                   //| 530c12
 7 object Console extends (Interact ~> Id) {
 8     def apply[A](i: Interact[A]): A = i match {
 9         case Ask(prompt) => {
10           println(prompt)
11           readLine
12         }
13         case Tell(msg) => println(msg)
14     }
15 }

运算上面那段Interact程序:由于Id不产生任何效果,Interact到Id转换即是直接运算Interact表达式:

1 val prg = for {
2     x <- Ask("What‘s your first name?")
3     y <- Ask("What‘s your last name?")
4     _ <- Tell(s"Hello $y $x!")
5 } yield ()                                        //> prg  : ch13.ex6.Free[ch13.ex6.Interact,Unit] = Bind(Ask(What‘s your first n
6                                                   //| ame?),<function1>)
7
8 prg.foldMap(Console)

或者我们可以试试再复杂一点的解译:

 1 type Tester[A] = Map[String, String] => (List[String], A)
 2 implicit val testerMonad = new Monad[Tester] {
 3     def unit[A](a: A) = (_ => (List(),a))
 4     def flatMap[A,B](ta: Tester[A])(f: A => Tester[B]): Tester[B] = {
 5         m => {
 6             val (l1,a) = ta(m)
 7             val (l2,b) = f(a)(m)
 8             (l1 ++ l2,b)
 9         }
10     }
11 }                                                 //> testerMonad  : ch13.ex6.Monad[ch13.ex6.Tester]{def unit[A](a: A): Map[Strin
12                                                   //| g,String] => (List[Nothing], A)} = [email protected]
13                                                   //| 8
14 object TestConsole extends (Interact ~> Tester) {
15     def apply[A](i: Interact[A]): Tester[A] = i match {
16       case Ask(prompt) => m => (List(), m(prompt))
17       case Tell(msg) => _ => (List(msg),())
18     }
19 }

以上我们把运行Interact中的交互信息存入Map[String,String]结构中。在这里进行了Interact到一个函数Map=>(List,A)的转换。

1 val prg = for {
2     x <- Ask("What‘s your first name?")
3     y <- Ask("What‘s your last name?")
4     _ <- Tell(s"Hello $y $x!")
5 } yield ()                                        //> prg  : ch13.ex6.Free[ch13.ex6.Interact,Unit] = Bind(Ask(What‘s your first n
6                                                   //| ame?),<function1>)
7
8 prg.foldMap(TestConsole)

在上一节我们讨论了Trampoline。主要目的是解决泛函算法中不可避免的堆栈溢出问题。如果我们用Free Monad来解决IO问题的话,堆栈溢出问题也是无法避免的。我们应该考虑在Free Monad里使用Trampoline类型。这样我们才可以放心地用Free Monad来产生任何类型的Monad并在运算中以heap换stack解决堆栈溢出问题。

时间: 2024-12-14 07:33:54

泛函编程(30)-泛函IO:Free Monad-Monad生产线的相关文章

泛函编程(27)-泛函编程模式-Monad Transformer

经过了一段时间的学习,我们了解了一系列泛函数据类型.我们知道,在所有编程语言中,数据类型是支持软件编程的基础.同样,泛函数据类型Foldable,Monoid,Functor,Applicative,Traversable,Monad也是我们将来进入实际泛函编程的必需.在前面对这些数据类型的探讨中我们发现: 1.Monoid的主要用途是在进行折叠(Foldable)算法时对可折叠结构内元素进行函数施用(function application). 2.Functor可以对任何高阶数据类型F[_]

泛函编程(5)-数据结构(Functional Data Structures)

编程即是编制对数据进行运算的过程.特殊的运算必须用特定的数据结构来支持有效运算.如果没有数据结构的支持,我们就只能为每条数据申明一个内存地址了,然后使用这些地址来操作这些数据,也就是我们熟悉的申明变量再对变量进行读写这个过程了.试想想如果没有数据结构,那我们要申明多少个变量呢.所以说,数据结构是任何编程不可缺少的元素. 泛函编程使用泛函数据结构(Functional Data Structure)来支持泛函程序.泛函数据结构的特点是”不可变特性“(Immutability), 是泛函编程中函数组

泛函编程(32)-泛函IO:IO Monad

由于泛函编程非常重视函数组合(function composition),任何带有副作用(side effect)的函数都无法实现函数组合,所以必须把包含外界影响(effectful)副作用不纯代码(impure code)函数中的纯代码部分(pure code)抽离出来形成独立的另一个纯函数.我们通过代码抽离把不纯代码逐步抽离向外推并在程序里形成一个纯代码核心(pure core).这样我们就可以顺利地在这个纯代码核心中实现函数组合.IO Monad就是泛函编程处理副作用代码的一种手段.我们先

泛函编程(23)-泛函数据类型-Monad

简单来说:Monad就是泛函编程中最概括通用的数据模型(高阶数据类型).它不但涵盖了所有基础类型(primitive types)的泛函行为及操作,而且任何高阶类或者自定义类一旦具备Monad特性就可以与任何类型的Monad实例一样在泛函编程中共同提供一套通用的泛函编程方式.所以有人把泛函编程视作Monadic Programming也不为过之.那么,具体什么是Monad呢? 在前面我们讨论过Monoid,我们说过它是一个特殊的范畴(Category),所有数据类型的Monoid实例都共同拥有一

泛函编程(34)-泛函变量:处理状态转变-ST Monad

泛函编程的核心模式就是函数组合(compositionality).实现函数组合的必要条件之一就是参与组合的各方程序都必须是纯代码的(pure code).所谓纯代码就是程序中的所有表达式都必须是Referentially Transparent(RT,等量可替换的),它的意思是:在一段程序p中,所有的表达式e都可以用e的运算结果替代而不影响到p的运算结果,那么e就是RT等量可替换的,也就是说程序p是由纯代码组成的.但如果程序p中包含了一些变量,这些变量的状态就会影响到程序中e的运算结果,那么p

泛函编程(24)-泛函数据类型-Monad, monadic programming

在上一节我们介绍了Monad.我们知道Monad是一个高度概括的抽象模型.好像创造Monad的目的是为了抽取各种数据类型的共性组件函数汇集成一套组件库从而避免重复编码.这些能对什么是Monad提供一个明确的答案吗?我们先从上节设计的Monad组件库中的一些基本函数来加深一点对Monad的了解: 1 trait Monad[M[_]] extends Functor[M] { 2 def unit[A](a: A): M[A] 3 def flatMap[A,B](ma: M[A])(f: A =

泛函编程(25)-泛函数据类型-Monad-Applicative

上两期我们讨论了Monad.我们说Monad是个最有概括性(抽象性)的泛函数据类型,它可以覆盖绝大多数数据类型.任何数据类型只要能实现flatMap+unit这组Monad最基本组件函数就可以变成Monad实例,就可以使用Monad组件库像for-comprehension这样特殊的.Monad具备的泛函式数据结构内部的按序计算运行流程.针对不同的数据类型,flatMap+unit组件实现方式会有所不同,这是因为flatMap+unit代表着承载数据类型特别的计算行为.之前我们尝试了List,O

泛函编程(35)-泛函Stream IO:IO处理过程-IO Process

IO处理可以说是计算机技术的核心.不是吗?使用计算机的目的就是希望它对输入数据进行运算后向我们输出计算结果.所谓Stream IO简单来说就是对一串按序相同类型的输入数据进行处理后输出计算结果.输入数据源可能是一串键盘字符.鼠标位置坐标.文件字符行.数据库纪录等.如何实现泛函模式的Stream IO处理则是泛函编程不可或缺的技术. 首先,我们先看一段较熟悉的IO程序: 1 import java.io._ 2 def linesGt4k(fileName: String): IO[Boolean

泛函编程(38)-泛函Stream IO:IO Process in action

在前面的几节讨论里我们终于得出了一个概括又通用的IO Process类型Process[F[_],O].这个类型同时可以代表数据源(Source)和数据终端(Sink).在这节讨论里我们将针对Process[F,O]的特性通过一些应用实例来示范它的组合性(composibility)和由数据源到接收终端IO全过程的功能完整性. 我们已经在前面的讨论中对IO Process的各种函数组合进行了调研和尝试,现在我们先探讨一下数据源设计方案:为了实现资源使用的安全性和IO程序的可组合性,我们必须保证无