深入理解Ruby中的block概念

程序员文章站 2022-11-15 19:26:50

ruby 里的 block一般翻译成代码块，block 刚开始看上去有点奇怪，因为很多语言里面没有这样的东西。事实上它还不错。 first-class function...

ruby 里的 block一般翻译成代码块，block 刚开始看上去有点奇怪，因为很多语言里面没有这样的东西。事实上它还不错。
first-class function and higher-order function

first-class function 和 higher-order function 是函数式编程语言里面的概念，听起来好像很高端的样子，其实很很简单的。

first-class functions 是指在某些语言里，函数是一等公民，可以把函数当做参数传递，
可以返回一个函数，可以把函数赋值个一个变量等等，反正就是正常值能做的事函数都能做。javascript 就是这样的。举个例子(下面的所有例子里，当我提到
javascript 时，示例代码都用的 coffeescript)：

greet = (name) ->
 return -> console.log "hello, #{name}"

greettomike = greet("mike")
greettomike() # => 输出 "hello, mike"
a = greettomike
a() # => 输出 "hello, mike"

在上面的第四行里，greet("mike") 返回了一个函数，所以第五行里才可以调用 greettomike()输出"hello, mike"。第六行把一个函数赋值给了a，所以第七行就可以调用这个函数了。

higher-order function 一般翻译成高阶函数，是指接受函数做参数或者返回函数的函数。
举个非常常用的例子（用 javascript）：

a = [ "a", "b", "c", "d" ]
a.map((x) -> x + '!') #=> ["a!", "b!", "c!", "d!"]

上面例子里 map 就接受了一个匿名函数作为参数。array.prototype里的很多方法，比如reduce, filter,every, some 等等都是高阶函数，因为他们都接受函数作为参数。

高阶函数非常强大，表达力很强，可以避免大量重复代码。总的来说，它就是个好东西。
block 的本质

先来看一组 ruby 和 coffeescript 代码的对比。

a = [ "a", "b", "c", "d" ]
a.map { |x| x + "!" } # => ["a!", "b!", "c!", "d!"]
a.reduce { |acc, x| acc + x} # => "abcd"

a = [ "a", "b", "c", "d" ]
a.map((x) -> x + '!') # => ["a!", "b!", "c!", "d!"]
a.reduce((acc, x) -> acc + x) # => "abcd"

这两组代码真的看起来超级像。我觉得这也暴露了 ruby 的 block 的本质：高阶函数的函数参数的变体。

javascript 里面的map 函数接受一个函数作为参数，但是 ruby 里的 map 却接受一个
block 作为参数。

其实 matz 早在一本书里《*的程序世界》里说了：

复制代码代码如下:

    最终来看，块到底是什么？

    ...

    块也可以看作只是高阶函数的一种特殊形式的语法。

    ...

    高阶函数和块的本质一样

    ...

在 ruby 里，函数不是一等公民，没有 first-class functions。但是在 ruby
里怎样使用高阶函数呢？答案就是使用 block。可以直接用 block，也可以用 lambda
或者 proc 把 block 转换成 proc 类的实例用。

我发现在 ruby 里使用 block 时，几乎所有的情况下都可以用 javascript
的高阶函数替代。

enumerable 模块里的所有方法都是典型的例子。事实上确实存在 javascript 版
的 enumerable，比如 prototype.js 就有个 enumerable，用起来跟 ruby版的几乎一样的。当然它是通过高阶函数实现的。
与高阶函数有何不同

除了语法上看上去有点不同外，有非常重要的两点。
控制流操作

在 block 里面可以用 break, next 等等这些在一般的循环里才有的控制流操作，这些
在高阶函数里是用不了的。比如你可以试试在 javascript 里用 foreach 而不用循环
实现个take_while 函数，真是相当别扭的。比如之前 cnode 上就有人发帖问：nodejs的foreach不支持break吗?，其实这个帖子下面回复用 return 的基本上都是错的，
some 和 every 这样利用短路求值的特点确实可以 hack 一下，但是明显不自然而且大大增加了别人理解代码的难度。

从这一点来看 block 确实还不错的。
只有一个函数参数的高阶函数

ruby 里一个方法只能接受一个 block 作为参数，大概就是类似于只有一个函数参数的高阶
函数。看起来好像是受到限制了。其实那本《*的程序世界》对此也有点解释。
大概是说了一个调查，在倾向于使用高阶函数的 ocaml 的标准库中，94%
的高阶函数只有一个函数参数。所以说这点限制不是什么问题。就我自己的体验来说，在 javascript 里，还从没用到需要两个函数参数的高阶函数。
未说明的

嗯，这篇文章看起来有点太长了，所以我不打算写下去了。其实还有一些重要的地方没说。比如
block 其实可以作为闭包用的。ruby 里用def定义方法时有点悲剧的，因为它不是闭包，接触
不到它外面的变量。

name = "mike"
def greet
 puts "hello, #{name}"
end
hello # => in `greet': undefined local variable or method `name' for main:object (nameerror)

但是用 block 就可以了

name = "mike"
define_method(:greet) do
 puts "hello, #{name}"
end
greet # => "hello, mike"

用 javascript 就根本不存在问题。

name = "mike"
greet = -> console.log "hello, #{name}"
greet() # => "hello, mike"

同理还有class 和 module 关键字都会创建新的作用域而在里面接触不到外面的变量，
也可以用 block 解决。

还有那个 proc 和 lambda 的区别。其实我一直不理解为什么会有人不用lambda
而跑去用 proc，明显 proc 的 return 行为太不符合常识了。但是到头来却发现
block 的行为跟 proc 创建的对象的行为是一样的，比如

def hello
 (1..10).each { |e| return e}
 return "hello"
end
hello # => 1

这感觉真是有点悲催。
结语

说了这么多，就是因为在 ruby 里面函数不是一等公民，又想获得函数式编程的便利。

上一篇： RVM安装和使用总结笔记

下一篇：在Ruby on Rails中优化ActiveRecord的方法

深入理解Ruby中的block概念

深入理解MyBatis中的一级缓存与二级缓存

Android 中ThreadLocal的深入理解

深入理解vue中的slot与slot-scope

深入理解C#中foreach遍历的使用方法

深入理解Java编程中异常处理的优劣

深入理解Spring中的Lookup(方法注入)

深入理解Spring中的循环依赖

深入理解Objective-C中类的数据结构

深入理解Python中命名空间的查找规则LEGB

深入理解Javascript中的valueOf与toString