写在最前面
相信大家都听说过 协程 这个概念吧。
但是有些同学对这个概念似懂非懂,不知道怎么实现,怎么用,用在哪,甚至有些人认为 yield 就是协程!
我始终相信,如果你无法准确地表达出一个知识点的话,我可以认为你就是不懂。
如果你之前了解过利用PHP实现协程的话,你肯定看过鸟哥的那篇文章:在PHP中使用协程实现多任务调度| 风雪之隅
鸟哥这篇文章是从国外的作者翻译来的,翻译的简洁明了,也给出了具体的例子了。
我写这篇文章的目的,是想对鸟哥文章做更加充足的补充,毕竟有部分同学的基础还是不够好,看得也是云头雾里的。
什么是协程
先搞清楚,什么是协程。
你可能已经听过『进程』和『线程』这两个概念。
进程就是二进制可执行文件在计算机内存里的一个运行实例,就好比你的.exe文件是个类,进程就是new出来的那个实例。
进程是计算机系统进行资源分配和调度的基本单位(调度单位这里别纠结线程进程的),每个CPU下同一时刻只能处理一个进程。
所谓的并行,只不过是看起来并行,CPU事实上在用很快的速度切换不同的进程。
进程的切换需要进行系统调用,CPU要保存当前进程的各个信息,同时还会使CPUCache被废掉。
所以进程切换不到非不得已就不做。
那么怎么实现『进程切换不到非不得已就不做』呢?
首先进程被切换的条件是:进程执行完毕、分配给进程的CPU时间片结束,系统发生中断需要处理,或者进程等待必要的资源(进程阻塞)等。你想下,前面几种情况自然没有什么话可说,但是如果是在阻塞等待,是不是就浪费了。
其实阻塞的话我们的程序还有其他可执行的地方可以执行,不一定要傻傻的等!
所以就有了线程。
线程简单理解就是一个『微进程』,专门跑一个函数(逻辑流)。
所以我们就可以在编写程序的过程中将可以同时运行的函数用线程来体现了。
线程有两种类型,一种是由内核来管理和调度。
我们说,只要涉及需要内核参与管理调度的,代价都是很大的。这种线程其实也就解决了当一个进程中,某个正在执行的线程遇到阻塞,我们可以调度另外一个可运行的线程来跑,但是还是在同一个进程里,所以没有了进程切换。
还有另外一种线程,他的调度是由程序员自己写程序来管理的,对内核来说不可见。这种线程叫做 用户空间线程。
协程可以理解就是一种用户空间线程。
协程,有几个特点:
- 协同,因为是由程序员自己写的调度策略,其通过协作而不是抢占来进行切换
- 在用户态完成创建,切换和销毁
- ⚠️ 从编程角度上看,协程的思想本质上就是控制流的主动让出(yield)和恢复(resume)机制
- generator经常用来实现协程
说到这里,你应该明白协程的基本概念了吧?
PHP实现协程
一步一步来,从解释概念说起!
可迭代对象
PHP5提供了一种定义对象的方法使其可以通过单元列表来遍历,例如用foreach
语句。
你如果要实现一个可迭代对象,你就要实现Iterator
接口:
|
|
生成器
可以说之前为了拥有一个能够被foreach
遍历的对象,你不得不去实现一堆的方法,yield
关键字就是为了简化这个过程。
生成器提供了一种更容易的方法来实现简单的对象迭代,相比较定义类实现Iterator
接口的方式,性能开销和复杂性大大降低。
|
|
记住,一个函数中如果用了yield
,他就是一个生成器,直接调用他是没有用的,不能等同于一个函数那样去执行!
所以,yield
就是yield
,下次谁再说yield
是协程,我肯定把你xxxx。
PHP协程
前面介绍协程的时候说了,协程需要程序员自己去编写调度机制,下面我们来看这个机制怎么写。
0)生成器正确使用
既然生成器不能像函数一样直接调用,那么怎么才能调用呢?
方法如下:
- foreach他
- send($value)
- current / next…
1)Task实现
Task就是一个任务的抽象,刚刚我们说了协程就是用户空间线程,线程可以理解就是跑一个函数。
所以Task的构造函数中就是接收一个闭包函数,我们命名为coroutine
。
|
|
2)Scheduler实现
接下来就是Scheduler
这个重点核心部分,他扮演着调度员的角色。
|
|
这样我们基本就实现了一个协程调度器。
你可以使用下面的代码来测试:
|
|
关键说下在哪里能用得到PHP协程。
|
|
这样就提高了程序的执行效率。
关于『系统调用』的实现,鸟哥已经讲得很明白,我这里不再说明。
3)协程堆栈
鸟哥文中还有一个协程堆栈的例子。
我们上面说过了,如果在函数中使用了yield
,就不能当做函数使用。
所以你在一个协程函数中嵌套另外一个协程函数:
|
|
这里的echoTimes
是执行不了的!所以就需要协程堆栈。
不过没关系,我们改一改我们刚刚的代码。
把Task
中的初始化方法改下,因为我们在运行一个Task的时候,我们要分析出他包含了哪些子协程,然后将子协程用一个堆栈保存。(C语言学的好的同学自然能理解这里,不理解的同学我建议去了解下进程的内存模型是怎么处理函数调用)
|
|
当Task->run()
的时候,一个循环来分析:
然后我们增加echoTime
的结束标示:
然后修改echoTimes
:
|
|
Task
变为:
|
|
这样就实现了一个协程堆栈,现在你可以举一反三了。
4)PHP7中yield from关键字
PHP7中增加了yield from
,所以我们不需要自己实现携程堆栈,真是太好了。
把Task
的构造函数改回去:
|
|
echoTimes
函数:
task1
生成器:
|
|
这样,轻松调用子协程。
总结
这下应该明白怎么实现PHP协程了吧?
议不要使用PHP的Yield来实现协程,推荐使用swoole,2.0已经支持了协程,并附带了部分案例