文档章节

C++ 协程与网络编程

江浸月
 江浸月
发布于 2012/12/31 17:32
字数 2163
阅读 11584
收藏 194

###协程 协程,即协作式程序,其思想是,一系列互相依赖的协程间依次使用CPU,每次只有一个协程工作,而其他协程处于休眠状态。协程可以在运行期间的某个点上暂停执行,并在恢复运行时从暂停的点上继续执行。 协程已经被证明是一种非常有用的程序组件,不仅被python、lua、ruby等脚本语言广泛采用,而且被新一代面向多核的编程语言如golang rust-lang等采用作为并发的基本单位。 协程可以被认为是一种用户空间线程,与传统的抢占式线程相比,有2个主要的优点:

  • 与线程不同,协程是自己主动让出CPU,并交付他期望的下一个协程运行,而不是在任何时候都有可能被系统调度打断。因此协程的使用更加清晰易懂,并且多数情况下不需要锁机制。
  • 与线程相比,协程的切换由程序控制,发生在用户空间而非内核空间,因此切换的代价非常的小。
  • 某种意义上,协程与线程的关系类似与线程与进程的关系,多个协程会在同一个线程的上下文之中运行。

###网络编程模型 我们首先来简单回顾一下一些常用的网络编程模型。网络编程模型可以大体的分为同步模型和异步模型两类。

  • 同步模型:

同步模型使用阻塞IO模式,在阻塞IO模式下调用read等IO函数时会阻塞线程直到IO完成或失败。 同步模型的典型代表是thread_per_connection模型,每当阻塞在主线程上的accept调用返回时则创建一个新的线程去服务于新的socket的读/写。这种模型的优点是程序逻辑简洁,符合人的思维;缺点是可伸缩性收到线程数的限制,当连接越来越多时,线程也越来越多,频繁的线程切换会严重拖累性能,同时不得不处理多线程同步的问题。

  • 异步模型:

异步模型一般使用非阻塞IO模式,并配合epoll/select/poll等多路复用机制。在非阻塞模式下调用read,如果没有数据可读则立即返回,并通知用户没有可读(EAGAIN/EWOULDBLOCK),而非阻塞当前线程。异步模型可以使一个线程同时服务于多个IO对象。 异步模型的典型代表是reactor模型。在reactor模型中,我们将所有要处理的IO事件注册到一个中心的IO多路复用器中(一般为epoll/select/poll),同时主线程阻塞在多路复用器上。一旦有IO事件到来或者就绪,多路复用器返回并将对应的IO事件分发到对应的处理器(即回调函数)中,最后处理器调用read/write函数来进行IO操作。

异步模型的特点是性能和可伸缩性比同步模型要好很多,但是其结构复杂,不易于编写和维护。在异步模型中,IO之前的代码(IO任务的提交者)和IO之后的处理代码(回调函数)是割裂开来的。

###协程与网络编程 协程的出现出现为克服同步模型和异步模型的缺点,并结合他们的优点提供了可能: 现在假设我们有3个协程A,B,C分别要进行数次IO操作。这3个协程运行在同一个调度器或者说线程的上下文中,并依次使用CPU。调度器在其内部维护了一个多路复用器(epoll/select/poll)。 协程A首先运行,当它执行到一个IO操作,但该IO操作并没有立即就绪时,A将该IO事件注册到调度器中,并主动放弃CPU。这时调度器将B切换到CPU上开始执行,同样,当它碰到一个IO操作的时候将IO事件注册到调度器中,并主动放弃CPU。调度器将C切换到cpu上开始执行。当所有协程都被“阻塞”后,调度器检查注册的IO事件是否发生或就绪。假设此时协程B注册的IO时间已经就绪,调度器将恢复B的执行,B将从上次放弃CPU的地方接着向下运行。A和C同理。 这样,对于每一个协程来说,它是同步的模型;但是对于整个应用程序来说,它是异步的模型。

好了,原理说完了,我们来看一个实际的例子,echo server。

###echo server

在这个例子中,我们将使用orchid库来编写一个echo server。orchid库是一个构建于boost基础上的 协程/网络IO C++库。

echo server首先必须要处理连接事件,我们创建一个协程来专门处理连接事件:

typedef boost::shared_ptr<orchid::socket> socket_ptr;
//处理ACCEPT事件的协程
void handle_accept(orchid::coroutine_handle co) {
    try {
        orchid::acceptor acceptor(co -> get_io_service());//构建一个acceptor
        acceptor.bind_and_listen("5678",true);
        for(;;) {
            socket_ptr sock(new orchid::socket(co -> get_scheduler().get_io_service()));
            acceptor.accept(*sock,co);

            //在调度器上创建一个协程来服务新的socket。
            //第一个参数是要创建的协程的main函数,
            //第二个参数是要创建的协程的栈的大小。
            co -> get_scheduler().spawn(boost::bind(handle_io,_1,sock),orchid::minimum_stack_size());
        }
    }
    catch(orchid::io_error& e) {
        ORCHID_ERROR("id %lu msg:%s",co->id(),e.what());
    }
}

在orchid中,协程的main函数必须满足函数签名void(orchid::coroutine_handle),如handle_accept所示,其中参数co是协程句柄,代表了当前函数所位于的协程。

在上面的代码中,我们创建了一个acceptor,并让它监听5678端口,然后在"阻塞"等待连接到来,当连接事件到来时,创建一个新的协程来服务新的socket。处理套接字IO的协程如下:

//处理SOCKET IO事件的协程
void handle_io(orchid::coroutine_handle co,socket_ptr sock) {
orchid::buffered_reader<orchid::socket> reader(*sock,co,16);//在socket上构建缓冲输入流
orchid::buffered_writer<orchid::socket> writer(*sock,co,16);//在socket上构建缓冲输出流

try {
    std::string line;
    std::size_t n = 0;

    for(;;) {
        n = reader.read_until(line,'\n');
        ORCHID_DEBUG("id %lu recv: %s",co->id(),line.c_str());
        writer.write(line.c_str(),line.size());
        writer.flush();
    }

} catch (const orchid::io_error& e) {
    if (e.code() == boost::asio::error::eof) {
        ORCHID_DEBUG("id %lu msg:%s",co->id(),"socket closed by remote side!");
    } else {
        ORCHID_ERROR("id %lu msg:%s",co->id(),e.what());
    }
}

IO处理协程首先在传入的套接字上创建了一个输入流和一个输出流,分别代表了TCP的输入和输出。然后不断地从输入流中读取一行,并输出到输出流当中。当socket上的TCP连接断开时,会抛出orchid::io_error的异常,循环结束,值得注意的是eof事件也被当成异常来抛出。对于不喜欢使用异常的用户,orchid提供了另外一套使用boost::system::error_code的接口。同时,对于熟悉asio的用户,orchid提供了一套boost asio风格的接口。

如果用户需要无缓冲的读写socket或者自建缓冲,可以直接调用orchid::socket的read和write函数,或者使用无缓冲的reader和writer。

细心的读者可能已经发现,handle_io的函数签名并不满足void(orchid::coroutine_handle),回到handle_accept中,可以发现,实际上我们使用了boost.bind对handle_io函数进行了适配,使之符合函数签名的要求。

最后是main函数:

int main() {
    orchid::scheduler sche;
    sche.spawn(handle_accept,orchid::coroutine::minimum_stack_size());//创建协程
    sche.run();
}

###总结 在上面这个echo server的例子中,我们采用了一种 coroutine per connection 的编程模型,与传统的 thread per connection 模型一样的简洁清晰,但是整个程序实际上运行在同一线程当中,所以我们也不需要处理多线程同步的问题。 由于协程的切换开销远远小于线程,因此我们可以轻易的同时启动上千协程来同时服务上千连接,这是 thread per connection的模型很难做到的;在性能方面,整个底层的IO系统实际上是使用boost.asio这种高性能的异步io库实现的。与IO所费的时间相比,协程切换的开销基本可以忽略。 因此通过orchid,我们可以在保持同步IO模型简洁性的同时,获得异步IO模型的高性能和扩展性。

最后,如果您对orchid感兴趣,欢迎关注和参与。

© 著作权归作者所有

共有 人打赏支持
江浸月

江浸月

粉丝 39
博文 9
码字总数 18652
作品 2
深圳
程序员
私信 提问
加载中

评论(15)

z
zcy421593
楼主这个封装有点重量级了
我也准备实现一个基于协程的网络库,是C风格的接口,现在还在早期开发阶段,有空可以交流下
https://github.com/zcy421593/co_socket
zmen
zmen
mark
a
amengren
mark
c
cc_osc
让我想到了 window 的 消息处理
蓝仇
yes
stonexin
stonexin
mark
付超_pku
付超_pku
mark~
LastRitter
LastRitter
mark
帝调
mark
starstroll
starstroll
mark
基于协程的网络编程库 - QtNetworkNg

QtNetworkNg 是一个基于协程的网络编程库。目标为 C++ 开发者提供简洁而不失强大的网络编程 API,成为 C++ 界最好的网络编程库。目前已经具备完善的协程管理功能、基本的 socket 编程和完善的...

hgoldfish
05/19
0
0
一个只有半年工作经验的开源爱好者的求职。

决定年后从国内前3的的互联网公司跳槽。虽然很多朋友,猎头,同事都劝我接着干下去,然后内部转岗之类的。但是我还是决定现在就开始着手准备,我相信好的机会是给有准备的人的。现在的我更倾向...

江浸月
2013/02/27
1K
8
跨平台网络通信与服务器框架 acl 3.2.0 发布

acl 3.2.0 版本发布了,acl 是 one advanced C/C++ library 的简称,主要包括网络通信库以及服务器框架库等功能,支持 Linux/Windows/Solaris/FreeBsd/MacOS 平台;整个 acl 项目主要包含三个...

郑树新
2016/08/27
1K
4
谈一点对 go 和 erlang 两门语言的体会

文章来自程序界 项目原因用到过ejabberd,所以接触过erlang,但比较肤浅,无论是理解还是使用。go最近也被炒得比较火,号称要是一门取代c++和java 的语言。所以,也就顺便买了一本许式伟大牛的...

oschina
2013/01/24
13.2K
40
acl.3.2.2 发布, 跨平台网络通信与服务器框架

acl 3.2.2 版本发布了,acl 是 one advanced C/C++ library 的简称,主要包括网络通信库以及服务器框架库等功能,支持 Linux/Windows/Solaris/FreeBsd/MacOS 平台;整个 acl 项目主要包含四个...

郑树新
2016/11/01
1K
2

没有更多内容

加载失败,请刷新页面

加载更多

大数据教程(9.6)map端join实现

上一篇文章讲了mapreduce配合实现join,本节博主将讲述在map端的join实现; 一、需求 实现两个“表”的join操作,其中一个表数据量小,一个表很大,这种场景在实际中非常常见,比如“订单日志...

em_aaron
15分钟前
0
0
关于《红楼梦》的读后感优秀范文2000字

关于《红楼梦》的读后感优秀范文2000字: (在写读《红楼梦》有感的路上遇到了博友“五音不全”师兄,使我感到汗颜,于是放弃了87版的电视剧,只读原著《红楼梦》和五音的评红作品,对原著才...

原创小博客
27分钟前
1
0
cookie与session详解

session与cookie是什么? session与cookie属于一种会话控制技术.常用在身份识别,登录验证,数据传输等.举个例子,就像我们去超市买东西结账的时候,我们要拿出我们的会员卡才会获取优惠.这时...

士兵7
29分钟前
1
0
十万个为什么之为什么大家都说dubbo

Dubbo是什么? 使用背景 dubbo为什么这么流行, 为什么大家都这么喜欢用dubbo; 通过了解分布式开发了解到, 为适应访问量暴增,业务拆分后, 子应用部署在多台服务器上,而多台服务器通过可以通过d...

尾生
今天
2
0
Docker搭建代码质量检测平台-SonarQube(中文版)

Sonar是一个用于代码质量管理的开源平台,用于管理源代码的质量,可以从七个维度检测代码质量。通过插件形式,可以支持包括java,C#,C/C++,PL/SQL,Cobol,JavaScrip,Groovy等等二十几种编程语言...

Jacktanger
今天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部