欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

并发编程之Disruptor并发框架

程序员文章站 2023-11-08 16:14:34
一、什么是Disruptor Martin Fowler在自己网站上写了一篇LMAX架构的文章,在文章中他介绍了LMAX是一种新型零售金融交易平台,它能够以很低的延迟产生大量交易。这个系统是建立在JVM平台上,其核心是一个业务逻辑处理器,它能够在一个线程里每秒处理6百万订单。业务逻辑处理器完全是运行 ......

一、什么是disruptor

martin fowler在自己网站上写了一篇lmax架构的文章,在文章中他介绍了lmax是一种新型零售金融交易平台,它能够以很低的延迟产生大量交易。这个系统是建立在jvm平台上,其核心是一个业务逻辑处理器,它能够在一个线程里每秒处理6百万订单。业务逻辑处理器完全是运行在内存中,使`用事件源驱动方式。业务逻辑处理器的核心是disruptor。

disruptor它是一个开源的并发框架,并获得2011 duke’s 程序框架创新奖,能够在无锁的情况下实现网络的queue并发操作。

disruptor是一个高性能的异步处理框架,或者可以认为是最快的消息框架(轻量的jms),也可以认为是一个观察者模式的实现,或者事件监听模式的实现。

在使用之前,首先说明disruptor主要功能加以说明,你可以理解为他是一种高效的"生产者-消费者"模型。也就性能远远高于传统的blockingqueue容器。

在jdk的多线程与并发库一文中, 提到了blockingqueue实现了生产者-消费者模型
blockingqueue是基于锁实现的, 而锁的效率通常较低. 有没有使用cas机制实现的生产者-消费者

disruptor使用观察者模式, 主动将消息发送给消费者, 而不是等消费者从队列中取; 在无锁的情况下, 实现queue(环形, ringbuffer)的并发操作, 性能远高于blockingqueue

二、disruptor的设计方案

disruptor通过以下设计来解决队列速度慢的问题:

  • 环形数组结构:
    为了避免垃圾回收,采用数组而非链表。同时,数组对处理器的缓存机制更加友好。
  • 元素位置定位:
    数组长度2^n,通过位运算,加快定位的速度。下标采取递增的形式。不用担心index溢出的问题。index是long类型,即使100万qps的处理速度,也需要30万年才能用完。
  • 无锁设计:
    每个生产者或者消费者线程,会先申请可以操作的元素在数组中的位置,申请到之后,直接在该位置写入或者读取数据。

三、disruptor实现生产与消费

1、pom maven依赖信息

    <dependencies>
        <dependency>
            <groupid>com.lmax</groupid>
            <artifactid>disruptor</artifactid>
            <version>3.2.1</version>
        </dependency>
    </dependencies>

2、首先声明一个event来包含需要传递的数据:

//定义事件event  通过disruptor 进行交换的数据类型。
public class longevent {

    private long value;

    public long getvalue() {
        return value;
    }

    public void setvalue(long value) {
        this.value = value;
    }

}

3、需要让disruptor为我们创建事件,我们同时还声明了一个eventfactory来实例化event对象。

public class longeventfactory implements eventfactory<longevent> {

    public longevent newinstance() {

        return new longevent();
    }

}

4、事件消费者,也就是一个事件处理器。这个事件处理器简单地把事件中存储的数据打印到终端:

public class longeventhandler implements eventhandler<longevent>  {

    public void onevent(longevent event, long sequence, boolean endofbatch) throws exception {
         system.out.println("消费者:"+event.getvalue());
    }

}

5、定义生产者发送事件

public class longeventproducer {

    public final ringbuffer<longevent> ringbuffer;

    public longeventproducer(ringbuffer<longevent> ringbuffer) {
        this.ringbuffer = ringbuffer;
    }

    public void ondata(bytebuffer bytebuffer) {
        // 1.ringbuffer 事件队列 下一个槽
        long sequence = ringbuffer.next();
        long data = null;
        try {
            //2.取出空的事件队列
            longevent longevent = ringbuffer.get(sequence);
            data = bytebuffer.getlong(0);
            //3.获取事件队列传递的数据
            longevent.setvalue(data);
            try {
                thread.sleep(10);
            } catch (interruptedexception e) {
                // todo auto-generated catch block
                e.printstacktrace();
            }
        } finally {
            system.out.println("生产这准备发送数据");
            //4.发布事件
            ringbuffer.publish(sequence);

        }
    }

}

6、main函数执行调用

public class disruptormain {

    public static void main(string[] args) {
        // 1.创建一个可缓存的线程 提供线程来出发consumer 的事件处理
        executorservice executor = executors.newcachedthreadpool();
        // 2.创建工厂
        eventfactory<longevent> eventfactory = new longeventfactory();
        // 3.创建ringbuffer 大小
        int ringbuffersize = 1024 * 1024; // ringbuffersize大小一定要是2的n次方
        // 4.创建disruptor
        disruptor<longevent> disruptor = new disruptor<longevent>(eventfactory, ringbuffersize, executor,
                producertype.single, new yieldingwaitstrategy());
        // 5.连接消费端方法
        disruptor.handleeventswith(new longeventhandler());
        // 6.启动
        disruptor.start();
        // 7.创建ringbuffer容器
        ringbuffer<longevent> ringbuffer = disruptor.getringbuffer();
        // 8.创建生产者
        longeventproducer producer = new longeventproducer(ringbuffer);
        // 9.指定缓冲区大小
        bytebuffer bytebuffer = bytebuffer.allocate(8);
        for (int i = 1; i <= 100; i++) {
            bytebuffer.putlong(0, i);
            producer.ondata(bytebuffer);
        }
        //10.关闭disruptor和executor
        disruptor.shutdown();
        executor.shutdown();
    }

}

四、什么是ringbuffer

它是一个环(首尾相接的环),你可以把它用做在不同上下文(线程)间传递数据的buffer。

并发编程之Disruptor并发框架

基本来说,ringbuffer拥有一个序号,这个序号指向数组中下一个可用的元素。(校对注:如下图右边的图片表示序号,这个序号指向数组的索引4的位置。)

并发编程之Disruptor并发框架

随着你不停地填充这个buffer(可能也会有相应的读取),这个序号会一直增长,直到绕过这个环。

并发编程之Disruptor并发框架

要找到数组中当前序号指向的元素,可以通过mod操作:
以上面的ringbuffer为例(java的mod语法):12 % 10 = 2。很简单吧。 事实上,上图中的ringbuffer只有10个槽完全是个意外。如果槽的个数是2的n次方更有利于基于二进制

优点

之所以ringbuffer采用这种数据结构,是因为它在可靠消息传递方面有很好的性能。这就够了,不过它还有一些其他的优点。

首先,因为它是数组,所以要比链表快,而且有一个容易预测的访问模式。(译者注:数组内元素的内存地址的连续性存储的)。这是对cpu缓存友好的—也就是说,在硬件级别,数组中的元素是会被预加载的,因此在ringbuffer当中,cpu无需时不时去主存加载数组中的下一个元素。(校对注:因为只要一个元素被加载到缓存行,其他相邻的几个元素也会被加载进同一个缓存行)

其次,你可以为数组预先分配内存,使得数组对象一直存在(除非程序终止)。这就意味着不需要花大量的时间用于垃圾回收。此外,不像链表那样,需要为每一个添加到其上面的对象创造节点对象—对应的,当删除节点时,需要执行相应的内存清理操作。

ringbuffer底层实现

ringbuffer是一个首尾相连的环形数组,所谓首尾相连,是指当ringbuffer上的指针越过数组是上界后,继续从数组头开始遍历。因此,ringbuffer中至少有一个指针,来表示ringbuffer中的操作位置。另外,指针的自增操作需要做并发控制,disruptor和本文的optimizedqueue都使用cas的乐观并发控制来保证指针自增的原子性。

disruptor中的ringbuffer上只有一个指针,表示当前ringbuffer上消息写到了哪里,此外,每个消费者会维护一个sequence表示自己在ringbuffer上读到哪里,从这个角度讲,disruptor中的ringbuffer上实际有消费者数+1个指针。由于我们要实现的是一个单消息单消费的阻塞队列,只要维护一个读指针(对应消费者)和一个写指针(对应生产者)即可,无论哪个指针,每次读写操作后都自增一次,一旦越界,即从数组头开始继续读写

五、disruptor的核心概念

ringbuffer

如其名,环形的缓冲区。曾经 ringbuffer 是 disruptor 中的最主要的对象,但从3.0版本开始,其职责被简化为仅仅负责对通过 disruptor 进行交换的数据(事件)进行存储和更新。在一些更高级的应用场景中,ring buffer 可以由用户的自定义实现来完全替代。

sequencedisruptor

通过顺序递增的序号来编号管理通过其进行交换的数据(事件),对数据(事件)的处理过程总是沿着序号逐个递增处理。一个 sequence 用于跟踪标识某个特定的事件处理者( ringbuffer/consumer )的处理进度。虽然一个 atomiclong 也可以用于标识进度,但定义 sequence 来负责该问题还有另一个目的,那就是防止不同的 sequence 之间的cpu缓存伪共享(flase sharing)问题。

sequencer

sequencer 是 disruptor 的真正核心。此接口有两个实现类 singleproducersequencer、multiproducersequencer ,它们定义在生产者和消费者之间快速、正确地传递数据的并发算法。

sequence barrier

用于保持对ringbuffer的 main published sequence 和consumer依赖的其它consumer的 sequence 的引用。 sequence barrier 还定义了决定 consumer 是否还有可处理的事件的逻辑。

wait strategy

定义 consumer 如何进行等待下一个事件的策略。 (注:disruptor 定义了多种不同的策略,针对不同的场景,提供了不一样的性能表现)

event

在 disruptor 的语义中,生产者和消费者之间进行交换的数据被称为事件(event)。它不是一个被 disruptor 定义的特定类型,而是由 disruptor 的使用者定义并指定。

eventprocessor

eventprocessor 持有特定消费者(consumer)的 sequence,并提供用于调用事件处理实现的事件循环(event loop)。

eventhandler

disruptor 定义的事件处理接口,由用户实现,用于处理事件,是 consumer 的真正实现。

producer

即生产者,只是泛指调用 disruptor 发布事件的用户代码,disruptor 没有定义特定接口或类型。

各概念的作用

  • ringbuffer——disruptor底层数据结构实现,核心类,是线程间交换数据的中转地;
  • sequencer——序号管理器,负责消费者/生产者各自序号、序号栅栏的管理和协调;
  • sequence——序号,声明一个序号,用于跟踪ringbuffer中任务的变化和消费者的消费情况;
  • sequencebarrier——序号栅栏,管理和协调生产者的游标序号和各个消费者的序号,确保生产者不会覆盖消费者未来得及处理的消息,确保存在依赖的消费者之间能够按照正确的顺序处理;
  • eventprocessor——事件处理器,监听ringbuffer的事件,并消费可用事件,从ringbuffer读取的事件会交由实际的生产者实现类来消费;它会一直侦听下一个可用的序号,直到该序号对应的事件已经准备好。
  • eventhandler——业务处理器,是实际消费者的接口,完成具体的业务逻辑实现,第三方实现该接口;代表着消费者。
  • producer——生产者接口,第三方线程充当该角色,producer向ringbuffer写入事件。

    个人博客