目录
前言
上篇文章我们介绍了消息刷盘的四种方式,本篇文章我们来介绍broker是如何实现这四种刷盘方式。
刷盘服务源码分析
broker中的四种刷盘分别是由commitrealtimeservice,flushrealtimeservice,groupcommitservice将消息从内存中刷到磁盘上的。在了解刷盘这三个刷盘服务之前,我们先来了解mappedfile中下面几个属性
public class mappedfile extends referenceresource { // 当前写文件位置,即数据被写入mappedfile的最新指针,可能存在bytebuffer中,没有提交 protected final atomicinteger wroteposition = new atomicinteger(0); // 数据被写入文件的最新指针(只是被写入文件映射,不一定被刷盘) protected final atomicinteger committedposition = new atomicinteger(0); // 刷盘位置,该指针之前的数据都持久化存储到磁盘中 private final atomicinteger flushedposition = new atomicinteger(0); // 文件大小,默认是1042*1024*4(4gb) protected int filesize; // 起始偏移量,mappedfile创建时从文件名中解析 private long filefromoffset; }
上面几个属性在mappedfile中的位置如下图所示
上面几个位置关系: flushedposition ≤ commitedposition ≤ wroteposition
commitrealtimeservice刷盘源码分析
commitrealtimeservice类的作用就是将上图中红色的消息(也就是committedposition -> wroteposition之间的消息)从直接内存bytebuffer提交到filechannel,提交完成并不带表刷盘完成,还需要将filechannel将数据刷到硬盘中,才正式刷盘完成。commitrealtimeservice核心代码逻辑是在run()中,在run()中是包含一个死循环,死循环中每个200ms提交一次消息,每次最少提交4页的消息,每页大小是4kb,也就是说只有wroteposition - committedposition ≥ 4*4kb
,消息才会被提交。
// org.apache.rocketmq.store.commitlog.commitrealtimeservice#run public void run() { // 死循环 while (!this.isstopped()) { // 消息提交时间间隔,默认200ms int interval = commitlog.this.defaultmessagestore.getmessagestoreconfig().getcommitintervalcommitlog(); // 最少提交页数,默认是4 int commitdataleastpages = commitlog.this.defaultmessagestore.getmessagestoreconfig().getcommitcommitlogleastpages(); try { // 提交消息 boolean result = commitlog.this.mappedfilequeue.commit(commitdataleastpages); // 等待200ms this.waitforrunning(interval); } catch (throwable e) { commitlog.log.error(this.getservicename() " service has exception. ", e); } } }
上面mappedfilequeue#commit
提交最终会调用mappedfile#commit0
,commit0代码逻辑如下,将直接内存bytebuffer中的数据拷贝到filechannel中。
// org.apache.rocketmq.store.mappedfile#commit0 protected void commit0() { // 写指针 int writepos = this.wroteposition.get(); // 最后提交指针 int lastcommittedposition = this.committedposition.get(); // bytebuffer的数据提交到filechannel if (writepos - lastcommittedposition > 0) { try { bytebuffer bytebuffer = writebuffer.slice(); bytebuffer.position(lastcommittedposition); bytebuffer.limit(writepos); this.filechannel.position(lastcommittedposition); this.filechannel.write(bytebuffer); this.committedposition.set(writepos); } catch (throwable e) { log.error("error occurred when commit data to filechannel.", e); } } }
flushrealtimeservice刷盘源码分析
flushrealtimeservice的代码与commitrealtimeservice类似,核心代码也带run()中,run()中也是一个死循环,每隔500ms调用mappedfilequeue#flush
刷盘。
// org.apache.rocketmq.store.commitlog.flushrealtimeservice#run public void run() { while (!this.isstopped()) { // 定时刷盘时间间隔,默认500ms int interval = commitlog.this.defaultmessagestore.getmessagestoreconfig().getflushintervalcommitlog(); // 一次刷盘页数,默认是4页 int flushphysicqueueleastpages = commitlog.this.defaultmessagestore.getmessagestoreconfig().getflushcommitlogleastpages(); try { if (flushcommitlogtimed) { // sleep 500ms thread.sleep(interval); } else { this.waitforrunning(interval); } // 消息刷盘 commitlog.this.mappedfilequeue.flush(flushphysicqueueleastpages); } catch (throwable e) { this.printflushprogress(); } } }
mappedfilequeue#flush
刷盘最终调用了mappedfile#flush
,代码如下所示,可以看到如果mappedfile中有直接内存写缓存,则会调用filechannel.force(false)
刷盘,如果没有写缓存,则消息直接提交到mappedfile的内存映射文件mappedbytebuffer中,因此调用mappedbytebuffer.force()
刷盘。
// org.apache.rocketmq.store.mappedfile#flush public int flush(final int flushleastpages) { if (this.isabletoflush(flushleastpages)) { if (this.hold()) { int value = getreadposition(); try { // 如果使用了堆外内存,那么通过filechannel强制刷盘,这是异步堆外内存的逻辑 if (writebuffer != null || this.filechannel.position() != 0) { this.filechannel.force(false); } else { // 如果没有使用堆外内存,那么通过filechannel强制刷盘,这是同步或者异步刷盘走的逻辑 this.mappedbytebuffer.force(); } } catch (throwable e) { log.error("error occurred when force data to disk.", e); } // 设置刷盘位置为写入位置 this.flushedposition.set(value); // 减少对该mappedfile的引用次数 this.release(); } else { log.warn("in flush, hold failed, flush offset = " this.flushedposition.get()); this.flushedposition.set(getreadposition()); } } return this.getflushedposition(); }
groupcommitservice刷盘源码分析
同步刷盘groupcommitservice代码与上述代码类似,都继承了servicethread
,它的核心逻辑在groupcommitservice#run
,在run()中也是一个死循环,每隔10ms调用一次docommit()
,虽然这个方法的名字叫docommit,实际底层也与flushrealtimeservice相同,都是调用的mappedfilequeue#flush
,将mappedbytebuffer
中的数据刷入磁盘。
// org.apache.rocketmq.store.commitlog.groupcommitservice#run public void run() { // 死循环 while (!this.isstopped()) { try { // 间隔10ms this.waitforrunning(10); this.docommit(); } catch (exception e) { commitlog.log.warn(this.getservicename() " service has exception. ", e); } } }
看到这里大家可能会有疑问,为什么同步刷盘也是定时刷盘,这与异步刷盘有什么区别呢?实际上这里有着相当精妙的设计,在上篇文章中我们了解到同步刷盘包括等待消息保存与不等待消息保存。
如果不等待消息保存,则调用了servicethread#wakeup
方法。
public void wakeup() { if (hasnotified.compareandset(false, true)) { waitpoint.countdown(); } }
servicethread状态如下所示,如果刷盘线程在10ms等待中,hasnotified属性值为false,hastnotified更新成功,刷盘线程被唤醒,立即停止等待。如果刷盘线程正在执行中,hasnotified更新失败,刷盘线程唤醒失败。只能等待下一次被唤醒或者下一次时间间隔后再次刷盘。
如果是要等待刷盘成功后才返回结果,就要利用到groupcommitservice属性中两个刷盘请求容器
- requestwrite
同步刷盘请求暂存容器
- requestsread
处理中的刷盘请求容器
class groupcommitservice extends flushcommitlogservice { // 同步刷盘请求暂存容器 private volatile linkedlistrequestswrite = new linkedlist (); // 每次处理刷盘的request容器 private volatile linkedlist requestsread = new linkedlist (); }
提交刷盘请求首先会被放入到requestswrite容器中,然后再唤醒刷盘线程。
// org.apache.rocketmq.store.commitlog.groupcommitservice#putrequest public synchronized void putrequest(final groupcommitrequest request) { lock.lock(); try { // 写请求 this.requestswrite.add(request); } finally { lock.unlock(); } // 唤醒当前线程 this.wakeup(); }
刷盘线程被唤醒或者线程结束等待时都会调用onwaitend()
方法,交换请求暂存容器和刷盘request容器
// org.apache.rocketmq.store.commitlog.groupcommitservice#onwaitend @override protected void onwaitend() { this.swaprequests(); } // org.apache.rocketmq.store.commitlog.groupcommitservice#swaprequests // 交换请求暂存容器和刷盘request容器 private void swaprequests() { lock.lock(); try { linkedlisttmp = this.requestswrite; this.requestswrite = this.requestsread; this.requestsread = tmp; } finally { lock.unlock(); } }
线程被唤醒后会调用docommit(),从下面代码可以发现,不管requestsread是否包含要处理的刷盘请求,实际都是通过调用mappedfilequeue#flush
执行刷盘。
- 如果requestsread中包含刷盘请求
则有可能需要调用mappedfilequeue#flush
,确保当前请求的消息能够被刷盘,并返回刷盘结果给客户端,如果包含请求,最多会调用两次刷盘方法,确保消息能够正确刷盘。
由于文件是固定大小,有可能刷盘位置在上一个mappedfile中,当前消息请求在最新的mappedfile中,刷盘两次,确保当前消息能够被刷入硬盘中
- 如果requestsread中不包含刷盘请求
处理请求容器中包含request,直接调用mappedfilequeue#flush
,如果当前消息不在flushposition所在的mappedfile中,则本次刷盘有可能并不会将当前消息持久化到磁盘中,需要等待下次刷盘。
// org.apache.rocketmq.store.commitlog.groupcommitservice#docommit private void docommit() { // 如果处理request不空 if (!this.requestsread.isempty()) { // 遍历处理request for (groupcommitrequest req : this.requestsread) { // 如果刷盘指针大于刷盘请求中需要刷盘的offset boolean flushok = commitlog.this.mappedfilequeue.getflushedwhere() >= req.getnextoffset(); // 消息刷盘 for (int i = 0; i < 2 && !flushok; i ) { commitlog.this.mappedfilequeue.flush(0); flushok = commitlog.this.mappedfilequeue.getflushedwhere() >= req.getnextoffset(); } // 唤醒客户端 req.wakeupcustomer(flushok ? putmessagestatus.put_ok : putmessagestatus.flush_disk_timeout); } } else { // 如果消息不等待刷盘成功就返回,则不会提交刷盘请求,调用这个方法 commitlog.this.mappedfilequeue.flush(0); } }
总结
本次我们了解了rocketmq中四种刷盘策略对应的刷盘服务
- 同步刷盘-等待消息保存到磁盘
- 同步刷盘-不等待消息保存到磁盘上
上面两个同步刷盘都是由groupcommitservice实现的,由groupcommitservice将mappedbytebuffer消息刷盘到磁盘上
- 异步刷盘-开启堆外缓存
如果开启了堆外缓存,刷盘时会先由commitrealtimeservice将消息从bytebuffer拷贝到filechannel,flushrealtimeservice再将消息从filechannel刷到磁盘上
- 异步刷盘-不开启堆外缓存
这种方式也是默认的刷盘方式,由flushrealtimeservice将mappedbytebuffer消息刷盘到磁盘上
以上就是rocketmq 源码分析broker消息刷盘服务的详细内容,更多关于rocketmq broker刷盘服务的资料请关注其它相关文章!