经常看到有群友调侃“为什么搞java的总在学习jvm调优?那是因为java烂!我们.net就不需要搞这些!”真的是这样吗?今天我就用一个案例来分析一下。
昨天,一位学生问了我一个问题:他建了一个默认的asp.net core web api的项目,也就是那个weatherforecast的默认项目模板,然后他把默认的生成5条数据的代码,改成了生成150000条数据,其他代码没变,如下:
public ienumerableget() { return enumerable.range(1, 150000).select(index => new weatherforecast { date = dateonly.fromdatetime(datetime.now.adddays(index)), temperaturec = random.shared.next(-20, 55), summary = summaries[random.shared.next(summaries.length)] }) .toarray(); }
然后他用压力测试工具对这个.net编写的web api模拟了1000个并发请求,发现内存一路飙升到7gb,并且在压力测试结束之后,内存占用也不见回落。而他用python编写的同样功能的web api项目,他用压力测试工具对这个python编写的web api模拟了同样多的请求,发现内存同样飙升,但是在压力测试结束之后,内存占用很快回落到了正常的水平。
他不由得发出了疑问“这样简单的程序就有内存泄漏了吗?.net的性能这么差吗?”
我用了四种方式“解决”了他的这个问题,下面我将会依次分析这几种方式的做法和原理。在这之前,我先简单科普一下垃圾回收(gc)的基本原理:
一个被创建出来的对象是占据内存的,我们必须在对象不再需要被使用之后把对象占据的内存释放出来,从而避免程序的内存占用越来越高。在c语言中,需要程序员来使用malloc来进行内存的申请,然后使用free进行内存的释放。而在c#、java、python等现代编程语言中,程序员很少需要去关心一个被创建出来的对象,程序员只需要根据需要尽情地new对象出来即可,垃圾回收器(garbage collector,简称gc)会帮我们把用不到的对象进行回收。
关于gc还有“0代、1代”等问题,这些问题大家可以看如下.net官方的资料:https://learn.microsoft.com/en-us/dotnet/standard/garbage-collection/?wt.mc_id=dt-mvp-5004444
下面开始谈这几种“kb88凯时官网登录的解决方案”。
kb88凯时官网登录的解决方案一:去掉toarray()
做法:get方法的返回值就是ienumerable
public ienumerableget() { return enumerable.range(1, 150000).select(index => new weatherforecast { date = dateonly.fromdatetime(datetime.now.adddays(index)), temperaturec = random.shared.next(-20, 55), summary = summaries[random.shared.next(summaries.length)] }); }
再运行同样的压力测试,惊人的一幕发生了,峰值内存占用也不到100mb。
原理分析:
这是为什么呢?ienumerable以及linq默认是以一种“流水线”的方式在工作,也就是说使用ienumerable的消费者(比如这里消费ienumerable的应该是json序列化器)每调用movenext()一次获取一条数据才执行一次select()来创建一个新的weatherforecast对象。而加上toarray()之后,则是一次性生成150000个weatherforecast对象,并且把这150000个对象放到一个数组中才把这个大数组返回。
对于不采用toarray()的“流水线式”工作方式,对象是一个个产生、一个个的消费,因此同时并发生成的对象是“缓缓流淌”地,因此不会有toarray()那样逐渐累积150000个对象的操作,因此并发内存占用更小。同时,由于weatherforecast对象是流水线式生产、消费的,因此当一个weatherforecast对象被消费完成后,就“可以”被gc回收了。而用toarray()之后,数组对象会持有那150000个weatherforecast对象的引用,因此只有数组对象被标记为“可回收”之后,那150000个weatherforecast对象才有可能被标记为“可回收”,因此weatherforecast对象被回收的机会被大大推后。
不知道为什么微软官方要给weatherforecast这个web api例子项目代码里给出toarray()这样没必要的写法,我要去找微软的人去反馈,谁也别拦着我!
这给我们的启示就是:尽量让linq“流水线式”工作,尽量使用ienumerable类型,而不是数组或者list类型,每次对ienumerable类型使用toarray()、tolist()操作的时候要谨慎。
上面这个方案是最完美的方案,下面的几种方案只是为了帮助大家更深入的理解gc。
kb88凯时官网登录的解决方案二:把class改成struct
做法:仍然保留原始的toarray(),但是把weatherforecast类型从class改为struct(结构体),代码如下:
public struct weatherforecast { public dateonly date { get; set; } public int temperaturec { get; set; } public int temperaturef => 32 (int)(temperaturec / 0.5556); public string? summary { get; set; } }
再运行同样的压力测试,用struct的峰值内存占用只有用class的大约一半,同样的,在压力测试结束之后,内存占用没有回落。
原理分析:class对象包含的信息更多,而struct包含的信息更少,而且struct的内存结构更加紧凑,因此包含同样成员的struct比class对象内存占用更小。这就是为什么把class改为struct之后,峰值内存占用降低的原因。
有的朋友可能会问“不是说struct对象是分配在栈上,会用完了之后自动回收,不需要gc回收吗?为什么在压力测试结束后内存占用没有回落呢?难道struct的内存没有被自动回收吗?”。需要注意的是“struct对象会自动回收,不需要gc”这种情况只发生在struct对象没有被引用类型对象所引用的情况,一旦一个struct对象被一个引用类型对象引用之后,struct对象也需要由gc来回收。我们的代码中由于进行了toarray()操作,所以这150000个struct对象会被一个数组引用,因此这些struct对象就必须依赖于gc的回收了。
当然不要因为struct比class占内存小就滥用struct,和class相比,struct也有缺点,具体请自行搜索资料。
kb88凯时官网登录的解决方案三: 手动gc
做法:既然由于gc没有及时执行导致在压力测试结束之后内存居高不下,那么我们可以在压力测试结束后手动调用gc,强制运行垃圾回收。
仍然保留原始的toarray()。我们再创建一个新的controller,然后在action中调用一下gc.collect()来强制执行内存回收。代码如下:
public class valuescontroller : controllerbase { [httpget(name = "rungc")] public string rungc() { gc.collect(); return "ok"; } }
我们再执行压力测试,在压力测试完成后,很显然内存占用没有回落。然后我们多请求几次rungc(),我们就能发现内存占用回落到100多mb了。
原理分析:gc.collect();就是强制执行内存回收,所以那些还没有被回收的weatherforecast对象就会被回收了。为什么要多次调用gc.collect();才会让内存占用回落到初始状态呢?那是因为内存回收是比较消耗cpu的操作,为了避免对程序性能造成影响,所以不会一次执行垃圾回收的时候把所有用不到的对象一次性全部回收。
主要注意的是,手动调用gc.collect()不是一个好的习惯,因为gc会根据策略选择合适的时机来执行内存回收,手动的执行垃圾回收可能会造成程序的性能问题。如果需要手动gc.collect()来降低让程序内存占用的达到你的期望的目的,要么是你的程序需要优化,要么是你对程序的内存占用的期望是错误的。什么叫“对程序的内存占用的期望是错误的”呢?下面这个kb88凯时官网登录的解决方案会提到。
kb88凯时官网登录的解决方案四:调整gc的类型
做法:仍然保留原始的toarray(),然后在asp.net core项目文件(也就是csproj文件)中加入如下的配置:
false
再运行同样的压力测试,压力测试结束后,内存占用很快就回落到初始的100多mb了。
原理分析:我们知道,我们开发的程序常用的有两种类别:桌面程序(如winforms、wpf)和服务器端程序(如asp.net core)。
桌面程序一般不会独占整个操作系统的内存和cpu资源,因为操作系统上还有很多其他程序在运行,因此桌面程序在内存和cpu占用上比较保守。对于一个桌面程序,如果它内存占用过多,我们会认为它不好。
与之相反,服务器端程序通常是拥有整个服务器的内存和cpu资源的(因为正常的系统都会把数据库、web server、redis等部署到不同的计算机中),所以充分利用内存和cpu能够提升网站程序的性能。这就是为什么oracle数据库默认会占满服务器的大部分内存的原因,因为内存闲着也是闲着,不如用起来提高性能。对于一个网站程序,如果可以通过占尽可能多的内存提升性能,但是它却占很少的内存,我们会认为它对内存利用不足,当然这里指的不是滥用内存。
对应的,.net的gc有workstation和server两种模式。workstation模式是为桌面程序准备的,内存占用偏保守,而server模式是为服务器端程序准备的,内存占用上更激进。我们知道垃圾回收比较消耗资源,对于服务器端程序来讲,频繁的gc会降低性能,因此server模式下,只要还有足够的可用内存,.net会尽量降低gc的频率和范围。而桌面程序对gc造成的性能影响容忍度高,而对内存占用过多则容忍度低。因此workstation模式下,gc会更高频的运行,从而保证程序内存占用小;而server模式下,只要还有足够多的可用内存,gc就尽量少运行,运行的时候也不会长时间的进行大量对象的回收。当然,这两种模式还有很多其他的区别,详细请查看微软的文档:
asp.net core程序默认就是启用的server模式的gc,所以压力测试结束后,内存也没有回落。而通过
除了gc的模式之外,.net中也像java的jvm中一样可以设置堆内存的大小、百分比等各种复杂的gc调优参数,详细请阅读微软的文档
总结:尽量使用linq的“流水线”操作,尽量避免对大数据量的数据源进行toarray()或者tolist();避免手动gc;建立对程序内存占用的正确期望,对于服务器端程序来讲并不是内存占用越低越好;用好gc的模式,从而满足不同程序的性能和内存占用的不同追求;可以通过gc的参数来对于程序的性能进行更加个性化的设置。