计算机系统应用教程网站

网站首页 > 技术文章 正文

系统性能分析工具:perf 系统性能分析方法

btikc 2024-11-11 11:17:26 技术文章 4 ℃ 0 评论


perf 是Linux的一款性能分析工具,能够进行函数级和指令级的热点查找,可以用来分析程序中热点函数的CPU占用率,从而定位性能瓶颈。

perf:Performance analysis tools for Linux.

系统性能优化通常可以分为两个阶段:性能分析和性能优化。

  • 性能分析的目的是查找性能瓶颈、热点代码,分析引发性能问题的原因;
  • 基于性能分析,可以进行性能优化,包括:算法优化(空间复杂度和时间复杂度的权衡)和代码优化(提高执行速度、减少内存占用)。

1、perf 的原理

Linux性能计数器是一个基于内核的子系统,它提供一个性能分析框架,比如硬件(CPU、PMU(Performance Monitoring Unit))功能和软件(软件计数器、tracepoint)功能。

通过 perf,应用程序可以利用PMU、tracepoint和内核中的计数器来进行性能统计。

Perf 可以对程序进行函数级别的采样,从而了解程序的性能瓶颈在哪里。其基本原理是:每隔一个固定时间,就是CPU上产生一个中断,看当前是哪个进程、哪个函数,然后给对应的进程和函数加一个统计值,这样就知道CPU有多少时间在某个进程或某个函数上了。

2、perf 的安装

在终端输入下面命令即可:

sudo apt install linux-tools-common linux-tools-generic linux-tools-`uname -r`

3、top 的使用

top 命令也是Linux下的性能分析工具,能够实时显示系统中各个进程的资源占用状况。

使用 perf 之前,可以先用 top 命令查看指定进程(xxx)的CPU占用率是否异常,命令如下:

top -p `ps aux | grep "xxx" | grep -v grep | cut -c 9-15` -d 1 -b

上面命令的含义是通过 top 查看指定进程(xxx)的整体运行情况,其中,

  • top -p:指定进程
  • top -d 1:指定屏幕刷新时间,1s刷新一次
  • top -b:表示以批处理模式操作
  • ps aux:列出所有进程
  • grep:查找指定进程
  • grep -v:反向查找
  • cut -c 9-15:选择每行指定列的字符

4、perf 的使用

使用 perf 进行性能分析,主要使用下面两个命令:

  • perf record:保存perf追踪的内容,文件名为perf.data
  • perf report:解析perf.data的内容

比如要分析进程 xxx,启动该进程后,首先启动使用下面命令:

sudo perf record -a --call-graph dwarf -p `ps aux | grep "xxx" | grep -v grep | cut -c 9-15`

其中,

  • -a:表示对所有CPU采样
  • --call-graph dward:表示分析调用栈的关系
  • -p:表示分析指定的进程

通过 Ctrl + C 结束后,会生成 perf.data 文件,然后通过 report 导出报告,即可以查看 main 函数和子函数的CPU平均占用率。

sudo perf report -i perf.data > perf.txt

5、perf 使用示例

比如,有下面一段代码。

#include <iostream>
#include <cmath>
using namespace std;

void for_loop()
{
    for (int i = 0; i < 1000; i++) {
        for (int j = 0; j < 10000; j++) {
            int x = sin(i) + cos(j);
        }
    }
}

void loop_small()
{
    for (int i = 0; i < 10; i++) {
        for_loop();
    }
}

void loop_big()
{
    for (int i = 0; i < 100; i++) {
        for_loop();
    }
}

int main()
{
    loop_big();
    loop_small();

    return 0;
}

其中,

  • for_loop()是一个两层循环,每次都要计算正弦和余弦的和,这是一个比较耗时的函数;
  • loop_small()把for_loop()循环10次;
  • loop_big()把for_loop()循环100次。

可以明显看出 main() 函数中 loop_big() 函数会占大部分CPU,下面通过 perf 命令验证下。

1)假设指定可执行文件的名称为“perf_for”,

g++ perf_for.cpp -o perf_for

2)运行 perf_for 之后,启动 perf record:

sudo perf record -a --call-graph dwarf -p `ps aux | grep "perf_for" | grep -v grep | cut -c 9-15` -d 1 -b

3)结束后,通过 perf report 导出报告:

sudo perf report -i perf.data > perf.txt

如下图所示,可以看出main函数90%的CPU都花在 loop_big() 函数上。

优化时就可以考虑:

  • 首先考虑优化 for_loop() 函数,主要是 sin 和 cos 的计算;
  • 若 for_loop() 函数无法优化,就考虑优化 loop_big(),比如减少 for_loop() 函数的调用次数。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表