计算机系统应用教程网站

网站首页 > 技术文章 正文

[性能优化]Perfetto - 系统性能分析、应用追踪和追踪分析

btikc 2024-11-11 11:17:29 技术文章 4 ℃ 0 评论

Perfetto is a production-grade open-source stack for performance instrumentation and trace analysis. It offers services and libraries for recording system-level and app-level traces, native + java heap profiling, a library for analyzing traces using SQL and a web-based UI to visualize and explore multi-GB traces.

Perfetto 是一个面向生产的开源堆栈,用于性能检测和追踪分析。它提供了服务和库来记录系统级和应用级追踪信息、原生 + Java 堆分析、一个使用 SQL 进行追踪分析的库,以及一个基于 Web 的用户界面来可视化和探索多 GB 追踪信息。

追踪记录(Recording traces)

其核心在于,Perfetto 引入了一种新颖的基于直接 protobuf 序列化到共享内存缓冲区的用户空间到用户空间的追踪协议。该追踪协议既在内部用于内置数据源,也通过追踪 SDK 和 Track Event Library 暴露给 C++ 应用程序。

这种新的追踪协议允许通过可扩展的基于 protobuf 的功能宣传和数据源配置机制(请参阅追踪配置文档)来动态配置追踪的各个方面。不同的数据源可以被复用到用户定义缓冲区的不同子集上,从而允许将任意长度的追踪流记录到文件系统中。

Android 和 Linux 上的系统级追踪

在 Linux 和 Android 上,Perfetto 打包了多种数据源,这些数据源能够从不同的系统接口收集详细的性能数据。要了解完整的数据源集合和详细信息,请参阅文档中的“数据源”部分。以下是一些示例:

  1. 内核追踪:Perfetto 与 Linux 的 ftrace 集成,允许将内核事件(如调度事件、系统调用)记录到追踪中。
  2. /proc 和 /sys 轮询器,这些轮询器允许随时间采集进程级或系统级 CPU 和内存计数器的状态。
  3. 与 Android HAL 模块的集成,用于记录电池和能耗计数器。
  4. 本地堆(Native Heap)分析:一种低开销的堆分析器,用于挂钩 malloc/free/new/delete 并根据进程外展开、可配置采样和附加到已运行进程,将内存与调用栈相关联。
  5. 捕获 Java 堆转储(Java heap dumps):使用与 Android 运行时紧密集成的进程外分析器捕获 Java 堆转储,允许获取托管堆保留图(类型、字段名称、保留大小和对其他对象的引用)的完整快照,但无需转储完整的堆内容(字符串和位图),从而减少了序列化时间和输出文件大小。

在 Android 上,Perfetto 是下一代系统追踪系统,并取代了基于 Chromium 的 systrace。基于 ATrace 的工具仍然完全受支持。有关更多详细信息,请参阅 Android 开发者文档。

追踪 SDK 和用户空间工具

Perfetto 追踪 SDK 允许 C++ 开发人员通过应用特定的追踪点来丰富追踪信息。您可以选择定义自己的强类型事件和创建自定义数据源,或者使用更易于使用的 Track Event Library,该库允许通过类似 TRACE_EVENT("category", "event_name", "x", "str", "y", 42) 的注解轻松创建时间受限的切片、计数器和时间标记。

该 SDK 专为多进程系统和多线程进程的追踪而设计。它基于 ProtoZero,这是一个用于在线程局部共享内存缓冲区上直接写入 protobuf 事件的库。

相同的代码既可以以完全进程内模式工作,在该模式下,在专用线程上托管一个 Perfetto 追踪服务实例,也可以以系统模式工作,通过 UNIX 套接字连接到 Linux/Android 追踪守护进程,允许将应用特定的工具点与全系统追踪事件相结合。

SDK 基于可移植的 C++17 代码,并使用主要的 C++ 清理器(ASan、TSan、MSan、LSan)进行了测试。它不依赖于运行时代码修改或编译器插件。

在 Chromium 中的追踪

Perfetto 从设计之初就旨在替换 chrome://tracing 基础设施的内部机制。在 Chromium 及其内部,所有主要平台(Android、CrOS、Linux、MacOS、Windows)上的追踪都基于 Perfetto 的代码库。系统级追踪的相同基于服务的架构同样适用,但在内部,Chromium 使用 Mojo IPC 系统而非 Perfetto 自带的 UNIX 套接字。

默认情况下,Chromium 中的追踪以进程内模式工作,仅记录由 Chromium 进程发出的数据。在 Android 上(以及在禁用 Chromium 沙箱功能的 Linux 上),追踪可以以混合进程内+系统模式工作,将 Chrome 特有的追踪事件与 Perfetto 系统事件相结合。

Trace Analysis

除了追踪记录功能外,Perfetto 代码库还包括一个专门用于导入、解析和查询新旧追踪格式的项目——Trace Processor。

Trace Processor 是一个可移植的 C++17 库,它提供了面向列的表存储,专为高效地将数小时的追踪数据保存在内存中而设计,并基于流行的 SQLite 查询引擎提供了一个 SQL 查询接口。追踪数据模型变为一系列 SQL 表,可以以极其强大和灵活的方式进行查询和联接,以分析追踪数据。

此外,Trace Processor 还包含一个基于追踪的度量子系统,该系统由预定义的且可扩展的查询组成,可以输出以 JSON 或 protobuf 消息形式(例如,不同频率状态下的 CPU 使用率,按进程和线程细分)的强类型摘要。

基于追踪的度量允许在性能测试场景或批量分析或大量追踪数据集中轻松集成追踪。

Trace Processor 还设计为支持低延迟查询和构建追踪可视化器。目前,Trace Processor 被 Perfetto UI 用作 Web Assembly 模块,被 Android Studio 和 Android GPU Inspector 用作原生 C++ 库。

注意:虽然标题是“race analysis”(竞争分析),但在此上下文中,它可能是一个误用或翻译不准确。通常,“race analysis”指的是在并发编程中识别和解决竞态条件的分析,但在此描述中,我们实际上讨论的是追踪数据的分析和处理,而不是竞态条件的分析。因此,我将“race analysis”理解为对追踪数据进行分析的广义概念,并相应地调整了翻译。

追踪可视化

Perfetto 还提供了一个全新的追踪可视化工具,用于打开和查询长达数小时的追踪数据,该工具可在 Perfetto UI 上获得。新的可视化工具利用了现代网络平台技术。其基于 WebWorkers 的多线程设计确保了用户界面始终保持响应;Trace Processor 和 SQLite 的分析能力完全通过 WebAssembly 在浏览器中可用。

Perfetto UI 在首次打开后即可完全离线工作。通过 UI 打开的追踪数据由浏览器在本地处理,无需任何服务器端交互。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表