Java 部署：应用性能监控（New Relic/APM 配置）

Java 应用部署与性能监控指南本文详细介绍如何使用 New Relic APM 监控 Java 应用性能。主要内容包括： APM 核心价值：解决慢 SQL、内存泄漏、线程阻塞等常见问题 New Relic 功能：涵盖事务追踪、JVM 监控、数据库分析等模块三种集成方式：重点推荐零侵入的 Java Agent 方案 Spring Boot 实战：演示从配置到部署的全流程高级技巧：自定义事务命

Jinkxs

87人浏览 · 2026-03-05 01:00:00

Jinkxs · 2026-03-05 01:00:00 发布

在这里插入图片描述

👋 大家好，欢迎来到我的技术博客！
📚 在这里，我会分享学习笔记、实战经验与技术思考，力求用简单的方式讲清楚复杂的问题。
🎯 本文将围绕Java部署这个话题展开，希望能为你带来一些启发或实用的参考。
🌱 无论你是刚入门的新手，还是正在进阶的开发者，希望你都能有所收获！

文章目录

Java 部署：应用性能监控（New Relic/APM 配置） 🚀

Java 部署：应用性能监控（New Relic/APM 配置） 🚀

在现代软件开发和运维体系中，可观测性（Observability）已成为保障系统稳定、高效运行的核心能力。而应用性能监控（Application Performance Monitoring, APM）作为可观测性的三大支柱之一（另外两个是日志和指标），能够帮助我们深入理解应用程序在生产环境中的真实行为，快速定位性能瓶颈、异常错误和资源瓶颈。

在众多 APM 工具中，New Relic 凭借其强大的数据采集能力、直观的可视化界面、丰富的告警机制以及对多种语言和框架的原生支持，成为 Java 应用监控领域的首选方案之一。本文将深入探讨如何在 Java 应用中集成 New Relic APM，并通过实际代码示例、配置技巧和最佳实践，帮助你构建一个可监控、可诊断、可优化的高性能 Java 系统。

什么是 APM？为什么需要它？🔍

APM 是一种用于监控和管理软件应用程序性能与可用性的技术。它不仅关注应用程序是否“活着”，更关注其响应速度、吞吐量、错误率、资源消耗等关键指标。

对于 Java 应用而言，常见的性能问题包括：

慢 SQL 查询：数据库交互成为瓶颈
内存泄漏：堆内存持续增长，最终导致 OOM
线程阻塞：死锁或长时间等待外部资源
高 CPU 使用率：算法效率低下或无限循环
第三方服务调用超时：依赖服务不可用或响应慢

如果没有 APM，这些问题往往只能通过日志排查、手动分析线程转储（thread dump）或堆转储（heap dump）来解决，耗时且低效。而 APM 工具如 New Relic 能够自动采集这些信息，并以可视化方式呈现，极大提升故障排查效率。

💡 小知识：New Relic 不仅提供 APM，还提供基础设施监控（Infrastructure）、日志管理（Logs）、浏览器监控（Browser）、移动端监控（Mobile）等，形成完整的可观测性平台。

New Relic 核心功能概览 🌐

New Relic 的 APM 功能主要包含以下模块：

应用概览（Overview）：展示应用的整体健康状态，包括吞吐量、响应时间、错误率等。
事务追踪（Transactions）：按 Web 请求、后台任务等维度分析性能，识别最慢的事务。
数据库分析（Databases）：自动捕获 SQL 语句，分析执行时间、调用频率。
外部服务（External Services）：监控 HTTP、gRPC、消息队列等外部调用。
JVM 监控（JVMs）：实时查看堆内存、GC 次数、线程状态、类加载等 JVM 指标。
错误分析（Errors）：聚合异常堆栈，统计错误发生频率和上下文。
自定义指标与事件（Custom Metrics & Events）：开发者可注入业务逻辑相关的监控数据。

这些功能共同构成了一个端到端的性能视图，从用户请求入口到数据库出口，全程可追踪。

准备工作：创建 New Relic 账户与 License Key 🔑

要使用 New Relic，首先需要注册账户（免费试用版可用）：

访问 https://newrelic.com/
点击 “Sign Up” 创建账户
登录后，进入 One New Relic 控制台
在左侧导航栏选择 All Capabilities > APM
点击 Add more data > Java
系统会引导你完成代理安装，并提供一个 License Key

⚠️ 注意：License Key 是你应用与 New Relic 后端通信的凭证，请妥善保管，不要泄露到公共代码库中。

集成 New Relic 到 Java 应用的三种方式 🛠️

New Relic 提供了多种方式将 Java 应用接入 APM，主要分为：

Java Agent（推荐）：通过 -javaagent 参数启动，无需修改代码
OpenTelemetry + New Relic Exporter：基于标准协议，适合云原生架构
New Relic Java SDK：手动埋点，适用于特定场景

下面我们将重点介绍 Java Agent 方式，因为它最简单、最全面，且对应用侵入性最小。

方式一：使用 Java Agent（零代码侵入）✅

步骤 1：下载 New Relic Java Agent

你可以通过以下方式获取 agent：

手动下载：从 New Relic 官方文档下载最新版 newrelic-java.zip
Maven/Gradle 插件（不推荐用于生产）：仅用于本地测试
Docker 镜像预装：在容器中提前解压 agent

假设你已下载并解压到 /opt/newrelic 目录。

步骤 2：配置 newrelic.yml

在解压后的目录中，找到 newrelic.yml 文件，这是 agent 的核心配置文件。关键配置如下：

common:
  # 替换为你的 License Key
  license_key: 'YOUR_LICENSE_KEY_HERE'

  # 应用名称，将在 New Relic 控制台显示
  app_name: 'MySpringBootApp'

  # 日志级别（info, fine, finer, finest）
  log_level: info

# JVM 监控相关
jvm:
  # 是否启用 JMX 监控
  jmx:
    enabled: true

# 事务采样率（默认 1.0 表示 100%）
transaction_tracer:
  enabled: true
  transaction_threshold: apdex_f

# 数据库查询是否记录原始 SQL（注意敏感信息）
datastore_tracer:
  record_sql: obfuscated  # 可选: plain, obfuscated, off

# 错误收集
error_collector:
  enabled: true
  ignore_errors: "java.lang.IllegalArgumentException"

🔒 安全提示：record_sql: plain 会记录完整 SQL，可能包含用户敏感数据，建议生产环境使用 obfuscated。

步骤 3：启动应用时附加 Java Agent

在启动 Java 应用时，通过 -javaagent 参数指定 agent jar 路径：

java -javaagent:/opt/newrelic/newrelic.jar \
     -Dnewrelic.config.file=/opt/newrelic/newrelic.yml \
     -jar myapp.jar

如果你使用 Spring Boot，也可以这样写：

java -javaagent:/path/to/newrelic/newrelic.jar \
     -jar target/my-spring-app-1.0.jar

✅ 优点：无需修改一行代码，自动监控所有 Web 请求、数据库调用、JVM 指标。

实战示例：Spring Boot 应用集成 New Relic 🌱

假设我们有一个简单的 Spring Boot REST API：

// UserController.java
@RestController
@RequestMapping("/api/users")
public class UserController {

    @Autowired
    private UserRepository userRepository;

    @GetMapping("/{id}")
    public User getUser(@PathVariable Long id) {
        return userRepository.findById(id)
                .orElseThrow(() -> new UserNotFoundException("User not found: " + id));
    }

    @PostMapping
    public User createUser(@RequestBody User user) {
        return userRepository.save(user);
    }
}

// UserRepository.java (Spring Data JPA)
public interface UserRepository extends JpaRepository<User, Long> {
}

部署步骤

构建应用：./mvnw clean package
下载并解压 New Relic Agent 到服务器
配置 newrelic.yml，设置 app_name: "UserManagementService"
启动命令：

java -javaagent:/opt/newrelic/newrelic.jar \
     -jar user-service-1.0.jar

预期效果

几分钟后，登录 New Relic 控制台，你将看到：

应用概览：显示 /api/users/{id} 和 /api/users 的平均响应时间、吞吐量
数据库分析：自动捕获 SELECT * FROM user WHERE id = ? 等 SQL
错误追踪：当 UserNotFoundException 抛出时，会被记录并聚合
JVM 指标：堆内存使用、GC 次数、线程数等实时图表

自定义事务与命名（Custom Transactions）🎯

默认情况下，New Relic 会根据 Controller 方法名或 URL 自动生成事务名称。但有时我们需要更语义化的命名。

例如，将 /api/users/123 统一归类为 UserController.getUser，而不是每个 ID 一个事务。

方法 1：使用注解（推荐）

New Relic 提供了 @Trace 注解：

import com.newrelic.api.agent.Trace;

@RestController
public class UserController {

    @Trace(dispatcher = true)
    @GetMapping("/{id}")
    public User getUser(@PathVariable Long id) {
        // 业务逻辑
    }
}

dispatcher = true 表示这是一个入口事务（类似 HTTP 请求入口）。

方法 2：使用 API 手动命名

import com.newrelic.api.agent.NewRelic;

@GetMapping("/{id}")
public User getUser(@PathVariable Long id) {
    NewRelic.setTransactionName(null, "UserService", "fetchUser");
    // ...
}

📌 注意：使用 com.newrelic.api.agent 包需要添加依赖（即使使用 Java Agent）：

<dependency>
    <groupId>com.newrelic.agent.java</groupId>
    <artifactId>newrelic-api</artifactId>
    <version>8.9.0</version>
    <scope>provided</scope>
</dependency>

设置 <scope>provided</scope> 是因为 agent 运行时已提供该类，避免打包冲突。

监控异步任务与后台作业 ⏳

Java 应用常包含异步任务（如 @Async、CompletableFuture、消息队列消费者）。New Relic 默认不会自动追踪这些后台线程。

解决方案：使用 `@Trace` + `NewRelic.recordMetric`

示例：Spring `@Async` 方法

@Service
public class NotificationService {

    @Async
    @Trace(dispatcher = true)
    public void sendEmail(String email) {
        NewRelic.setTransactionName(null, "Notification", "sendEmail");
        // 发送邮件逻辑
        try {
            Thread.sleep(2000); // 模拟耗时
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
    }
}

确保在主配置类启用异步：

@EnableAsync
@SpringBootApplication
public class Application {
    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }
}

这样，sendEmail 就会在 New Relic 中作为一个独立的后台事务被监控。

数据库监控深度解析 🗄️

New Relic 能自动捕获 JDBC 调用，包括：

SQL 语句（脱敏）
执行时间
调用次数
慢查询列表

支持的数据库

MySQL
PostgreSQL
Oracle
SQL Server
MongoDB（需额外配置）
Redis（通过 Lettuce/Jedis）

优化建议

避免 N+1 查询：New Relic 会显示高频小查询，提示你使用 JOIN 或批量加载
索引缺失：慢查询列表可帮助 DBA 识别未索引字段
连接池监控：结合 HikariCP 等连接池，观察等待时间

📊 在 New Relic 控制台，点击 Databases 标签，即可看到所有 SQL 的性能分布。

JVM 监控：内存、GC、线程全掌握 🧠

New Relic 的 JVM 监控非常强大，无需额外配置即可获取：

堆内存使用趋势
GC 次数与暂停时间
线程数量与状态（RUNNABLE, BLOCKED, WAITING）
类加载数量
CPU 使用率

识别内存泄漏

如果堆内存呈持续上升趋势，且 Full GC 后无法释放，很可能存在内存泄漏。

New Relic 会标记出：

对象分配速率
存活对象最多的类

虽然不能替代 heap dump 分析，但能快速预警。

线程阻塞检测

若大量线程处于 BLOCKED 状态，可能是同步锁竞争激烈。New Relic 会显示线程堆栈，帮助定位锁持有者。

错误与异常监控 🚨

New Relic 自动捕获未处理的异常，并聚合相同堆栈的错误。

自定义错误忽略

在 newrelic.yml 中：

error_collector:
  ignore_errors: "java.lang.IllegalArgumentException,com.example.CustomValidationException"

手动记录错误

try {
    riskyOperation();
} catch (Exception e) {
    NewRelic.noticeError(e);
    // 或带自定义属性
    NewRelic.noticeError(e, Map.of("userId", userId, "action", "checkout"));
}

这在捕获已处理但需监控的异常时非常有用。

分布式追踪（Distributed Tracing）🌐

现代应用多为微服务架构，一次用户请求可能跨越多个服务。New Relic 支持 分布式追踪，通过 trace_id 串联所有服务。

自动传播

New Relic Agent 会自动在 HTTP 头中注入 NewRelic-ID，并在下游服务中提取，实现跨服务追踪。

与 OpenTelemetry 兼容

如果你使用 OpenTelemetry，New Relic 也提供 exporter：

<dependency>
    <groupId>com.newrelic.telemetry</groupId>
    <artifactId>opentelemetry-exporters-newrelic-auto</artifactId>
    <version>0.10.0</version>
</dependency>

然后配置 OTel SDK 使用 New Relic 作为后端。

性能开销评估 ⚖️

很多团队担心 APM 会拖慢应用。实际上，New Relic Java Agent 的设计非常高效：

CPU 开销：< 5%
内存开销：约 50-100 MB
延迟影响：微秒级，通常可忽略

官方建议在生产环境开启，因为其带来的可观测性收益远大于微小开销。

可通过以下方式进一步优化：

调整采样率：transaction_tracer.transaction_threshold: 500ms（只追踪慢于 500ms 的事务）
关闭非必要模块：如不需要 JMX，可设 jmx.enabled: false

高级配置：环境变量与动态配置 🌍

除了 newrelic.yml，New Relic 也支持通过环境变量配置：

export NEW_RELIC_LICENSE_KEY=your_key
export NEW_RELIC_APP_NAME="MyApp-Prod"
export NEW_RELIC_LOG_LEVEL=info

这在 Docker 或 Kubernetes 环境中非常方便。

Kubernetes 部署示例

# deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: user-service
spec:
  template:
    spec:
      containers:
      - name: app
        image: my-registry/user-service:1.0
        env:
        - name: NEW_RELIC_LICENSE_KEY
          valueFrom:
            secretKeyRef:
              name: newrelic-secret
              key: licenseKey
        - name: NEW_RELIC_APP_NAME
          value: "UserService-K8s"
        volumeMounts:
        - name: newrelic-agent
          mountPath: /newrelic
      volumes:
      - name: newrelic-agent
        configMap:
          name: newrelic-agent-config

其中 newrelic-agent-config ConfigMap 包含 newrelic.jar 和 newrelic.yml。

告警与通知（Alerts & Notifications）🔔

New Relic 强大的告警功能可让你在问题发生前收到通知。

常见告警策略

响应时间过高：P95 > 2s 持续 5 分钟
错误率突增：错误率 > 1% 持续 10 分钟
JVM 内存不足：堆使用率 > 90%
事务吞吐量骤降：可能表示服务宕机

创建告警策略（通过 UI）

进入 Alerts & AI > Alert policies
点击 Create a policy
添加条件（Conditions），如：
- NRQL 条件：SELECT average(duration) FROM Transaction WHERE appName = 'MyApp' SINCE 5 minutes AGO
配置通知渠道（Slack、Email、PagerDuty 等）

使用 Infrastructure 告警

除了 APM，还可监控主机 CPU、磁盘、网络等：

SELECT average(cpuPercent) FROM SystemSample WHERE hostname = 'prod-server-01'

自定义指标与业务监控 📈

除了技术指标，业务指标同样重要。例如：

每分钟订单数
用户注册成功率
支付失败率

New Relic 支持通过 API 上报自定义指标：

import com.newrelic.api.agent.NewRelic;

public void processOrder(Order order) {
    // 业务逻辑
    if (order.isSuccessful()) {
        NewRelic.recordMetric("Custom/Orders/Success", 1);
    } else {
        NewRelic.recordMetric("Custom/Orders/Failure", 1);
    }
}

然后在 New Relic 中创建仪表盘，使用 NRQL 查询：

SELECT rate(sum(`Custom/Orders/Success`), 1 minute) FROM Metric

这让你能同时监控技术健康度和业务健康度。

故障排查实战：从告警到根因 🕵️‍♂️

假设你收到告警：“User Service P95 响应时间 > 3s”。

排查步骤

进入 APM > Transactions，查看慢事务列表
发现 /api/users/{id} 平均耗时 3.2s
点击该事务，查看 Breakdown：
- 2.8s 花费在数据库查询
进入 Databases，发现 SELECT * FROM user WHERE id = ? 执行时间长
检查该表是否有索引？发现 id 是主键，应有索引
查看 Slow queries，发现某次查询耗时 2.8s，但其他很快
结合 JVM 监控，发现当时 GC 暂停长达 2s
进一步分析 GC 日志，发现老年代空间不足，频繁 Full GC

根因

JVM 堆内存配置过小，导致 GC 频繁，进而影响数据库查询响应。

解决方案

增加堆内存：-Xmx2g
优化对象生命周期，减少短命大对象

整个过程无需登录服务器，全部在 New Relic UI 中完成！

安全与合规考虑 🔐

在企业环境中，需注意：

数据脱敏：确保 record_sql: obfuscated，避免敏感信息上传
网络策略：New Relic Agent 需要外连 collector.newrelic.com:443，确保防火墙放行
License Key 保护：不要硬编码在代码中，使用环境变量或密钥管理服务
GDPR/CCPA 合规：New Relic 提供数据驻留选项（Data Residency），可选择数据存储区域

🌍 New Relic 支持欧盟、美国、亚太等多个区域的数据中心，满足合规要求。

替代方案对比：New Relic vs Prometheus + Grafana vs Datadog 🆚

特性	New Relic	Prometheus + Grafana	Datadog
部署复杂度	低（Agent 一键）	中（需配置 Exporter、Prometheus、Grafana）	低
自动追踪	✅ 强大	❌ 需手动埋点或 OpenTelemetry	✅
JVM 监控	✅ 原生支持	⚠️ 需 JMX Exporter	✅
分布式追踪	✅	⚠️ 需 Jaeger/Tempo	✅
定价模型	按主机/应用计费	开源免费	按主机/容器计费
学习曲线	低	高	中

💡 如果你追求开箱即用、快速见效，New Relic 是最佳选择；如果已有 Prometheus 生态，可考虑 OpenTelemetry + New Relic Exporter 混合方案。

最佳实践总结 🏆

尽早集成：在开发/测试环境就接入 APM，养成监控习惯
合理命名事务：使用 @Trace 或 setTransactionName 提高可读性
监控关键路径：支付、登录、下单等核心流程必须覆盖
设置有效告警：避免告警疲劳，聚焦真正影响业务的问题
定期审查仪表盘：每周花 10 分钟看性能趋势，防患于未然
结合日志：New Relic Logs 可与 APM 事件关联，提供上下文

可视化架构：New Relic 数据流 📊

下面是一个典型的 New Relic Java 应用监控架构图，使用 Mermaid 渲染：

该图展示了从应用到 New Relic 云端的完整数据流，强调了 Agent 作为数据采集器的核心角色。

结语：让性能问题无处遁形 🎯

在微服务、云原生、高并发的时代，“看不见”的性能问题是最危险的。New Relic APM 为 Java 应用提供了一双“透视眼”，让我们能够：

实时掌握应用健康状态
快速定位性能瓶颈
预防潜在故障
优化用户体验

通过本文的详细配置指南、代码示例和最佳实践，相信你已经具备了在生产环境中部署 New Relic APM 的能力。记住，监控不是成本，而是投资——它能为你节省数小时甚至数天的故障排查时间，保障业务连续性。

现在，就去为你的 Java 应用装上 New Relic 吧！🚀

📚 延伸阅读：

New Relic Java Agent 官方文档

NRQL 查询语言指南

OpenTelemetry 与 New Relic 集成

Happy Monitoring! 😊

🙌 感谢你读到这里！
🔍 技术之路没有捷径，但每一次阅读、思考和实践，都在悄悄拉近你与目标的距离。
💡 如果本文对你有帮助，不妨 👍 点赞、📌 收藏、📤 分享给更多需要的朋友！
💬 欢迎在评论区留下你的想法、疑问或建议，我会一一回复，我们一起交流、共同成长 🌿
🔔 关注我，不错过下一篇干货！我们下期再见！✨

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Chaterm致力于打造20年经验的SRE副驾驶

合合信息推出的Chaterm定位为"20年经验的运维专家"，旨在解决AI时代复杂的运维挑战。该产品能通过模糊问题描述快速定位服务器故障，利用多维度并行分析能力大幅缩短故障解决时间（MTTR）。在云原生环境中，Chaterm作为智能自动化层，帮助管理异构基础设施（GPU/NPU/CUDA等），应对微服务和K8s体系下的立体化故障排查难题。其开箱即用的特性降低了企业交付成本，已在故

2048 AI社区

初探AI世界

人工智能（AI）是通过程序让机器模拟人类思维和行为的计算机技术，可分为弱AI、强AI和超AI三类。大模型是AI的高级形态，经过预训练和微调等过程，具备知识处理和推理能力。AI生态包含大模型开发者、应用开发者和使用者三个角色。AI Agent是具备自主决策和执行能力的智能实体，由大模型、记忆、任务规划和工具使用等组件构成，能通过多Agent协作完成复杂任务。AI技术正深刻影响电商、教育、金融等行业，

2048 AI社区

OpenCode 开源AI编程助手完全使用指南（零基础入门到精通）

2048 AI社区

所有评论(0)

查看更多评论

Jinkxs

@qq_41187124

已为社区贡献503条内容

Java 部署：应用性能监控（New Relic/APM 配置）

Jinkxs

文章目录

Java 部署：应用性能监控（New Relic/APM 配置） 🚀

什么是 APM？为什么需要它？🔍

New Relic 核心功能概览 🌐

准备工作：创建 New Relic 账户与 License Key 🔑

集成 New Relic 到 Java 应用的三种方式 🛠️

方式一：使用 Java Agent（零代码侵入）✅

步骤 1：下载 New Relic Java Agent

步骤 2：配置 newrelic.yml

步骤 3：启动应用时附加 Java Agent

实战示例：Spring Boot 应用集成 New Relic 🌱

部署步骤

预期效果

自定义事务与命名（Custom Transactions）🎯

方法 1：使用注解（推荐）

方法 2：使用 API 手动命名

监控异步任务与后台作业 ⏳

解决方案：使用 @Trace + NewRelic.recordMetric

示例：Spring @Async 方法

数据库监控深度解析 🗄️

支持的数据库

优化建议

JVM 监控：内存、GC、线程全掌握 🧠

识别内存泄漏

线程阻塞检测

错误与异常监控 🚨

自定义错误忽略

手动记录错误

分布式追踪（Distributed Tracing）🌐

自动传播

与 OpenTelemetry 兼容

性能开销评估 ⚖️

高级配置：环境变量与动态配置 🌍

Kubernetes 部署示例

告警与通知（Alerts & Notifications）🔔

常见告警策略

创建告警策略（通过 UI）

使用 Infrastructure 告警

自定义指标与业务监控 📈

故障排查实战：从告警到根因 🕵️‍♂️

排查步骤

根因

解决方案

安全与合规考虑 🔐

替代方案对比：New Relic vs Prometheus + Grafana vs Datadog 🆚

最佳实践总结 🏆

可视化架构：New Relic 数据流 📊

结语：让性能问题无处遁形 🎯

所有评论(0)

Jinkxs

解决方案：使用 `@Trace` + `NewRelic.recordMetric`

示例：Spring `@Async` 方法