Skip to Content
监控代理版本发布说明

版本说明

本文为您介绍监控代理(UBoltAgent)的版本发布信息。

1.3.4

分类说明
发布时间2026-5-20
问题修复1. 修复进程监控空列表状态更新问题
2.修复裸金属GPU监控指标:解码器使用率(cloudwatch_uphost_gpu_utilization_decoder)、编码器使用率(cloudwatch_uphost_gpu_utilization_encoder)采集异常问题

1.3.3

分类说明
发布时间2026-4-9
问题修复1.修复在GPU驱动异常时,可能因异常处理不充分导致程序崩溃的问题

1.3.2

分类说明
发布时间2026-4-2
新特性新特性:
1. 支持A800 GPU云主机采集RDMA网卡流量数据(需更改配置启动采集)
• cloudwatch_rdma_port_xmit_rate(RDMA端口出速率)
• cloudwatch_rdma_port_rcv_rate(RDMA端口入速率)
• cloudwatch_rdma_port_xmit_packets(RDMA端口出包量)
• cloudwatch_rdma_port_rcv_packets(RDMA端口入包量)
问题修复修复linux安装脚本在某些环境下因grep查询异常导致的无法安装问题

1.3.0

分类说明
发布时间2025-12-5
新特性1. 云主机新增指标:
CPU 类指标:
• cloudwatch_cpu_usage_usr(用户空间 CPU 占比)
• cloudwatch_cpu_usage_sys(内核空间 CPU 占比)
• cloudwatch_cpu_usage_idle(CPU 空闲时间占比)
• cloudwatch_cpu_usage_iowait(I/O 等待时间占比)
• cloudwatch_cpu_usage_irq(硬件中断时间占比)
• cloudwatch_cpu_usage_softirq(软中断时间占比)
• cloudwatch_cpu_usage_steal(CPU 抢占时间占比)

内存类指标:
• cloudwatch_memory_system_usage(系统内存使用率)

进程类指标:
• cloudwatch_process_cpu_usage(进程 CPU 使用率)
• cloudwatch_process_mem_usage(进程内存使用率)
• cloudwatch_process_open_files(进程打开文件数)
• cloudwatch_process_match_count(匹配到的进程数)

2.裸金属云主机新增指标:
CPU 类指标:
• cloudwatch_uphost_cpu_usage_usr(用户空间 CPU 占比)
• cloudwatch_uphost_cpu_usage_sys(内核空间 CPU 占比)
• cloudwatch_uphost_cpu_usage_idle(CPU 空闲时间占比)
• cloudwatch_uphost_cpu_usage_iowait(I/O 等待时间占比)
• cloudwatch_uphost_cpu_usage_irq(硬件中断时间占比)
• cloudwatch_uphost_cpu_usage_softirq(软中断时间占比)
• cloudwatch_uphost_cpu_usage_steal(CPU 抢占时间占比)

内存类指标:
• cloudwatch_uphost_memory_system_usage(系统内存使用率)

进程类指标:
• cloudwatch_uphost_process_cpu_usage(进程 CPU 使用率)
• cloudwatch_uphost_process_mem_usage(进程内存使用率)
• cloudwatch_uphost_process_open_files(进程打开文件数)
• cloudwatch_uphost_process_match_count(匹配到的进程数)
问题修复修复 Linux 内核 3.14 及以上版本中内存使用率计算异常的问题。

1.0.2

分类说明
发布时间2025-11-6
新特性1. 增加对内存ECC错误数指标的监控
a. cloudwatch_uphost_memory_ecc_errors(内存ECC错误数)
b. cloudwatch_uphost_memory_noinfo_ecc_errors(无法定位的内存ECC错误)
问题修复1. 解决gpu掉卡时,可能导致UBoltAgent崩溃的问题
2. 修复部分TCP状态指标采集异常问题,包括:
a. cloudwatch_uphost_tcp_closed_count(TCP_CLOSED_状态数)
b. cloudwatch_uphost_tcp_syn_recv_count(TCP_SYN_RECEIVED_状态数)
c. cloudwatch_uphost_tcp_fin_wait1_count(TCP_FIN_WAIT1_状态数)
d. cloudwatch_uphost_tcp_fin_wait2_count(TCP_FIN_WAIT2_状态数)