监控系统
本节指出了用于监控 Paragon Active Assurance 系统运行状况的参数。
系统参数
标准系统参数:
- CPU 利用率
- 应保持在 80% 以下
- 内存利用率(不包括缓存和缓冲区)
- 应保持在 80% 以下
- 磁盘利用率
- 应保持在 80% 以下
应用程序参数
对于控制中心,运行 命令
ncc status
以下参数特别感兴趣:
test_agent_appliance_online
:这表示当前有多少测试代理设备登录到服务器。这里理想的数字当然取决于如何部署测试代理。scheduled_call_latency
:这表明后台工作处理远远落后于计划。除其他事项外,此处理会收集测试代理的结果并生成定期报告。延迟应保持在 10 以下。
许可证
可使用 命令检查服务器上激活的许可证的到期日期
ncc license show
在此命令的输出中,请查找 end_date
。
过程
以下 ncc 进程通常应在运行:
- Netrounds 呼叫执行器
- netrounds-confd
- netrounds-plugin
- netrounds-probe-login
- apache2
- 卡 夫 卡
- openvpn@netrounds
- 动物园管理员
- netrounds 指标(如果启用了流式 API 或 TimescaleDB)
- netrounds 时尺度数据库(如果启用了流式 API 或 TimescaleDB)
日志
Webapp 日志
该文件 /var/log/apache/netrounds_access.log
包含向控制中心 Web GUI 发出的所有 HTTP 请求。
该文件 /var/log/apache/netrounds_error.log
包含 Apache 针对针对控制中心 Web GUI 的 HTTP 请求报告的所有错误。控制中心后端的控制台输出也在此文件中;默认情况下,所有日志记录均由控制台完成。
日志记录的配置使用 Python 日志模块配置模式 (docs.python.org/2/library/logging.config.html#configuration-dictionary-schema) 完成。
呼叫执行器日志
callexecuter
是执行后台任务的服务,例如配置测试代理或获取指标。
要查看此服务的日志,您可以使用 journalctl
,例如查看最后一小时的日志,然后遵循所有传入日志:
sudo journalctl -u netrounds-callexecuter.service --since "1 hour ago" --follow
插件服务日志
对于插件系统,您可以使用:
sudo journalctl -u netrounds-plugin.service
指标服务日志
这些日志仅在启用此功能时才相关,如果您使用流 API 或 TimescaleDB,则这种情况就是如此。
指标服务负责将指标数据提取到 TimescaleDB 中,并将这些数据推送至流式 API,只要这些数据已启用。
sudo journalctl -u netrounds-metrics.service
时间尺度数据库
要查看 TimescaleDB 日志,请运行:
sudo journalctl -u netrounds-timescaledb.service
卡 夫 卡
要查看 Kafka 日志,请运行:
sudo journalctl -u kafka
动物园管理员
卡夫卡依赖动物园管理员。
要查看动物园管理员日志,请运行:
sudo journalctl -u zookeeper
自定义格式
Paragon Active Assurance 提供了两种自定义格式,可产生有关日志条目的附加信息,因此应青睐于 Python 的默认格式器:
- 格式化器
netrounds.utils.loggers.ContextFormatter
提供record_tags
并context_tags
提供有关日志条目上下文的附加信息,例如日志条目涉及的测试代理。还支持颜色。 - 格式化器
netrounds.thirdparty.logstash_formatter.ContextLogstashFormatterV1
输出与 Logstash 兼容的 JSON 格式。
默认情况下会添加自定义格式:
LOGGING['formatters']['context']
LOGGING['formatters']['context_color']
LOGGING['formatters']['logstash']