使用 InfluxDB 进行监控和告警
MinIO 通过以下方式发布集群和节点指标:Prometheus 数据模型. InfluxDB支持抓取MinIO指标数据用于监控和告警。
本页面的流程记录了以下内容:
配置 InfluxDB 服务以抓取和显示 MinIO 部署的指标
在 MinIO 指标上配置告警
对于在 Kubernetes 上的 MinIO 部署,此流程假设所有必要的网络控制组件(如 Ingress 或负载均衡器)均已就位,以便于 MinIO 租户与 InfluxDB 服务之间的访问。
配置 InfluxDB 使用 MinIO 指标进行收集和告警
重要
此过程专门使用 InfluxDB UI 来创建抓取端点。
InfluxDB UI 不提供与使用Telegraf以及相应的Prometheus 插件具体来说:
您无法通过 InfluxDB UI 启用对 MinIO 指标端点的身份验证访问
您无法为收集的指标设置标签(例如
url_tag) 用于唯一标识给定 MinIO 部署的指标
Telegraf Prometheus 插件还支持 Kubernetes 特定功能,例如从minio给定 MinIO 租户的服务。
配置 Telegraf 超出了本流程的范围。 您可以将本流程作为配置 Telegraf 抓取 MinIO 指标的一般指南。
配置对 MinIO 指标的公共访问权限
设置
MINIO_PROMETHEUS_AUTH_TYPE环境变量"public"对于 MinIO 部署中的所有节点。 然后您可以重新启动部署以允许对 MinIO 指标进行公共访问。您可以通过尝试以下操作来验证更改:
curl指标端点:curl https://HOSTNAME/minio/v2/metrics/cluster替换
HOSTNAME通过您访问 MinIO 部署的负载均衡器或反向代理的 URL。 您也可以指定任何单个节点作为HOSTNAME:PORT除了节点主机名外,还需要指定 MinIO 服务器 API 端口。响应体应包含收集到的MinIO指标列表。
登录 InfluxDB UI 并创建存储桶
选择组织您希望存储 MinIO 指标的位置。
创建一个新存储桶用于存储 MinIO 部署指标的存储位置。
创建新的抓取源
创建一个新的 InfluxDB 数据采集器.
指定 MinIO 部署的完整 URL,包括指标端点:
https://HOSTNAME/minio/v2/metrics/cluster
替换
HOSTNAME通过您访问 MinIO 部署的负载均衡器或反向代理的 URL。 您也可以指定任何单个节点作为HOSTNAME:PORT除了节点主机名外,还需要指定 MinIO 服务器 API 端口。验证数据
使用DataExplorer可视化收集的 MinIO 数据。
例如,您可以设置一个过滤器在
minio_cluster_capacity_usable_total_bytes和minio_cluster_capacity_usable_free_bytes比较 MinIO 部署中的总可用空间与总空闲空间。配置检查
创建一个new Check关于 MinIO 指标。
以下示例检查规则为 MinIO 部署提供了警报基准。 您可以修改这些示例或将其用作构建自定义检查的指导。
创建一个阈值检查命名
MINIO_NODE_DOWN.设置过滤器为
minio_cluster_nodes_offline_totalkey.设置阈值 to WARN当值大于1
创建一个阈值检查命名
MINIO_QUORUM_WARNING.设置过滤器为
minio_cluster_drive_offline_totalkey.设置阈值 to CRITICAL当该值比您配置的值小一时擦除码奇偶校验设置。
例如,使用 EC:4 的部署应将此值设置为
3.