节点故障恢复
如果 MinIO 节点遭遇完全硬件故障(例如所有驱动器、数据等全部丢失),该节点将开始治疗操作一旦重新加入部署。 MinIO 修复仅发生在替换的硬件上,通常不会影响 部署性能。
MinIO healing 确保恢复到驱动器上的所有数据的一致性和正确性。
驱动器独占访问
MinIO需要 独家对象存储所提供的驱动器或卷的访问权限。 任何其他进程、软件、脚本或人员均不得执行任何直接对提供给 MinIO 的驱动器或卷,或 MinIO 置于其上的对象或文件执行操作。
除非得到 MinIO 工程团队指示,否则不得使用脚本或工具直接修改、删除或移动所提供驱动器上的任何数据分片、校验分片或元数据文件,包括在不同驱动器或节点间的转移操作。 此类操作极有可能导致大范围损坏和数据丢失,超出 MinIO 的自我修复能力范围。
替换节点的硬件应与故障节点基本相似。使用改进的硬件不会对性能产生负面影响。
更换的驱动器硬件应与故障驱动器基本相似。例如,用相同容量的另一个SSD驱动器替换故障的SSD。虽然您可以使用容量更大的驱动器,但MinIO使用最小所有驱动器的容量上限服务器池.
以下步骤提供了节点替换的更详细演练。 这些步骤假设 MinIO 部署中每个节点都具有 DNS 主机名 如已记录的先决条件.
1) 启动替换节点
确保新节点已根据行业、监管或组织标准和要求接收所有必要的安全、固件和操作系统更新。
新节点软件配置必须与部署中其他节点的配置相匹配,包括但不限于操作系统和内核版本及其配置。异构的软件配置可能导致部署中出现意外或不符合预期的行为。
2) 更新新节点的主机名
可选此步骤仅在替换节点的 IP 地址与故障主机不同时才需要执行。
确保与故障节点关联的主机名现在解析到新节点。
例如,如果https://minio-1.example.net之前解析到故障主机的请求,现在应该解析到新的主机。
3) 下载并准备 MinIO 服务器
遵循部署流程下载 并使用与部署中所有其他节点匹配的配置来运行 MinIO 服务器。
MinIO 服务器版本必须在所有节点上匹配
MinIO 服务及环境文件配置必须在所有节点上匹配。
4) 将节点重新加入部署
在节点上启动 MinIO 服务器进程并使用监控进程输出mc admin logs或通过监控 MinIO 服务日志使用journalctl -u minioforsystemd托管安装。
服务器输出应表明它已检测到部署中的其他节点并开始治疗操作.
使用mc admin heal监控部署的整体修复状态。MinIO 会主动修复节点,确保从降级状态快速恢复。
5) 后续步骤
继续监控部署直到修复完成。对于存在持续和重复节点故障的部署,应安排专门的维护来识别根本原因。考虑使用MinIO SUBNET与 MinIO 工程团队协调此类操作的指导原则。