2016-10-08 00:00:00嘉辉 IBM认证
运行在某个独立 AIX 服务器上的几乎任何应用程序都可以通过使用 HACMP 集群得到保护,从这个意义上讲,HACMP 是一个灵活的高可用性解决方案。
在开始集群应用程序规划时,应该考虑以下方面:
与所使用的 AIX 版本的应用程序兼容性。与要实现用于高可用性的存储方法的应用程序兼容性。还必须知道应用程序和平台之间的所有相互依赖性,也就是所有应用程序文件的所有存储位置(持久数据、临时文件、套接字,以及管道——如适用的话)。还应该能够提供无人参与的应用程序启动/停止方法(脚本),并且应用程序必须能够在重新启动时从错误(例如,在运行应用程序的节点崩溃的情况下)中恢复。重要:如果应用程序无法在独立节点上正常运行,或者不能确定所有的应用程序依赖性,请不要继续进行 HACMP 实现!
如果计划使用应用程序监视,则还应该提供应用程序监视工具(方法、行为和脚本)。应用程序客户端依赖性(服务器重新启动时的客户端行为)。应用程序网络依赖性(套接字、路由等等)许可证授权问题,也就是说,如果应用程序依赖 CPU ID,则应该考虑为能够承载应用程序的每个节点购买备用许可证。此外,如果应用程序基于处理器数量授予许可证,则在故障转移情况下,要确保不会违背许可证授权。应用程序服务器
根据 HACMP 定义,应用程序服务器由一个脚本集合来表示,HACMP 使用这些脚本在激活资源组时启动应用程序,或在将资源组置于离线时停止同一个应用程序。
在应用程序已启动之后,HACMP 还可以监视该应用程序,并在应用程序不能正常运行时采取相应措施。应用程序监视可以在进程级别执行,还可以使用自定义方法来执行(例如,对于诸如数据库引擎等多进程应用程序)。
注意:HACMP/ES V4.4 中已经引入了基于 RSCT 的事件管理功能 (EM) 的应用程序监视。从 HACMP V5.2 开始,事件管理已被取代为资源监视和控制(Resource Monitoring and Control,RMC),后者在功能上是等效的,但是提供了更多的灵活性。从 HACMP V5.2 开始,还可以监视应用程序启动。
HACMP 还提供了应用程序可用性分析工具,此工具对于审核总体应用程序可用性和用于评估集群环境非常有用。
规划 NFS 配置
HACMP 的典型应用之一是为客户端计算机和应用程序提供高可用性网络文件系统 (HA-NFS)。这对于使用交叉挂载的网络文件系统实现相互接管来说是非常有用的,在运行应用程序的集群中尤其是如此。
从 HACMP V4.4 开始,HA-NFS 功能已集成到 HACMP 中,因此不再存在单独的产品。
使用 NFS 时的一些注意事项:
对于将要通过 NFS 导出的共享卷组,卷组主编号(Major Number)在能够提供该 VG 中的文件系统的所有集群节点上都是相同的。
在 AIX 中,当您导出文件和目录时,将使用 mknfsexp 命令,因此将创建/更新 /etc/exports 文件。另一方面,在 HACMP 中,必须在资源组配置中指定要导出和进行 NFS 装入的文件系统和目录。如果需要这些文件系统的任何可选配置,则应该创建 /usr/es/sbin/cluster/etc/exports 文件。对于具有要导出的文件系统的所有资源组,必须将“File systems Mounted before IP Address Configured”属性设置为“true”。HACMP 脚本包含缺省 NFS 行为。您可能需要修改这些脚本以处理特定的配置。在 HACMP V5.1 中,除了级联资源组外,还可以在循环或自定义资源组中配置高可用性 NFS。注意:NFS 锁功能仅限于两节点的集群。此功能提供了可靠的 NFS 服务器能力,允许备份处理器在主 NFS 服务器发生故障时恢复当前 NFS 活动,从而将锁保留在 NFS 文件系统和副本缓存 (dupcache) 上。
有关更多信息,请参见 HACMP for AIX 5L V5.1 Planning and Installation Guide,SC23-4861-02。
许可证授权
大多数软件供应商都要求,对于每台物理计算机或多处理器 (SMP) 计算机中的每个处理器,每个应用程序应该使用一个唯一的许可证。通常,许可证激活代码是在安装时输入的。
但是在 HACMP 环境中,在接管情况下,如果应用程序在不同的节点上重新启动,您必须确保拥有用于新计算机的必需激活代码(许可证);否则应用程序可能无法正常启动。
应用程序还可能需要与节点绑定的唯一许可证(每个节点上的一个单独许可证文件)。
有些应用程序还具有关于可在集群中用于该应用程序的浮动许可证数量的限制。为避免此问题,请确保您拥有用于每台集群节点计算机的足够许可证,以便应用程序能够同时在多个节点上运行(对于并发应用程序尤其是如此)。
客户端连接
在资源组接管期间,应用程序在另一个节点上启动,因此客户端必须知道该操作。在某些情况下,应用程序客户端使用客户端计算机上的 ARP 缓存来重新连接到服务器。在此情况下,存在两种可能的情形:
包含该应用程序的服务 IP 的网络将通过 IP 替换的 IPAT 用于本地管理的 MAC 地址接管(因而不必更新客户端计算机 ARP 缓存)。每当发生网络或节点事件,HACMP 就使用 clinfo 程序,此程序将调用 /usr/es/sbin/cluster/etc/clinfo.rc 脚本。缺省情况下,此操作将更新系统的 ARP 缓存和指定的客户端 ARP 缓存,以反映对网络地址的更改。如果需要进一步的操作,可以自定义此脚本。运行 clinfo 守护进程的客户端将能够在发生集群事件后快速重新连接到集群。
注意:如果使用通过 IP 别名的 IPAT,请确保所有客户端都支持 TCP/IP 无故 ARP 功能。
如果 HACMP 节点和客户端在同一个子网上,并且客户端没有运行 clinfo 守护进程,您可能必须通过从集群节点 ping 该客户端,从而间接更新本地 ARP 缓存。
865
人