管控平台¶
管控平台是OpsAny的底层资源纳管和控制系统,是OpsAny体系与用户资源的连接器。管控平台支持Agent和SSH混合连接方式,支持常见的基于Linux、Windows操作系统,为其它平台提供远程执行、文件分发、数据采集三种运维原子操作,管控平台是其他运维管理的基础,只有讲资源纳管后,才能进行相关的管理操作。
一、资源纳管¶
主机管理主要帮助用户在管控平台中保存和同步主机数据,通过分组的形式对主机进行管理,同时用户可以安装Agent和管理Agent的状态。用户也可以基于SSH通信链路或者Windows的3389远程端口,以客户端的形式登录目标主机,并进行操作。
1.1 主机管理¶
主机管理主要用于用户对所要管理的主机进行纳管,查看当前主机的纳管状态是否正常,可以登录主机进行管理和操作。
点击页面右上角【添加主机】按钮,主要分为四种方式添加主机:自定义添加、从资源平台添加、手工添加、批量导入
- 自定义添加主机: 用户可以自定义配置主机相关的字段信息,完成主机自定义创建操作。
每个主机均可以添加监控组件,也可以不添加监控组件。默认不添加监控组件。
- 从资源平台添加主机: 用户可以从CMDB的主机中选择需要管理的物理机、虚拟机、云主机等。列表中的主机均未在管控平台进行管理。
- 点击配置按钮,进行相关字段的填写,然后保存到主机管理列表中。
- 手动添加主机: 手动添加主要用于用户自己到目标机器上进行Agent的安装,然后管控平台可以自动发现已经安装Agent的主机,展示在主机管理的列表中。
- 批量导入主机: 支持用户一次性导入多个主机的相关数据,导入之前先下载xlsx模板,填写主机相关数据然后本地上传导入,导入之后会在第二步进行数据校验,确保每个主机的信息都是完整且正确的,以避免导入错误或遗漏。
- 主机管理列表操作中,包含配置、登录、资产采集、联通测试、自动安装、手动安装、重启Agent、卸载Agent、加入纳管、移除纳管、安装日志、同步监控、同步CMDB等操作。
- 配置:用户可以自定义编辑目标主机的信息。
- 登录:用户可以通过客户端的形式访问目标主机,然后进行操作。
- 资产采集:主要用于同步目标主机的静态资源信息。
- 联通测试:用于测试Agent是否可用。
- 自动安装:用于安装目标主机的Agent。
- 手动安装:用于用户手动到目标主机上安装Agent。
- 重启Agent:用户可以远程重启Agent。
- 卸载Agent:用户可以远程卸载Agent。
- 加入纳管:对于自动发现的主机,用户可以直接进行纳管,纳管过程包括信息采集的过程。
- 移除纳管:从主机管理列表中移除该目标主机。
- 安装日志:查看自动安装过程中的日志统计,主要展示最近一次的安装日志.
- 同步监控:单独为主机增加监控组件。
- 同步CMDB:点击【同步CMDB】按钮系统检测主机自动同步到CMDB。
1.2 数据库管理¶
对数据库进行纳管,支持MySQL、Redis、MongoDB等。
点击页面右上角【添加实例】按钮,主要分为二种方式添加数据库实例:自定义添加、从资源平台添加,
- 自定义添加: 用户可以自定义配置数据库相关的字段信息,完成数据库自定义创建操作。
- 从资源平台添加: 用户可以从CMDB的数据库中选择需要管理的MySQL、云MySQL、Redis等。列表中的数据库均未在管控平台进行管理。
- 数据库管理列表操作中,包含配置、移除纳管、联通测试等操作。
- 配置:用户可以自定义编辑目标数据库的信息。
- 移除纳管:从数据库管理列表中移除该目标数据库。
- 联通测试:用于测试Agent是否可用。
二、网络管理¶
2.1 网络设备¶
网络设备管理主要是协助用户管理交换机、路由器等这些网络设备,目前支持通过SNMP协议来管理,纳管方式支持SSH和Telnet,监控方式目前通过zabbix来实现。
自定义添加网络设备
- 基本信息:选择CMDB中的网络设备模型,并进行分组。
- SNMP信息:选择版本和团体名称。
- 纳管信息:通过SSH和Telnet两种形式进行管理。
- 同步监控:目前支持zabbix进行管理。
从资源平台添加网络设备
- 从资源平台添加网络设备可以单独配置不同的设备类型,设备类型是根据资源平台的资源模型获取的。
2.2 IP地址管理¶
对录入的IP地址段进行扫描,动态识别IP地址池的使用状态。
- 点击页面右上角【添加IPv4子网】按钮,打开添加IPv4子网页面之后根据页面字段信息完成创建操作。
三、采集插件¶
3.1 指标采集¶
指标采集插件,支持Zabbix、Prometheus Exporter等插件,用于监控指标的采集。
指标采集支持导入和导出功能。
- 点击页面右上角【新增】按钮,打开新建指标采集页面,根据页面相关字段信息完成创建操作。
3.2 资产采集¶
资产采集插件,用于资产的自动发现,通过采集任务进行自动录入。插件支持导入和导出。目前支持脚本语言有Python,Bat,Shell。
创建资产采集
第一步:采集配置
第二步:采集调试
此处对调试结果进行判定,如果调试不成功,不能往下继续进行。所以需要对采集插件进行仔细调试,否则创建不成功。
四、数据统计¶
4.1 纳管分析¶
纳管分析主要是针对多个平台的资源进行纳管分析,识别出异常数据,协助管理员进行数据运营。可以从不同的角度审视数据管理的缺陷,比如管控和CMDB的差异,就能知道哪些主机没有被纳管,或者不需要被纳管,从而了解资产的可管理性是否足够强。
点击立即分析,即可得到当前数据的最终分析结果。
五、平台设置¶
5.1 采控管理¶
采控管理是管控平台的核心组件,目前支持proxy控制器,elasticsearch集成,zabbix集成,grafana集成。每个控制器都可以同时支持多个控制器同时运行。
5.1.1 控制器(Proxy)¶
每一个控制器是指一个独立的管控区域,多控制器用于大规模节点管理。
新建proxy控制器
- 名称:用户可以自定义控制器的名称。
- 类型:支持本地和远程两种类型。
- 控制器可以分别填写内网和外网地址,便于用户根据不同的网络环境使用。
- proxy密钥:每一个控制器会有一个密钥,用于数据通信的验证使用。
5.1.2 Elasticsearch集成¶
新建ES集群
- 集群成员:选择http/https输入集群地址和端口,支持同时添加多个集群。
- 用户名:输入用户名和密码,支持集群连接测试是否成功。
- 输入Kibana地址、用户名和密码后,支持连接测试是否成功。
5.1.3 Zabbix集成¶
新建Zabbix Server
同步zabbix
支持同步Zabbix资源到主机管理和网络设备管理
添加网络设备到管控需要提前将Zabbix内的网络设备打上标签
- 找到要同步的网络设备点击进入
- 增加标签 host_type:network device_type:SWITCH device_type数据来自资源平台网络设备模型唯一标识(同步时会根据device_type确定设备类型)
- 检查打标签是否成功 备注:如果网络设备没有打上指定标签会按照主机数据同步至主机管理
操作完成后便可以执行同步操作
5.1.4 Prometheus集成¶
新建Prometheus Server
根据页面字段信息填写内容完成创建操作
5.1.5 Grafana集成¶
目前grafana是默认集成的,用于监控平台使用。
5.1.6 StackStorm集成¶
点击【新建StackStorm服务】按钮进行创建,输入StackStorm服务器的URL和API Token,只能添加一个。StackStorm服务用于稳定性平台事件运营。
5.2 备份策略¶
为不同的厂商和型号的网络设备,设置对应的备份采集参数。
进入备份策略页面,点击页面右上角【创建备份策略】按钮,打开创建备份策略页面之后根据页面相关字段信息完成创建操作。
Info
开源技术使用声明:OpsAny积极拥抱开源技术,鼓励大家一起保护开源技术知识产权及合法使用,管控平台使用了以下开源技术。
- Ansible:https://github.com/ansible/ansible
- SaltStack: https://github.com/saltstack/salt
注:OpsAny是当前业界最早同时支持Ansible和SaltStack的运维产品。