安装配置Agent 本章节主要介绍安装配置物理机监控agent。 操作场景 当您购买了一台物理机后,了解其运行状态一定是您的迫切需求,天翼云物理机和云监控服务结合使用,自动收集物理机的CPU、内存、磁盘以及网络使用情况等监控指标,以便您及时了解物理机实例运行状况和性能。本章节指导您如何为物理机服务器安装及配置Agent插件。 前提条件 物理机服务器可以正常使用。 物理机服务器内DNS Server正常工作,配置方法请参考内网DNS与安全组配置。 操作步骤 1. 添加域名解析地址:在物理机“/etc/resolv.conf”文件中添加各区域域名解析地址。 2. 修改子网DNS地址:按物理机所在区域修改子网的DNS服务器地址。 3. 配置安全组:用于下载Telescope包、发送指标数据、采集日志等。 此第三步请参见内网DNS与安全组配置。 4. 下载telescope安装包,访问地址参考云监控服务安装Agent(Linux)。 5. 安装Agent:手动为物理机安装Agent,实现主机监控。 此步请参见安装配置云监控服务安装Agent(Linux)。 6. 配置Agent,使用root账号,登录物理机。 7. 执行以下命令,切换至Agent安装路径的bin下。 cd /usr/local/telescope/bin 8. 修改配置文件conf.json。 a. 执行以下命令,打开配置文件conf.json。 vi conf.json b. 修改文件中的参数,具体参数请参见下表。 { "InstanceId":"xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", "ProjectId": "b5b92ee0xxxxxxxxxxxxxxxxcab92396", "AccessKey": "QZ0XGJXFxxxxxxxxT65R", "SecretKey": "lEv2aXAGwxxxxxxxxxxxxxxxxxxxxF8t0Bf18Tn2", "RegionId": "cnhz1" } 公共配置参数 参数 说明 :: InstanceId 物理机ID,可通过登录管理控制台,在物理机列表中查看。 说明 InstanceId可不用配置,保持"InstanceId":"",即可,若需要配置,请参考下两条。 该资源ID需保证全局唯一性,即同一个RegionID下Agent使用的InstanceId不能相同,否则系统可能会出现异常。 InstanceId必须与实际的物理机资源ID一致,否则云监控界面将看不到对应物理机资源操作系统监控的数据。 ProjectId ProjectId可不用配置,保持"ProjectId": "",即可。若需要配置,请参考已下获取方式。 项目ID,获取方式如下: 1. 登录管理控制台,单击右上角“用户名”,选择“我的凭证”; 2. 在项目列表中,查看物理机资源对应的所属区域的项目ID。 AccessKey/SecretKey 访问密钥,获取方式如下: 登录管理控制台,单击右上角“用户名”,选择“我的凭证>管理访问秘钥”; 如已有访问密钥,查看创建时下载保存的credentials.csv文件中,获取文件中记录的Key值即可; 如未创建,则通过“新增访问密钥”可创建新的访问密钥,妥善保存credentials.csv文件,并获取文件中记录的Key值。 注意 为了安全考虑,建议该用户为IAM用户,并且权限仅为CES Administrator和LTS Administrator。 配置的AccessKey必须在“我的凭证 >管理访问秘钥”列表中,否则将鉴权失败,云监控界面看不到操作系统监控数据 RegionId 区域ID,例如:物理机资源所属区域为“杭州”,则RegionID为“cnhz1”。 9. 修改云监控指标采集模块的配置文件confces.json。 a. 执行以下命令,打开公共配置文件confces.json。 vi confces.json b. 修改文件中的参数,具体参数请参见下表。 { "Endpoint": " } 指标采集模块参数配置 参数 说明 :: Endpoint 物理机资源所属区域的云监控Endpoint URL,例如:物理机资源所属区域为“杭州”,则URL中使用“ces.cnhz1.ctyun.cn”。 说明 Agent插件配置完成后,因监控数据暂未上报,插件状态仍显示“未安装”,等待35分钟,刷新即可。 10. 管理Agent ,查看Agent状态。 11. 登录天翼云物理机服务器,执行以下命令,查看Agent状态。 service telescoped status 当系统返回以下内容,则表示Agent为正常运行状态。 "Telescope process is running well." 启动Agent 执行以下命令,启动Agent。 /usr/local/telescope/telescoped start 重启Agent 执行以下命令,重启Agent。 /usr/local/telescope/telescoped restart 停止Agent 执行以下命令,停止Agent。 service telescoped stop 说明 如果Telescope安装失败,可能会导致无法正常停止Agent,可通过执行以下命令进一步尝试: /usr/local/telescope/telescoped stop 卸载Agent 用户可手动卸载Agent插件,卸载后将不再监控BMS实例监控数据。如需再次使用,请参考安装Agent重新安装。 执行以下命令,即可卸载Agent。 /usr/local/telescope/uninstall.sh 12. 查看监控指标 以上配置完成后,进入控制台界面,选择“管理与部署 > 云监控”,在左侧导航栏选择“主机监控 > 物理机”,列表展示该物理机的名称/ID、主机状态、插件状态等信息。