调用监控 调用监控支持查看在线推理预置服务、我的服务在指定时间段内的调用数据和监控指标详情,包括调用总量、调用失败量、调用总tokens等指标,并支持按日、按时、按分钟粒度展示数据,帮助了解服务的使用情况和性能变化。 支持查看在线推理预置服务、专属服务、我的服务以及批量推理在指定时间段内的调用数据和监控指标详情,并支持按日、按时、按分钟粒度展示数据,帮助了解服务的使用情况和性能变化。 前提条件 在线推理的我的服务和批量推理产生调用记录后才可查看调用监控数据。 账号权限说明 主账号可查看其名下所有子账号分别的调用监控数据,且支持导出所有子账号的所选服务的监控数据。 查看服务调用的监控数据 1. 登录模型推理服务。 2. 在左侧导航栏选择“调用监控”。 3. 选择目标服务名称,点击“调用监控”,进入该模型的调用数据详情页,可以查看具体的模型在特定服务组、特定服务中的调用监控情况。 1. 点击“调用失败明细”,可以查看调用失败的次数、占比、错误信息等数据。 2. 点击“导出”,可以直接导出调用总览或调用失败明细数据到本地。 4. 选择目标专属服务,点击“资源监控”,进入可查看专属服务资源的监控信息,包含GPU/NPU利用率、显存利用率、 表1 调用监控详情页筛选项说明 筛选项 说明 主/子用户 筛选子账号。 仅名下存在子账号的主账号可见。 服务名称 支持选择在线推理的预置服务和我的服务。 服务组 选择查看全部服务组或具体的服务组名称。 时间精度 支持选择按日、按时、按分钟。 时间范围 自定义选择时间范围。 当时间精度选择按日时,范围最大支持31天;当时间精度选择按时时,范围最大支持7天;当时间精度选择按分钟时,范围最大支持1天。