New Relic エージェントは、ユーザーへの影響に関するデータを自動的にキャプチャします。 エラー グループ別に整理すると、エラーの影響を受けるユーザーの数を確認できます。 これにより、影響を受けるユーザー数が最も多いエラーが表示されるため、デバッグ作業をどこに集中させるかを優先順位付けするのに役立ちます。
one.newrelic.com > APM & Services > Errors (Errors Inbox) > Triageに移動します。影響を受けるユーザーは、Error count [エラー数]とError rate [エラー率の]時系列の下にあるError groups [エラー グループ]テーブルの 2 番目の列で確認できます。
影響を受けるユーザーを追跡するためのカスタムアトリビュート
場合によっては、エラー イベントには、そのエラー イベントの影響を受けるエンドユーザーを識別するプロパティがない場合があります。 カスタムアトリビュートを手動で追加して、取り込み時にユーザーを識別するメタデータをエージェントがキャプチャできるようにすることができます。
カスタム アトリビュートを追加する必要がある場合は、エンド ユーザー プロパティの命名には複数の共通規則があるため、 OpenTelemetryのプロパティ規則を確認することをお勧めします。
たとえば、 OpenTelemetry 標準では、優先順位に従って次の属性が使用されます。
userId
user
New Relicカスタムイベントの収集 に関するドキュメントを読むことで、 カスタムアトリビュートをどのように処理するかを確認できます。
影響を受けたユーザーへの投稿
エラー グループの影響を受けるユーザーの数は、 newrelic.error.group.userImpact
という名前のメトリック データ型として記録されます。このメトリクスは、次の NRQL 文字列で使用できます。
SELECT uniqueCount(newrelic.error.group.userImpact) FROM Metric WHERE metricName='newrelic.error.group.userImpact'
このメトリクスは、選択した期間内のユニーク ユーザーのおおよその数を取得します。userImpact
メトリクスによって提供され、 FACET
句で使用できる追加の属性は、 error.group.guid
、 entity.guid
です。
影響を受けたユーザーの集計
NRQLアラート条件を作成することにより、開発者は、エラーの影響を受けるユーザーの数が閾値を超えたときに をトリガーできます。
このアラートを作成するには、ユースケースを最もよく捉える方法で影響を受けるユーザーの数を測定するNRQL クエリを決定する必要があります。
例として、次の NRQL クエリは、特定のエンティティからのエラー グループの影響を受けたユニーク ユーザーの数を測定します。
SELECT uniqueCount(newrelic.error.group.userImpact) FROM Metric WHERE metricName='newrelic.error.group.userImpact' AND entity.guid='RXxCUk9XU9182nNEFQUExJQ0FLsU9OfDgzNzgwNw' FACET error.group.guid TIMESERIES
uniqueCount()
関数の使用方法、エンティティのエンティティ GUID を検索する方法の詳細をご覧ください。
同様に、次の NRQL クエリは、過去 1 時間にアカウントのすべてのエンティティからのエラーの影響を受けたユーザーの総数を測定します。
SELECT count(newrelic.error.group.userImpact) FROM Metric WHERE metricName='newrelic.error.group.userImpact' SINCE 1 hour ago TIMESERIES
NRQL クエリを決定したら、それを使用してNRQL アラート条件を作成できます。
トリガーされたアラートの信号対ノイズ比を改善するには、 アラート作成のヒント、 アラートしきい値の評価方法、およびアラート条件の例を参照してください。
setUser メソッドで影響を受けるユーザーを設定する
エージェント メソッドを使用して、エンド ユーザーを識別できます。以下の各エージェントの実装の詳細を参照してください。