当社の Apache Hadoop インテグレーションは、Hadoop クラスタとアプリケーションのパフォーマンスを監視します。 インテグレーションは、HDFS (Hadoop 分散ファイル システム)、ブロック、システム負荷、データ ノード、NodeManager、ジョブに関するデータを提供することで、Apache Hadoop のパフォーマンスと健全性を詳細に把握できるようにします。
Apache Hadoop をセットアップすると、Apache Hadoop メトリクスのダッシュボードが提供されます。
インテグレーションをインストールするには、次の手順を実行します。
インフラストラクチャエージェントをインストールします
Apache Hadoop インテグレーションを使用するには、まず同じホストにインフラストラクチャエージェントをインストールする必要があります。 インフラストラクチャエージェントはホスト自体を監視しますが、次の手順でインストールするインテグレーションは Hadoop 固有のデータを使用して監視を拡張します。
Apache Hadoop 用に NRI-Flex を構成する
当社の flex インテグレーションはNew Relic Infrastructureエージェントにバンドルされており、Apache Hadoop データをNew Relicに送信するために使用されます。 flex 設定ファイルを作成するには、次の手順に従います。
/etc/newrelic-infra/integrations.d
パスにnri-flex-hadoop-config.yml
という名前のファイルを作成します。構成テンプレート を使用して、作成された
nri-flex-hadoop-config.yml
という名前のファイル内のフィールドEVENT_TYPE
とYOUR_DOMAIN
を更新します。event_type
の値は、NRDB にメトリクスを保存するために使用されます。例:
EVENT_TYPE1
に更新できますHadoopResourceManagerSample
EVENT_TYPE2
に更新できますHadoopNameNodeSample
nri-flex-hadoop-config.yml
ファイルは次のようになります。integrations:- name: nri-flex# interval: 30sconfig:name: hadoopMetricsapis:- event_type: EVENT_TYPE1commands:# run any command, you could cat .json file, or run some commands that produce a json output# the example just calls an API that returns json- run: curl -s https://YOUR_DOMAIN:9870/jmx #json output is retrieved from this command- event_type: EVENT_TYPE2commands:- run: curl -s https://YOUR_DOMAIN:8088/jmx?qry=Hadoop:*
Apache Hadoop ログを New Relic に転送する
ログ転送を 使用して、Apache Hadoop ログを New Relic に転送できます。
logging.yml
という名前のログファイルを作成します/etc/newrelic-infra/logging.d/
ログ ファイルを作成した後、次のスクリプトを
logging.yml
ファイルに追加します。logs:- name: hadoop_secondarynamenode_logfile: /usr/local/hadoop/logs/hadoop-hadoopuser-secondarynamenode-hadoop-master.logattributes:logtype: hadoop_secondarynamenode_logs- name: hadoop_resourcemanager_logfile: /usr/local/hadoop/logs/hadoop-hadoopuser-resourcemanager-hadoop-master.logattributes:logtype: hadoop_hadoop_resourcemanager_logs- name: hadoop_namenode_logfile: /usr/local/hadoop/logs/hadoop-hadoopuser-namenode-hadoop-master.logattributes:logtype: hadoop_namenode_logs
New Relic インフラストラクチャ エージェントを再起動します
データの使用を開始する前に、 インフラストラクチャ エージェントを再起動します。
次のコマンドはほとんどのシステムで動作するはずです:
$sudo systemctl restart newrelic-infra.service
データを検索する
Apache Hadoop
という名前の事前に構築されたダッシュボード テンプレートを選択して、Apache Hadoop サーバーのメトリクスを監視できます。事前に構築されたダッシュボード テンプレートを使用するには、次の手順に従います。
+ Integrations & Agents
ページに移動します。
Dashboards
をクリックします。
検索バーに
apache hadoop
と入力します。Apache Hadoop ダッシュボードが表示されます。それをクリックしてインストールします。
Apache Hadoop ダッシュボードはカスタムダッシュボードとみなされ、Dashboards UIで確認できます。 ダッシュボードの使用と編集に関するドキュメントについては、ダッシュボードのドキュメントをご覧ください。
以下は、リソース マネージャーからアクティブ ユーザーを確認するための NRQL クエリです。
SELECT latest(activeUsers)FROM HadoopResourceManagerSample以下は、ネーム ノードからアクティブなクライアントの数を表示する NRQL クエリです。
SELECT latest(numActiveClients)FROM HadoopNameNodeSample
次は何ですか?
NRQL クエリの作成とダッシュボードの生成の詳細については、次のドキュメントをご覧ください。
- 基本的なクエリと高度なクエリを作成するためのクエリ ビルダーの概要。
- ダッシュボードをカスタマイズしてさまざまなアクションを実行するためのダッシュボードの概要。
- ダッシュボードを管理して、ダッシュボードの表示モードを調整したり、ダッシュボードにコンテンツを追加したりします。