Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
wiki:linux:grafana_prometheus [2023/04/21 14:19] – DEROUET Valentin | wiki:linux:grafana_prometheus [2023/04/26 17:44] (Version actuelle) – DEROUET Valentin | ||
---|---|---|---|
Ligne 5: | Ligne 5: | ||
Dans cette documentation nous installerons une solution de supervision matérielle avec le couple Grafana/ | Dans cette documentation nous installerons une solution de supervision matérielle avec le couple Grafana/ | ||
- | Nous installerons aussi les agents sur les clients à surveiller.rant le | + | Nous installerons aussi les agents sur les clients à surveiller. |
Pour mieux s'y retrouver, cette documentation disposera de plusieurs screenshots illustrant les consignes. | Pour mieux s'y retrouver, cette documentation disposera de plusieurs screenshots illustrant les consignes. | ||
Ligne 31: | Ligne 31: | ||
2. **Les réseaux** : La supervision des réseaux permet de s' | 2. **Les réseaux** : La supervision des réseaux permet de s' | ||
- | 3. **Les bases de données** : Les bases de données sont souvent le cœur de l' | + | 3. **Les bases de données** : Les bases de données sont souvent le cœur de l' |
- | + | ||
- | Cette documentation est réalisée dans le cadre scolaired' | + | |
- | Pour mieux s'y retrouver cette documentation disposera de plusieurs screenshots illustrantir | + | |
4. **Les applications** : Les applications sont souvent les interfaces les plus visibles pour les utilisateurs finaux. La supervision des applications peut inclure la surveillance de leur temps de réponse, de leur disponibilité et de leur utilisation des ressources. | 4. **Les applications** : Les applications sont souvent les interfaces les plus visibles pour les utilisateurs finaux. La supervision des applications peut inclure la surveillance de leur temps de réponse, de leur disponibilité et de leur utilisation des ressources. | ||
- | 5. **Les périphériques** : Les périphériques tels que les imprimantes, | + | 5. **Les périphériques** : Les périphériques tels que les imprimantes, |
- | + | ||
- | ## Préambule | + | |
### Pourquoi le duo Grafana/ | ### Pourquoi le duo Grafana/ | ||
Ligne 145: | Ligne 140: | ||
``` | ``` | ||
- | tar -xvf prometheus-2.42.00.7.linux-amd64.tar.gz | + | tar -xvf prometheus-2.42.0.linux-amd64.tar.gz |
``` | ``` | ||
Ligne 151: | Ligne 146: | ||
``` | ``` | ||
- | mv prometheus-2.42.00.7.linux-amd64 / | + | mv prometheus-2.42.0.linux-amd64 / |
``` | ``` | ||
Ligne 469: | Ligne 464: | ||
``` | ``` | ||
- | - Ajouter le dépôt dans les sourcess | + | - Ajouter le dépôt dans les sources |
```bash | ```bash | ||
Ligne 522: | Ligne 517: | ||
### Accéder au serveur web | ### Accéder au serveur web | ||
- | {{ wiki: | + | {{ wiki: |
- | web écoute sur le port '' | + | |
+ | Le serveur | ||
Les identifiants par défault sont : '' | Les identifiants par défault sont : '' | ||
Le mot de passe sera à changer. | Le mot de passe sera à changer. | ||
- | #a | + | # Configuration de Grafana |
## Ajout de la data-source Prometheus | ## Ajout de la data-source Prometheus | ||
Ligne 621: | Ligne 617: | ||
*Réponse* : il faut un temps compris entre `1m et 20s + 1m + 1m`. La limite supérieure est probablement plus élevée que ce à quoi vous vous attendez lorsque vous fixez FOR 1m, mais elle est tout à fait logique dans l' | *Réponse* : il faut un temps compris entre `1m et 20s + 1m + 1m`. La limite supérieure est probablement plus élevée que ce à quoi vous vous attendez lorsque vous fixez FOR 1m, mais elle est tout à fait logique dans l' | ||
- | Le cycle de vie d'une alerte explique la raison d'un tel délai dans le pire.png?7600 |}} | + | Le cycle de vie d'une alerte explique la raison d'un tel délai dans le pire des cas. Le diagramme suivant montre la séquence des événements sur une ligne de temps : |
+ | |||
+ | {{ wiki: | ||
La charge d'un nœud change constamment, | La charge d'un nœud change constamment, | ||
Les règles d' | Les règles d' | ||
Lorsqu' | Lorsqu' | ||
- | Lors des cycles d' | + | Lors des cycles d' |
+ | |||
+ | ## Ajout des règles pour Prometheus | ||
Ligne 660: | Ligne 660: | ||
- Téléchargement des sources avec la commande '' | - Téléchargement des sources avec la commande '' | ||
+ | |||
+ | <WRAP center round tip 60%> | ||
+ | Vérifier la dernière version sur : [https:// | ||
+ | </ | ||
- Définir une variable provisoire pour le wget | - Définir une variable provisoire pour le wget | ||
``` | ``` | ||
- | VER=0.254.0 | + | VER=0.25.0 |
``` | ``` | ||
Ligne 799: | Ligne 803: | ||
``` | ``` | ||
- | #### Vous pouvez retrouver ici plusieurs modèles de règles pour prometheus : | + | #### Vous pouvez retrouver ici plusieurs modèles de règles pour prometheus : |
+ | |||
+ | [https:// | ||
Il suffit de copier coller les règles dans un fichier '' | Il suffit de copier coller les règles dans un fichier '' | ||
Ligne 835: | Ligne 841: | ||
- Via Discord (dans un channel) | - Via Discord (dans un channel) | ||
- | ### Trigger | + | ### Trigger |
- Ouvrir le fichier de configuration | - Ouvrir le fichier de configuration | ||
Ligne 845: | Ligne 851: | ||
*Fichier de configuration avec la fonctionnalité d' | *Fichier de configuration avec la fonctionnalité d' | ||
- | ```yamlbash | + | ```yaml |
global: | global: | ||
resolve_timeout: | resolve_timeout: | ||
Ligne 852: | Ligne 858: | ||
group_by: [' | group_by: [' | ||
group_wait: 10s | group_wait: 10s | ||
- | group_interval: | + | group_interval: |
repeat_interval: | repeat_interval: | ||
routes: | routes: | ||
Ligne 859: | Ligne 865: | ||
severity: critical|warning #match le label critical ou warning | severity: critical|warning #match le label critical ou warning | ||
continue: true #continuer d' | continue: true #continuer d' | ||
- | 24h | + | |
- | receiver: ' | + | |
receivers: | receivers: | ||
- name: ' | - name: ' | ||
email_configs: | email_configs: | ||
- to: ' | - to: ' | ||
+ | hello: ' | ||
+ | # important de préciser le parametre hello, lors de la commande EHLO il faut un FQDN | ||
from: ' | from: ' | ||
- | smarthost: 10.192.44.11: | + | smarthost: 10.192.44.11: |
auth_username: | auth_username: | ||
auth_identity: | auth_identity: | ||
Ligne 1511: | Ligne 1518: | ||
## Ajout de l' | ## Ajout de l' | ||
- | Dans le fichier ''/ | + | Dans le fichier ''/ |
- | + | ||
- | <WRAP center round info 60%> | + | |
- | Aide pour la création du fichier de configuration : [prometheus.io/ | + | |
- | </ | + | |
- | + | ||
- | - Vérifier le fichier de configuration | + | |
- | + | ||
- | ``` | + | |
- | amtool check-config / | + | |
```yaml | ```yaml | ||
Ligne 2044: | Ligne 2042: | ||
{{ wiki: | {{ wiki: | ||
- | Retrouvez la doc de GO ici : [ | + | Retrouvez la doc de GO ici : [https:// |
- | + | ||
- | - Redémarrer le service | + | |
- | + | ||
- | ``` | + | |
- | systemctl restart alertmanager | + | |
- | ``` | + | |
- | + | ||
- | {{ wiki: | + | |
- | + | ||
- | ## Vérifier le serveur d' | + | |
- | + | ||
- | Un serveur web écoute sur le port '' | + | |
- | ```https:// | + | |
*Version actuelle de GO : **1.20.2*** | *Version actuelle de GO : **1.20.2*** | ||
Ligne 2348: | Ligne 2333: | ||
Il existe plein d' | Il existe plein d' | ||
- | [https:// | + | [https:// |
- | + | ||
- | {{ wiki: | + | |
- | + | ||
- | # Conclusion | + | |
Tous les objectifs que nous voulions pour notre solution de monitoring ont été atteints. | Tous les objectifs que nous voulions pour notre solution de monitoring ont été atteints. | ||
Ligne 2411: | Ligne 2392: | ||
2. [https:// | 2. [https:// | ||
- | ### Prometheus | + | ### Prometheus |
- | - ajouter pve_exporter | + | |
- | - ajouter la conf dans grafana de alertmanager de prometheus | + | |
- | ## doc blackbox | + | 1. [https:// |
- | + | 2. [https:// | |
- | 1. | + | 3. [https:// |
- | https:// | + | |
- | 2. | + | |
- | https:// | + | |
- | 3. | + | |
- | https:// | + | |
4. [https:// | 4. [https:// | ||
Ligne 2431: | Ligne 2405: | ||
### Prometheus SNMP | ### Prometheus SNMP | ||
- | 1. | + | 1. [https:// |
- | ## doc snmp prometheus | + | 2. [https:// |
- | + | 3. [https:// | |
- | https:// | + | 4. [https:// |
- | 2. https:// | + | 5. [https:// |
- | 3. https:// | + | 6. [https:// |
- | 4. https:// | + | 7. [https:// |
- | 5. | + | 8. [https:// |
- | https:// | + | 9. [https:// |
- | 6. https:// | + | 10. [https:// |
- | 7. https:// | + | 11. [https:// |
- | 8. https:// | + | |
- | 9. https:// | + | |
- | 10. https:// | + | |
- | 11. https:// | + | |
### Pour aller plus loin... | ### Pour aller plus loin... | ||
- | - agent prometheus pour mesurer la débit du lien Internet | + | - Agent prometheus pour mesurer la débit du lien Internet |
- | 1. | + | 1. |
- | https:// | + | |
- | - exctinction automoatiquqe | + | - Extinction automatique |
- | 1. https:// | + | 1. [https:// |
- | 2. https:// | + | 2. [https:// |