▼
Scroll to page 2
of
234
Bull AIX 4.3 Guide de résolution des incidents et références AIX 86 F2 32JX 02 Bull AIX 4.3 Guide de résolution des incidents et références AIX Logiciel Novembre 1999 BULL ELECTRONICS ANGERS CEDOC 34 Rue du Nid de Pie – BP 428 49004 ANGERS CEDEX 01 FRANCE 86 F2 32JX 02 The following copyright notice protects this book under the Copyright laws of the United States and other countries which prohibit such actions as, but not limited to, copying, distributing, modifying, and making derivative works. Copyright Bull S.A. 1992, 1999 Imprimé en France Vos suggestions sur la forme et le fond de ce manuel seront les bienvenues. Une feuille destinée à recevoir vos remarques se trouve à la fin de ce document. Pour commander d’autres exemplaires de ce manuel ou d’autres publications techniques Bull, veuillez utiliser le bon de commande également fourni en fin de manuel. Marques déposées Toutes les marques déposées sont la propriété de leurs titulaires respectifs. AIXR est une marque déposée d’IBM Corp. et est utilisée sous licence. UNIX est une marque déposée licenciée exclusivement par X/Open Company Ltd. An 2000 Le produit décrit dans ce manuel est en conformité avec les impératifs de l’an 2000. La loi du 11 mars 1957, complétée par la loi du 3 juillet 1985, interdit les copies ou reproductions destinées à une utilisation collective. Toute représentation ou reproduction intégrale ou partielle faite par quelque procédé que ce soit, sans consentement de l’auteur ou de ses ayants cause, est illicite et constitue une contrefaçon sanctionnée par les articles 425 et suivants du code pénal. Ce document est fourni à titre d’information seulement. Il n’engage pas la responsabilité de Bull S.A. en cas de dommage résultant de son application. Des corrections ou modifications du contenu de ce document peuvent intervenir sans préavis ; des mises à jour ultérieures les signaleront éventuellement aux destinataires. Table des matières A propos de ce manuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mode d’emploi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Structure du manuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conventions typographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ISO 9000 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commande de manuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix ix ix x x x xi Chapitre 1. Résolution des incidents - Présentation . . . . . . . . . . . . . . . . . . . . . . . Bibliothèque : contenu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Index des symptômes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Module Aides au service . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Voir aussi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rapport d’incident . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Renseignements généraux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Description de l’incident . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Données enregistrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1-1 1-2 1-3 1-5 1-5 1-6 1-6 1-6 1-6 Chapitre 2. Système inactif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification du matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mise sous tension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification de l’afficheur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Activation du moniteur ou du terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification des processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relance du défilement ligne par ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Combinaison de touches Ctrl-D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Combinaison de touches Ctrl-C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Connexion depuis un terminal ou un hôte distant . . . . . . . . . . . . . . . . . . . . . . . . . . Arrêt à distance d’un processus bloqué . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relance du système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification de la position du sélecteur de mode . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification de l’unité d’amorçage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chargement du système d’exploitation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2-1 2-2 2-2 2-2 2-2 2-3 2-3 2-3 2-3 2-4 2-4 2-5 2-5 2-5 2-6 Chapitre 3. Incidents liés au terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Libération d’un terminal saturé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réponse aux messages écran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3-1 3-2 3-3 Chapitre 4. Défaillance de l’horloge système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Test de la pile système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réinitialisation de l’horloge système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commande date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commande setclock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4-1 4-2 4-3 4-3 4-4 Table des matières iii iv Chapitre 5. Incidents liés aux unités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification des composants matériels des unités . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification des connexions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification de l’état Prêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lancement des diagnostics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification du logiciel des unités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Contrôle du journal des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liste exhaustive des unités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Contrôle de l’état d’une unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Contrôle des attributs d’une unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modification des attributs d’une unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Utilisation d’une unité avec une autre application . . . . . . . . . . . . . . . . . . . . . . . . . . Configuration d’une nouvelle unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5-1 5-2 5-2 5-2 5-2 5-3 5-3 5-3 5-3 5-3 5-4 5-4 5-4 Chapitre 6. Incidents liés aux supports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recherche des erreurs liées aux supports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lecture d’un support . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ecriture sur les supports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Restauration des données d’une disquette endommagée . . . . . . . . . . . . . . . . . . . . . Voir aussi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6-1 6-2 6-2 6-3 6-4 6-5 Chapitre 7. Incidents liés au réseau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incidents logiciels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conversion du nom d’hôte en adresse IP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recherche du fichier /etc/resolv.conf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mise à jour du fichier /etc/resolv.conf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recherche d’une interface manquante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Activation du démon inetd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Débogage du démon inetd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Débogage du démon telnetd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incidents matériels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incidents liés à la carte de communication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incidents logiciels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Incidents matériels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7-1 7-2 7-2 7-2 7-3 7-3 7-4 7-5 7-6 7-7 7-8 7-8 7-9 Chapitre 8. Incidents liés à l’impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réactivation du démon de file d’attente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nettoyage du système de files d’attente d’impression . . . . . . . . . . . . . . . . . . . . . . . . . Réaffectation des ressources de l’imprimante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Suppression des fichiers inutiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Voir aussi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8-1 8-2 8-3 8-5 8-6 8-7 Chapitre 9. Diagnostics du matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sélection et chargement des diagnostics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Choix des options de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réponse aux messages de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Choix d’un test spécifique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identification du matériel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identification de l’écran de la console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identification du clavier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interprétation des codes de l’afficheur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réponse aux codes 260, 261 et 262 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Informations sur la configuration du système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commande lscfg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commande snap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9-1 9-2 9-9 9-9 9-9 9-11 9-11 9-11 9-12 9-15 9-16 9-16 9-16 Guide de résolution des incidents et références Diagnostics périodiques et analyse automatique du journal des erreurs . . . . . . . . . Diagnostics périodiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse automatique du journal des erreurs (diagela) . . . . . . . . . . . . . . . . . . . . . . 9-17 9-17 9-17 Chapitre 10. Journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Journalisation des erreurs - Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gestion de la journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transfert du journal des erreurs sur un autre système . . . . . . . . . . . . . . . . . . . . . . Configuration du journal des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Suppression d’entrées du journal des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Activation et désactivation de la journalisation pour un incident . . . . . . . . . . . . . . Configuration de la notification d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Journalisation des activités de maintenance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tâches de journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lecture d’un rapport d’erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemples de rapports détaillés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemple de rapport abrégé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Création d’un rapport d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Arrêt de la journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Suppression d’entrées du journal des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Copie du journal des erreurs sur disquette ou sur bande . . . . . . . . . . . . . . . . . . . . Journalisation des erreurs et messages d’alerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commandes de journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commandes de journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sous-routines de journalisation et services de noyau . . . . . . . . . . . . . . . . . . . . . . . Fichiers de journalisation des erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Voir aussi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10-1 10-3 10-4 10-4 10-4 10-5 10-6 10-6 10-6 10-8 10-8 10-10 10-15 10-15 10-16 10-16 10-17 10-18 10-19 10-19 10-20 10-20 10-20 Chapitre 11. Utilitaire de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lancement de l’utilitaire de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Configuration de la commande trace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Enregistrement de données de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Canaux de suivi génériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lancement de la fonction de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Arrêt de la fonction de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Création de rapport de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commandes de l’utilitaire de suivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Commandes et sous-commandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Appels et sous-routines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fichiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11-1 11-2 11-2 11-4 11-4 11-4 11-5 11-5 11-6 11-6 11-6 11-7 Chapitre 12. Cliché système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Configuration d’une unité de cliché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lancement d’un cliché système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Via la ligne de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Via SMIT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bouton de restauration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Combinaison de touches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vérification de l’état d’un cliché système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Codes d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Copie d’un cliché système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Copie d’un cliché système sur un poste sans données . . . . . . . . . . . . . . . . . . . . . Copie d’un cliché système sur un poste avec données . . . . . . . . . . . . . . . . . . . . . Augmentation de la taille d’une unité de cliché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Détermination de la taille de l’unité de cliché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Détermination du type de volume logique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Augmentation de la taille de l’unité de cliché . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12-1 12-2 12-3 12-3 12-4 12-4 12-5 12-6 12-6 12-8 12-8 12-9 12-11 12-11 12-11 12-11 Table des matières v vi Chapitre 13. Réamorçage à distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . reboot_enable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . reboot_string . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13-1 13-1 13-1 Annexe A. Acronymes des messages d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . A-1 Annexe B. Validation du logiciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B-1 Annexe C. Identificateurs d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Carte parallèle 370 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ATE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . BADISK (disque connecté au bus) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C327 (carte de connexion 3270) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CHRP (journal RTAS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . COM (unité TTY) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CXMA (carte 128 ports) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CD-ROM, DISK et R/W OPTICAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . DISKETTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ENT Error (Ethernet) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . EPOW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ERRLOG (démon error) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . EU (unité d’extension asynchrone) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anomalies/interruptions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sous-système graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . HCON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identificateurs d’erreurs IDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IENT (Ethernet intégré) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . LION (concentrateurs 64 ports) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . LVM (gestionnaire de volume logique) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . MACHINE CHECK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . MEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . MPQP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . MSLA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . NETBIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . PSLA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . RECOV ECC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . RS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SCSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SLA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TAPE (bande) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TMSCSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TOK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TTY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VCA (carte de commande vocale) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . X25 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Identificateurs d’erreurs diverses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C-1 C-2 C-3 C-4 C-5 C-6 C-8 C-11 C-13 C-15 C-16 C-18 C-19 C-20 C-21 C-29 C-43 C-45 C-46 C-48 C-49 C-52 C-53 C-54 C-57 C-58 C-62 C-63 C-64 C-65 C-67 C-68 C-70 C-72 C-74 C-75 C-79 C-80 C-82 C-87 Guide de résolution des incidents et références Annexe D. Récupération de groupes de volumes . . . . . . . . . . . . . . . . . . . . . . . . . Réinitialisation du groupe de volumes rootvg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réinitialisation d’un groupe de volumes défini par l’utilisateur . . . . . . . . . . . . . . . . . . Restauration de la version originale du gestionnaire d’objets ODM . . . . . . . . . . . . . D-1 D-2 D-3 D-4 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . X-1 Table des matières vii viii Guide de résolution des incidents et références A propos de ce manuel AIX - Guide de résolution des incidents et références donne des informations permettant d’identifier et de résoudre les incidents relatifs au système d’exploitation, aux éléments logiciels ou matériels, ou aux programmes installés sur le système. Avant d’appeler le service de maintenance, suivez les procédures expliquées au chapitre 1, ’Résolution des incidents - Présentation’. Mode d’emploi Remarque : Avant d’essayer de résoudre les anomalies, faites une copie du rapport d’incident qui se trouve au chapitre 1 afin d’y noter les renseignements relatifs aux incidents. Si votre unité centrale affiche un code à trois positions ou un message, reportezvous directement à AIX - Guide des messages pour plus d’informations sur le message et les procédures à suivre. Ce guide a pour but de vous aider à trouver les instructions et les outils requis pour résoudre les incidents en fonction de vos besoins et de vos connaissances. Le chapitre 1 contient des renseignements préalables indispensables, comme l’index des symptômes et le rapport d’incident. Les chapitres 2 à 8 proposent des procédures de dépannage pour des incidents particuliers. Les chapitres 9 à 12, qui fournissent des outils permettant d’étudier les incidents système, nécessitent quelques connaissances en programmation. Structure du manuel Analyse guidée des incidents • Chapitre 1, ’Résolution des incidents - Présentation’ : point de départ de l’identification des incidents. L’Index des symptômes vous permet de trouver le symptôme général relatif à l’incident en cause et vous renvoie à celui des chapitres suivants où est décrite la procédure pour y remédier. Vous trouverez également dans ce chapitre les instructions d’installation des Aides au service. • Chapitre 2, ’Système inactif’ : vérification du matériel et des processus en cours et relance du système une fois localisée la zone où intervenir. • Chapitre 3, ’Incidents liés au terminal’ : description de la façon de libérer un terminal saturé de processus et réponses aux messages écran. • Chapitre 4, ’Défaillance de l’horloge système’ : test de la pile système ou utilisation des commandes date et setclock pour réinitialiser l’horloge système. • Chapitre 5, ’Incidents liés aux unités’ : vérification des éléments matériels et logiciels susceptibles d’affecter les performances des unités. • Chapitre 6, ’Incidents liés aux supports’ : vérification des erreurs liées aux supports et récupération des données d’une disquette endommagée. • Chapitre 7, ’Incidents liés au réseau’ : résolution des incidents du réseau par le biais de diagnostics opérés sur le matériel, le logiciel et les cartes de communication. • Chapitre 8, ’Incidents liés à l’impression’ : réactivation du démon de files d’attente, suppression d’une file d’attente d’impression, réaffectation des ressources d’impression et suppression des fichiers inutiles dans le répertoire de l’imprimante. A propos de ce manuel ix Outils de résolution des incidents • Chapitre 9, ’Diagnostics matériels’ : chargement d’un programme de diagnostic système, choix d’une option de test et communication d’un numéro de demande d’intervention (code SRN). Inclut des renseignements permettant d’identifier le matériel, d’interpréter les codes de l’afficheur et de collecter des informations sur la configuration du système. • Chapitre 10, ’Journalisation des erreurs’ : utilisation de la fonction de journalisation des erreurs pour enregistrer les incidents matériels et logiciels et obtenir les messages renseignant sur l’exploitation du système. Vous trouverez également dans ce chapitre des informations relatives au journal des erreurs, aux alertes et programmes utilisés pour l’analyse automatique du journal des erreurs. • Chapitre 11, ’Utilitaire de suivi’ : utilisation de l’utilitaire de suivi pour identifier les incidents grâce au contrôle des événements du système. • Chapitre 12, ’Cliché système’ : description de la fonction de cliché système, configuration d’une unité de cliché, lancement et copie d’un cliché système, retour aux opérations normales. • Chapitre 13, ’Fonction de réamorçage à distance’ : description de la fonction de réamorçage à distance et du réamorçage du système depuis un port série natif (intégré). Renseignements de référence • Annexe A, ’Acronymes des messages d’erreur’ : signification des acronymes utilisés dans le manuel. • Annexe B, ’Validation du logiciel’ : vérification de l’état d’un logiciel installé (ou de tout autre produit sous licence). • Annexe C, ’Identificateurs d’erreur’ : liste des entrées du journal des erreurs par étiquette d’erreur. • Annexe D, ’Récupération de groupes de volume’ : récupération des groupes de volumes altérés. Conventions typographiques Voici les conventions typographiques adoptées dans ce manuel : Gras Commandes, mots-clés, fichiers, répertoires et autres éléments dont le nom est prédéfini par le système. Italique Paramètres dont le nom ou la valeur doit être fournie par l’utilisateur. Espacement fixe Exemples (de valeurs spécifiques, de texte affiché, de code programme), messages système, titres et options de menu, lignes de commandes, etc. ISO 9000 Ce produit répond aux normes qualité ISO 9000. Bibliographie Vous trouverez d’autres renseignements sur la résolution des incidents dans les manuels suivants : • AIX - Bibliographie, CEDOC 86 F2 71WE. • Le guide opérateur de votre système comprend les procédures de détermination des incidents, de vérification du système et d’utilisation des diagnostics. • AIX - Guide des messages, CEDOC 86 F2 33JX. • AIX 4.3 Guide d’administration : système d’exploitation et unités, CEDOC 86 F2 99HX. x Guide de résolution des incidents et références • AIX 4.3 Guide d’administration : communications et réseaux, CEDOC 86 F2 31JX. • AIX - Guide d’optimisation, CEDOC 86 F2 72AP. • Performance Toolbox 1.2 and 2.1 for AIX: User’s Guide, CEDOC 86 A2 10AQ. • AIX General Programming Concepts : Writing and Debugging Programs, CEDOC 86 A2 34JX. • Common Diagnostics Information Manual for MCA Systems, CEDOC 86 A2 75AT. • AIX Communications Programming Concepts, CEDOC 86 A2 35JX • AIX Guide des imprimantes et de l’impression, CEDOC 86 F2 37JX • AIX Commands Reference, CEDOC 86 A2 38JX à 86 A2 43JX • AIX Kernel Extensions and Device Support Programming Concepts, CEDOC 86 A2 36JX • 3270 Information Display System: 3274 Control Unit Description and Programmer’s Guide Commande de manuels Adressez-vous à votre représentant ou à votre point de vente. Pour commander d’autres exemplaires de ce manuel, rappelez la référence CEDOC 86 F2 32JX. A propos de ce manuel xi xii Guide de résolution des incidents et références Chapitre 1. Résolution des incidents - Présentation Ce chapitre vous dirige sur les informations relatives à la résolution aux incidents spécifiques du système. Avant d’entamer une procédure de résolution d’incident, reportez-vous aux sections suivantes : • Bibliothèque : contenu, page 1-2 • Index des symptômes, page 1-3 • Aides au service, page 1-5 • Rapport d’incident, page 1-6 Résolution des incidents - Présentation 1-1 Bibliothèque : contenu Ce document traite de nombreux incidents système ; cependant, il ne se substitue pas aux procédures décrites dans d’autres ouvrages de référence. Comme autres documents relatifs à la résolution des incidents, vous trouverez : Guide de résolution des indidents Guide des messages Guide d’optimisation SMG - Exploitation du système et des unités SMG - Communications et réseaux Performance Toolbox Résolution des incidents - Généralités • AIX - Guide des messages ouvrage de référence permettant de remettre le système en route après incident, d’après les messages (de sept caractères) et les codes d’erreur (de trois chiffres) affichés sur le panneau de commande. • AIX 4.3 Guide d’administration : système d’exploitation et unités décrit la résolution des incidents relatifs aux volumes logiques, aux systèmes de fichiers, à la comptabilité du système, à l’impression et aux incidents d’ordre général survenant sur les unités. • AIX 4.3 Guide d’administration : communications et réseaux décrit la résolution des incidents d’ordre général, relatifs aux communications et aux réseaux. • AIX - Guide d’optimisation présente les concepts et les techniques inhérents aux performances des systèmes AIX. • Performance Toolbox 1.2 and 2.1 for AIX: User’s Guide décrit l’interface graphique de nombreux outils de contrôle et d’optimisation. Avant d’entamer une procédure, reportez-vous à l’Index des symptômes pour déterminer la source d’information la mieux adaptée à l’incident survenu sur votre système. 1-2 Guide de résolution des incidents et références Index des symptômes En matière de résolution d’incident, consultez toujours l’index des symptômes en premier. A la rubrique 3 du Rapport d’incident, reportez le symptôme se rapprochant le plus de l’incident rencontré, puis suivez les procédures indiquées. Code d’erreur formé de 7 caractères avec un texte de message Reportez-vous au document AIX - Guide des messages. Code de 3 chiffres (affiché sur le panneau de commande) Reportez-vous au document AIX - Guide des messages. Système inactif Reportez-vous à Vérification du matériel, page 2-2 Reportez-vous à Vérification des processus, page 2-3 Reportez-vous à Relance du système, page 2-5 Incidents liés au terminal Reportez-vous à Libération d’un terminal saturé, page 3-2 Reportez-vous à Réponse aux messages écran, page 3-3 Défaillance de l’horloge système Reportez-vous à Contrôle de la pile système, page 4-2 Reportez-vous à Réinitialisation de l’horloge système, page 4-3 Incidents liés aux unités Reportez-vous à Vérification du matériel, page 5-2 Reportez-vous à Vérification du logiciel, page 5-3 Incidents liés aux supports Reportez-vous à Recherche des erreurs de support, page 6-2 Reportez-vous à Restauration des données d’une disquette endommagée, page 6-4 Incidents liés au réseau Reportez-vous à Résolution des incidents logiciels, page 7-2 Reportez-vous à Résolution des incidents matériels, page 7-7 Reportez-vous à Résolution des incidents liés aux cartes de communication, page 7-8 Incidents liés à l’impression Reportez-vous à Réactivation du démon de file d’attente, page 8-2 Reportez-vous à Nettoyage du système de files d’attente d’impression, page 8-3 Reportez-vous à Réaffectation des ressources de l’imprimante, page 8-5 Reportez-vous à Suppression des fichiers inutiles, page 8-6 Diagnostics du matériel Reportez-vous à Sélection et chargement des diagnostics, page 9-4 Reportez-vous à Identification du matériel, page 9-11 Reportez-vous à Interprétation des codes de l’afficheur, page 9-12 Reportez-vous à Informations sur la configuration du système, page 9-16 Résolution des incidents - Présentation 1-3 1-4 Recherche ou génération d’un rapport d’après le journal des erreurs Reportez-vous à Journalisation des erreurs, page 10-1 Génération d’un historique Reportez-vous à Utilitaire ‘Trace’, page 11-1 Extraction d’un cliché système Reportez-vous à Fonction de cliché système, page 12-1 Guide de résolution des incidents et références Module Aides au service Sous AIX version 4, quelques commandes de journalisation des erreurs et de cliché sont livrées dans un module en option : bos.sysmgt.serv_aid. Le système de base (bos.rte) inclut les services dédiés à la journalisation des erreurs dans le fichier journal : le sous-programme errlog, les services noyau errsave et errlast, le pilote (/dev/error), le démon d’erreur et la commande errstop. Les commandes nécessaires à l’installation de programmes sous licence (errinstall et errupdate) figurent également dans bos.rte. La commande sysdumpstart fait partie des commandes de cliché système de bos.sysmgt.serv_aid. Pour savoir si ce module est installé, entrez : lslpp –l | grep bos.sysmgt.serv_aid Si oui, la ligne suivante s’affiche : bos.sysmgt.serv_aid Sinon, installez-le via SMIT (System Management Interface Tool). Si SMIT n’est pas installé, utilisez la commande installp. installp –xad <installation device> bos.sysmgt.serv_aid Voir aussi Les commandes errclear, errdead, errlogger, errmsg et errpt font partie du module en option Aides au service (bos.sysmgt.serv_aid) requis pour générer des rapports ou supprimer des entrées du journal des erreurs. Pour plus d’informations, reportez-vous à ”Transfert du journal des erreurs sur un autre système”, page 10-4. Résolution des incidents - Présentation 1-5 Rapport d’incident Renseignements généraux 1. Date et heure _______________________________ 2. Date et heure système (si disponibles) ______________________ 3. Symptôme ________________________________________ 4. Code SRN (numéro de demande d’intervention) ou codes d’erreur ___________________________________________________________ 5. Codes de trois chiffres (si disponibles) __ __ __ – __ __ __ – __ __ __ –__ __ __ 6. Codes d’emplacement • Premier code FRU__ __–__ __–__ __–__ __ • Second code FRU__ __–__ __–__ __–__ __ • Troisième code FRU__ __–__ __–__ __–__ __ • Quatrième code FRU__ __–__ __–__ __–__ __ Description de l’incident Données enregistrées Description des données d’erreurs enregistrées (clichés système, clichés de processus, ID d’erreur, journaux d’erreurs et messages) qui doivent être examinées par le service de maintenance. (Après avoir complété ce formulaire, faites-en une copie et gardez-la à portée de main afin d’y noter d’autres références.) 1-6 Guide de résolution des incidents et références Chapitre 2. Système inactif Un problème matériel et/ou logiciel peut être responsable de l’inactivité de votre système. Les procédures qui suivent vous guident pour résoudre ces problèmes et relancer votre système. Si le problème persiste, reportez-vous à la procédure de détermination des incidents matériels décrite dans le guide opérateur de votre système. Procédures à suivre : • Vérification du matériel, page 2-2 • Vérification des processus, page 2-3 • Relance du système, page 2-5 Si le problème persiste, reportez-vous à ”Accès à un système non amorçable” dans AIX - Guide des messages. Système inactif 2-1 Vérification du matériel Procédures à suivre : • Mise sous tension, page 2-2 • Vérification de l’afficheur, page 2-2 • Activation du moniteur ou du terminal, page 2-2 Mise sous tension Le témoin de tension s’allume-t-il ? Oui Passez à la question suivante. Non Vérifiez que le système est branché et sous tension. Si le problème persiste, reportez-vous à ”Diagnostics matériels”, page 9-1. Vérification de l’afficheur L’afficheur est-il vide ? Oui Passez à la question suivante. Non Reportez-vous au manuel AIX - Guide des messages pour plus d’informations sur l’afficheur. Activation du moniteur ou du terminal Vérifiez : • Le branchement du câble entre l’écran et l’unité centrale. • Le branchement du câble du clavier. • Le branchement du câble de la souris. • La mise sous tension de l’écran (témoin allumé). • La luminosité de l’affichage. • Les paramètres de communication du terminal. Le système est-il actif ? Oui Les différentes vérifications matérielles ont permis de résoudre l’incident. Non Le système est-il devenu inactif alors que vous tentiez de le relancer ? 2-2 Oui Passez à ”Relance du système”, page 2-5. Non Passez à ”Vérification des processus”, page 2-3. Guide de résolution des incidents et références Vérification des processus Un processus arrêté ou bloqué peut rendre votre système inactif. Les procédures suivantes permettent de vérifier les processus : • Relance du défilement ligne par ligne, page 2-3 • Combinaison de touches Ctrl-D, page 2-3 • Combinaison de touches Ctrl-C, page 2-3 • Connexion depuis un terminal ou un hôte distant, page 2-4 • Arrêt à distance d’un processus bloqué, page 2-4 Relance du défilement ligne par ligne Pour relancer le défilement ligne par ligne arrêté par Ctrl-S : 1. Activez la fenêtre ou le shell concerné par l’incident. 2. Appuyez sur Ctrl-Q pour relancer le défilement. Appuyer sur Ctrl-S stoppe le défilement ; appuyer sur Ctrl-Q le relance. Le système est-il actif ? Oui La vérification a permis de résoudre l’incident. Non Passez à ”Combinaison de touches Ctrl-D”, page 2-3. Combinaison de touches Ctrl-D Pour débloquer un processus arrêté : 1. Activez la fenêtre ou le shell concerné par l’incident. 2. Appuyez sur Ctrl-D. Cette combinaison envoie un code EOF (fin de fichier) au processus. Il est possible que la fenêtre ou le shell soit fermé et que vous soyez déconnecté du système. Le système est-il actif ? Oui L’incident est résolu. Non Passez à ”Combinaison de touches Ctrl-C”, page 2-3. Combinaison de touches Ctrl-C Pour débloquer un processus arrêté : 1. Activez la fenêtre ou le shell concerné par l’incident. 2. Appuyez sur Ctrl-C. Cette combinaison de touches arrête la recherche en cours ou le filtre. Le système est-il actif ? Oui L’incident est résolu. Non Passez à ”Connexion depuis un terminal ou un hôte distant”, page 2-4. Système inactif 2-3 Connexion depuis un terminal ou un hôte distant Pour vous connecter à distance, choisissez l’une de ces deux méthodes : • Connectez-vous au système depuis un autre terminal, si plusieurs terminaux sont connectés à votre système. • Connectez-vous depuis un autre hôte du réseau (si votre système fonctionne en réseau) en entrant la commande tn suivante : tn NomDeVotreSystème Avec la commande tn, vous devez fournir votre nom de connextion et votre mot de passe. Avez-vous pu vous connecter au système depuis un autre terminal ou hôte ? Oui Passez à ”Arrêt à distance d’un processus bloqué”, page 2-4. Non Reportez-vous à ”Relance du système”, page 2-5 Vous pouvez également lancer un cliché système pour savoir pourquoi votre système est inactif. Pour plus d’informations sur ce point, reportez-vous à ”Cliché système”, page 12-1. Arrêt à distance d’un processus bloqué Pour mettre fin, depuis un terminal distant, à un processus bloqué, procédez comme suit : 1. Affichez la liste des processus actifs via la commande ps : ps –ef Les indicateurs –e et –f permettent d’identifier tous les processus actifs et inactifs. 2. Trouvez l’ID du processus bloqué. Pour ce faire, vous pouvez lancer la commande grep suivie d’une chaîne de recherche. Par exemple, pour quitter le processus xlock, entrez : ps –ef | grep xlock La commande grep, appliquée au résultat de ps, identifie l’ID d’un processus particulier. 3. Mettez fin au processus via la commande kill : Remarque : Seul un utilisateur racine est habilité à appliquer la commande kill à des processus qu’il n’a pas déclenchés. kill –9 ProcessID Si vous ne parvenez pas à déterminer le processus à l’origine de l’inactivité du système, il se peut que le dernier processus déclenché soit en cause. Dans ce cas, mettez fin au processus le plus récent. Le système est-il actif ? Oui Les vérifications ont permis de résoudre l’incident. Non Reportez-vous à ”Relance du système”, page 2-5 Vous pouvez également lancer un cliché système pour savoir pourquoi votre système est inactif. Pour plus d’informations sur ce point, reportez-vous à ”Cliché système”, page 12-1. 2-4 Guide de résolution des incidents et références Relance du système Si les deux premières procédures de réactivation ont échoué, vous devez relancer le système. Remarque : Avant de relancer le système, lancez un cliché système. Pour plus d’informations sur ce point, reportez-vous à ”Cliché système”, page 12-1. Procédures à suivre : • Vérification de la position du sélecteur de mode, page 2-5 • Vérification de l’unité d’amorçage, page 2-5 • Chargement du système d’exploitation, page 2-6 Vérification de la position du sélecteur de mode La position du sélecteur de mode dépend du type de logiciel à installer. Placez le sélecteur de mode en : • Position normale pour charger le système d’exploitation. • Position maintenance pour amorcer le système en mode maintenance ou pour établir des diagnostics matériels (reportez-vous à ”Diagnostics matériels”, page 9-1). Passez à ”Vérification de l’unité d’amorçage”, page 2-5. Vérification de l’unité d’amorçage Votre système peut être amorcé à partir d’un support amovible, d’une unité externe, d’une interface SCSI, d’une unité IDE (Integrated Device Electronics) ou d’un réseau local (LAN). Selon le cas, vérifiez l’unité d’amorçage comme suit : • Support amovible (bande magnétique par exemple) : vérifiez que le support est correctement inséré. • Unités IDE : vérifiez que l’ID attribué aux unités IDE est unique sur chaque carte. Si une seule unité est raccordée à la carte, elle doit recevoir un ID d’unité maîtresse. • Unité externe (unité de bande par exemple), vérifiez que : – l’unité est sous tension ; – les câbles reliant l’unité à l’unité centrale sont correctement branchés ; – le témoin de tension est allumé (si l’unité en est équipée). • Interfaces SCSI externes : vérifiez l’unicité des adresses SCSI. • Réseau local : vérifiez que le réseau fonctionne et est exploitable. L’unité d’amorçage fonctionne-t-elIe correctement ? Oui Passez à ”Chargement du système d’exploitation”, page 2-6. Non Passez à ”Diagnostics matériels”, page 9-1. Système inactif 2-5 Chargement du système d’exploitation Pour charger le système d’exploitation AIX : 1. Mettez la machine hors tension. 2. Patientez environ 1 minute. 3. Mettez le système sous tension. 4. Attendez environ 5 minutes, le temps que le système s’amorce. L’amorçage du système s’est-il déroulé correctement ? Oui La procédure a permis de résoudre l’incident. Non Si le chargement du système d’exploitation AIX a échoué, amorcez le disque en mode maintenance ou chargez un programme de diagnostics matériels. Pour charger un programme de diagnostics matériels, reportez-vous à ”Diagnostics matériels”, page 9-1. Si vous n’arrivez toujours pas à relancer le système, communiquez le code SRN au technicien de maintenance. Reportez-vous à ”Diagnostics matériels”, page 9-1 pour obtenir ce code. 2-6 Guide de résolution des incidents et références Chapitre 3. Incidents liés au terminal Les processus bloqués ou inutiles peuvent affecter le fonctionnement du terminal. Parfois, un message indique l’origine supposée de l’incident. Pour les procédures suivantes, vous devez disposer d’un second terminal, d’un modem ou d’une connexion à un réseau. Sinon, réinitialisez votre système pour résoudre l’incident. Choisissez la procédure appropriée pour résoudre les incidents liés au terminal : • Libération d’un terminal saturé, page 3-2 • Réponse aux messages écran, page 3-3 Incidents liés au terminal 3-1 Libération d’un terminal saturé Identifiez puis mettez fin aux processus bloqués ou inutiles comme suit : 1. Pour afficher les processus actifs, lancez la commande ps : ps –ef | pg La commande ps indique l’état des processus. L’indicateur –e écrit des informations relatives à tout processus (excepté le processus kernel) et l’indicateur –f génère une liste exhaustive des processus indiquant le nom de la commande et ses paramètres à la création du processus. La commande pg pagine la sortie : ainsi les informations sont affichées page à page, évitant un défilement trop rapide hors de l’écran. Les processus à surveiller sont ceux qui consomment une grande quantité d’une ressource système (temps processeur, espace disque). Les processus système comme sendmail, routed et lpd deviennent souvent incontrôlables. Lancer la commande ps u permet de vérifier l’utilisation du temps processeur. 2. Pour savoir qui exécute les processus sur un système, lancez la commande who : who Cette commande affiche des informations sur tous les utilisateurs du système (nom de connexion, poste de travail, date et heure de connexion). 3. Déterminez si vous devez arrêter ou suspendre un processus utilisateur, voire modifier sa priorité. Remarque : Vous devez détenir les droits d’utilisateur racine pour mettre fin aux processus que vous n’avez pas lancés. Si vous interrompez un processus utilisateur ou modifiez sa priorité, prévenez la personne qui l’a lancé. – Interrompez le processus via la commande kill. Par exemple : kill 1883 Cette commande envoie un signal à un processus en cours. Précisez l’ID du processus (PID) à interrompre, 1883 dans l’exemple. La commande ps affiche les PID. – Pour suspendre le processus et l’exécuter en arrière-plan, utilisez le signe &. Par exemple : /u/bin1/prog1 & La perluète (&) signale que vous souhaitez passer ce processus à l’arrière-plan : le shell n’attend pas la fin de son exécution pour afficher l’invite. Lorsque l’exécution d’un processus demande plus de quelques secondes, lancez-le en arrière-plan en tapant & à la fin de la ligne de commande. Les travaux en arrière-plan figurent dans la liste générée par la commande ps. – Pour modifier la priorité des processus saturés, lancez la commande renice : renice 20 1883 Cette commande modifie la priorité des processus en cours. Plus le chiffre est élevé, plus le niveau de priorité est faible, 20 étant la priorité la plus faible. Dans l’exemple ci-dessus, renice reprogramme le processus 1883 en lui attribuant le niveau de priorité le plus bas. Ce processus sera exécuté lorsqu’un court laps de temps processeur sera disponible. 4. Si le problème persiste, suivez les procédures décrites dans ”Diagnostics matériels”, page 9-1. 3-2 Guide de résolution des incidents et références Réponse aux messages écran Pour répondre aux messages écran et résoudre les erreurs correspondantes, procédez comme suit : 1. Si un message d’erreur s’affiche sur le terminal, recherchez-le dans AIX - Guide des messages. 2. Vérifiez la variable d’environnement DISPLAY. Vous avez le choix entre deux méthodes : – Affichez les variables d’environnement via la commande setsenv : setsenv Cette commande affiche l’environnement à l’état protégé activé lors de la connexion. Vérifiez si la variable DISPLAY a été définie. Dans l’exemple suivant, la variable DISPLAY n’apparaît pas, ce qui signifie qu’elle n’est pas définie : SYSENVIRON: NAME=casey TTY=/dev/pts/5 LOGNAME=casey LOGIN=casey OU – Modifiez la valeur de la variable DISPLAY. Par exemple, pour définir cette variable pour le système bastet et le terminal 0, entrez : DISPLAY=bastet:0 export DISPLAY DISPLAY prend la valeur par défaut unix:0 (console). Le format de la variable est nom:numéro, nom étant le nom d’hôte d’un système spécifique et numéro, le numéro du serveur X du système. 3. Pour restaurer les valeurs par défaut du terminal, lancez la commande stty : stty sane Cette commande restaure le fonctionnement normal des pilotes de terminal. Elle génère un code de réinitialisation de terminal, extrait du fichier /etc/termcap (ou /usr/share/lib/terminfo, s’il existe). 4. Si la touche Retour fonctionne mal, réinitialisez-la en entrant : ^J stty sane ^J Les signes ^J représentent la combinaison de touches Ctrl-J. 5. Si le problème persiste, suivez les procédures décrites dans ”Diagnostics matériels”, page 9-1. Incidents liés au terminal 3-3 3-4 Guide de résolution des incidents et références Chapitre 4. Défaillance de l’horloge système L’horloge système enregistre la date et l’heure des événements système, vous permet de programmer des événements (lancer un diagnostic matériel à 3 h 00, par exemple) et vous renseigne sur la date et l’heure de création d’un fichier ou de son dernier enregistrement. Pour réinitialiser ou réactiver une horloge défaillante, vous pouvez : • Tester la pile système. Reportez-vous page 4-2 • Réinitialiser l’horloge système. Reportez-vous page 4-3 Défaillance de l’horloge système 4-1 Test de la pile système Si l’horloge système n’est plus à l’heure, il se peut que la pile soit épuisée ou déconnectée. Pour connaître l’état de la pile, entrez la commande diag comme suit : diag –B –c Dans le menu principal Diagnostics, sélectionnez l’option Problem Determination. Si la pile est épuisée ou déconnectée, un menu des incidents s’affiche avec un numéro de demande d’intervention (code SRN). Notez ce numéro à la rubrique 4 du rapport d’incident et prévenez le service de maintenance. Si la pile fonctionne, l’incident peut provenir soit d’une erreur d’exécution de la commande date ou setclock soit de l’échec de l’une ou l’autre commande. Reportez-vous à ”Réinitialisation de l’horloge système”, page 4-3. 4-2 Guide de résolution des incidents et références Réinitialisation de l’horloge système Réinitialisez l’horloge système à l’aide de la commande date. Pour réinitialiser l’heure et la date sur un hôte du réseau, utilisez la commande setclock. Passez, selon le cas, à la section : • Commande date, page 4-3 • Commande setclock, page 4-4 Commande date La commande date permet d’afficher ou de réinitialiser la date et l’heure. Pour connaître l’heure et la date sur votre système, entrez : /usr/bin/date Attention : Ne modifiez pas la date tandis que plusieurs personnes utilisent le système. Pour définir le paramètre Date, vous avez le choix entre plusieurs formats : • mmjjHHMM[.SSyy] (default) • aammjjHHMM[.SS] • jjmmHHMMaa[.SS] Les variables sont définies comme suit : mm Indique le mois. jj Indique le jour. HH Indique l’heure (sur la base de 24 heures). MM Indique les minutes. SS Indique les secondes. aa Indique les deux derniers chiffres de l’année. Remarque : Si vous choisissez le format aammjj, la valeur de aa doit être comprise entre 88 et 99. Utilisée sans indicateur ou avec une suite d’indicateurs commençant par le signe plus (+), la commande date affiche la date et l’heure. Sinon, la date seule est affichée. Seul un utilisateur racine peut modifier la date et l’heure. La commande date affiche la syntaxe de la commande pour chaque indicateur ou entrée inconnue. Pour contrôler la sortie de la commande, faites suivre la commande date du signe plus (+) et d’un descripteur de zone. Chaque descripteur de zone doit être précédé du signe %. Le système remplace le descripteur de zone par la valeur spécifiée. Entrez un littéral % comme %% (deux signes de pourcentage). La commande date affiche en sortie tous les autres caractères sans modification. La chaîne de cette commande se termine toujours par un caractère de nouvelle ligne. Indicateurs –n Sur un réseau local, n’ajuste pas l’heure des machines dont l’horloge est synchronisée. –u Affiche ou ajuste l’heure en temps universel (UTC). Défaillance de l’horloge système 4-3 Commande setclock /usr/sbin/setclock Cette commande donne l’heure obtenue via un serveur horaire du réseau et, lorsqu’elle est exécutée par un utilisateur racine, permet de régler l’heure et la date locales. La commande setclock prend en compte la première réponse du serveur horaire, convertit l’horloge calendrier et affiche la date et l’heure locales. Si cette commande est exécutée par un utilisateur racine, elle contacte les points d’entrée de la station standard pour régler la date et l’heure du système. Si aucun serveur horaire ne répond ou que le réseau n’est pas opérationnel, la commande setclock affiche un message et ne modifie ni la date ni l’heure. Remarque : Tout hôte exécutant le démon inetd peut servir de serveur horaire. Paramètre TimeServer 4-4 Nom ou adresse d’un hôte du réseau qui répond aux requêtes TIME. La commande setclock transmet une requête TIME d’un réseau public à un hôte serveur horaire. En l’absence de nom pour TimeServer, la commande setclock adresse la requête au serveur horaire défini par défaut. Dans un environnement DOMAIN, le serveur horaire par défaut est spécifié par le serveur de noms. Pour les autres environnements, il est spécifié dans le fichier /etc/hosts. Guide de résolution des incidents et références Chapitre 5. Incidents liés aux unités Les incidents liés aux périphériques (unités ou imprimantes, par exemple) affectent le fonctionnement du système. Pour en trouver l’origine, effectuez les opérations suivantes : • Vérification des éléments matériels des unités, page 5-2 • Vérification du logiciel des unités, page 5-3 Incidents liés aux unités 5-1 Vérification des composants matériels des unités Procédures à suivre : • Vérification des connexions, page 5-2 • Vérification de l’état Prêt, page 5-2 • Lancement des diagnostics, page 5-2 Vérification des connexions Procédez comme suit : 1. Vérifiez l’alimentation de la prise électrique. 2. Vérifiez le branchement du câble d’alimentation de l’unité. 3. Vérifiez le branchement du câble d’interface qui relie l’unité à l’unité centrale. 4. Sur les interfaces SCSI, vérifiez la présence de la terminaison SCSI et l’adresse SCSI. 5. Vérifiez que les unités de communication sont connectées à une ligne de télécommunications. 6. Vérifiez que l’unité est sous tension. Pour en savoir plus, reportez-vous à la documentation de l’unité pour les procédures de câblage et de configuration. Avez-vous résolu l’incident ? Oui Le contrôle des connexions a résolu l’incident. Non Passez à ”Vérification de l’état Prêt”, page 5-2. Vérification de l’état Prêt Pour savoir si une unité est à l’état Prêt : 1. Vérifiez que le témoin de tension est allumé. 2. Vérifiez que les supports amovibles (bande magnétique, disquette, unité optique, par exemple) sont correctement insérés. 3. Sur les imprimantes et les traceurs, vérifiez l’état du ruban, la réserve de papier et de toner. 4. Si vous essayez d’écrire, vérifiez que le support utilisé est accessible en écriture. Avez-vous résolu l’incident ? Oui Le contrôle de l’état Prêt a résolu l’incident. Non Passez à ”Lancement des diagnostics”, page 5-2. Lancement des diagnostics L’unité est peut-être défectueuse. Reportez-vous à ”Diagnostics matériels”, page 9-1 pour connaître l’origine de l’incident. Si le diagnostic des éléments matériels ne relève aucune anomalie, reportez-vous à ”Vérification du logiciel des unités”, page 5-3. Si les tests du logiciel ne révèlent rien, le problème peut provenir d’une incompatibilité entre l’unité et le logiciel. Dans cette éventualité, contactez le service de maintenance logicielle. 5-2 Guide de résolution des incidents et références Vérification du logiciel des unités Pour résoudre un problème logiciel, effectuez les opérations suivantes : • Contrôle du journal des erreurs, page 5-3 • Liste exhaustive des unités, page 5-3 • Contrôle de l’état d’une unité, page 5-3 • Contrôle des attributs d’une unité, page 5-3 • Modification des attributs d’une unité, page 5-4 • Utilisation d’une unité avec une autre application, page 5-4 • Configuration d’une nouvelle unité, page 5-4 Contrôle du journal des erreurs Recherchez dans le journal des erreurs toute erreur concernant l’unité, sa carte ou l’application utilisant l’unité. Pour ce faire, reportez-vous à ”Journalisation des erreurs”, page 10-1. Revenez ensuite à cette section. Avez-vous résolu le problème ? Oui Le contrôle au niveau du journal des erreurs a résolu l’incident. Non Passez à ”Liste des unités”, page 5-3. Liste exhaustive des unités La commande lsdev –C affiche la liste exhaustive des unités configurées ou disponibles. Elle indique en outre les caractéristiques de chaque unité du système. L’unité apparaît-elle dans cette liste ? Oui Passez à ”Contrôle de l’état d’une unité”, page 5-3. Non Passez à ”Configuration d’une nouvelle unité”, page 5-4. Contrôle de l’état d’une unité Recherchez l’unité dans la liste générée par la commande lsdev –C. Vérifiez si l’unité est disponible (état Available). L’unité est-elle disponible ? Oui Passez à ”Contrôle des attributs d’une unité”, page 5-3 Non Passez à ”Configuration d’une nouvelle unité”, page 5-4. Contrôle des attributs d’une unité La commande lsattr –E –l NomUnité donne la liste des attributs de l’unité. La commande lsattr affiche les caractéristiques des unités du système et leurs valeurs possibles. Pour la définition des paramètres, reportez-vous à la documentation de l’unité. Les attributs de l’unité sont-ils corrects ? Oui Passez à ”Utilisation de l’unité avec une autre application”, page 5-4. Non Passez à ”Contrôle des attributs d’une unité”, page 5-4. Incidents liés aux unités 5-3 Modification des attributs d’une unité La commande chdev –l Nom –a Attribut=Valeur modifie les attributs d’une unité. La commande chdev modifie les caractéristiques de l’unité désignée via l’indicateur –l Nom. Reportez-vous au manuel AIX Commands Reference avant d’exécuter cette commande. Avez-vous résolu le problème ? Oui La modification des attributs de l’unité a résolu l’incident. Non Passez à ”Utilisation de l’unité avec une autre application”, page 5-4. Utilisation d’une unité avec une autre application Testez l’unité avec une autre application. Si elle fonctionne correctement, c’est sans doute la première application qui est en cause. L’unité fonctionne-t-elle correctement avec une autre application ? Oui La première application est sans doute défectueuse. Prévenez le technicien de maintenance. Non Passez à ”Configuration d’une nouvelle unité”, page 5-4. Configuration d’une nouvelle unité Remarque : Seul un utilisateur racine ou un membre du groupe de sécurité est habilité à exécuter la commande mkdev. La commande mkdev permet d’ajouter une unité au système. Elle peut soit configurer et rendre disponible une nouvelle unité soit rendre disponible une unité déjà configurée. Seule la combinaison des indicateurs –c, –s et –t permet d’identifier une unité déjà configurée. Reportez-vous au manuel AIX Commands Reference avant d’exécuter cette commande. Avez-vous résolu le problème ? 5-4 Oui La définition de l’unité a résolu l’incident. Non Vous pouvez soit arrêter et prévenir le technicien de maintenance, soit lancer un programme de diagnostic pour tester l’unité. Si vous souhaitez établir un diagnostic, reportez-vous à ”Diagnostics matériels”, page 9-1. Guide de résolution des incidents et références Chapitre 6. Incidents liés aux supports Une erreur de support sur une disquette équivaut à une erreur de secteur sur un disque : les parties contaminées ou endommagées d’une disquette la rendent inutilisable. Les supports défectueux ne doivent pas être utilisés pour enregistrer des données. Les supports usagés peuvent être à l’origine de certains problèmes. La durée de vie des bandes magnétiques est estimée dans le tableau suivant : Bande Durée de vie 4 mm DAT 5 ans ou 650 opérations de lecture/écriture sur la bande globale 8 mm type DATA grade 4 ans ou 500 opérations de lecture/écriture sur la bande globale 1/4 pouce non disponible 1/2 pouce non disponible Ce chapitre traite des opérations suivantes : • Recherche des erreurs liées aux supports, page 6-2 • Restauration des données d’une disquette endommagée, page 6-4 Reportez-vous à ”Logical Volume Storage Overview” dans AIX 4.3 System Management Concepts: Operating System and Devices pour plus d’informations concernant le stockage sur volume logique (basé sur l’unité de disque). Incidents liés aux supports 6-1 Recherche des erreurs liées aux supports Cette recherche s’effectue en deux étapes : • Lecture d’un support, page 6-2 • Ecriture sur un support, page 6-3 Lecture d’un support Cette opération implique la détection des données et du format du support. • Pour connaître le contenu d’un disque ou d’une disquette, vous pouvez utiliser la commande dd. Par exemple, pour lire une disquette sur le lecteur rfd0, entrez : dd if=/dev/rfd0 of=/dev/null bs36b L’indicateur bs spécifie la taille du tampon interne pour dd. Remarque : La valeur 36b pour l’indicateur améliore grandement les performances de l’opération. Avec un tampon de 18 ko, dd peut lire les deux pistes d’une disquette en seulement deux révolutions de disquette. • Pour lire une bande magnétique, utilisez la commande tcopy. Par exemple, pour lire une bande sur le lecteur rmt0, entrez : tcopy /dev/rmt0 • Les erreurs au niveau des supports sont également consignées dans le journal des erreurs. Par exemple, l’entrée TAPE_ERR1 signale une erreur sur une bande magnétique. Pour plus d’informations, reportez-vous à ”Journalisation des erreurs”, page 10-1 et à ”Identificateurs d’erreur”, page C-1. Si vous parvenez à lire le support avec la commande dd ou tcopy, l’incident a probablement pour origine une erreur de syntaxe ou d’utilisation. Ce type d’erreur inclut : • L’utilisation d’un outil d’archivage inapproprié. • Une sauvegarde via cpio dépourvue des en-têtes ASCII requis par la commande (–c). • Un total de contrôle, calculé par la commande tar, différent de celui enregistré sur la bande et indiquant la présence d’un volume incorrect sur le lecteur. (Utilisez l’indicateur –i pour ignorer les totaux de contrôle.) • (Bandes) Une taille de bloc, définie dans DEVICE block size, différente de celle des blocs du fichier de la bande. • (Bandes) Un espace tampon de l’outil d’archivage insuffisant pour contenir un bloc complet du fichier de la bande. 6-2 Guide de résolution des incidents et références Ecriture sur les supports Attention : La procédure de reformatage détruit toutes les données du support. Ecrire sur un support aide également à en identifier les incidents. • Pour formater des disquettes, utilisez la commande format ou dosformat (disquettes DOS). Par exemple, pour formater une disquette dans l’unité rfd0, entrez : format –d /dev/rfd0 OU dosformat –D /dev/rdf0 • Pour écrire des données sur une bande, utilisez la commande dd. Par exemple, pour écrire le fichier motd sur l’unité rmt0, entrez : dd if=/etc/motd of=/dev/rmt0 Remarque : L’écriture de données sur une bande ne garantit la non–détérioration que de la portion de bande effectivement utilisée pour l’opération. Incidents liés aux supports 6-3 Restauration des données d’une disquette endommagée Les disquettes peuvent subir des dommages externes (torsion ou pliage) ou internes. Pour restaurer les données d’une disquette endommagée : 1. Vérifiez qu’il existe une copie de sauvegarde de cette disquette. 2. Procurez-vous, si possible, une seconde copie des données de la disquette. 3. Restaurez autant de fichiers que possible en choisissant une des méthodes proposées pour les copier sur disquette. – Si les fichiers ont été écrits via la commande tar –f, restaurez-les comme suit : tar –xvf/dev/rfd0 La commande tar copie ou récupère des fichiers sur disquette ou bande magnétique. /dev/rfd0 indique que les données seront restaurées à partir de l’unité de disquette zéro (rfd0). Remarque : Si vous obtenez une erreur de total de contrôle lors de la récupération des données, utilisez l’indicateur –i pour ignorer cette erreur sur l’en-tête. Si le chemin d’accès aux données de la disquette est relatif, la commande tar extrait les données de l’unité de disquette rfd0 et les copie vers le système de fichiers courant. Sinon, la commande tar tente de copier les données de l’unité de disquette rfd0 à l’emplacement indiqué par le chemin d’accès absolu. Par exemple, si le chemin d’accès relatif du fichier est ./monfichier, le fichier est restauré dans le répertoire courant. Par exemple, si le chemin d’accès /u/diane/monfichier est absolu, le fichier est copié de la disquette vers /u/diane/monfichier. Si le fichier /u/diane/monfichier existe déjà, il est écrasé. Remarque : Le chemin d’accès absolu est le chemin complet du fichier. Il commence par une barre oblique (/) immédiatement suivie du répertoire racine et contient tous les répertoires menant au fichier. Le chemin d’accès relatif part du répertoire courant et est identique à son nom de base si le fichier réside dans le répertoire $HOME. S’il réside dans un sous-répertoire de $HOME, le chemin d’accès relatif est le chemin du répertoire courant au fichier. – Si les fichiers ont été écrits via la commande cpio, restaurez-les comme suit : cpio –iv < /dev/rfd0 La commande cpio permet de copier des fichiers dans et à partir de la mémoire, et de déplacer des arborescences. Notez que les fichiers désignés par des chemins d’accès absolus sont restaurés à leur emplacement d’origine, et non dans le répertoire courant. – Si les fichiers ont été écrits via la commande dd, restaurez-les comme suit : dd if=/dev/rfd0 of=monfichier 6-4 Guide de résolution des incidents et références La commande dd permet de copier des fichiers. Elle est particulièrement utile dans le cas de fichiers non–UNIX. Dans l’exemple précédent, dd copie la totalité de la disquette sur monfichier. – Si les fichiers ont été écrits via la commande backup, restaurez-les comme suit : restore –xvf/dev/rfd0 La commande restore restaure les fichiers sauvegardés à l’aide de backup. – Vous pouvez également passer par SMIT comme suit : smit restore 4. Ouvrez les fichiers restaurés pour vous assurer qu’ils sont corrects. Sachez que vous n’avez pas la garantie que les données d’un fichier restauré soient correctes. Pour empêcher toute suppression inopinée de données sur vos disquettes, protégez-les contre l’écriture. En outre, les disquettes ne doivent pas être conservées à proximité de sources magnétiques ou d’écrans cathodiques. Voir aussi ’Backup Overview’ dans AIX 4.3 System Management Concepts: Operating System and Devices. Incidents liés aux supports 6-5 6-6 Guide de résolution des incidents et références Chapitre 7. Incidents liés au réseau Les incidents survenant sur le réseau peuvent être liés à l’impossibilité de joindre un hôte (et aux problèmes de conversion de nom), de joindre un réseau distant (problème de routage) ou aux difficultés d’accès à un service particulier d’un hôte. Ce chapitre traite des points suivants : • Incidents logiciels, page 7-2 • Incidents matériels, page 7-7 • Incidents liés à la carte de communication, page 7-8 Incidents liés au réseau 7-1 Incidents logiciels Pour savoir si le logiciel est à l’origine des problèmes de réseau, effectuez les opérations suivantes : • Conversion du nom d’hôte en adresse IP, page 7-2 • Recherche du fichier /etc/resolv.conf, page 7-2 • Mise à jour du fichier /etc/resolv.conf, page 7-3 • Recherche d’une interface manquante, page 7-3 • Activation du démon inetd, page 7-4 • Débogage du démon inetd, page 7-5 • Débogage du démon telnetd, page 7-6 Conversion du nom d’hôte en adresse IP 1. Vérifiez si la conversion s’effectue à l’aide du fichier /etc/resolv.conf. Si votre machine est la seule sur le réseau à ne pas disposer d’un fichier /etc/resolv.conf, il s’agit probablement d’une erreur. Pour en savoir plus sur le fichier /etc/resolv.conf, reportez-vous à la description de la ”Conversion des noms de domaine” dans dans AIX Communications Programming Concepts. 2. Vérifiez si la conversion s’effectue à l’aide d’un serveur de communication NIS : Par exemple : ps –ef | grep yp Recherchez les processus ypserv et ypbind. S’ils existent, la conversion s’effectue vraisemblablement via un serveur de communication NIS : Pour afficher le nom du serveur NIS du système local, entrez la commande ypwhich : ypwhich Si vous obtenez un message semblable à nomdomaine non défini sur cette machine, cela signifie que vous ne faites probablement pas appel au serveur NIS. 3. Vérifiez si la conversion s’effectue à l’aide du fichier /etc/hosts : Par exemple : ls /etc/hosts Si /etc/hosts existe, il est utilisé pour la conversion. Consultez /etc/hosts pour vous assurer que le nom hôte (sans marques de commentaire) y figure. Recherche du fichier /etc/resolv.conf 1. Si la conversion s’effectue à l’aide du fichier /etc/resolv.conf, vérifiez qu’il existe : Par exemple : ls /etc/resolv.conf 7-2 Guide de résolution des incidents et références 2. Si /etc/resolv.conf n’existe pas, le message suivant s’affiche lors de la tentative de connexion à un hôte : telnet: Unknown host SystemName (nom système de l’hôte inconnu) 3. De même, le message suivant s’affiche lors de la tentative d’envoi d’une demande d’écho via la commande ping : ping: HostName SystemName NOT FOUND (nom système du nom hôte NON TROUVE) La commande ping transmet une demande d’écho à un système hôte. Si celui-ci est actif et défini sur le réseau, il envoie une réponse. Par défaut, ping transmet les requêtes en continu jusqu’à réception d’un signal d’interruption (Ctrl-C). Mise à jour du fichier /etc/resolv.conf Le fichier /etc/resolv.conf utilisé pour la conversion doit contenir un nom d’hôte et une adresse IP corrects. Si les données de /etc/resolv.conf sont incorrectes, le système s’arrête lors de l’envoi d’une demande d’écho via la commande ping. Remarque : /etc/resolv.conf contient les adresses IP des serveurs de noms que vous pouvez utiliser ainsi que votre nom de domaine. Votre administrateur système est en mesure de vous fournir le domaine et l’adresse IP corrects. Recherche d’une interface manquante Quand vous tentez de convertir le nom d’hôte en adresse et de lancer la commande telnet sur une autre machine et que l’interface ne fonctionne pas ou est absente, vous obtenez le message : telnet: connect: Network is down (panne de réseau) 1. Vérifiez la présence et l’état des interfaces via la commande netstat : Par exemple : netstat –i netstat affiche l’état des interfaces du réseau. Les interfaces signalées par un astérisque (*) ne fonctionnent pas. Recherchez une interface de réseau telle que en0 pour Ethernet. 2. Si l’interface ne fonctionne pas, est absente ou déconnectée, vous devez, selon le cas, la mettre en fonction, la créer ou la rattacher au réseau via la commande ifconfig. Par exemple, si l’interface Ethernet en0 ne fonctionne pas, entrez : ifconfig en0 inet 129.35.147.121 up Si en0 est absente, entrez : ifconfig en0 129.35.147.121 netmask 255.255.255.0 up ifconfig configure les paramètres d’interface de réseau. Incidents liés au réseau 7-3 Activation du démon inetd Si la connexion est impossible alors que la conversion du nom d’hôte a abouti et que l’interface est correctement configurée, vous obtenez un message semblable au suivant : Tentative de connexion en cours... telnet: connect: Connection refused (connexion refusée). 1. Vérifiez que le démon inetd est activé en entrant : Par exemple : telnet SystemName echo Si vous obtenez une réponse, inetd est activé, sinon vous devez l’activer. 2. Lancez inetd : – Si vous utilisez le contrôleur des ressources système (SRC), entrez : startsrc –s inetd Remarque : Si vous utilisez le contrôleur SRC, vérifiez qu’il est lancé : ps –eaf | grep srcmst – Sinon, entrez : /etc/inetd 3. Si la tentative de connexion à l’aide du service telnet du démon inetd n’a pas abouti, assurez-vous que ce service est activé en le recherchant dans le fichier inetd.conf : a. Vérifiez que le service telnet figure bien dans ce fichier ; b. la ligne correspondant au service telnet ne doit pas y figurer en commentaire ; c. le chemin d’accès à telnet doit aussi être vérifié. 4. Si vous modifiez le fichier inetd.conf, régénérez-le : – Si vous utilisez le contrôleur SRC, entrez : refresh –s inetd – Sinon, tuez le démon inetd : kill –1 ‘ps –e | grep /etc/inetd | cut –c1-7‘ 7-4 Guide de résolution des incidents et références Débogage du démon inetd Si la connexion est impossible alors que le démon inetd est opérationnel et actif, et que la fonction requise est également active, soumettez les processus d’inetd à un programme de débogage. 1. Arrêtez temporairement inetd : stopsrc –s inetd La commande stopsrc arrête les sous-systèmes comme inetd. 2. Modifiez le fichier syslog.conf : Par exemple : vi /etc/syslog.conf a. Ajoutez la ligne ”*.debug /tmp/monfichier” à la fin du fichier et quittez l’éditeur. b. Le fichier désigné doit être existant (/tmp/monfichier dans l’exemple précédent). Pour que ce fichier soit existant, vous pouvez faire appel à la commande touch. 3. Régénérez le fichier : – Si vous utilisez le contrôleur SRC, entrez : refresh –s syslogd – Sinon, tuez le démon syslogd : kill –1 ‘ps –e | grep /etc/syslogd | cut –c1-7‘ 4. Relancez le démon inetd en activant la fonction de débogage : startsrc –s inetd –a ”–d” L’indicateur –d active le débogage. 5. Faites une tentative de connexion pour que les erreurs soient consignées dans le fichier de débogage /tmp/monfichier : Par exemple : tn bastet Tentative de connexion en cours... connected to bastet login:> Connection closed (connexion fermée) 6. Analysez les erreurs consignées dans le fichier de débogage : Par exemple : tail –f /tmp/monfichier Incidents liés au réseau 7-5 Débogage du démon telnetd Si la connexion via la commande telnet reste impossible alors que le démon inetd a pu exécuter le service telnet, l’incident est peut être dû à l’interface telnet elle-même : 1. Vérifiez que telnet utilise le type de terminal approprié. a. Contrôlez la variable $TERM sur votre machine : echo $TERM b. Connectez-vous à la machine concernée et contrôlez sa variable $TERM : echo $TERM 2. Exécutez les fonctions de débogage de l’interface telnet via la commande telnet sans option : telnet tn> a. Entrez open hôte, hôte étant le nom de la machine. b. Appuyez sur Ctrl–T pour afficher l’invite tn%gt; . c. A l’invite, entrez debug pour passer en mode débogage. 3. Essayez de vous connecter à une autre machine par l’intermédiaire de l’interface telnet : telnet bastet Tentative de connexion en cours... Connected to bastet Caractère d’échappement : ’^T’. Différentes commandes défilent à l’écran : Par exemple : SENT SENT SENT SENT SENT RCVD RCVD RCVD RCVD SENT RCVD SENT RCVD RCVD ... do ECHO do SUPPRESS GO AHEAD will TERMINAL TYPE (reply) do SUPPORT SAK will SUPPORT SAK (reply) do TERMINAL TYPE (don’t reply) will ECHO (don’t reply) will SUPPRESS GO AHEAD (don’t reply) wont SUPPORT SAK (reply) dont SUPPORT SAK (reply) do SUPPORT SAK (don’t reply) suboption TELOPT_NAWS Width 80, Height 25 suboption TELOPT_TTYPE SEND suboption TELOPT_TTYPE aixterm 4. Consultez /etc/termcap ou /usr/lib/terminfo pour déterminer la définition d’aixterm : Par exemple : ls –a /usr/lib/terminfo 5. Si la définition aixterm n’existe pas, créez le fichier ibm.ti pour l’ajouter : tic ibm.ti La commande tic permet de compiler les informations de terminal. 7-6 Guide de résolution des incidents et références Incidents matériels Pour résoudre les incidents matériels du réseau, recherchez les variations d’impédance du câble avec un réflectomètre de domaine (TDR) : • Câbles non protégés par une terminaison ; • Câbles créant un court-circuit ou prises émetteur-récepteur défectueuses ; • Prises émetteur-récepteur opérationnelles ; • Fiches et adaptateurs cylindriques opérationnelles ; • Câbles endommagés (tordus, dénudés, vrillés). 1. Analysez les paquets et les données qui transitent par le câble avec un programme d’analyse de réseau. 2. Si vous utilisez un réseau en anneau à jeton, vérifiez la vitesse de l’anneau (entre 4 et 16 Mo). Pour ce faire, entrez la commande smit : smit tcpip Vous avez directement accès au sous-menu TCP/IP. Dans ce sous-menu, choisissez l’option Configuration minimale et lancement et Interface de réseau en anneau à jeton (tr0, par exemple), puis vérifiez la valeur du champ Vitesse de l’ANNEAU. 3. Si vous utilisez le réseau Ethernet, assurez-vous que la connexion est correcte (bnc ou bix). Pour ce faire, entrez la commande smit : smit devices Vous avez directement accès au sous-menu Unités. Dans ce sous-menu, choisissez Liste des unités, puis Affich. caractér. d’une unité prise en charge. Sélectionnez carte, choisissez une interface dans la liste Interface d’unité (mca, par exemple), puis sélectionnez ethernet dans la liste Type d’unité et contrôlez le champ CONNECTEUR de carte. Incidents liés au réseau 7-7 Incidents liés à la carte de communication Cette section traite des points suivants : • Incidents logiciels, page 7-8 • Incidents matériels, page 7-9 Incidents logiciels 1. Vérifiez la route entre votre système et le système cible via la commande netstat : Par exemple : netstat –r netstat affiche l’état du réseau et diverses statistiques le concernant. Si le message d’erreur un acheminement vers l’hôte éloigné n’est pas disponible s’affiche, la route entre votre système et le système cible est incomplète ou l’une des machines sur cette route ne fonctionne pas. 2. Recherchez les erreurs d’entrée-sortie : Par exemple : netstat –i Ces erreurs peuvent provenir de câbles endommagés ou de paquets défectueux transmis à la machine locale. Un paquet envoyé vers un protocole inconnu peut également être à l’origine d’erreurs en entrée. 3. Vérifiez si votre système a besoin de tampons supplémentaires pour fonctionner en réseau : Par exemple : netstat –m Si les statistiques signalent une mémoire insuffisante, prévoyez de reconfigurer la taille des tampons affectés au réseau. Pour en savoir plus, reportez-vous au manuel AIX - Guide d’optimisation. 4. Recherchez les connexions interrompues : Par exemple : netstat –s Consultez les statistiques relatives aux couches de protocole. Les connexions peuvent être interrompues en raison d’un incident sur le réseau ou de câbles déconnectés. 5. Vérifiez via la commande arp que vous disposez de l’adresse IP complète du système cible : Par exemple : arp –a La commande arp recherche l’adresse physique d’une carte. En cas d’adresse incomplète, des données semblables aux suivantes s’affichent : Par exemple : ? (192.100.61.210) at (incomplet) 7-8 Guide de résolution des incidents et références Ce type d’incident peut provenir d’un système débranché, d’une adresse parasite (aucun système connu à cette adresse) ou d’un problème matériel (par exemple, un système capable de recevoir un paquet mais incapable d’en envoyer). 6. Recherchez les erreurs liées à la carte, par exemple : netstat –v La commande netstat –v affiche les statistiques relatives aux pilotes des cartes réseau Ethernet, en anneau à jeton, X.25 et 802.3. Les informations affichées concernent également le fonctionnement du réseau et les erreurs consignées pour tous les pilotes de périphérique actifs sur une interface. Les zones affichées comprennent : Erreurs Nbre Mbuf, Erreurs et extensions Nbre Mbuf et Paquets transmis et erreurs détectées par la carte. Incidents matériels Pour être testée efficacement, la carte réseau ne doit pas être configurée sur le réseau. Il est recommandé d’effectuer le test en mode autonome ou une fois la configuration de la carte annulée. Pour tester la carte, lancez les diagnostics dans un sens ou dans l’autre. • Entrez la commande diag : Remarque : Seul un utilisateur racine est habilité à exécuter la commande diag. diag • Lancez la commande smit diag, choisissez l’option Diagnostics du shell en cours. Sélectionnez la carte appropriée dans le menu Sélection des tests de diagnostic à partir du menu Sélection de fonction : smit diag Incidents liés au réseau 7-9 7-10 Guide de résolution des incidents et références Chapitre 8. Incidents liés à l’impression Les problèmes d’impression surviennent lorsque le système de fichiers /var est saturé. La saturation se produit lorsque les travaux transmis à la file d’attente d’impression sont copiés plusieurs fois, augmentant le volume des répertoires de spoulage du système de fichiers. Généralement, les répertoires saturés sont /var/spool/lpd et /var/spool/qdaemon. La file d’attente d’impression peut générer des copies si le démon de file d’attente ne fonctionne plus, que l’imprimante est en panne ou hors tension, ou qu’un travail d’impression volumineux mobilise toutes les ressources. Le système de fichiers /var peut également être saturé si d’autres répertoires, outre celui de spoulage, deviennent trop volumineux. Si le système de fichiers /var est saturé, effectuez une ou plusieurs des opérations suivantes : • Réactivation du démon de file d’attente, page 8-2 • Nettoyage du système de files d’attente d’impression, page 8-3 • Réaffectation des ressources de l’imprimante, page 8-5 • Suppression des fichiers inutiles, page 8-6 Incidents liés à l’impression 8-1 Réactivation du démon de file d’attente Le processus du démon de file d’attente (qdaemon) gère les demandes d’impression en fonction de la disponibilité des imprimantes. qdaemon maintient les files des processus en attente et répartit ceux-ci (dans l’ordre) sur les imprimantes à mesure qu’elles se libèrent. Si qdaemon ne fonctionne plus, vous vous heurterez à des problèmes d’impression et vous devrez le réactiver. Remarque : Certaines commandes ne peuvent être exécutées que par un utilisateur racine ou un membre du groupe système. 1. Pour vérifier si qdaemon est actif, entrez la commande ps : ps –ef | grep qdaemon Si la liste des processus actifs ne contient pas /var/sbin/qdaemon, qdaemon ou /etc/qdaemon, alors qdaemon n’est pas actif. 2. Pour relancer qdaemon, entrez la commande startsrc : startsrc –s qdaemon Si vous n’utilisez pas le contrôleur SRC, relancez le démon de file d’attente via la commande qdaemon. Laissez qdaemon imprimer tous les travaux de la file d’attente. 3. Pour vérifier que le démon lpd est actif, entrez : startsrc –s lpd Le démon lpd définit le serveur d’impression distant du réseau. 8-2 Guide de résolution des incidents et références Nettoyage du système de files d’attente d’impression Pour nettoyer le système de files d’attente, arrêtez qdaemon et vérifiez le système de fichiers /var. S’il est saturé, nettoyez les répertoires de files d’attente et relancez qdaemon comme suit : 1. Vérifiez que vous êtes connecté comme utilisateur racine. 2. Si possible, attendez la fin de tous les travaux d’impression en cours ou annulez-les. Pour annuler un travail d’impression, lancez la commande lpstat qui vous fournira le numéro de ce travail. Vous pouvez ensuite exécuter la commande enq pour annuler chaque travail d’impression voulu : enq –x numéro_travail La commande lpstat vous permet d’obtenir des informations sur l’état actuel de l’imprimante ligne. La commande enq permet de placer un fichier en file d’attente. 3. Pour arrêtez qdaemon, utilisez la commande : stopsrc –s qdaemon 4. Vérifiez qu’il n’a pas généré d’autres processus : ps –ef | grep qdaemon ps –ef | grep pio La commande ps indique l’état des processus. La commande grep recherche un fichier en fonction d’un modèle donné. Si vous obtenez un seule ligne en résultat de la commande grep, passez directement à l’étape 6. Si vous en obtenez plusieurs, passez à l’étape 5. 5. Si d’autres processus qdaemon ou pios sont affichés en retour par la commande ps –ef, tuez-les en entrant, pour chaque ID de processus : kill –9 pid L’exemple suivant montre un processus qdaemon affiché par ps –ef. L’ID du processus est 3357. root 3357 2288 0 13:32:21 – 0:04 dtterm Pour tuer ce processus, entrez kill –9 3357 sur la ligne de commande. 6. Exécutez cette étape si vous ne souhaitez pas supprimer les travaux d’impression en cours. Sinon, passez à l’étape 7. Si un travail d’impression est mis en file d’attente dans l’un des répertoires indiqués ci-dessous, effectuez-en une copie et placez-la dans /tmp ; vous pourrez l’imprimer lorsque le système de files d’attente sera à nouveau opérationnel. Remarque : Les fichiers placés dans ces répertoires ont des noms de système inhabituels. /var/spool/qdaemon /var/spool/lpd Incidents liés à l’impression 8-3 7. Si le système de fichiers /var est saturé, vous risquez de vous heurter à des problèmes avec qdaemon ou le spouleur. Les travaux d’impression volumineux risquent d’échouer ou des fichiers 00root de longueur nulle peuvent apparaître dans le répertoire qdir. Dans ce cas, il se peut que la réinitialisation du système ne permette pas de supprimer ces fichiers ou de relancer qdaemon. Entrez la commande df et vérifiez, dans la colonne %used de /var, si le système est saturé. Libérez autant d’espace que nécessaire dans le système de fichiers. La commande df affiche l’espace total et l’espace disponible du système de fichiers. 8. Changez de répertoire : cd /var/spool/lpd/qdir 9. Lancez la commande pwd pour vérifier que vous êtes dans le bon répertoire. Supprimez ensuite tous les fichiers qu’il contient, via la commande del : del * La commande pwd affiche le chemin d’accès complet au répertoire courant (depuis le répertoire racine). La commande del supprime les entrées du fichier désigné ou tous les fichiers d’un répertoire. 10.Changez de répertoire : cd /var/spool/lpd/stat 11. Lancez la commande pwd pour vérifier que vous êtes dans le bon répertoire. Supprimez ensuite tous les fichiers qu’il contient : del * 12.Changez de répertoire : cd /var/spool/qdaemon 13.Lancez la commande pwd pour vérifier que vous êtes dans le bon répertoire. Supprimez ensuite tous les fichiers qu’il contient : del * 14.N’exécutez cette étape que si la file d’attente distante ou lpd vous pose problème. Changez de répertoire : cd /var/spool/lpd Lancez la commande pwd pour vérifier que vous êtes dans le bon répertoire. Supprimez ensuite tous les fichiers qu’il contient, via la commande del : del * Remarque : La commande del ne supprime pas les sous-répertoires. 15.Lancez qdaemon : startsrc –s qdaemon Le système de mise en files d’attente doit s’exécuter normalement. Si certaines files sont inopérantes, entrez : enable nom_file 8-4 Guide de résolution des incidents et références Réaffectation des ressources de l’imprimante Pour éviter qu’un seul travail d’impression n’utilise toutes les ressources de l’imprimante, procédez comme suit. Remarque : Certaines commandes ne peuvent être exécutées que par un utilisateur racine ou un membre du groupe système. 1. Pour savoir si un travail utilise toutes les ressources, vous avez le choix entre : – Entrer la commande lpq : lpq Sans indicateur, cette commande affiche l’état de la file d’attente par défaut. – Entrer la commande enq : enq –q La commande enq place un fichier dans la file d’attente d’une ressource partagée, le plus souvent une imprimante. L’indicateur –q affiche l’état de la file d’attente par défaut. 2. Exécutez l’une des commandes suivantes pour retirer un travail de la file d’attente d’impression (seul un utilisateur racine peut retirer des travaux qu’il n’a pas lancés) : – Exécutez la commande enq : enq –x 21 Dans cet exemple, enq est assortie de l’indicateur –x pour annuler le travail 21. – Exécutez la commande lprm : lprm –P lp0 42 Dans cet exemple, lprm ôte le travail 42 de la file d’impression lp0, désignée par l’indicateur –P. Vous pouvez en outre retirer les travaux d’un utilisateur donné en le désignant sur la ligne de commande. – Exécutez la commande qadm : qadm –X lp0 Dans cet exemple, qadm est assortie de l’indicateur –x pour annuler tous les travaux sur l’imprimante lp0. – Utilisez le raccourci SMIT de la commande qcan : smit qcan Dans cet exemple, vous pouvez choisir l’option By Print Queue pour annuler tous les travaux d’un utilisateur ou d’une imprimante donnée. 3. Demandez à l’émetteur du travail d’impression de le scinder via la commande split, puis envoyez le fichier comme une suite de travaux : split –50 grosfichier La commande split lit le fichier spécifié et le divise en segments dans un ensemble de fichiers de sortie. Dans cet exemple, grosfichier est divisé en segments de 50 lignes nommés grosfichieraa, grosfichierab, grosfichierac, etc. Incidents liés à l’impression 8-5 Suppression des fichiers inutiles Pour supprimer les fichiers inutiles du répertoire de spoulage, procédez comme suit. Remarque : Certaines commandes ne peuvent être exécutées que par un utilisateur racine ou un membre du groupe système. 1. Vérifiez s’il existe des fichiers superflus dans le répertoire de spoulage, via la commande du : du –rs /var/spool La commande du fait un résumé de l’espace disque utilisé. du est assortie de l’indicateur –s pour n’afficher que l’espace disque utilisé par le répertoire /var/spool et ses fichiers. du est assortie de l’indicateur –r pour afficher un message d’erreur lorsqu’un fichier ou un répertoire est illisible. 2. Si le répertoire est saturé : – Supprimez les fichiers superflus : Par exemple : rm fichiersuperflu – Déplacez les fichiers récents vers un répertoire temporaire. Par exemple : mv fichiersuperflu /u/spoolhold Remarque : Seul un utilisateur racine est habilité à supprimer ou déplacer des fichiers qui ne lui appartiennent pas. 3. Empêchez les autres utilisateurs de stocker des fichiers dans votre répertoire de spoulage : – Limitez les droits d’accès à ce répertoire à l’aide de la commande chmod : Modifiez le répertoire pour exclure les utilisateurs standard. Par exemple : chmod go–rw /var/spool/lp0 – Créez un travail cron pour nettoyer le répertoire (vous devez disposer des droits de niveau racine). Modifiez le fichier crontab. Par exemple, ajoutez la ligne suivante au crontab : find /spool –mtime +7 –a –exec rm –f Cette ligne entraîne la suppression des fichiers du répertoire /var/spool dont la dernière modification date de plus d’une semaine. Pour en savoir plus sur la création de travaux cron et l’utilisation de la commande crontab, reportez-vous à ”Mise en oeuvre d’un système de comptabilité” dans AIX 4.3 Guide d’administration : système d’exploitation et unités. 8-6 Guide de résolution des incidents et références – Définissez des règles applicables par tout utilisateur du groupe. Par exemple, demandez aux utilisateurs d’éliminer les fichiers dont ils n’ont plus besoin, par l’intermédiaire du courrier électronique ou en modifiant le message du jour (/etc/motd). Pour modifier le message du jour, reportez-vous à ”Modification du message du jour” dans AIX 4.3 Guide d’administration : système d’exploitation et unités. Créez ensuite un script pour identifier les personnes dont les fichiers saturent l’espace et demandez-leur de remédier à cette situation. – Trouvez une autre solution pour stocker les fichiers (par exemple, une unité de bande placée dans un lieu accessible à tous), afin que les utilisateurs puissent archiver les fichiers peu utilisés. 4. En dernier ressort, agrandissez le répertoire de spoulage. Pour ce faire, vous avez le choix entre : – Lancer la commande mount, qui permet à un système de fichiers d’être disponible à l’endroit désigné : Par exemple : mount /var/spool morespool – Exécuter la commande smit mount, choisir l’option Montage d’un système de fichiers et préciser le nom et les attributs du système de fichiers. Voir aussi ”Montage/démontage d’un système de fichiers” dans AIX 4.3 Guide d’administration : système d’exploitation et unités. ”Printer Overview for System Management” dans AIX Guide des imprimantes et de l’impression. Incidents liés à l’impression 8-7 8-8 Guide de résolution des incidents et références Chapitre 9. Diagnostics du matériel Exécuter les diagnostics en ligne et les diagnostics autonomes permet de résoudre les problèmes liés au matériel. Les diagnostics en ligne sont installés en option avec le système d’exploitation AIX. Ils sont exécutables en mode maintenance ou concurrent. Les diagnostics autonomes se trouvent sur un support amovible et sont exécutables en mode maintenance. Certains systèmes ne comportent pas d’afficheur ou de sélecteur de mode. D’autres ne prennent pas en charge les programmes de diagnostics en ligne et autonomes. Au besoin, reportez-vous à la documentation de votre système pour déterminer quels diagnostics sont compatibles et comment les charger en mode maintenance. Si votre système ne prend pas en charge les deux types de diagnostics proposés, vous trouverez dans sa documentation quelles procédures suivre pour effectuer des diagnostics. Ce chapitre traite des sujets suivants : • Sélection et chargement des diagnostics, page 9-2 • Identification du matériel, page 9-11 • Interprétation des codes de l’afficheur, page 9-12 • Informations sur la configuration du système, page 9-16 Tenez compte de ce qui suit avant d’exécuter la procédure : • Les programmes de diagnostic utilisent indifféremment un écran connecté au système ou un terminal tty connecté au port S1. Remarque : Reportez-vous au guide de l’opérateur de votre terminal tty pour connaître les touches requises pour ”dialoguer” avec les programmes de diagnostic. • Le système ne détecte pas les adaptateurs ISA. L’aide aux services de configuration des adaptateurs ISA fournie avec les programmes de diagnostics autonomes permet d’identifier et de configurer ce type d’adaptateur. Pour pouvoir être testés, les adaptateurs ISA doivent être identifiés et configurés. • L’écran DIAGNOSTIC OPERATING INSTRUCTIONS ne peut pas s’afficher sur les consoles connectées aux systèmes 5085 ou 5086. Il s’affiche pour les consoles connectées au système. • Si l’une des procédures requiert l’arrêt du système d’exploitation et que ce dernier est connecté à d’autres systèmes, vérifiez quelle conséquence votre action peut avoir sur ces autres systèmes. Prévenez les opérateurs des systèmes concernés. Les procédures suivantes peuvent affecter les systèmes connectés au vôtre : lancer et arrêter les communications avec un autre système, lancer les diagnostics sur un système, utiliser des fiches de bouclage avec un programme de diagnostic, et analyser le contenu du journal des erreurs. Isolez l’unité centrale des systèmes connectés avant d’arrêter votre système d’exploitation ou de lancer un programme de diagnostic. Certaines modifications du câblage sur le système (par exemple, installation de fiches de bouclage ou suppression d’un périphérique de la configuration) peut nécesiter une intervention préalable de l’opérateur du système connecté. Diagnostics du matériel 9-1 Sélection et chargement des diagnostics Il est important de sélectionner les tests de diagnostic dont vous avez besoin. Pour ce faire, procédez comme suit : 1. Contrôlez le système d’exploitation 2. Choisissez les bons diagnostics 3. Chargez les routines de diagnostic 4. Choisissez un test de diagnostic spécifique 1. Contrôle du système d’exploitation, page 0 – Si votre système d’exploitation accepte les commandes, reportez-vous à Choix des diagnostics, page 0. Sinon, commencez par arrêter le système d’exploitation en exécutant la commande shutdown. Si cette commande est inefficace, éteignez l’ordinateur et reportez-vous à Chargement des diagnostics en ligne en mode maintenance, page 9-3. 2. Choix des diagnostics, page 0 – Les diagnostics en mode concurrent permettent de tester de nombreuses ressources lorsque le système d’exploitation fonctionne et que les utilisateurs accèdent au système. Les diagnostics en ligne en mode maintenance permettent cependant d’isoler les incidents et de procéder à des tests plus complets. Pour charger les diagnostics en ligne en mode maintenance, arrêtez le système d’exploitation au moyen de la commande shutdown ; mettez l’ordinateur hors tension et reportez-vous à Chargement des diagnostics en ligne en mode maintenance, page 9-3. Sinon, reportez-vous à Chargement des diagnostics en ligne en mode concurrent, page 0. Chargement des diagnostics en ligne en mode concurrent – Chargez le programme de diagnostics en mode concurrent comme suit : a. Lancez les diagnostics via la commande diag. Remarque : Pour charger les diagnostics, vous devez posséder les droits root ou le rôle d’administration ’RunDiagnostics’. Si vous n’êtes pas utilisateur root, vous devez en outre appartenir au groupe primaire ’system’ et à un ensemble de groupes incluant le groupe ’shutdown’. Ce dernier est nécessaire pour les opérations de fermeture et de redémarrage requises pour certaines opérations de diagnostics. Les utilisateurs dont le rôle est ”Run Diagnostics” peuvent modifier la configuration du système, mettre à jour le microcode, etc. Les utilisateurs ayant ce rôle doivent être conscient des responsibilités qu’il implique. Pour configurer un utilisateur non root, le CE (Customer Engineer) ou le SSR (Service Support Representative) chargé de lancer les diagnostics crée un utilisateur unique via SMIT (System Management Interface Tool). Le groupe primaire de cet utilisateur doit être ’system’. Cet utilisateur doit en outre avoir le rôle ’RunDiagnostics’ et appartenir à un groupe incluant ’shutdown’. b. Attendez l’affichage des instructions d’exécution des diagnostics. c. Les programmes de diagnostics affichent l’écran Diagnostic Operating Instructions. Si l’écran Diagnostic Operating Instructions s’affiche mal, l’écran de la console est en cause. Pour résoudre ce problème, reportez-vous à ”Identification de l’écran de la console”. Si cette section ne vous permet pas de corriger le problème, notez le numéro SRN (Service Request Number) 111–121 et indiquez-le à votre fournisseur de service. 9-2 Guide de résolution des incidents et références d. Appuyez sur Entrée pour continuer. L’écran Function Selection doit s’afficher. Dans le cas contraire, le clavier est peut-être en cause. Si vous avez un tty, appuyez sur une touche autre que la touche Entrée. Reportez-vous à Identification du clavier, page 9-11. Chargement des diagnostics en ligne en mode maintenance Remarque : Si vous choisissez de charger les diagnostics en ligne en mode maintenance, vous ne pourrez peut-être pas tester le disque système et l’adaptateur SCSI. Le cas échéant, reportez-vous à Chargement des diagnostics autonomes en mode maintenance, page 9-3. Chargez les diagnostics en ligne comme suit : a. Arrêtez le système au moyen de la commande shutdown. b. Mettez le système hors tension. c. Passez le sélecteur de mode du système en position Service, le cas échéant. d. Mettez les unités associées sous tension. e. Mettez le système sous tension. f. Si votre système N’EST PAS équipé d’un sélecteur de mode et que l’icône ou le code mnémonique de la première unité s’affiche, appuyez sur la touche F6 du clavier directement rattaché ou sur la touche 6 du clavier tty. A l’affichage de l’invite ou de l’icône de mot de passe, entrez le mot de passe. g. Lorsque le menu Maintenance est affiché, sélectionnez System Boot––>Boot From List. h. Suivez les instructions pour sélectionner une console. i. Les programmes de diagnostic doivent afficher l’écran Diagnostic Operating Instructions. – Si le système s’arrête avant l’affichage de l’écran Diagnostic Operating Instructions, reportez-vous à Interprétation des codes de l’afficheur. – Si l’écran Diagnostic Operating Instructions s’affiche mal, l’écran de la console est peut-être en cause. Le cas échéant, reportez-vous à ”Identification de l’écran de la console”. Si cette section ne vous permet pas de corriger le problème, notez le numéro SRN (Service Request Number) 111–121 et indiquez-le à votre fournisseur de service. j. Appuyez sur Entrée pour continuer. L’écran Function Selection doit s’afficher. – Dans le cas contraire, le clavier est peut-être en cause. Si vous avez un tty, appuyez sur une touche autre que la touche Entrée. Reportez-vous à Identification du clavier, page 9-11. – Si le système s’arrête avant l’affichage de l’écran Function Selection, reportez-vous à Interprétation des codes de l’afficheur. k. Pour continuer les tests de diagnostic, reportez-vous à Chargement des routines de diagnostic. Chargement des diagnostics autonomes en mode maintenance Remarque : Si vous chargez les diagnostics en mode autonome via un terminal tty, vérifiez les conditions suivantes au préalable : – Le terminal tty doit être connecté au port S1 du système. – Les attributs du terminal doivent avoir la valeur par défaut des diagnostics. Pour plus d’information sur le chargement des diagnostics au moyen d’un tty, reportez-vous au guide de l’opérateur de votre système. Pour que les diagnostics fonctionnent, les attributs du terminal doivent être définis. Diagnostics du matériel 9-3 A l’issue du contrôle des attributs, reportez-vous à la présente section. Notez les attributs qui ont été modifiés. Chargez les diagnostics comme suit : a. Arrêtez le système au moyen de la commande shutdown. b. Mettez le système hors tension. c. Passez le sélecteur du système en position Service, le cas échéant. d. Mettez toutes les unités associées sous tension. e. Mettez le système sous tension. f. Insérez le suport Standalone Diagnostics dans l’unité adéquaté. g. Si votre système N’EST PAS équipé d’un sélecteur de mode et que l’icône ou le code mnémonique de la première unité s’affiche, appuyez sur la touche F5 du clavier directement rattaché ou sur la touche 5 du clavier tty. A l’affichage de l’invite ou de l’icône de mot de passe, entrez le mot de passe. h. Lorsque le menu Maintenance est affiché, sélectionnez System Boot––>Boot From List. i. Répondez au message qui s’affiche, puis appuyez sur la touche Entrée. Le programme de diagnostic définit votre console système et affiche l’écran Diagnostic Operating Instructions. j. Appuyez sur Entrée pour continuer. Le programme de diagnostic affiche l’écran Function Selection. k. Sélectionnez Initialize Terminal dans le menu de l’écran Function Selection. l. Entrez le type de votre terminal. Le programme de diagnostic initialise votre environnement système et réaffiche l’écran Function Selection. m. Pour savoir comment reprendre les tests de diagnostic, reportez-vous à Chargement des routines de diagnostic, page 9-4. 3. Chargement des routines de diagnostic Diagnostics en ligne en mode concurrent ou en mode maintenance Sélectionnez Diagnostic Routines dans le menu de l’écran Function Selection. Suivez les procédures du tableau ci–après, en fonction des réponses du système. 9-4 Réponse du système Intervention Affichage du menu Diagnostic Mode Selection Sélectionnez Problem Determination dans le menu et appuyez sur Entrée. Reportez-vous à Choix d’un test de diagnostic spécifique. Affichage du menu DIAGNOSTIC SELECTION Si le menu DIAGNOSTIC SELECTION s’affiche lorsque vous sélectionnez Problem Determination, reportez-vous à Choix d’un test de diagnostic spécifique, page 9-6. Guide de résolution des incidents et références Réponse du système Intervention Affichage du menu MISSING RESOURCE ou NEW RESOURCE. Suivez les instructions affichées jusqu’à l’affichage du menu DIAGNOSTIC SELECTION ou d’un numéro SRN. Remarques : – Chargez tous les autres supports fournis avec l’adaptateur ou l’unité et sélectionnez l’option DIAGNOSTICS ROUTINES. – Si vous chargez des diagnostics autonomes, assurez-vous que l’ensemble des adaptateurs et des unités SCSI sont listés dans le menu NEW RESOURCE. – Il est possible que les ressources associées aux ports série et parallèle n’apparaissent pas dans le menu NEW RESOURCE. Le système ne détecte pas les adaptateurs ISA. L’aide au service de configuration de l’adaptateur ISA des diagnostics autonomes permet l’identification et la configuration des adaptateurs ISA. Si le menu DIAGNOSTIC SELECTION s’affiche, reportez-vous à Choix d’un test de diagnostic spécifique, page 9-6. Le cas échéant, notez le code SRN qui s’affiche et indiquez-le à votre fournisseur de service. Si un code s’affiche dans le panneau opérateur, reportez-vous à Interprétation des codes de l’afficheur, page 9-12. Le message The system will now continue the boot process est affiché en permanence sur la console de l’unité du système. Mettez le système hors tension et prévenez votre fournisseur de service. Les diagnostics démarrent le test d’une ressource. Suivez les instructions qui s’affichent. Si l’écran No Trouble Found s’affiche, appuyez sur Entrée. Remarque : Si l’option Problem Determination a été sélectionnée dans le menu DIAGNOSTIC MODE SELECTION et si une erreur a été récemment consignée dans le journal des erreurs, les diagnostics démarrent automatiquement le test de la ressource. Si une autre ressource est testée, recommencez cette étape. Si le menu DIAGNOSTIC SELECTION s’affiche, reportez-vous à Choix d’un test de diagnostic spécifique, page 9-6. Si un code SRN s’affiche, indiquez-le à votre fournisseur de service. Si un code s’affiche dans le panneau opérateur, reportez-vous à Interprétation des codes de l’afficheur, page 9-12. Le système s’est arrêté et indique le Reportez-vous à Interprétation des codes de code de trois positions 888 ou un code l’afficheur, page 9-12. de quatre positions dans le panneau de l’opérateur. Diagnostics du matériel 9-5 Diagnostics autonomes en mode maintenance Sélectionnez Diagnostic Routines dans le menu de l’écran Function Selection. Lorsque vous sélectionnez Diagnostics Routines ou Advanced Diagnostics Routines la première fois, les diagnostics listent la totalité des ressources détectées, hormis les adaptateurs ISA et les ressources associées aux ports série et parallèle. L’aide au service de configuration de l’adaptateur ISA permet l’identification et la configuration d’un adaptateur ISA. Avant d’être testés, tous les adaptateurs ISA doivent être identifiés et configurés. Suivez les instructions qui s’affichent. Assurez-vous que les ressources mises en cause sont bien listées(page 9-6) (page 9-6). Réponse du système Intervention Diagnostic Mode Selection Sélectionnez Problem Determination dans le menu et appuyez sur Entrée. Reportez-vous à Choix d’un test de diagnostic spécifique. Diagnostic Selection Si le menu Diagnostic Selection s’affiche lorsque vous sélectionnez Problem Determination, reportez-vous à Choix d’un test de diagnostic spécifique Affichage d’un code SRN Notez le code SRN et indiquez-le à votre fournisseur de service. Menu New Resource Si l’écran New Resource s’affiche, suivez les instructions à l’écran. Le système ne détecte pas les adaptateurs ISA. L’aide au service de configuration de l’adaptateur ISA permet l’identification et la configuration des adaptateurs ISA. Avant d’être testés, les adaptateurs ISA doivent être identifiés et configurés. Remarques : Les unités rattachées aux ports série et parallèle intégrés n’apparaissent pas dans le menu New Resource. Si l’écran Diagnostic Selection apparaît, reportez-vous à Choix d’un test de diagnostic spécifique. Le cas échéant, notez le code SRN et indiquez-le à votre fournisseur service. 4. Choix d’un test de diagnostic spécifique Sélectionnez les tests de diagnostic et chargez-les pour le matériel qui pose problème. Sinon, lancez une vérification exhaustive du système pour contrôler la totalité du matériel configuré. Sélectionnez ce type de diagnostics dans le menu de l’écran Diagnostic Selection. Si le menu Diagnostic Mode Selection apparaît, sélectionnez Problem Determination et appuyez sur Entrée. 9-6 Guide de résolution des incidents et références Le tableau suivant répertorie les différentes réponses du système lorsque vous choisissez un test spécifique. Réponse du système Intervention Affichage d’une intervention Une intervention s’affiche pour les problèmes ne requérant pas de remplacement matériel. Suivez la procédure affichée. Affichage d’un code SRN Notez le code SRN et indiquez-le à votre fournisseur de service. Arrêt du système Si le système s’arrête et affiche un code dans le panneau opérateur, reportez-vous à Interprétation des codes de l’afficheur, page 9-12. Cherchez votre code dans la liste et prenez connaissance de sa signification et de l’intervention appropriée. Un message de fin s’affiche avant la fin effective du test – Si l’écran Testing Complete s’affiche sur la console avec le message No trouble was found et que vous n’avez pas testé toutes les ressources, appuyez sur Entrée. – Si l’écran Diagnostic Selection s’affiche, reportez-vous à Choix d’un test de diagnostic spécifique, page 9-6. – Si aucun code SRN ne s’affiche, le programme de diagnostic n’a trouvé aucun problème matériel. Vérifiez la configuration. Si le problème persiste, contactez le centre de maintenance du logiciel IBM. Si le système est connecté à un autre système, reportez-vous à Diagnostics du matériel, page 9-1. Le système ne détecte pas les adaptateurs ISA. Lors de l’exécution de diagnostics autonomes, l’aide au service Configuration de l’adaptateur ISA permet l’identification et la configuration des adaptateurs ISA. Avant d’être testés, les adaptateurs ISA doivent être identifiés et configurés. Remarque : Si des claviers de numérotation et LPFK sont rattachés aux ports série intégrés et que vous exécutez les diagnostics en ligne, ils n’apparaissent sur l’écran de sélection que s’ils ont été configurés par l’utilisateur. Configurez-les éventuellement au moyen de l’aide au service configuration des claviers de fonction et des claviers LPFK ou via SMIT. Si des claviers de fonction et LPFK sont rattachés aux ports série intégrés, configurez-les au moyen de l’aide au service configuration des claviers de fonction et des claviers LPFK avant de les tester au moyen des diagnostics autonomes. Diagnostics du matériel 9-7 Réponse du système Un message de fin s’affiche après la fin effective du test Intervention – Si l’écran de la console affiche l’écran Testing Complete avec le message No trouble was found et que vous n’avez pas testé toutes les ressources, le programme de diagnostic ne trouve aucun problème matériel. – En cas de problème persistant, contrôlez la configuration et contactez le centre de maintenance du logiciel IBM. Si le système est connecté à un autre système, reportez-vous à la section traitant des systèmes multiples dans le chapitre sur l’utilisation des diagnostics du guide de l’opérateur de votre système. 9-8 Guide de résolution des incidents et références Choix des options de test Sélectionnez Diagnostic Routines dans le menu FUNCTION SELECTION. L’écran DIAGNOSTIC MODE SELECTION s’affiche. Sélectionnez Identification des incidents. Pour démarrer les tests, effectuez les procédures suivantes : • Réponse aux messages de test, page 9-9 • Choix d’un test spécifique, page 9-9 Réponse aux messages de test Selon le cas, reportez-vous à : • Affichage du menu Diagnostic Selection, page 9-9 • Affichage du menu Missing Resource, page 9-9 • Affichage du menu New Resource, page 9-9 Affichage du menu Diagnostic Selection Si l’écran DIAGNOSTIC SELECTION s’affiche quand vous sélectionnez Identification des incidents, passez à ”Choix d’un test spécifique”, page 9-9. Affichage du menu Missing Resource Si l’écran MISSING RESOURCE apparaît, suivez les instructions à l’écran jusqu’à l’affichage de l’écran DIAGNOSTIC SELECTION ou d’un code SRN. Si l’écran DIAGNOSTIC SELECTION s’affiche, reportez-vous à ”Choix d’un test spécifique”, page 9-9. Si un code SRN s’affiche, notez-le pour le communiquer au technicien de maintenance. Si un code s’affiche, reportez-vous à ”Interprétation des codes de l’afficheur, page 9-12. Affichage du menu New Resource Si l’écran NEW RESOURCE apparaît, suivez les instructions affichées. Le système ne détecte pas les adaptateurs ISA. L’aide aux services de configuration des adaptateurs ISA fournie avec les programmes de diagnostics autonomes permet d’identifier et de configurer ce type d’adaptateur. Pour pouvoir être testés, les adaptateurs ISA doivent être identifiés et configurés. Remarque : Les unités connectées aux ports série S1 et S2 n’apparaissent pas dans le menu NEW RESOURCE. Si l’écran DIAGNOSTIC SELECTION s’affiche, reportez-vous à ”Choix d’un test spécifique”, page 9-9. Si un code SRN s’affiche, notez-le pour le communiquer au technicien de maintenance. Choix d’un test spécifique Sélectionnez et exécutez les tests sur le matériel qui pose problème. Vous pouvez également effectuer une vérification complète du système pour contrôler toutes les unités matérielles qui y sont connectées. La vérification complète n’est disponible que pour les diagnostics en ligne et en mode maintenance. Sélectionnez l’option System Checkout du menu DIAGNOSTIC SELECTION. Diagnostics du matériel 9-9 Quand vous choisissez un test, le système peut répondre de différentes façons : • Affichage d’un code SRN, page 9-10 • Arrêt du système, page 9-10 • Affichage d’un avertissement de fin de test avant la fin du test, page 9-10 • Affichage d’un avertissement de fin de test après la fin du test, page 9-10 Affichage d’un code SRN Si un code SRN s’affiche quand vous exécutez un test, notez-le pour le communiquer au technicien de maintenance. Arrêt du système Si un code s’affiche, reportez-vous à ”Interprétation des codes de l’afficheur, page 9-12. Repérez le code dans la liste et voyez comment l’interpréter pour intervenir. Si aucun code n’est affiché, signalez le code SRN 111–905. Affichage d’un avertissement de fin de test avant la fin du test Si l’écran TESTING COMPLETE s’affiche avec le message No trouble was found et que vous n’avez pas testé toutes les ressources, appuyez sur Entrée. Si l’écran DIAGNOSTIC SELECTION s’affiche, reportez-vous à ”Choix d’un test spécifique”, page 9-9. Si le menu de maintenance s’affiche, reportez-vous à ”Affichage du menu Missing Resource”, page 9-9. Si le menu New Resource s’affiche, reportez-vous à ”Affichage du menu New Resource”, page 9-9. Si un code SRN s’affiche, notez-le pour le communiquer au technicien de maintenance. Si aucun code SRN ne s’affiche, le programme de diagnostic n’a décelé aucun problème matériel. Si des problèmes subsistent, vérifiez votre configuration et contactez le centre de maintenance logicielle d’IBM. Si vous êtes connecté à un autre système, reportez-vous aux remarques sur les diagnostics matériels, page 9-1. Le système ne détecte pas les adaptateurs ISA. L’aide aux services de configuration des adaptateurs ISA fournie avec les programmes de diagnostics autonomes permet d’identifier et de configurer ce type d’adaptateur. Pour pouvoir être testés, les adaptateurs ISA doivent être identifiés et configurés. Remarque : Si vous exécutez des diagnostics en ligne et que les rotateurs et les claviers LPFK sont connectés aux ports série S1 ou S2, ils ne s’affichent sur l’écran de sélection que s’ils ont été configurés par l’utilisateur. Utilisez l’aide au service des rotateurs et claviers LPFK, ou SMIT, pour configurer ces périphériques. Si les rotateurs et les claviers LPFK sont connectés au port série S1 ou S2, utilisez l’aide au service de configuration pour les configurer avant de procéder à des tests de diagnostic en mode autonome. Affichage d’un avertissement de fin de test après la fin du test Si l’écran TESTING COMPLETE s’affiche avec le message No trouble was found et que vous avez testé toutes les ressources, le programme de diagnostic n’a décelé aucun problème matériel. Si des problèmes subsistent, vérifiez votre configuration et contactez le centre de maintenance logicielle d’IBM. Si vous êtes connecté à un autre système, reportez-vous à la section traitant des systèmes multiples dans le manuel de l’opérateur de l’unité centrale. 9-10 Guide de résolution des incidents et références Identification du matériel Pour identifier votre matériel, effectuez les opérations suivantes : • Identification de l’écran de la console, page 9-11 • Identification du clavier, page 9-11 Identification de l’écran de la console Identifiez votre écran de console dans la liste suivante. Suivez les procédures indiquées si votre écran est à l’origine des problèmes de test. TYPE CONSOLE INTERVENTION écran Reportez-vous à la documentation de votre écran pour identifier le problème. terminal tty Reportez-vous à la documentation de votre terminal pour identifier le problème. Identification du clavier Identifiez votre clavier dans la liste suivante. Notez le code SRN (Service Request Number) si votre clavier est à l’origine des problèmes de test. TYPE CLAVIER INTERVENTION 101 touches Identifiable par la touche Entrée. Elle occupe la hauteur d’une seule rangée de touches. Notez le code SRN 111–921. 102 touches Identifiable par la touche Entrée. Elle occupe la hauteur de deux rangées de touches. Notez le code SRN 111–922. Kanji Identifiable par les caractères japonais. Notez le code SRN 111–923. terminal tty Reportez-vous à la documentation du matériel. Cela s’applique à tous les terminaux connectés. Diagnostics du matériel 9-11 Interprétation des codes de l’afficheur Quand le chargement des diagnostics pose problème, un code apparaît dans l’afficheur (si la machine en est équipée). Le code a soit une valeur fixe, soit plusieurs valeurs en alternance, soit il est clignotant. Selon le code affiché, reportez-vous à : VALEUR AFFICHEE DEFINITION c31 (fixe) Le code c31 s’affiche quand le programme de diagnostic ne peut pas détecter une console. Suivez les instructions affichées pour sélectionner une console. Si vous n’avez pas de console, placez le sélecteur de mode en position normale, puis en position maintenance pour le signaler au programme de diagnostic. Remarque : Des incidents au niveau de l’écran ou du clavier peuvent empêcher de sélectionner une console. Si l’affichage sur l’écran est défectueux (texte déformé ou illisible), reportez-vous à Identification de l’écran de la console, page 9-11 et suivez les instructions. Si le clavier semble ne pas répondre quand vous sélectionnez une console, il est probablement en cause. Passez Identification du clavier, page 9-11 pour rechercher le code SRN servant à signaler l’incident. 9-12 Code à 8 positions Notez ce code d’erreur et signalez–le au technicien de maintenance. Code à 3 positions commençant par F Point de reprise à trois positions. Notez ce code et signalez–le au technicien de maintenance. Code à 3 positions ne commençant pas par F Indicateur d’événement AIX à trois positions. Notez le code SRN 111–xxx, xxx étant le code à 3 positions, et signalez–le au technicien de maintenance. Code à 4 positions commençant par 8, 9 ou A–F Point de reprise à quatre positions. Notez ce code et signalez–le au technicien de maintenance. Code à 4 positions commençant par un chiffre entre 0 et 7. Indicateur d’événement AIX à quatre positions. Notez le code SRN 111–xxx, xxx étant le code à 4 positions, et signalez–le au technicien de maintenance. Guide de résolution des incidents et références VALEUR AFFICHEE DEFINITION 200 (fixe) Si le code 200 s’affiche, vérifiez que le sélecteur de mode est en position maintenance. Sinon, basculez le sélecteur en position maintenance. Reportez-vous à Chargement des diagnostics en ligne en mode maintenance, page 9-3 ou Chargement des diagnostics autonomes en mode maintenance, page 9-3. Si oui, notez le code SRN 111–102 pour le communiquer au technicien de maintenance. 260 (fixe) Remarque : Notez le code SRN 111–101 pour le communiquer au technicien de maintenance si vous chargez des diagnostics autonomes sur un système autre qu’un DPX/20 100 ou DPX/20 105. Si vous utilisez un DPX/20 100 ou un DPX/20 105, appuyez sur la touche 1 pour poursuivre les diagnostics. Poursuivez la procédure si vous chargez des diagnostics en ligne. Si le code 260 s’affiche, vérifiez si l’écran de la console est connecté directement à l’unité centrale via une carte graphique. Si oui, passez à ”Réponse aux codes 260, 261 et 262”, page 9-15. Sinon, appuyez sur la touche 1. Observez la réaction de votre système, puis passez à ”Réponse aux codes 260, 261 et 262”, page 9-15. 261 (fixe) Remarque : Notez le code SRN 111–101 pour le communiquer au technicien de maintenance si vous chargez des diagnostics autonomes sur un système autre qu’un DPX/20 100 ou DPX/20 105. Si vous utilisez un DPX/20 100 ou un DPX/20 105, appuyez sur 1 pour poursuivre les diagnostics. Poursuivez la procédure si vous chargez des diagnostics en ligne. Appuyez sur la touche 1. Observez la réaction de votre système, puis passez à ”Réponse aux codes 260, 261 et 262”, page 9-15. Diagnostics du matériel 9-13 VALEUR AFFICHEE DEFINITION 262 (fixe) Remarque : Notez le code SRN 111–101 pour le communiquer au technicien de maintenance si vous chargez des diagnostics autonomes sur un système autre qu’un DPX/20 100 ou qu’un DPX/20 105. Si vous utilisez un DPX/20 100 ou un DPX/20 105, appuyez sur 1 pour poursuivre les diagnostics. Poursuivez la procédure si vous chargez des diagnostics en ligne. Le programme de diagnostic n’a pas détecté de clavier. Si un clavier est connecté (connecteur K) à l’unité centrale, notez le code SRN 101–262 pour le communiquer au technicien de maintenance. Sinon, appuyez sur la touche 1, et passez à ”Réponse aux codes 260, 261 et 262”, page 9-15. 888 (clignotant) Le code 888 clignotant indique qu’un problème a été détecté mais ne peut être affiché sur la console. 888 est suivi de 102, 103 ou 105. Le bouton de réinitialisation permet de faire défiler le message. • Le code 102 signale une vérification du matériel ou du logiciel et indique que le système ne peut pas continuer. Un message 102 peut être suivi d’un message 103. Le cas échéant, suivez la procédure du message 103. Si le message 103 ne s’affiche pas, notez le code SRN 111–107 et indiquez–le au technicien de maintenance. • Le message 103 indique un SRN suivi de 103. Le SRN est constitué de deux ensembles de valeurs suivies du message 103. Notez le code SRN et indiquez–le au technicien de maintenance. • Le message 105 indique un SRN encodé suivi de 105. Notez le code SRN 111–108 et indiquez–le au technicien de maintenance. 9-14 Guide de résolution des incidents et références VALEUR AFFICHEE DEFINITION 888 (clignotant) suivi d’une chaîne de chiffres Le code 888 clignotant signale qu’un problème a été detecté mais ne peut être affiché sur la console. 888 est suivi de 102, 103 ou 105. • 102 indique signale une vérification du matériel ou du logiciel et indique que le système ne peut pas continuer. Un message 102 peut être suivi d’un message 103. Le cas échéant, suivez la procédure du message 103. Si le message 103 ne s’affiche pas, notez le code SRN 111–107 et indiquez–le au technicien de maintenance. • 103 indique un code SRN suivi de 103. Le SRN est constitué de deux ensembles de valeurs suivies du message 103. Notez le code SRN et indiquez–le au technicien de maintenance. • Le message 105 indique un SRN encodé suivi de 105. Notez le code SRN 111–108 et indiquez–le au technicien de maintenance. Plusieurs valeurs (en alternance) Remarque : Notez le code SRN 111–101 pour le communiquer au technicien de maintenance si vous chargez des diagnostics à partir d’un support amovible. Poursuivez la procédure si vous chargez des diagnostics en ligne. Votre système s’est arrêté en affichant en alternance plusieurs valeurs comprises entre 221 et 296. Ce code indique que le système n’a pas trouvé les programmes de diagnostic. Si vous avez déjà tenté de charger les diagnostics autonomes, notez le code SRN 111–101 pour le communiquer. Réponse aux codes 260, 261 et 262 Lorsque le code 260, 261 ou 262 s’affiche, appuyez sur la touche 1 et observez les réactions du système. En fonction de vos observations, suivez les procédures indiquées. Remarque : Reportez-vous aux descriptions de ces trois codes et exécutez les opérations nécessaires avant de poursuivre. 1. Si les informations ne s’affichent pas correctement (texte déformé, flou ou illisible), reportez-vous à ”Identification de l’écran de la console”, page 9-11. 2. Si un code SRN s’affiche, notez-le pour le communiquer au technicien de maintenance. 3. Si le MENU PRINCIPAL s’affiche, vous pouvez arrêter la procédure en cours ou charger les diagnostics à partir d’un autre support. Si vous souhaitez arrêter, notez le code SRN 111–103 pour le communiquer au technicien de maintenance. Si vous souhaitez poursuivre, passez à ”Chargement des diagnostics autonomes en mode maintenance”, page 9-3. Diagnostics du matériel 9-15 Informations sur la configuration du système Vous disposez de deux commandes : • Commande lscfg, page 9-16 • Commande snap, page 9-16 Commande lscfg Pour afficher la configuration du système, entrez : lscfg La commande lscfg affiche le nom, l’emplacement et la description de toutes les unités matérielles du système. Commande snap Remarque : Seuls les utilisateurs racine sont habilités à utiliser la commande snap. Pour collecter les informations relatives à la configuration dans un fichier tar et le copier sur disquette, entrez : snap –a –o /dev/rfd0 Dans cet exemple, l’indicateur –a permet de collecter toute information relative à la configuration du système. L’indicateur –o copie le fichier compressé tar vers l’unité que vous désignez. /dev/rfd0 représente l’unité de disque. Pour collecter les informations relatives à la configuration dans un fichier tar et le copier sur bande, entrez : snap –a –o /dev/rmt0 /dev/rmt0 est le nom de l’unité de bande. Remarque : Si vous décidez d’envoyer une image snap à la maintenance logicielle d’IBM sur une bande, celle–ci doit avoir l’un des formats suivants : 8 mm et capacité de 2,3 Go, 8 mm et capacité de 5,0 Go ou 4 mm et capacité de 4,0 Go. Tout autre format empêchera ou retardera le travail de la maintenance logicielle. 9-16 Guide de résolution des incidents et références Diagnostics périodiques et analyse automatique du journal des erreurs Les programmes de diagnostics périodiques et d’analyse automatique du journal des erreurs sont intégrés aux programmes de diagnostic. Diagnostics périodiques La fonction chargée de tester régulièrement les unités de disque et la pile est activée par défaut. L’analyse du journal des erreurs est effectuée sur tous les disques. Le test de la pile vérifie l’horloge en temps réel et la pile de la NV–RAM. L’exécution des diagnostics périodiques dépend de la version du programme. AIX version 4 Pour la version 4 d’AIX, les diagnostics périodiques sont contrôlés par l’aide au service Periodic Diagnostic. Cette aide assure l’analyse quotidienne du journal des erreurs concernant les ressources matérielles. Par défaut, toutes les unités de disque et la pile sont activées. Le diagnostic de la pile s’exécute chaque jour à 4 h 00, et l’analyse du journal des erreurs sur tous les disques chaque jour à 3 h 00. D’autres unités peuvent être ajoutées à la liste Periodic Diagnostic Device, et l’heure de l’analyse du journal des erreurs modifiée. Un message s’affiche sur la console système en cas d’incident, et un courrier électronique est adressé à tous les groupes membres du système. Ce message contient le code SRN. L’exécution de diagnostics sur les unités du système de base via l’aide au service Periodic Diagnostic revient à utiliser la commande diag –c –d unité. Toutes les autres unités sont appelées avec l’indicateur –e. Analyse automatique du journal des erreurs (diagela) La fonction diagela permet d’analyser le journal des erreurs chaque fois qu’une erreur de ressource matérielle permanente est consignée dans le journal. Chaque fois qu’une telle erreur est consignée dans le journal, le programme diagela est appelé, à condition qu’il soit activé. Ce programme est activé par défaut sur toutes les plates–formes. diagela détermine si l’erreur doit être analysée ou non. Dans l’affirmative, une application de diagnostic est appelée pour effectuer l’analyse. Aucun test n’est effectué. S’il est établi qu’une intervention de maintenance est nécessaire, un message est envoyé sur la console et à tous les groupes membres du système. Ce message contient le code SRN ou une action corrective. L’exécution de diagnostics dans ce mode revient à utiliser la commande diag –c –e –d unité. Il est possible de personnaliser la notification en ajoutant une strophe à la classe d’objet PDiagAtt. Un exemple d’appel de programme client personnalisé, destiné à remplacer la notification standard, est illustré ci-dessous : PDiagAtt: DClass = ”” DSClass = ”” DType = ”” attribute = ”diag_notify” value = ”/usr/bin/customer_notify_program $1 $2 $3 $4 $5” rep = ”s” Diagnostics du matériel 9-17 Si DClass, DSClass et DType ne sont pas renseignés, customer_notify_program est appliqué à TOUTES les unités. Renseigner DClass, DSClass et DType active customer_notify_program uniquement pour ce type d’unité. Cette strophe insérée dans la base de données ODM provoque l’affichage des messages d’erreur sur la console système et l’appel du programme spécifié comme valeur de l’attribut prédéfini diag_notify. Les mots-clés ci-dessous sont automatiquement développés comme des arguments du programme de notification : $1 mot–clé ”diag_notify” $2 nom de la ressource incriminée $3 code SRN $4 type de l’unité $5 libellé de l’erreur dans l’entrée du journal des erreurs S’il n’y a aucun programme de diagnostic pour analyser les entrées du journal des erreurs ou si l’analyse ne décèle aucune erreur, il est possible de spécifier un autre programme. Pour ce faire, ajoutez une strophe à la classe d’objet PDiagAtt avec l’attribut = ”diag_analyze”. L’exemple suivant illustre comment appeler un programme client pour cette condition : PDiagAtt: DClass = ”” DSClass = ”” DType = ”” attribute = ”diag_analyze” value = ”/usr/bin/customer_analyzer_program $1 $2 $3 $4 $5” rep = ”s” Si DClass, DSClass et DType ne sont pas renseignés, customer_analyzer_program s’applique à TOUTES les unités. Renseigner DClass, DSClass et DType active customer_analyzer_program uniquement pour ce type d’unité. Cette strophe insérée dans la base de données ODM provoque l’activation du programme spécifié si aucun programme de diagnostic n’est spécifié pour l’erreur ou si l’analyse ne décèle aucune erreur. Les mots–clés suivants seront automatiquement étendus comme arguments pour le programme d’analyse : Mots–clé Définition $1 Le mot–clé ”diag_analyze” $2 Le nom de la ressource à l’origine de l’erreur $3 L’un des cas suivants : • Le libellé de l’erreur d’après l’entrée du journal des erreurs si appemé pour ELA • Le mot–clé ”PERIODIC” si appelé pour Periodic Diagnostics. • Le mot–clé ”REMINDER” si appelé pour fournir un Diagnostic Reminder. $4 Le type d’unité $5 L’un des mots–clés suivants : • ”no_trouble_found” si l’analyseur a été activé mais qu’aucune erreur n’a été trouvée • ”no_analyzer” si l’analyseur est indisponible 9-18 Guide de résolution des incidents et références Pour activer la fonction d’analyse, connectez-vous en tant qu’utilisateur racine et entrez : /usr/lpp/diagnostics/bin/diagela ENABLE Pour la désactiver, connectez-vous en tant qu’utilisateur racine et entrez : /usr/lpp/diagnostics/bin/diagela DISABLE diagela peut également être activé et désactivé via l’aide au service Periodic Diagnostic. Diagnostics du matériel 9-19 9-20 Guide de résolution des incidents et références Chapitre 10. Journalisation des erreurs La fonction de journalisation des erreurs permet d’enregistrer les incidents matériels et logiciels dans le journal des erreurs - à titre d’information ou pour y remédier. Ce chapitre traite des points suivants : • Journalisation des erreurs - Présentation, page 10-3 • Gestion de la journalisation des erreurs, page 10-4 • Tâches de journalisation des erreurs, page 10-8 • Journalisation des erreurs et messages d’alerte, page 10-18 • Commandes de journalisation des erreurs, page 10-19 • Analyse automatique du journal des erreurs, page 9-17 Sous AIX version 4, certaines commandes du journal des erreurs sont proposées dans le module en option bos.sysmgt.serv_aid. Le système de base (bos.rte) inclut les services dédiés à la journalisation des erreurs dans le fichier journal : sous-programmes errlog, services de noyau errsave et errlast, pilote d’erreur /dev/error, démon error et commande errstop. Les commandes nécessaires installer les programmes sous licence (errinstall et errupdate) sont également dans bos.rte. Pour en savoir plus, reportez-vous à ”Module Aides aux services”, page 1-5. Pour plus d’informations sur le transfert du fichier journal sur un système doté du module Aides aux services, reportez-vous à ”Transfert du journal des erreurs sur un autre système”, page 10-4. Journalisation des erreurs 10-1 La figure suivante illustre le processus de journalisation des erreurs : SMIT application(s) locale(s) commande errpt Notification de l’erreur Données de configuration démon error Données techniques essentielles (VPD) fichier journal erreurs Fiches d’erreurs Module de détection sous-routine errlog espace utilisateur espace noyau routine détection Kernel ou Interrupt service noyau errsave /dev/error Processus de journalisation des erreurs 10-2 Guide de résolution des incidents et références Journalisation des erreurs - Présentation Le processus de journalisation des erreurs débute lorsqu’un module du système d’exploitation détecte une erreur. Le segment du code détecteur d’erreurs transmet les informations au service de noyau errsave ou au sous-programme errlog. Ces informations sont ensuite consignées dans le fichier spécialisé /dev/error. En outre, le processus horodate les données collectées. Le démon errdemon contrôle régulièrement le fichier /dev/error à la recherche de nouvelles entrées et exécute une série d’opérations lorsqu’il en trouve une. Avant qu’une erreur ne soit enregistrée dans le journal des erreurs, le démon errdemon compare l’étiquette d’erreur transmise par le code du noyau ou de l’application avec le contenu du référentiel des fiches d’erreurs. Si l’étiquette correspond à un élément du référentiel, le démon collecte des données supplémentaires dans d’autres parties du système. Pour enregistrer une erreur, le démon errdemon extrait la fiche appropriée du référentiel, le nom de ressource de l’unité qui a détecté l’erreur et les données détaillées. Si l’incident est d’origine matérielle, le démon récupère les données techniques essentielles (VPD) existantes dans le gestionnaire d’objets ODM. Quand vous accédez au journal des erreurs, via SMIT ou via la commande errpt, il est au format de la fiche d’erreur du référentiel et présenté dans un rapport abrégé ou détaillé. La plupart des entrées du journal des erreurs correspondent à des problèmes logiciels et matériels ; certaines sont des messages d’information. La commande diag utilise le journal des erreurs en partie pour diagnostiquer des problèmes matériels. Pour diagnostiquer correctement les nouveaux incidents, le système supprime du journal des erreurs les entrées relatives au matériel qui y figurent depuis plus de 90 jours. Quant aux entrées concernant le logiciel, elles sont supprimées à l’issue de 30 jours. Voici quelques termes relatifs à la journalisation des erreurs : ID erreur (error ID) Code CRC hexadécimal de 32 bits identifiant une erreur particulière. Chaque fiche d’erreur a un ID erreur unique. étiquette d’erreur (error label) Nom mnémonique d’un ID erreur. journal des erreurs (error log) Fichier dans lequel sont consignés tous les incidents du système. entrée du journal des erreurs (error log entry) Enregistrement décrivant un incident matériel ou logiciel, ou un message destiné à l’opérateur. Chaque enregistrement contient les données relatives à l’incident. fiche d’erreur (error record template) Description formatée du contenu d’un rapport d’erreur, c’est-à-dire les informations relatives au type et à la classe de l’erreur, à ses causes probables et aux interventions préconisées. Le référentiel des fiches d’erreurs regroupe la totalité des fiches. Journalisation des erreurs 10-3 Gestion de la journalisation des erreurs La journalisation des erreurs est lancée automatiquement pendant l’initialisation du système par le script rc.boot et est arrêtée de la même façon à l’arrêt du système par le script shutdown. L’analyse du journal des erreurs effectuée par le programme de diagnostic (commande diag) permet d’étudier les entrées liées aux erreurs matérielles de moins de 90 jours. Si vous supprimez des entrées de moins de 90 jours, vous limitez l’analyse du journal des erreurs. Pour gérer efficacement la journalisation des erreurs, reportez-vous à : • Transfert du journal des erreurs sur un autre système, page 10-4 • Configuration du journal des erreurs, page 10-4 • Suppression d’entrées du journal des erreurs, page 10-5 • Activation et désactivation de la journalisation pour un incident, page 10-6 • Configuration de la notification d’erreur, page 10-6 • Journalisation des activités de maintenance, page 10-6 Transfert du journal des erreurs sur un autre système Les commandes errclear, errdead, errlogger, errmsg et errpt figurent dans le module en option Aide aux services (bos.sysmgt.serv_aid). Pour générer des rapports d’après le journal des erreurs ou supprimer des entrées du journal, ce module est indispensable. Vous pouvez l’installer sur votre système ou transférer le journal des erreurs sur un système où il figure. Pour connaître le chemin d’accès au journal des erreurs, lancez la commande : /usr/lib/errdemon –l Pour transférer ce fichier, vous avez le choix de la méthode. Par exemple, vous pouvez le copier sur un système de fichiers distant via la commande cp, ou par le réseau via la commande rcp, ftp ou tftp, ou sur un support amovible via la commande tar ou backup et le restaurer sur un autre système. Pour générer des rapports d’après le journal d’erreurs copié sur votre système, vous pouvez utiliser l’indicateur –i ou la commande errpt. L’indicateur –i permet de préciser le chemin d’accès à un fichier journal autre celui par défaut. De la même façon, vous pouvez supprimer des entrées d’un journal copié sur votre système, via l’indicateur –i ou la commande errclear. Configuration du journal des erreurs Selon vos besoins, vous pouvez modifier le nom et l’emplacement du journal des erreurs ainsi que la taille de la mémoire tampon d’erreur interne. Affichage des paramètres courants Pour afficher les paramètres courants (nom et taille du journal et taille de la mémoire tampon) qui sont enregistrés dans la base de configuration du journal des erreurs, exécutez la commande /usr/lib/errdemon –l. Modification de l’emplacement du journal Pour renommer le journal d’erreurs, exécutez la commande /usr/lib/errdemon –i NomFichier. Le nouveau nom est enregistré dans la base de configuration du journal des erreurs, et le démon error est immédiatement relancé. 10-4 Guide de résolution des incidents et références Modification de la taille du fichier journal Pour modifier la taille maximale du fichier journal, entrez : /usr/lib/errdemon –s LogSize La valeur maximale de la taille du fichier est enregistrée dans la base de configuration du journal des erreurs et le démon error est immédiatement relancé. Si la nouvelle valeur est inférieure à celle du fichier journal courant, ce dernier prend l’extension .old et un nouveau fichier journal est créé à la taille précisée. L’espace indiqué est réservé au journal des erreurs et n’est accessible à aucun autre fichier. Veillez à ne pas avoir un journal d’erreurs trop volumineux. À l’inverse, si le journal est trop petit, des informations importantes risquent d’être écrasées prématurément. Lorsque le fichier journal atteint sa taille limite, il ‘boucle’ c’est-à-dire que les nouvelles entrées écrasent les plus anciennes. Modification de la taille de la mémoire tampon Pour modifier la taille de la mémoire tampon interne du pilote du journal des erreurs, entrez : /usr/lib/errdemon –B BufferSize La valeur affectée à la mémoire tampon est enregistrée dans la base de configuration du journal des erreurs et, si elle est supérieure à la taille actuelle, entre immédiatement en vigueur. Sinon, la nouvelle valeur prend effet lorsque le démon est relancé après réinitialisation du système. La taille de la mémoire tampon ne peut être inférieure à sa valeur par défaut (8 ko). La taille spécifiée est arrondie au multiple supérieur de la taille des pages mémoire (4 ko). La mémoire allouée au tampon lui est exclusivement réservée (aucun autre processus ne peut l’exploiter). Si vous affectez une valeur trop importante à la taille du tampon, vous risquez de réduire les performances du système. A l’inverse, si le tampon est trop petit, il peut être saturé rapidement et n’être pas à même de lire et placer les entrées dans le fichier à mesure qu’elles se présentent. Lorsque le tampon est saturé, les entrées sont mises de côté en attendant que de l’espace soit libéré. Dans ce cas, une entrée est créée dans le journal pour vous en informer : agrandissez la taille du tampon en conséquence. Suppression d’entrées du journal des erreurs Les entrées sont supprimées du journal des erreurs quand un utilisateur racine exécute la commande errclear, lorsque cette commande est lancée par le travail cron quotidien, et quand le fichier boucle pour cause de saturation. Lorsque le journal atteint sa taille maximale (définie dans sa base de configuration), les nouvelles entrées écrasent les plus anciennes. Suppression automatique Le système est livré avec un fichier crontab, qui supprime les erreurs matérielles datant de plus de 90 jours et les autres erreurs, au bout de 30 jours. Pour afficher les entrées crontab, entrez : crontab –l Command Pour les modifier, entrez : crontab –l Command Reportez-vous à la commande crontab. Journalisation des erreurs 10-5 Commande errclear La commande errclear supprime des entrées du journal des erreurs, selon le(s) critère(s) spécifié(s) : ID erreur, numéro d’ordre, étiquette d’erreur, nom ou classe de ressource, classe ou type d’erreur. Précisez également l’âge (en jours) des entrées à supprimer : toutes les entrées répondant à ces critères et dépassant l’âge spécifié seront supprimées. Activation et désactivation de la journalisation pour un incident Vous pouvez désactiver la journalisation ou les rapports concernant un incident donné en modifiant la zone correspondante (Log ou Report) sur sa fiche. La commande errupdate permet de modifier les paramètres courants d’un incident. Affichage des incidents non journalisés Pour afficher la liste des incidents dont la journalisation est désactivée, entrez : errpt –t –F Log=0 Ces incidents ne sont pas consignés dans le journal des erreurs. Affichage des incidents dont la fonction de rapport est désactivée Pour afficher la liste des incidents dont la fonction de rapport est désactivée, entrez : errpt –t –F Report=0 Ces incidents sont enregistrés dans le journal des erreurs, mais ne sont pas affichés par la commande errpt. Modification des paramètres courants d’un incident La commande errupdate permet de modifier les paramètres courants d’un incident. L’entrée de cette commande peut être issue d’un fichier ou de l’entrée standard. Dans l’exemple suivant, l’entrée standard est utilisée. Pour désactiver la fonction de rapport de l’incident ERRLOG_OFF (ID erreur 192AC071), entrez les lignes suivantes, afin d’exécuter la commande errupdate : errupdate <Enter> =192AC071: <Enter> Report=False <Enter> <Ctrl–D> <Ctrl–D> Configuration de la notification d’erreur Pour en savoir plus, reportez-vous à ”Error Notification Object Class” dans dans AIX General Programming Concepts : Writing and Debugging Programs. Journalisation des activités de maintenance La commande errlogger permet à l’administrateur système d’enregistrer des messages dans le journal des erreurs. Lorsque vous procédez à ces tâches de maintenance (par exemple, suppression d’entrées du journal des erreurs, remplacement de matériel, correction d’un logiciel), il est utile de les enregistrer dans le journal des erreurs. 10-6 Guide de résolution des incidents et références Réacheminement des messages syslog vers le journal des erreurs Certaines applications font appel à syslog pour la journalisation des erreurs. Les administrateurs préfèrent parfois regrouper sur un même rapport les messages du journal des erreurs et les messages syslog. Pour ce faire, il suffit de réacheminer les messages syslog vers le journal des erreurs. Entrez errlog comme destination dans le fichier de configuration syslog (/etc/syslog.conf). Reportez-vous au démon syslogd pour plus d’informations. Acheminement des messages du journal des erreurs vers syslog Vous pouvez enregistrer des incidents du journal des erreurs dans le fichier syslog en associant à la commande logger la fonction de notification d’erreurs. Par exemple, pour enregistrer les messages systèmes (syslog), ajoutez un objet errnotify incluant ce qui suit : errnotify: en_name = ”syslog1” en_persistenceflg = 1 en_method = ”logger Msg from Error Log: ‘errpt –l $1 | grep –v ’ERROR_ID TIMESTAMP’‘” Par exemple, créez le fichier /tmp/syslog.add comprenant ces éléments, puis exécutez la commande odmadd /tmp/syslog.add (seul un utilisateur racine est habilité à exécuter cette commande). Pour plus d’informations sur la notification concurrente d’erreurs, reportez-vous à ”Error Notification Object Class” dans dans AIX General Programming Concepts : Writing and Debugging Programs. Journalisation des erreurs 10-7 Tâches de journalisation des erreurs Cette section traite des points suivants : • Lecture d’un rapport d’erreurs, page 10-8 • Exemples de rapports détaillés, page 10-10 • Exemple de rapport abrégé, page 10-15 • Création d’un rapport d’erreurs, page 10-15 • Arrêt de la journalisation des erreurs, page 10-16 • Suppression d’entrées du journal des erreurs, page 10-16 • Copie du journal des erreurs sur disquette ou sur bande, page 10-17 Lecture d’un rapport d’erreurs Pour obtenir le rapport des erreurs enregistrées au cours des 24 heures précédant l’incident, entrez : errpt –a –s jjmmaahhmm | pg jjmmaahhmm représentant la date (jour, mois, année, heure et minutes) 24 heures avant l’incident. Un rapport d’erreurs contient les informations suivantes : Remarque : Toutes les erreurs ne génèrent pas la totalité de ces informations. 10-8 ÉTIQUETTE (LABEL) Nom prédéfini de l’incident. ID Identificateur numérique de l’incident. Date/heure(Date/Time) Date et heure d’enregistrement de l’incident. Numéro d’ordre (Sequence Number) Numéro unique de l’incident. ID machine (Machine ID) Numéro d’identification du processeur. ID nœud (Node ID) Nom mnémonique du système. Classe erreurs (Class) Source globale de l’erreur. Les classes d’erreur possibles sont : H Erreur matérielle. (Si l’incident est d’origine matérielle, reportez-vous à votre guide de l’opérateur pour plus d’informations sur la réalisation de diagnostics matériels.) Le programme de diagnostic teste le matériel et analyse les enregistrements du journal des erreurs pour connaître l’état du matériel. S Erreur logicielle. O Messages d’information. U Erreur indéterminée (liée au réseau, par exemple). Guide de résolution des incidents et références Type erreurs (Type) Gravité de l’incident. Il existe cinq types d’erreurs : PEND Indisponibilité imminente d’une unité ou d’un de ses composants. PERF Une unité ou un de ses composants fonctionne en dessous du seuil d’efficacité acceptable. PERM Incident qui n’a pu être résolu. Les erreurs de ce type sont des erreurs graves ; elles indiquent qu’une unité logicielle ou matérielle est défectueuse. Les types autres que PERM ne signalent pas un élément défectueux ; elles sont cependant enregistrées pour être analysées par le programme de diagnostic. TEMP Incident résolu après plusieurs tentatives infructueuses. Ce type d’erreurs permet également d’enregistrer les messages d’information, comme les statistiques de transfert de données pour les unités de stockage à accès direct. UNKN Degré de gravité de l’erreur impossible à déterminer. INFO Message d’information. Nom ressource Nom de la ressource qui a détecté l’erreur. Pour les erreurs logicielles, il s’agit d’un composant logiciel ou d’un programme exécutable. Pour les erreurs matérielles, il s’agit d’une unité ou d’un composant du système. N’est pas utilisé pour indiquer que le composant est défectueux ou qu’il doit être remplacé, mais pour déterminer les modules diagnostics à utiliser pour analyser l’erreur. Classe ressource Classe de la ressource qui a détecté l’anomalie (par exemple, disk). Type de ressource Type de la ressource qui a détecté l’anomalie (par exemple, 355mb). Code d’emplacement Chemin d’accès à l’unité. Comporte quatre zones maximum (tiroir, emplacement, connecteur et port). VPD Données techniques essentielles (VPD) Le contenu de cette zone, si indiqué, est variable. Les enregistrements du journal des erreurs relatives aux unités matérielles contiennent des informations concernant le fabricant, le numéro de série, les niveaux de modification technique et les niveaux de mémoire morte. Description Résumé de l’erreur. Causes probables Liste de quelques causes probables de l’incident. Cause utilisateur Liste des causes possibles d’erreurs utilisateur. Par exemple, disquette mal insérée ou unité (modem, imprimante,...) hors tension. Actions recommandées Description de l’intervention qui résoudra l’erreur utilisateur. Cause installation Liste des causes possibles d’erreurs dues à une installation ou à une configuration incorrectes. Les erreurs de ce type englobent les incompatibilités entre le matériel et le logiciel, les mauvais branchements de câbles, les configurations incorrectes de systèmes. Journalisation des erreurs 10-9 Actions recommandées Description de l’intervention qui résoudra l’erreur d’installation. Causes anomalie Liste des défauts logiciels ou matériels possibles. Remarque : Si l’anomalie concerne une entrée du journal relative au logiciel, le logiciel est généralement défectueux. En revanche, les entrées mettant en cause l’utilisateur ou l’installation indiquent que le logiciel n’est pas à l’origine de l’erreur. Si vous pensez que le logiciel est défectueux ou que vous n’êtes pas en mesure de résoudre l’incident, prévenez le service de maintenance logiciel. Actions recommandées Description de l’intervention qui résoudra l’incident. Dans le cas d’erreurs matérielles, l’EXÉCUTION DES PROCÉDURES D’IDENTIFICATION DES INCIDENTS MATÉRIELS est l’une des actions recommandées. Elle vous invite à lancer les programmes de diagnostic. Données de détail Informations propres à chaque entrée du journal des erreurs, telles que les données de détection d’une unité. La fonction de rapport peut avoir été désactivée pour certaines erreurs. Pour les afficher, entrez : errpt –t –F report=0 | pg Si cette fonction est désactivée pour toutes les erreurs, entrez la commande errupdate. La fonction d’enregistrement peut également avoir été désactivée pour certaines erreurs. Pour afficher ces dernières, entrez : errpt –t –F log=0 | pg Si cette fonction est désactivée pour toutes les erreurs, entrez la commande errupdate. L’enregistrement de toutes les erreurs se révèle utile quand il est nécessaire de recréer une erreur système. Exemples de rapports détaillés Vous trouverez ci-dessous des exemples de rapports d’erreurs générés par la commande errpt –a. La classe d’erreur H et le type PERM indiquent que l’incident système est d’origine matérielle (pilote d’adaptateur SCSI) et qu’il n’est pas résolu. LABEL: ID: 10-10 SCSI_ERR1 0502F666 Guide de résolution des incidents et références Date/Time: Jun 19 22:29:51 Sequence Number: 95 Machine ID: 123456789012 Node ID: host1 Class: H Type: PERM Resource Name: scsi0 Resource Class: adapter Resource Type: hscsi Location: 00–08 VPD: Device Driver Level.........00 Diagnostic Level............00 Displayable Message.........SCSI EC Level....................C25928 FRU Number..................30F8834 Manufacturer................IBM97F Part Number.................59F4566 Serial Number...............00002849 ROS Level and ID............24 Read/Write Register Ptr.....0120 Description ADAPTER ERROR Probable Causes ADAPTER HARDWARE CABLE CABLE TERMINATOR DEVICE Failure Causes ADAPTER CABLE LOOSE OR DEFECTIVE Recommended Actions PERFORM PROBLEM DETERMINATION PROCEDURES CHECK CABLE AND ITS CONNECTIONS Detail Data SENSE DATA 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 La classe d’erreurs H et le type PEND indiquent qu’un élément matériel (ici, le réseau en anneau à jeton) risque d’être inaccessible en raison des nombreuses erreurs détectées par le système. LABEL: ID: TOK_ESERR AF1621E8 Journalisation des erreurs 10-11 Date/Time: Sequence Number: Machine Id: Node Id: Class: Type: Resource Name: Resource Class: Resource Type: Location: Jun 20 11:28:11 17262 123456789012 host1 H PEND TokenRing tok0 Adapter TokenRing Description EXCESSIVE TOKEN–RING ERRORS Probable Causes TOKEN–RING FAULT DOMAIN Failure Causes TOKEN–RING FAULT DOMAIN Recommended Actions REVIEW LINK CONFIGURATION DETAIL DATA CONTACT TOKEN–RING ADMINISTRATOR RESPONSIBLE FOR THIS LAN Detail Data SENSE DATA 0ACA 0032 A440 0000 2080 0000 0000 0000 78CC 1000 5A4F 5685 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0000 0000 3030 0000 0000 0000 0000 0010 0000 3030 0000 0000 0000 0000 0000 0005 0000 0000 0000 0000 0000 0000 C88F 0000 0000 0000 0000 0000 0304 0000 0000 0000 0000 0000 F4E0 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 1000 0000 0000 0000 0000 0000 5A4F 0000 0000 0000 La classe d’erreurs S et le type PERM indiquent que l’incident système est d’origine logicielle et qu’il n’est pas résolu. LABEL: ID: 10-12 DSI_PROC 20FAED7F Guide de résolution des incidents et références 0000 0000 5685 0000 0000 0000 Date/Time: Sequence Number: Machine Id: Node Id: Class: Type: Resource Name: Jun 28 23:40:14 20136 123456789012 123456789012 S PERM SYSVMM Description Data Storage Interrupt, Processor Probable Causes SOFTWARE PROGRAM Failure Causes SOFTWARE PROGRAM Recommended Actions IF PROBLEM PERSISTS THEN DO THE FOLLOWING CONTACT APPROPRIATE SERVICE REPRESENTATIVE Detail Data Data Storage Interrupt Status Register 4000 0000 Data Storage Interrupt Address Register 0000 9112 Segment Register, SEGREG D000 1018 EXVAL 0000 0005 La classe d’erreurs S et le type TEMP indiquent que l’incident système est d’origine logicielle. Après plusieurs tentatives, le système est parvenu à résoudre l’incident. LABEL: ID: SCSI_ERR6 52DB7218 Journalisation des erreurs 10-13 Date/Time: Sequence Number: Machine Id: Node Id: Class: Type: Resource Name: Jun 28 23:21:11 20114 123456789012 host1 S INFO scsi0 Description SOFTWARE PROGRAM ERROR Probable Causes SOFTWARE PROGRAM Failure Causes SOFTWARE PROGRAM Recommended Actions IF PROBLEM PERSISTS THEN DO THE FOLLOWING CONTACT APPROPRIATE SERVICE REPRESENTATIVE Detail Data SENSE DATA 0000 0000 0000 FFFE 4000 1C1F 0325 0018 0040 0000 0100 0000 0000 0000 0000 01A9 1500 0000 0000 09C4 0000 0000 0011 0000 0000 0000 0000 000F 0000 0000 0008 0000 0000 0000 000E 0000 0000 0000 0900 0000 0000 0000 0000 0000 0000 0000 0000 FFFF 0000 0000 FFFF FFFF 0800 0000 La classe d’erreurs O indique qu’un message d’information a été enregistré dans le journal des erreurs. LABEL: ID: 10-14 OPMSG AA8AB241 Guide de résolution des incidents et références Date/Time: Sequence Number: Machine Id: Node Id: Class: Type: Resource Name: Jul 16 03:02:02 26042 123456789012 host1 O INFO OPERATOR Description OPERATOR NOTIFICATION User Causes errlogger COMMAND Recommended Actions REVIEW DETAILED DATA Detail Data MESSAGE FROM errlogger COMMAND hdisk1 : Error log analysis indicates a hardware failure. Exemple de rapport abrégé Vous trouverez ci-dessous un exemple de rapport abrégé des erreurs généré par la commande errpt. Une seule ligne d’information est générée par erreur. Remarque : La section ”Identificateurs d’erreur”, page C-1 présente la liste des erreurs possibles pour chaque étiquette. ERROR_ IDENTIFIER 192AC071 0E017ED1 9DBCFDEE 038F2580 AA8AB241 TIMESTAMP 0101000070 0405131090 0101000070 0405131090 0405130990 T I P I U I CL 0 H 0 H O RESOURCE_NAME errdemon mem2 errdemon scdisk0 OPERATOR ERROR_DESCRIPTION Error logging turned off Memory failure Error logging turned on UNDETERMINED ERROR OPERATOR NOTIFICATION Création d’un rapport d’erreur Procédez comme suit : 1. Déterminez si le journal des erreurs est activé. Pour ce faire, vérifiez s’il contient des entrées : errpt –a Journalisation des erreurs 10-15 La commande errpt génère un rapport d’erreurs à partir des entrées du journal des erreurs système. S’il ne contient aucune entrée, le journal est désactivé. Pour l’activer, entrez : /usr/lib/errdemon Remarque : Seul un utilisateur racine est habilité à exécuter cette commande. Le démon errdemon lance la journalisation des erreurs et consigne des entrées dans le journal des erreurs système. Si le démon est désactivé, les entrées ne sont pas consignées dans le journal. 2. Exécutez la commande errpt pour créer un rapport d’erreurs. Par exemple, pour visualiser toutes les erreurs de l’unité de disque hdisk1, entrez : errpt –N hdisk1 3. Vous pouvez générer un rapport par via SMIT. Par exemple, utilisez la commande smit errpt : smit errpt Choisissez 1 pour envoyer le rapport en sortie standard ou 2 pour l’envoyer vers l’imprimante. Choisissez oui pour afficher ou imprimer les entrées du journal des erreurs au fur et à mesure ; sinon, choisissez non. Indiquez le nom de l’unité appropriée dans Sélection noms de ressource (par exemple, hdisk1). Sélectionnez Exéc. Arrêt de la journalisation des erreurs La procédure ci-dessous décrit comment mettre fin à la journalisation des erreurs. En temps ordinaire, il n’y a pas lieu d’arrêter la journalisation des erreurs. Il est préférable de nettoyer le journal des erreurs en supprimant toute entrée ancienne ou inutile. Reportez-vous à ”Suppression d’entrées du journal des erreurs”, page 10-16. Il est conseillé de désactiver la journalisation des erreurs lors de l’installation ou du test d’une nouvelle unité logicielle ou matérielle. De cette façon, le démon logging n’utilise pas l’unité centrale pour enregistrer les erreurs attendues. Remarque : Seul un utilisateur racine est habilité à exécuter la commande suivante. Pour désactiver la journalisation des erreurs, entrez la commande errstop : errstop La commande errstop arrête le démon de journalisation des erreurs. Suppression d’entrées du journal des erreurs La procédure ci-dessous décrit comment éliminer du journal des erreurs les entrées devenues inutiles. Cette tâche est automatique pendant l’exécution quotidienne de la commande cron. Si ce ”nettoyage” n’est pas automatique, il est recommandé d’éliminer régulièrement les entrées inutiles, après vous être assuré que les incidents détectés ont été traités. 10-16 Guide de résolution des incidents et références L’élimination des erreurs peut être sélective : si vous avez un nouveau disque, vous pouvez supprimer les erreurs relatives à l’ancien, pour éviter toute confusion dans le journal. Pour supprimer les entrées du journal des erreurs, vous avez le choix entre deux méthodes. • Commande errclear –d : Par exemple, pour supprimer toutes les entrées relatives aux incidents logiciels, entrez : errclear –d S 0 errclear supprime du journal toutes les entrées enregistrées depuis un certain nombre de jours. Dans l’exemple ci-dessus, l’option 0 signifie que la commande s’applique à tous les jours et non à une période déterminée. • Commande smit errclear : smit errclear Copie du journal des erreurs sur disquette ou sur bande Procédez comme suit : • Pour copier le journal des erreurs sur disquette, exécutez les commandes ls et backup. Insérez une disquette formatée dans le lecteur approprié et entrez : ls /var/adm/ras/errlog | backup –ivp • Pour copier le journal sur bande, placez une bande dans le lecteur approprié et entrez : ls /var/adm/ras/errlog | backup –ivpf/dev/rmt0 OU • Lancez la commande snap pour copier les informations relatives à la configuration du système dans un fichier tar et recopiez-le sur une disquette. Insérez une disquette formatée dans le lecteur approprié et entrez : Remarque : Seuls les utilisateurs racine sont habilités à utiliser la commande snap. snap –a –o /dev/rfd0 Dans cet exemple, l’indicateur –a permet de collecter toute information relative à la configuration du système. L’indicateur –o copie le fichier compressé tar vers l’unité que vous désignez. /dev/rfd0 représente l’unité de disque. Pour collecter les informations relatives à la configuration dans un fichier tar et le copier sur bande, entrez : snap –a –o /dev/rmt0 /dev/rmt0 donne un nom à votre lecteur de bande. Pour plus d’informations, reportez-vous à la commande snap dans le manuel AIX Commands Reference. Journalisation des erreurs 10-17 Journalisation des erreurs et messages d’alerte Lorsque la zone Alert d’une fiche d’erreur a la valeur True, les programmes traitant les alertes se servent des zones suivantes du journal des erreurs : • Class (classe d’erreur) • Type (type d’erreur) • Description • Probable Cause (origine probable) • User Cause (erreur utilisateur) • Install Cause (erreur de l’installation) • Failure Cause (anomalie) • Recommended Action (action recommandée) • Detail Data (données de détail) Ces zones doivent être définies conformément à l’architecture SNA Generic Alert. Les alertes non définies conformément à cette architecture ne peuvent pas être correctement traitées par un programme récepteur, tel que NetView. Les messages ajoutés au journal des erreurs ne doivent pas entrer en conflit avec l’architecture SNA Generic Alert. Lorsqu’ils sont ajoutés via la commande errmsg, cette dernière sélectionne les numéros de messages qui ne sont pas en conflit avec l’architecture. Si la zone Alert d’une fiche d’erreur a la valeur False, vous pouvez utiliser n’importe quel message du catalogue du journal des erreurs. 10-18 Guide de résolution des incidents et références Commandes de journalisation des erreurs Cette section traite des points suivants : • Commandes de journalisation des erreurs, page 10-19 • Sous-routines et services de noyau pour la journalisation des erreurs, page 10-20 • Fichiers de journalisation des erreurs, page 10-20 Commandes de journalisation des erreurs errclear Supprime des entrées du journal des erreurs. Cette commande peut effacer complètement le journal des erreurs. Supprime les entrées dont l’ID, la classe ou le type est spécifié. errdead Extrait certains enregistrements de la mémoire tampon du fichier /dev/error provenant du cliché système. Le cliché système ne contient des enregistrements d’erreurs que si le démon errdemon était inactif avant ce cliché. errdemon Ce démon lit les enregistrements du fichier /dev/error, puis les consigne dans le journal des erreurs. errdemon procède également à la notification de l’erreur, comme spécifié dans le gestionnaire d’objets ODM. Ce démon est lancé automatiquement lors de l’initialisation du système. errinstall Sert à ajouter ou remplacer des messages dans le catalogue des messages d’erreur. Cette commande est utilisée par les procédures d’installation du logiciel. Le système génère un fichier de sauvegarde appelé Fichier. undo qui permet d’annuler les modifications effectuées via la commande errinstall. errlogger Consigne un message opérateur dans le journal des erreurs. errmsg Intègre la journalisation des erreurs à des applications ‘maison’. errmsg permet d’ajouter, supprimer ou établir la liste des messages enregistrés dans le catalogue des messages d’erreur. Avec cette commande, vous pouvez ajouter du texte dans les zones Error Description, Probable Cause, User Cause, Install Cause, Failure Cause, Recommended Action et Detailed Data. errpt Génère un rapport d’erreurs à partir des entrées du journal d’erreurs système. Ce rapport peut être simple (une ligne par entrée) ou détaillé. Dans le rapport, les entrées concernant certains types ou classes peuvent être omises ou incluses. Journalisation des erreurs 10-19 errstop Interrompt le démon errdemon, lancé automatiquement lors de l’initialisation du système. errstop permet également de désactiver les fonctions de diagnostic et de récupération. errupdate Ajoute ou supprime des fiches d’erreur du référentiel de fiches du journal des erreurs. Permet également de modifier les attributs Alert, Log et Report d’une fiche d’erreur. Cette commande est utilisée par les procédures d’installation du logiciel. Sous-routines de journalisation et services de noyau errlog Consigne une erreur sur le pilote d’unité du journal des erreurs. errsave et errlast Permet au noyau et à ses extensions d’écrire dans le journal des erreurs. Fichiers de journalisation des erreurs /dev/error Fournit les interfaces de pilotes d’unités standard requises par les composants du journal des erreurs. /dev/errorctl Fournit les interfaces de pilotes d’unités non standard requises pour le contrôle du journal des erreurs système. /usr/include/sys/err_rec.h Contient les structures définies comme arguments du service de noyau errsave et de la sous-routine errlog. /var/adm/ras/errlog Enregistre les incidents survenus sur le système. /var/adm/ras/errtmplt Contient le référentiel des fiches d’erreurs. Voir aussi ”Error Notification Object Class” dans AIX General Programming Concepts : Writing and Debugging Programs. 10-20 Guide de résolution des incidents et références Chapitre 11. Utilitaire de suivi Remarque : Sous AIX version 4, le sous-système d’utilitaire de suivi se trouve dans le module en option Software Trace Service Aids (bos.sysmgt.trace.obj). Bien que le système de base comprenne les fonctions minimales de suivi (sous-routines trcstart, trcstop, trcon et trcoff, et commande trcupdate), vous devez installer le module Software Trace Service Aids pour activer le démon trace et générer des rapports de suivi. L’utilitaire de suivi vous aide à identifier les incidents système en surveillant des événements sélectionnés. Il vous permet de surveiller les événements suivants : entrées/sorties de certaines sous-routines, routines de noyau, routines d’extension de noyau et gestionnaires d’interruption. L’utilitaire de suivi enregistre un flot séquentiel d’événements système, procurant un niveau de détail pointu de l’activité du système. Les événements sont montrés en séquence et dans le contexte d’autres événements. L’utilitaire de suivi se révèle utile pour obtenir des informations étendues et comprendre quand, comment et même pourquoi l’événement s’est produit. Ces informations sont enregistrées dans un fichier journal système appelé trace. Les commandes de l’utilitaire permettent d’activer et de contrôler les suivis et de générer des rapports de suivi. Les programmes et les extensions de noyau disposent de plusieurs sous-routines pour enregistrer des événements supplémentaires. Cette section traite des points suivants : • Lancement de l’utilitaire de suivi, page 11-2 • Commandes de l’utilitaire de suivi, page 11-6 Utilitaire de suivi 11-1 Lancement de l’utilitaire de suivi Cette section traite des points suivants : • Configuration de la commande trace, page 11-2 • Enregistrement de données de suivi, page 11-4 • Canaux de suivi génériques, page 11-4 • Lancement de la fonction de suivi, page 11-4 • Arrêt de la fonction de suivi, page 11-5 • Création de rapport de suivi, page 11-5 Configuration de la commande trace La commande trace lance le suivi des événements du système, contrôle la taille du fichier journal trace et le gère ainsi que les tampons internes de suivi qui collectent les données des événements de suivi. Sa syntaxe est la suivante : trace [–fl] [–ad] [–s] [–h] [–jk events] [,events] [–m message] [–o outfile][–g] [–T buf_sz] [–L log_sz] Les options de la commande trace sont les suivantes : –f ou –l Contrôle l’enregistrement en mémoire centrale des données de suivi. Si aucune des options –f et –l n’est spécifiée, l’utilitaire de suivi crée deux zones tampons dans la mémoire centrale pour enregistrer ces données. trace permet également de gérer les fichiers de suivi et les tampons internes (y compris leur taille). Les indicateurs –f et –l permettent d’éviter l’écriture des données dans le fichier pendant leur collecte. Ces options permettent de recueillir des données jusqu’à saturation du tampon (–f enregistre les premières données), ou d’utiliser la mémoire tampon comme une mémoire circulaire qui ne collecte que les derniers événements avant l’arrêt de la fonction trace (–l). –f et –l s’excluent mutuellement. Avec l’indicateur –f ou –l, les données sont transférées des tampons dans le fichier une fois que la fonction trace n’est plus active. –a Exécute la collecte de façon asynchrone (en arrière-plan), et renvoie une invite de ligne de commande. Sans cette option, la commande trace s’exécute en mode sous-commande (similaire à la commande crash) et renvoie l’invite >. Vous pouvez exécuter des sous-commandes et des commandes shell classiques via la sous-commande trace en les faisant précéder d’un point d’exclamation (!). –d Diffère la collecte des données. L’utilitaire de suivi est configuré. La collecte est différée jusqu’à l’occurrence d’un événement déclencheur. Les différentes méthodes permettant de déclencher ou d’arrêter la collecte de données sont les suivantes : • sous-commandes trace • commandes trace • sous-routines trace 11-2 Guide de résolution des incidents et références événements –j ou événements –k Désigne un ensemble d’événements à inclure (–j) ou exclure (–k) du processus de collecte. La liste de ces événements est formée d’une série d’ID hexadécimaux de trois chiffres séparés par un espace. –s Interrompt la collecte de données quand le fichier journal trace atteint sa taille maximale. L’option par défaut est de boucler et d’écraser les données du fichier journal selon le principe du premier entré, premier sorti (FIFO). –h N’ajoute pas d’en-tête date/sysname/message au fichier journal trace. –m message Texte (message) à intégrer à l’enregistrement d’en-tête du journal trace. Ce message apparaît dans les rapports générés via la commande trcrpt. –o outfile Désigne le fichier à utiliser comme fichier journal. Sans l’option –o, le fichier journal par défaut est /var/adm/ras/trcfile. Pour acheminer les données de suivi vers la sortie standard, l’option –o doit figurer sous la forme –o –. N’utilisez cette procédure que pour diriger le flot de données vers un autre processus car les données de suivi contiennent des événements binaires non affichables. –g Duplique la syntaxe de trace pour différents canaux. Le canal par défaut, canal 0, est toujours utilisé pour l’enregistrement des événements système. Les autres sont des canaux génériques et leur utilisation n’est pas prédéfinie. Leur usage est varié au sein du système. Ils sont disponibles pour les applications utilisateur. Chaque canal représente un flot de données distinct. Les événements enregistrés dans le canal 0 sont mélangés au flot prédéfini d’événements système. Les autres canaux n’ont pas d’usage prédéfini et leur affectation est générique. En général, un programme requiert qu’un canal générique soit ouvert via la sous-routine trcstart. Le numéro du canal de suivi générique (ID canal) est renvoyé à l’application qui l’a demandé, de la même façon qu’un descripteur de fichier est renvoyé à l’ouverture d’un fichier. Le programme peut enregistrer des événements dans ce canal et obtenir ainsi un flot de données privé. Dans quelques cas, la commande trace peut servir à configurer un canal de suivi générique en lui attribuant un numéro de canal. –T size et –L size Spécifient respectivement (en octets) la taille des tampons de collecte et la taille maximale du fichier journal. Remarque : L’utilitaire de suivi réservant les tampons de collecte de données, cette mémoire est indisponible pour le reste du système. Ceci peut avoir un impact sur les performances d’un système dont la capacité de mémoire est restreinte. Si l’application gérée n’a pas une capacité de mémoire restreinte, ou si la routine trace n’utilise qu’une faible proportion de la mémoire disponible, l’impact de la mémoire bloquée par trace est minime. Si vous ne précisez pas de valeur, trace utilise la taille définie par défaut. Utilitaire de suivi 11-3 Enregistrement de données de suivi Les données enregistrées pour chaque événement consistent en un mot contenant l’identificateur et le type de point d’ancrage, suivi d’un nombre variable de mots, puis éventuellement de l’horodate. Le premier mot est appelé mot d’ancrage. Les deux autres octets du mot d’ancrage, appelés données d’ancrage, servent à l’enregistrement des événements de suivi. Identificateur de point d’ancrage Cet ID, constitué de trois chiffres hexadécimaux, identifie l’événement en cours de suivi. L’ID point d’ancrage est spécifié dans les douze premiers bits du mot d’ancrage. Les valeurs comprises entre 0x010 et 0x0FF sont disponibles pour les applications utilisateur. Toutes les autres valeurs sont réservées à l’usage du système. La commande trcrpt –j fournit la liste des ID points d’ancrage définis sur le système. Ces ID, figurant dans le fichier /usr/include/sys/trchkid.h, et les modèles de formatage, dans le fichier /etc/trcfmt, sont partagés par tous les canaux de suivi. Type de point d’ancrage Le type de point d’ancrage, défini par l’utilisateur, identifie la composition des données d’événement. Il occupe les bits 12 à 16 du mot d’ancrage. Pour en savoir plus, reportez-vous aux sous-routines trcgen, trcgenk et trchook. Canaux de suivi génériques L’utilitaire de suivi peut prendre en charge jusqu’à huit sessions d’analyse simultanées. Chaque session utilise un canal du fichier spécialisé de suivi multiplexé /dev/systrace. Le canal 0 sert à enregistrer les événements système. L’analyse de ces derniers est respectivement lancée et arrêtée par les commandes trace et trcstop. Les canaux 1 à 7, appelés canaux génériques, sont utilisés par des sous-systèmes pour enregistrer d’autres types d’analyse portant, par exemple, sur la liaison de données. Pour utiliser les canaux génériques pour le suivi, un sous-système fait appel à la sous-routine trcstart qui active un canal et détermine son numéro. Les modules du sous-système enregistrent ensuite les événements via trcgen, trcgent, trcgenk ou trcgenkt. Le numéro de canal renvoyé par trcstart est l’un des paramètres qui doit être transmis à ces sous-routines. Le sous-système peut suspendre et reprendre la collecte des données de suivi, via les sous-routines trcoff et trcon, et peut en outre désactiver un canal de suivi via trcstop. Les événements de suivi de chaque canal doivent être écrits dans un fichier journal de suivi séparé que vous désignez quand vous appelez la sous-routine trcstart). Le sous-système doit fournir l’interface utilisateur nécessaire pour activer et désactiver le suivi. Lancement de la fonction de suivi Vous avez le choix entre les procédures suivantes : • Via la commande trace. Lance le suivi de façon asynchrone. Par exemple : trace –a mycmd trcstop 11-4 Guide de résolution des incidents et références Le démon trace analyse les événements système sélectionnés (par exemple, la commande mycmd). La commande trcstop met fin à la fonction de suivi. OU Lancez le suivi de façon interactive. Par exemple : trace –>!mycmd –>quit Passe en mode interactif (indiqué par l’invite –>). Utilisez les sous-commandes trace (telles que !) pour le suivi des événements système sélectionnés. Utilisez quit pour mettre fin au suivi. • Via smit trace et l’option Start Trace. smit trace Arrêt de la fonction de suivi Lancez l’une des procédures suivantes : • Si la fonction de suivi a été lancée en mode asynchrone à partir de la ligne de commande, entrez la commande trcstop : trace –a mycmd trcstop Le démon trace analyse les événements système sélectionnés (par exemple la commande mycmd). La commande trcstop met fin à la fonction de suivi. • Si la fonction de suivi a été lancée en mode interactif à partir de la ligne de commande, entrez la sous-commande quit : trace –>!mycmd –>quit Passe en mode interactif (indiqué par l’invite –>). Utilisez les commandes trace (telles que !) pour le suivi des événements système sélectionnés. Utilisez quit pour mettre fin au suivi. • Entrez la commande smit trace et choisissez l’option Stop Trace : smit trace Création de rapport de suivi Exécutez l’une des procédures suivantes : • Entrez la commande trcrpt : trcrpt>/tmp/nouveaufichier Cette commande formate les entrées du journal de suivi et envoie le rapport dans le fichier /tmp/nouveaufichier. trcrpt lit le fichier journal trace, en formate les entrées et écrit un rapport. • Entrez la commande smit : smit trcrpt Reportez-vous à ”Commandes de l’utilitaire de suivi”, page 11-6 pour plus d’informations sur les commandes, les appels, les sous-routines et les fichiers trace. Utilitaire de suivi 11-5 Commandes de l’utilitaire de suivi Une fois configuré, l’utilitaire permet de déclencher, d’interrompre ou de mettre fin à la collecte de données (l’arrêt déconfigure la commande trace et libère les tampons réservés). L’utilitaire de suivi comprend : • Commandes et sous-commandes, page 11-6 • Appels et sous-routines, page 11-6 • Fichiers, page 11-7 Commandes et sous-commandes trace Lance l’analyse des événements système. trace permet également de gérer les fichiers de suivi et les tampons internes (y compris leur taille). trcdead Extrait des informations de suivi à partir d’un cliché système. Si le système s’arrête alors que l’utilitaire de suivi est actif, le contenu des tampons trace internes est enregistré. Les données de suivi extraites du cliché sont inscrites dans le fichier trace. trcrpt Formate le rapport généré à partir des données de suivi du fichier trace. Vous pouvez spécifier les événements à inclure (ou omettre) dans le rapport. Vous pouvez aussi déterminer la présentation du rapport en sortie. trcrpt utilise les modèles de formatage enregistrés dans le fichier /etc/trcfmt pour déterminer comment interpréter les données concernant chaque événement. trcstop Arrête l’analyse des événements système. trcupdate Met à jour les modèles de formatage figurant dans le fichier /etc/trcfmt. Lorsque vous ajoutez des applications ou des extensions de noyau qui enregistrent des événements de suivi, les modèles correspondants doivent être ajoutés au fichier /etc/trcfmt. trcrpt utilise les modèles de formatage pour déterminer comment interpréter les données enregistrées pour chaque événement. Les logiciels qui enregistrent des événements exécutent couramment la commande trcupdate, ceci faisant partie du processus d’installation. Appels et sous-routines trcgen, trcgent Enregistrent des événements de suivi de plus de cinq mots. La sous-routine trcgen permet d’enregistrer un événement en tant qu’événement système (canal 0) ou sur un canal de suivi générique (canaux 1 à 7). Vous indiquez le numéro de canal dans un paramètre de sous-routine quand vous enregistrez l’événement. trcgent horodate les données de l’événement. 11-6 Guide de résolution des incidents et références trcgenk, trcgenkt Sous-routines utilisées par les extensions de noyau pour enregistrer des événements de plus de cinq mots. Permettent d’enregistrer un événement en tant qu’événement système (canal 0) ou sur un canal de suivi générique (canaux 1 à 7). Vous indiquez le numéro de canal dans un paramètre de sous-routine quand vous enregistrez l’événement. trcgentkt horodate les données de l’événement. trchook, utrchook Enregistre des données comportant jusqu’à cinq mots. Permettent d’enregistrer un événement en tant qu’événement système (canal 0). utrchook utilise un chemin d’accès FAST–SVC spécifique pour améliorer les performances. Les programmes doivent utiliser cette sous-routine au niveau utilisateur (application). trcoff Interrompt la collecte sur le canal des événements système (canal 0) ou sur un canal de suivi générique (1 à 7). Le canal de suivi demeure actif ; la sous-routine trcon permet de relancer le suivi. trcon Lance la collecte des données de suivi sur un canal de suivi. Ce canal est soit le canal des événements système (canal 0) soit un canal de suivi générique (1 à 7). Il doit avoir été activé au préalable via la commande trace ou la sous-routine trcstart. La sous-routine trcoff permet d’interrompre la collecte. trcstart Requiert un canal de suivi générique. Cette sous-routine active un canal de suivi générique dont l’ID est renvoyé à l’application qui l’a demandé pour l’enregistrement des événements collectés via trcgen, trcgent, trcgenk et trcgenkt. trcstop Libère et désactive un canal de suivi générique. Fichiers /etc/trcfmt Contient les modèles de formatage utilisés par la commande trcrpt pour déterminer comment interpréter les données enregistrées pour chaque événement. /usr/include/sys/trcmacros.h Contient les macros couramment utilisées pour enregistrer des événements de suivi. /var/adm/ras/trcfile Fichier journal de suivi par défaut. La commande trace permet d’en indiquer un autre. Utilitaire de suivi 11-7 11-8 Guide de résolution des incidents et références Chapitre 12. Cliché système Le système génère un cliché système en cas d’erreur grave. Le cliché système peut aussi être demandé par tout utilisateur doté du droit racine. Le cliché système génère une image du contenu de la mémoire du système. Les administrateurs système et les programmeurs peuvent effectuer un cliché et analyser son contenu lors du débogage de nouvelles applications. Si votre système s’arrête et que le code888 clignote dans l’afficheur, cela signifie qu’un cliché a été lancé et sauvegardé dans une unité de cliché. Pour en savoir plus sur le copie de clichés, reportez-vous à ”Copie d’un cliché système”, page 12-8. Ce chapitre traite des points suivants : • Configuration d’une unité de cliché, page 12-2 • Lancement d’un cliché système, page 12-3 • Vérification de l’état d’un cliché système, page 12-6 • Copie d’un cliché système, page 12-8 • Augmentation de la taille d’une unité de cliché, page 12-11 Sous AIX version 4, quelques commandes de journalisation des erreurs et de cliché sont livrées dans le module en option bos.sysmgt.serv_aid. Les commandes de cliché système figurant dans bos.sysmgt.serv_aid comprennent la commande sysdumpstart. Pour plus d’informations, reportez-vous à ”Module Aides au service”, page 1-5. Cliché système 12-1 Configuration d’une unité de cliché Lors d’un arrêt imprévu du système, la fonction de cliché système copie automatiquement certaines zones sélectionnées de données du noyau vers l’unité de cliché principale. Ces zones comprennent le segment 0 et d’autres zones enregistrées dans la table de cliché maître par des modules ou des extensions du noyau. Si le cliché sur l’unité principale échoue lorsque vous travaillez sous AIX version 4.2.1 ou ultérieure, une autre tentative est effectuée sur l’unité secondaire (à condition que celle-ci soit définie). Lors de l’installation du système d’exploitation, l’unité de cliché est configurée automatiquement. Par défaut, /dev/hd6 est l’unité principale (volume logique de pagination) et /dev/sysdumpnull, l’unité secondaire. Pour les systèmes migrés à partir d’une version d’AIX antérieure à la version 4.1, /dev/hd7 reste l’unité principale. Si un cliché est lancé dans l’espace de pagination, il est automatiquement copié lors de la réinitialisation du système. Par défaut, le cliché est copié dans un répertoire du groupe de volumes racine /var/adm/ras. Reportez-vous à la commande sysdumpdev pour plus d’informations sur la copie de cliché. Remarque : Les systèmes sans disque configurent automatiquement une unité de cliché distante. Si vous utilisez AIX version 4.3.2 ou ultérieurr, compresser les clichés système avant qu’ils ne soient écrits sur l’unité de cliché réduit la taille requise des unités de cliché. Pour plus d’informations, reportez–vous à la commande sysdumpdev. 12-2 Guide de résolution des incidents et références Lancement d’un cliché système Attention : Ne lancez pas de cliché système si le code 888 clignote dans l’afficheur. Ce code signale que le système a déjà effectué un cliché et l’a copié sur l’unité de cliché principale : si vous lancez un cliché, il écrasera le cliché initial. Suivez les procédures indiquées au chapitre 2, ”Code 888 clignotant”, dans le manuel AIX - Guide des messages pour enregistrer le code. Reportez-vous également à ”Vérification de l’état d’un cliché système”, page 12-6. Un cliché demandé par l’utilisateur est différent d’un cliché généré par un arrêt imprévu du système en ceci que l’utilisateur peut désigner l’unité de cliché voulue. En cas d’arrêt imprévu du système, le cliché système est automatiquement exécuté sur l’unité de cliché principale. Pour lancer un cliché système, utilisez l’une des méthodes indiquées ci-après. La commande sysdumpstart n’est disponible que si le module Aides au service est installé. Reportez-vous à ”Module Aide au service”, page 1-5. Vous pouvez lancer un cliché système : • Via la ligne de commande, page 12-3 • Via SMIT, page 12-4 Si le module Aides au service n’est pas installé, utilisez l’une des méthodes suivantes : • Bouton de restauration, page 12-4 • Combinaison de touches, page 12-5 Via la ligne de commande Pour choisir une unité de cliché, lancer un cliché système et déterminer l’état d’un cliché, procédez comme suit : Remarque : Seul un utilisateur racine est habilité à lancer un cliché via la commande sysdumpstart. 1. Déterminez l’unité de cliché appropriée (principale ou secondaire) via la commande sysdumpdev : sysdumpdev –l Cette commande affiche la liste des unités de cliché courantes. Lancez la commande sysdumpdev pour modifier l’affectation de l’unité. 2. Lancez le cliché système via la commande sysdumpstart : sysdumpstart –p Cette commande lance un cliché système sur l’unité de cliché principale par défaut. Spécifiez l’indicateur –s pour désigner l’unité de cliché secondaire. 3. Si un code s’affiche, reportez-vous à ”Vérification de l’état d’un cliché système”, page 12-6. Sinon, le cliché n’a pas été lancé. Recommencez en utilisant le bouton de restauration. Cliché système 12-3 Via SMIT Pour choisir une unité de cliché et lancer un cliché système : Remarque : Seul un utilisateur racine est habilité à lancer un cliché via SMIT. SMIT exécute la commande sysdumpstart pour lancer un cliché système. 1. Déterminez l’unité de cliché appropriée (principale ou secondaire) via le raccourci SMIT suivant : smit dump 2. Choisissez Affichage des unités de cliché courantes et notez les unités disponibles. 3. Entrez de nouveau la commande : smit dump 4. Choisissez l’unité de cliché principale (premier exemple) ou secondaire (deuxième exemple) : Cliché sur l’unité principale OU Cliché sur l’unité secondaire en fonction des unités relevées à l’étape 2. 5. Si un code s’affiche, reportez-vous à ”Vérification de l’état d’un cliché système”, page 12-6. Sinon, le cliché n’a pas été lancé. Recommencez en utilisant le bouton de restauration. Remarque : Pour lancer un cliché à l’aide du bouton de restauration ou d’une séquence de touches, vous devez disposer du sélecteur de mode, placé en position maintenance, ou autoriser de façon permanente la création de cliché (Always Allow System Dump positionné sur true). Pour ce faire : a. Utilisez le raccourci SMIT : smit dump b. Basculez la valeur de Always Allow System Dump sur true. Cette opération est obligatoire sur les machines qui ne sont pas équipées d’un sélecteur de mode. Bouton de restauration Pour lancer un cliché système à l’aide du bouton de restauration, procédez comme suit (cette procédure fonctionne avec toutes les configurations et dans des circonstances où d’autres méthodes ne fonctionnent pas) : 1. Positionnez le sélecteur de mode sur maintenance ou l’option Always Allow System Dump sur true. 2. Appuyez sur le bouton de restauration. Le système lance un cliché sur l’unité de cliché principale. 12-4 Guide de résolution des incidents et références Combinaison de touches Procédez comme suit : 1. Positionnez le sélecteur de mode sur maintenance ou l’option Always Allow System Dump sur true. 2. Appuyez simultanément sur les touches Ctrl, Alt et la touche 1 du pavé numérique pour enregistrer les informations sur l’unité de cliché principale, ou sur les touches Ctrl, Alt et 2 pour les enregistrer sur l’unité de cliché secondaire. Remarque : Cette méthode de lancement de cliché système fonctionne UNIQUEMENT sur le clavier d’origine. Cliché système 12-5 Vérification de l’état d’un cliché système Lorsqu’un cliché système est lancé, des codes d’état et d’avancement apparaissent dans l’afficheur. A la fin des opérations, le code 0cx s’affiche (cliché lancé par un utilisateur) ou le code 888 clignote (cliché lancé par le système). Vous pouvez vérifier si le cliché a abouti ou, si ce n’est pas le cas, la raison de l’échec. Si 0cx s’affiche, reportez-vous à ”Codes d’état” ci-dessous. Si 888 clignote, reportez-vous au manuel AIX - Guide des messages. Remarque : Si le cliché échoue et qu’après réinitialisation un enregistrement au journal des erreurs a l’étiquette DSI_PROC ou ISI_PROC et que la zone de données détaillées affiche une valeur EXVAL 000 0005, il s’agit d’une erreur d’E/S de l’espace de pagination. Si l’espace de pagination (probablement /dev/hd6) est l’unité de cliché ou se trouve sur le même disque dur que l’unité de cliché, il se peut que le disque soit à l’origine de l’échec du cliché. Effectuez un diagnostic du disque. Codes d’état Suivez les instructions correspondant au code affiché : 12-6 000 Le programme de débogage du noyau est lancé. Si un terminal ASCII est connecté à l’un des ports série natifs, entrez q dump à l’invite du programme de débogage (>) sur ce terminal et attendez que 888 clignote dans l’afficheur. Reportez-vous à ”Vérification de l’état d’un cliché système”, page 12-6. 0c0 Le cliché est terminé. Passez à ”Copie d’un cliché système”, page 12-8. 0c1 Une erreur d’E/S s’est produite pendant le cliché. Reportez-vous à ”Fonction de cliché système, page 12-1 0c2 Un cliché à la demande de l’utilisateur n’est pas terminé. Patientez pendant environ 1 minute, jusqu’à la fin du cliché et l’affichage d’un autre code. Si un autre code s’affiche, recherchez sa signification dans la liste. Si le code reste affiché, un incident empêche le cliché d’aboutir : remplissez le Rapport d’incident et prévenez le service de maintenance logicielle. 0c4 L’espace réservé au cliché est saturé. Le cliché enregistré sur l’unité de cliché n’est que partiel, l’espace étant insuffisant sur cette unité pour le contenir en entier. Pour éviter que cet incident ne se reproduise, augmentez la taille de l’unité de cliché. Reportez-vous à ”Augmentation de la taille de l’unité de cliché”, page 12-11. 0c5 Le cliché n’a pu aboutir en raison d’une erreur interne. Patientez pendant environ 1 minute, jusqu’à la fin du cliché et l’affichage d’un autre code. Si un autre code s’affiche, recherchez sa signification dans la liste. Si le code reste affiché, un incident empêche le cliché d’aboutir : remplissez le Rapport d’incident et prévenez le service de maintenance logicielle. 0c7 Un cliché réseau a été lancé et le système hôte attend une réponse du serveur. Les codes 0c7 et 0c2 ou 0c9 s’affichent en alternance. Si le code reste affiché, un incident empêche le cliché d’aboutir : remplissez le Rapport d’incident et prévenez le service de maintenance logicielle. 0c8 L’unité de cliché est désactivée. Aucune unité du système n’est configurée pour ce type d’opération. Lancez la commande sysdumpdev pour configurer l’unité de cliché. Guide de résolution des incidents et références 0c9 Un cliché lancé par le système n’a pas abouti. Patientez pendant environ 1 minute, jusqu’à la fin du cliché et l’affichage d’un autre code. Si un autre code s’affiche, recherchez sa signification dans la liste. Si le code reste affiché, un incident empêche le cliché d’aboutir : remplissez le Rapport d’incident et prévenez le service de maintenance logicielle. 0cc (AIX version 4.2.1 et ultérieures) Une erreur s’est produite pendant le cliché sur l’unité principale ; le cliché a basculé sur l’unité secondaire. Patientez pendant environ 1 minute, jusqu’à la fin du cliché et l’affichage d’un autre code. Si un autre code s’affiche, recherchez sa signification dans la liste. Si le code reste affiché, un incident empêche le cliché d’aboutir : remplissez le Rapport d’incident et prévenez le service de maintenance logicielle. c20 Le programme de débogage du noyau s’est interrompu sans demander de cliché système. Entrez la sous-commande quit dump. Prenez connaissance du nouveau code affiché. Cliché système 12-7 Copie d’un cliché système Une unité de cliché contient les informations des clichés système générés par le système ou par l’utilisateur. Vous pouvez copier ces informations sur disquette ou sur bande et les transmettre au service de maintenance pour analyse. Remarque : Si vous décidez d’envoyer une image snap à la maintenance logicielle d’IBM sur une bande, celle–ci doit avoir l’un des formats suivants : 8 mm et capacité de 2,3 Go, 8 mm et capacité de 5,0 Go ou 4 mm et capacité de 4,0 Go. Tout autre format empêchera ou retardera le travail de la maintenance logicielle. La procédure dépend du type de matériel : poste de travail avec ou sans données : • Copie d’un cliché système sur un poste sans données, page 12-8 • Copie d’un cliché système sur un poste avec données, page 12-9 Copie d’un cliché système sur un poste sans données Le cliché est copié sur le serveur lors du réamorçage du poste sans données après l’exécution du cliché. Cependant, le poste sans données n’a pas toujours accès au cliché. Procédez comme suit : 1. Redémarrage en mode normal, page 12-8. 2. Localisation du cliché système, page 12-8. 3. Copie d’un cliché système à partir d’un serveur, page 12-9. Réamorçagee en mode normal 1. Mettez le système hors tension. 2. Amenez le sélecteur de mode en position normale. 3. Mettez le système sous tension. Localisation du cliché système Pour localiser le système où se trouve le cliché et son chemin d’accès : 1. Connectez-vous au serveur. 2. Entrez la commande lsnim pour trouver l’objet cliché correspondant au poste. (Dans cet exemple, actif est le nom d’objet du poste sur le serveur.) lsnim –l actif L’objet cliché s’affiche comme suit : dump = dumpobject 3. Lancez à nouveau la commande lsnim pour connaître le chemin d’accès à l’objet : lsnim –l actif Le chemin d’accès indique le répertoire contenant le cliché. Le nom du cliché est généralement le même que celui de l’objet du poste sans données. 12-8 Guide de résolution des incidents et références Copie d’un cliché système à partir d’un serveur Le cliché est copié comme n’importe quel autre fichier. Pour le copier sur bande, lancez la commande tar : tar –c ou pour le copier sur une autre bande que /dev/rmt0, tapez : tar –cfunité_de_bande Pour recopier le cliché à partir d’un support externe (unité de bande, par exemple), exécutez la commande tar. Pour le copier à partir de /dev/rmt0, entrez : tar –x Pour le recopier à partir d’un autre support, entrez : tar –xfunité_de_bande Copie d’un cliché système sur un poste avec données Procédez comme suit : 1. Réamorçage du système, page 12-9 2. Copiez le cliché système en utilisant l’une des méthodes suivantes : – Copie d’un cliché système après réamorçage en mode normal, page 12-9 – Copie d’un cliché système après réamorçage en mode maintenance, page 12-10 Réamorçage du système Pour réamorcer en mode normal : 1. Mettez le système hors tension. 2. Amenez le sélecteur de mode en position normale. 3. Mettez le système sous tension. Reportez-vous à ”Copie d’un cliché système après réamorçage en mode normal”, page 12-9 si l’invite de connexion du système s’affiche. Si un code s’affiche au lieu de l’invite de connexion, passez à ”Copie d’un cliché système après réamorçage en mode maintenance”, page 12-10 après avoir réamorcé le système en mode maintenance. Copie d’un cliché système après réamorçage en mode normal Procédez comme suit : 1. Connectez-vous en tant qu’utilisateur racine. 2. Copiez le cliché système sur disquette (premier exemple) ou sur bande (deuxième exemple) en entrant la commande snap comme suit : /usr/sbin/snap –gfkD –o /dev/rfd0 ou /usr/sbin/snap –gfkD –o /dev/rmt# Cliché système 12-9 Dans l’exemple qui précède, remplacez le signe dièse (#) par le numéro de l’unité de bande disponible (généralement /dev/rmt0). Pour trouver ce numéro, entrez la commande lsdev comme suit et recherchez l’unité de bande marquée Disponible : lsdev –C –c tape –H Remarque : Si le cliché a été acheminé vers un volume logique de pagination, c’est qu’il a été copié sur un répertoire du groupe de volumes racine /var/adm/ras. Pour plus d’informations, reportez-vous à ”Configuration d’une unité de cliché” et à la commande sysdumpdev. Les clichés sont toujours copiés par la commande snap. La commande sysdumpdev –L donne l’emplacement exact du cliché. 3. Pour recopier le cliché à partir d’un support externe (unité de bande, par exemple), exécutez la commande tar. Pour le copier à partir de /dev/rmt0, entrez : tar –x Pour le recopier à partir d’un autre support, entrez : tar –xfunité_de_bande Copie d’un cliché système après amorçage en mode maintenance Remarque : Cette procédure sert uniquement lorsque vous n’avez pas réussi à amorcer votre système en mode normal. 1. Après avoir amorcé votre système en mode maintenance, copiez un cliché système sur disquette (premier exemple) ou sur bande (deuxième exemple) via la commande snap comme suit : /usr/sbin/snap –gfkD –o /dev/rfd0 ou /usr/sbin/snap –gfkD –o /dev/rmt# 2. Pour recopier le cliché à partir d’un support externe (unité de bande, par exemple), exécutez la commande tar. Pour le copier à partir de /dev/rmt0, entrez : tar –x Pour le recopier à partir d’un autre support, entrez : tar –xfunité_de_bande 12-10 Guide de résolution des incidents et références Augmentation de la taille d’une unité de cliché Reportez-vous aux sections suivantes pour augmenter la taille d’un volume logique ou d’un volume logique de pagination et pour déterminer la taille du volume logique de cliché. • Détermination de la taille de l’unité de cliché, page 12-11 • Détermination du type de volume logique, page 12-11 • Augmentation de la taille de l’unité de cliché, page 12-11 Détermination de la taille de l’unité de cliché La taille requise pour un cliché n’est pas constante : le système ne fait pas de cliché de l’unité de pagination mais seulement des données en mémoire réelle. Le cliché système est généralement stocké sur un volume logique de pagination. Un cliché incomplet étant inutilisable, procédez comme suit pour vérifier si l’unité de cliché a suffisamment d’espace libre. Quand un cliché système est effectué, l’ensemble du segment de noyau (segment 0) qui réside en mémoire réelle en fait partie. Les données utilisateur en mémoire résidante (tels que les blocs u) font également partie du cliché. Pour déterminer au mieux la taille minimale de l’espace réservé au cliché, utilisez la commande sysdumpdev –e. Cette commande donne une estimation tenant compte de la mémoire couramment utilisée par le système. Siles clichés sont compressés, l’estimation affichée concerne la taille du cliché compressé, non pas sa taille d’origine. En général, la taille estimée des clichés compressés est plus élevée que la taille courante. Cela est dû à l’efficacité relative de l’algorithme de compression. Assurez–vous toutefois que l’unité de cliché peut contenir la taille estimée afin de ne perdre aucune donnée de cliché. Entrez par exemple : sysdumpdev –e Si la commande sysdumpdev –e renvoie le message Estimation de la taille du cliché (en octets) : 9830400, la taille de l’unité de cliché doit être d’au moins 9 830 400 octets, ou 12 Mo pour un disque est divisé en partitions de 4 Mo (3 partitions). Remarque : Lorsqu’un système client fait des clichés sur un serveur distant, ils y sont stockés sous forme de fichiers. Ainsi, le fichier /export/dump/kakrafon/dump contient le cliché de kakrafon : la taille du système de fichiers du répertoire /export/dump/kakrafon doit être suffisante pour loger les clichés clients. Détermination du type de volume logique 1. Pour afficher la liste des unités de cliché, lancez la commande sysdumpdev. Le volume logique de l’unité de cliché principale est /dev/hd6 ou /dev/hd7. Remarque : Vous pouvez également passer par SMIT. Sélectionnez Affichage des unités cliché courantes dans le menu SMIT Cliché système. 2. Déterminez le type de votre volume logique via SMIT. Entrez le raccourci SMIT smit lvm ou smitty lvm. Vous accédez directement à l’option Volumes logiques. Sélectionnez l’option Liste des volumes logiques par groupe de volume. Recherchez le volume de cliché dans la liste et notez son type (deuxième colonne). Par exemple, paging pour hd6 ou sysdump pour hd7. Augmentation de la taille de l’unité de cliché Si vous avez confirmation que votre unité de cliché est un espace de pagination, reportez–vous à Modification/suppression d’un espace de pagination dans AIX 4.3 Guide d’administration : système d’exploitation et unités. Si vous avez confirmation que votre unité de cliché est sysdump, reportez–vous à la commande extendlv. Cliché système 12-11 12-12 Guide de résolution des incidents et références Chapitre 13. Réamorçage à distance Le réamorçage à distance permet de relancer le système depuis un port série natif (intégré). Le port reçoit la chaîne de réamorçage et une réponse de confirmation de 1 indique que le système est réamorcé. Cette fonction est utile lorsque le système ne répond plus mais peut gérer des interruptions de port série. Elle ne peut activée que sur un seul port série à la fois. L’utilisateur doit veiller lui–même à la protection du port. Le réamorçage à distance fonctionne au niveau de la classe d’interruption de l’unité ”la plus haute” et en cas de défaillance de l’UART à procéder à un nettoyage rapide de la mémoire tampon de transmission, les autres dispositifs peuvent alors perdre leurs données si leur mémoire tampon est surchargée à ce moment précis. Il est recommandé d’utiliser cette fonction uniquement pour réamorcer une machine qui ne peut être relancée autrement et qui ne peut être connectée à distance. Les systèmes de fichiers NE SERONT PAS synchronisés et les données qui n’ont pas été vidées risquent d’être perdues. Il est fortement conseillé de ne par utiliser le port, en particulier pour le transfert de fichiers, lorsque le réamorçage à distance est activé afin d’empêcher tout réamorçage intempestif. Deux attributs de port série natifs commandent l’opération de réamorçage à distance. reboot_enable Indique si ce port est activé pour réamorcer la machine dès réception de la CHAINE de réamorçage à DISTANCE, et si tel est le cas, s’il faut procéder à un vidage système avant le réamorçage. no – Signifie que le réamorçage à distance est désactivé reboot – Signifie que le réamorçage à distance est activé dump – Signifie que le réamorçage à distance est activé, et qu’un vidage système doit être effectué sur l’unité de vidage primaire avant le réamorçage. reboot_string Donne la chaîne de réamorçage à distance que le port série recherchera lorsque le réamorçage à distance sera activé. Lorsque tel est le cas et que la chaîne de réamorçage est reçue sur le port, le caractère ”>” est transmis et le système est prêt pour le réamorçage. Si le caractère ”1” est transmis, le système est réamorcé ; tout caractère autre que ”1” suspend le processus de réamorçage. La chaîne de réamorçage a une longueur maximale de 16 caractères et ne doit pas contenir d’espace, de virgule, de signe égal, de zéro, de nouvelle ligne ou de caractère exécuté avec la touche cntrl–\. Le réamorçage à distance peut être activé avec SMIT, ou avec la ligne de commandes. Dans le cas où SMIT est utilisé le chemin d’accès System Environments –> Manage Remote Reboot Facility peut être utilisé pour un TTY configuré. Le réamorçage à distance peut également être activé lors de la configuration d’un nouveau TTY depuis les menus Add a TTY ou Change/Show Characteristics of a TTY. Ces menus sont accessibles par le chemin d’accès Devices –> TTY. Réamorçage à distance 13-1 Dans le cas où la ligne de commandes est utilisée, les commandes mkdev ou chdev permettent d’activer le réamorçage à distance. Par exemple, la commande suivante active le réamorçage à distance (avec l’option vidage) et initialise la chaîne de réamorçage sur ReBoOtMe de tty1. chdev –l tty1 –a remreboot=dump –a reboot_string=ReBoOtMe Cet exemple active le réamorçage à distance sur tty0 avec la chaîne de réamorçage en cours dans la base de données uniquement (agira sur le réamorçage suivant). chdev –P –l tty0 –a remreboot=reboot Si le tty est utilisé comme un port normal, la commande pdisable devra être utilisée avant d’activer le réamorçage à distance. La commande penable permet de réactiver le port par la suite. 13-2 Guide de résolution des incidents et références Annexe A. Acronymes des messages d’erreur Cette annexe fournit la liste des acronymes utilisés dans ce guide, avec leur développé. ACLST Alternating–Current Logic Self–Test AST Array Self–Test BIST Built–In Self–Test BOS Base Operating System BSCRW Bisync Read–Write CRC Cyclical Redundancy Check CD–ROM Compact Disc Read–Only Memory DCLST Direct–Current Logic Self–Test DLC Data Link Control EPROM Erasable Programmable Read–Only Memory EPOW Early Power–Off Warning ESCON Enterprise Systems Connection FDDI Fiber Distributed Data Interface FSLA F–Serial Link Adapter IDE Integrated Device Electronics IP Internet Protocol IPL Initial Program Load I/O Input/Output LAN Local Area Network LED Light–Emitting Diodes LPFK Lighted Program Function Keyboard LVM Logical Volume Manager NVRAM Nonvolatile Random Access Memory NETBIOS Network Basic Input/Output System OCS On–Chip Sequencer IOCC Input/Output Channel Controller PTY Pseudo Terminal RAM Random Access Memory ROM Read–Only Memory SIO Serial Input/Output SNA System Network Architecture SVC Switched Virtual Circuit SCSI Small Computer System Interface SDLC Synchronous Data Link Control SIMM Single In–line Memory Module TCW Translation Control Words TTY Teletypewriter VME Video Monitor Extended Acronymes des messages d’erreur A-1 A-2 Guide de résolution des incidents et références Annexe B. Validation du logiciel La validation d’un logiciel en option ou d’un programme sous licence permet de s’assurer que celui-ci n’est pas endommagé. Les fichiers du logiciel sont analysés afin de s’assurer qu’ils existent et qu’ils sont complets, et pour vérifier leurs valeurs de total de contrôle (‘checksum’) et leurs liens symboliques. Ils sont ensuite comparés à la base SWVPD (Software Vital Product Data). Toute valeur discordante signifie que le programme est endommagé. Contactez alors votre service de maintenance logicielle. Il existe deux méthodes pour valider un logiciel : • Utilisez la commande lppchk. Pour vérifier, par exemple, l’existence, la taille et la valeur de total de contrôle d’un fichier, entrez : lppchk –c Cette commande peut également être utilisée pour un programme particulier ; par exemple : lppchk –c bos.rte Pour vérifier les liens symboliques d’un fichier, entrez : lppchk –f La commande lppchk permet de vérifier les fichiers d’un logiciel en option. • Entrez la commande smit problem et choisissez l’option Validation logiciels : smit problem Validation du logiciel B-1 B-2 Guide de résolution des incidents et références Annexe C. Identificateurs d’erreur Les erreurs et les incidents du système sont consignées dans le journal des erreurs. Des identificateurs d’erreur permettent la compilation des rapports. Chaque identificateur d’erreur, unique, est représenté par un code hexadécimal de 32 bits, identifiant la fiche d’erreur utilisée dans le rapport. Identificateurs d’erreur C-1 Carte parallèle 370 CAT ERR1 Description de l’erreur : LICENSED INTERNAL CODE (LIC) PROGRAM ABNORMALLY TERMINATED Apparaît sous forme de notification dans la ligne d’état de la carte à chaque fois que le microcode s’interrompt. CAT ERR2 Description de l’erreur : LICENSED INTERNAL CODE (LIC) PROGRAM ERROR Une demande de téléchargement de microcode a renvoyé un code d’erreur ou le délai est dépassé. CAT ERR3 Description de l’erreur : RESOURCE UNAVAILABLE Un appel de la macro m_get ou m_clget au service du noyau mbuf a échoué. Cela signifie que le pilote n’a pas obtenu de mbuf lors de la réception de données en provenance de l’hôte System/370. CAT ERR4 Description de l’erreur : RESOURCE UNAVAILABLE Un appel du sous-programme xmalloc échoue. Le pilote n’a pas pu réserver de mémoire à des données internes. CAT ERR5 Description de l’erreur : ADAPTER ERROR La configuration des paramètres de la carte ou le téléchargement d’une table de l’unité centrale a échoué, ou le délai est dépassé. CAT ERR6 Description de l’erreur : RESOURCE UNAVAILABLE Un appel du service du noyau d_init ou i_init a échoué. Le pilote ne peut pas être configuré. CAT ERR7 Description de l’erreur : ADAPTER ERROR Le pilote interne n’a plus accès à la mémoire DMA ou le receveur a signalé que des données ont été perdues. CAT ERR8 Description de l’erreur : ADAPTER ERROR Erreur irrémédiable d’entrée-sortie du programme lors de l’accès à la mémoire du bus. C-2 Guide de résolution des incidents et références ATE ATE ERR1 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Aucun caractère de régulation n’a été reçu. ATE ERR2 Description de l’erreur : COMMUNICATION PROTOCOL ERROR De nombreuses erreurs de transmission ont été détectées. ATE ERR3 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Aucun accusé de réception n’a été reçu. ATE ERR4 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Le site de réception n’est pas prêt. ATE ERR5 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Le site d’émission n’envoie aucune donnée. ATE ERR6 Description de l’erreur : SOFTWARE PROGRAM ERROR Aucun signal de porteuse n’est présent. ATE ERR7 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Une erreur a été détectée dans le total de contrôle. ATE ERR8 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Un secteur a été reçu deux fois. ATE ERR9 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Un secteur incorrect a été reçu. ATE ERR10 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Le secteur n’a pas pu être vérifié. Identificateurs d’erreur C-3 BADISK (disque connecté au bus) Cette catégorie d’identificateurs contient les étiquettes d’erreur suivantes : BADISK ERR1 BADISK ERR2 BADISK ERR3 BADISK ERR4 BADISK ERR5 BADISK ERR8 Reportez-vous aux identificateurs d’erreur. BADISK ERR1 Description de l’erreur : DISK FAILURE Une erreur de lecture logicielle a été résolue. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. BADISK ERR2 Description de l’erreur : DISK OPERATION ERROR Une erreur de lecture matérielle a été détectée. Reportez-vous à Données de détail dans BADISK ERR 1. BADISK ERR3 Description de l’erreur : DISK OPERATION FAILURE Une erreur logicielle a été détectée. Reportez-vous à Données de détail dans BADISK ERR 1. BADISK ERR4 Description de l’erreur : DISK OPERATION ERROR Une erreur matérielle a été détectée. Reportez-vous à Données de détail dans BADISK ERR 1. BADISK ERR5 Description de l’erreur : DISK FAILURE Une erreur due à une connexion incorrecte a été détectée. Reportez-vous à Données de détail dans BADISK ERR 1. BADISK ERR8 Description de l’erreur : DISK OPERATION ERROR Une erreur de localisation a été détectée. Reportez-vous à Données de détail dans BADISK ERR 1. C-4 Guide de résolution des incidents et références C327 (carte de connexion 3270) Cette catégorie d’identificateurs contient les étiquettes d’erreur suivantes : C327 INTR C327 START Reportez-vous aux identificateurs d’erreur. C327 INTR Description de l’erreur : C327 ERROR INTERRUPT Le contrôleur a détecté une erreur, elle a été corrigée, ou le contrôleur ne répond pas (câble coaxial déconnecté). DONNÉES DE DÉTAIL Code de raison Localise l’erreur. La plupart des erreurs sont décrites dans la brochure 3270 Information Display System : 3274 Control Unit Description and Programmer’s Guide. Il peut également s’agir d’une des erreurs ci-dessous : Adresse de la ligne 603 Le contrôleur ne répond pas (câble coaxial déconnecté). 670 Le contrôleur ne répond pas (câble coaxial déconnecté). 671 La carte ne fonctionne pas correctement. 774 La session n’est pas disponible. Numéro de la session où s’est produit l’erreur (les sessions sont numérotées à partir de 1). C327 START Description de l’erreur : C327 START ERROR Le lancement d’une session hôte est impossible. DONNÉES DE DÉTAIL Code de raison Raison pour laquelle la session n’a pu être lancée. Il peut également s’agir d’une des erreurs ci-dessous : Adresse de la ligne 8200 Le contrôleur ne répond pas (câble coaxial déconnecté). 8300 La carte ne fonctionne pas correctement. 8303 Le contrôleur SNA n’est pas pris en charge. 8306 Le contrôleur ne prend pas en charge l’état AEDV étendu. 8601 La session n’est pas disponible. Numéro de la session où s’est produit l’erreur (les sessions sont numérotées à partir de 1). Identificateurs d’erreur C-5 CHRP (journal RTAS) Remarque : Cette fonction n’est disponible qu’à partir d’AIX version 4.2.1. SCAN_ERROR_CHRP Description de l’erreur : RTAS event-scan log. Un appel du système vers RTAS (runtime abstraction services) indique une erreur ou un événement. DONNÉES DE DÉTAIL Problem Data Journal RTAS brut renvoyé par l’analyseur d’événements. RTAS_ERROR Description de l’erreur : RTAS call failure. Un appel vers RTAS (runtime abstraction services) renvoie au système un code d’erreur inattendu. DONNÉES DE DÉTAIL Error Code Code renvoyé par le service RTAS défaillant. Malfunction Code Identificateur interne du service RTAS défaillant. Problem Data Journal en option des erreurs RTAS fournissant des renseignements complémentaires. MACHINE_CHECK_CHRP Description de l’erreur : Machine check on a CHRP system. Cette erreur peut indiquer plusieurs problèmes : erreur mémoire, erreur de données ou de parité du bus d’adressage, erreur de parité du cache interne ou erreur du bus d’E/S. DONNÉES DE DÉTAIL Machine status save/restore register 0 Registre où est consigné l’état de la machine. Machine status save/restore register 1 Registre où est consigné l’état de la machine. Problem Data Journal en option des erreurs renvoyées par RTAS. EPOW_SUS_CHRP Description de l’erreur : Electrical Power Event interrupt occurred. Un événement risquant d’affecter la puissance du système s’est produit. DONNÉES DE DÉTAIL Power Status Register Code décrivant l’état de l’alimentation du système au moment de l’erreur. Problem Data C-6 Journal des erreurs RTAS brut contenant des informations supplémentaires sur l’échec. Cette donnée est facultative. Guide de résolution des incidents et références UPDATE_FLASH_ERR Description de l’erreur : An update of flash-memory failed. La mise à jour de la mémoire flash a échoué. Il est possible que cet échec se soit produit pendant la mise à jour et que la mémoire flash ait été endommagée. Vous risquez de ne pas pouvoir réinitialiser le système. DONNÉES DE DÉTAIL Error Code Les nombres correspondent aux erreurs renvoyées par l’appel RTAS update-flash-and-reboot, à l’exception de –200, signalant une mémoire réelle insuffisante dans le segment de mémoire. Problem Data Journal des erreurs RTAS brut contenant des informations supplémentaires sur l’échec. Cette donnée est facultative. Identificateurs d’erreur C-7 COM (unité TTY) COM CFG ADPT Description de l’erreur : CONFIGURATION FAILED: ADAPTER CONFIGURED La carte est déjà configurée. DONNÉES DE DÉTAIL ERROR CODE Code d’erreur système (voir sys/errno.h). COM CFG BUSI Description de l’erreur : CONFIGURATION FAILED: BAD BUS ID Un ID de bus incorrect est détecté. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG BUSID Description de l’erreur : CONFIGURATION FAILED: BUS ID OUT OF RANGE L’ID de bus n’est pas compris dans l’intervalle défini. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG BUST Description de l’erreur : CONFIGURATION FAILED: BAD BUS TYPE Le type de bus est incorrect. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG DEVA Description de l’erreur : CONFIGURATION FAILED: STR_INSTALL (LOAD ) FAILED Une demande str_install () n’a pas abouti. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG DEVD Description de l’erreur : CONFIGURATION FAILED: STR_INSTALL (UNLOAD ) FAILED Une demande str_install () n’a pas abouti. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG DMA Description de l’erreur : CONFIGURATION FAILED: DMA LEVEL CONFLICT Le niveau DMA est incompatible. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG IFLG Description de l’erreur : CONFIGURATION FAILED: BAD INTERRUPT FLAG Une option d’interruption incorrecte est détectée. Reportez-vous aux Données de détail dans COM CFG ADPT. C-8 Guide de résolution des incidents et références COM CFG ILVL Description de l’erreur : CONFIGURATION FAILED: BAD INTERRUPT LEVEL Une priorité d’interruption incorrecte a été détectée. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG INTR Description de l’erreur : CONFIGURATION FAILED: INTERRUPT PRIORITY Une priorité d’interruption incorrecte a été détectée. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG MNR Description de l’erreur : CONFIGURATION FAILED: BAD MINOR NUMBER Un numéro mineur incorrect a été détecté. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG NADP Description de l’erreur : CONFIGURATION FAILED: ADAPTER NOT PRESENT Une absence de carte a été détectée. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG PORT Description de l’erreur : CONFIGURATION FAILED: PORT CONFIGURED Le port est déjà configuré. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG RESID Description de l’erreur : CONFIGURATION FAILED: RESID NOT CORRECT Une valeur residual count incorrecte a été détectée. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG SLIH Description de l’erreur : CONFIGURATION FAILED: I_INIT OF SLIH FAILED Une demande i_init() n’a pas abouti. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG UIO Description de l’erreur : CONFIGURATION FAILED: RESID NOT CORRECT Une demande uiomove() n’a pas abouti. Reportez-vous aux Données de détail dans COM CFG ADPT. COM CFG UNK Description de l’erreur : CONFIGURATION FAILED: BAD ADAPTER TYPE Un type de carte incorrect a été détecté. Reportez-vous aux Données de détail dans COM CFG ADPT. Identificateurs d’erreur C-9 COM MEM SLIH Description de l’erreur : CAN NOT ALLOCATE MEMORY: SLIH STRUCTURE Une demande malloc() pour la structure SLIH n’a pas abouti. Reportez-vous aux Données de détail dans COM CFG ADPT. COM PERM PIO Description de l’erreur : PIO EXCEPTION Une anomalie a été détectée dans une opération d’entrée-sortie, ce qui peut indiquer un incident lié à la carte. DONNÉES DE DÉTAIL PIO csr register Registre d’état du canal PIO. PIO dsisr register Registre d’état d’interruption du stockage des données PIO. PIO srval register Contenu des registres de segments PIO. PIO dar register Registre des adresses des données PIO. Adapter Check Status Etat du contrôle de la carte. COM TEMP PIO Description de l’erreur : PIO EXCEPTION Une erreur PIO temporaire a été détectée. DONNÉES DE DÉTAIL C-10 PIO csr register Registre d’état du canal PIO. PIO dsisr register Registre d’état d’interruption du stockage des données PIO. PIO srval register Contenu des registres de segments PIO. PIO dar register Registre des adresses des données PIO. Adapter Check Status Etat du contrôle de la carte. Additional Information Données supplémentaires relatives à l’incident, qui doivent être transmises au responsable technique si l’incident persiste. Guide de résolution des incidents et références CXMA (carte 128 ports) CXMA_ERR_ASSRT Description de l’erreur : Message d’assertion du pilote. DONNÉES DE DÉTAIL Le pilote de la carte 128 ports a détecté une erreur interne. La zone Driver Line Number contient le numéro de ligne du pilote où l’erreur s’est produite. Prévenez le technicien de maintenance. CXMA_CFG_FEPOS Description de l’erreur : Erreur au cours de l’exécution du microcode FEPOS de la carte 128 ports. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_CG_BIOS Description de l’erreur : Erreur au cours de l’exécution du microcode BIOS de la carte 128 ports. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_CFG_RST Description de l’erreur : La carte 128 ports ne répond pas à la réinitialisation d’une unité matérielle. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_ADP_FAIL Description de l’erreur : Le pilote de la carte 128 ports a détecté une erreur grave en communiquant avec la carte. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_CFG_MEM Description de l’erreur : L’adresse mémoire de la carte 128 ports de la structure DDS, passée de la méthode de configuration cfgcmxa au point d’entrée de la configuration du pilote, est incorrecte. Une base de données ODM altérée peut en être la cause. DONNÉES DE DÉTAIL Prévenez le technicien de maintenance. CXMA_CFG_PORT Description de l’erreur : L’adresse du port d’E-S de la carte 128 ports de la structure DDS, passée de la méthode de configuration cfgcmxa au point d’entrée de la configuration du pilote, est incorrecte. Une base de données ODM altérée peut en être la cause. DONNÉES DE DÉTAIL Prévenez le technicien de maintenance. Identificateurs d’erreur C-11 CXMA_CFG_MTST Description de l’erreur : Le pilote de la carte 128 ports a détecté une erreur au cours d’un test de la mémoire à double accès de la carte. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_CFG_TALLOC Description de l’erreur : Le pilote de la carte 128 ports a détecté une erreur au cours d’une tentative d’allocation d’une structure trb timer. DONNÉES DE DÉTAIL Prévenez le technicien de maintenance. CXMA_IO_ATT Description de l’erreur : Le pilote de la carte 128 ports a détecté une erreur au cours d’une tentative de connexion à la mémoire d’E-S. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. CXMA_MEM_ATT Description de l’erreur : Le pilote de la carte 128 ports a détecté une erreur au cours d’une tentative de connexion à la mémoire de bus. DONNÉES DE DÉTAIL Exécutez les ”Diagnostics matériels”, page 9-1 ou prévenez le technicien de maintenance. C-12 Guide de résolution des incidents et références CD-ROM, DISK et R/W OPTICAL DISK ERR1 Description de l’erreur : CD-ROM, DISK, or R/W OPTICAL DRIVE OPERATION ERROR Une erreur liée à un volume physique a été détectée. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. DISK ERR2 Description de l’erreur : CD-ROM, DISK, or R/W OPTICAL DRIVE FAILURE Une erreur matérielle a été détectée. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. DISK ERR3 Description de l’erreur : CD-ROM, DISK, or R/W OPTICAL DRIVE FAILURE Une erreur liée à la carte a été détectée. DONNÉES DE DÉTAIL Sense Data Données de détection non applicables à cette erreur. Des zéros sont enregistrés. DISK ERR4 Description de l’erreur : CD-ROM, DISK, or R/W OPTICAL RECOVERED ERROR Une erreur liée à un volume physique a été détectée. Les données ont été restaurées par l’unité ou son programme pilote. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. DISK ERR5 Description de l’erreur : UNDETERMINED ERROR Une erreur indéterminée a été détectée. DONNÉES DE DÉTAIL Sense Data Données de détection non applicables à cette erreur. Des zéros sont enregistrés. Identificateurs d’erreur C-13 IDE DISK ERR1 Description de l’erreur : DISK OPERATION ERROR Cette entrée est enregistrée par le pilote d’unité de disque IDE lorsque qu’une erreur de support est détectée. DONNÉES DE DÉTAIL Status Validity and ATA Command Data Ces données contiennent des informations sur la commande qui n’a pas abouti et doit être analysée par les programmes de diagnostic. IDE DISK ERR2 Description de l’erreur : SOFTWARE ERROR Cette entrée est enregistrée par le pilote d’unité de disque IDE lorsque qu’un disque a arrêté prématurément une commande. Ceci se produit quand une commande non admise est rejetée par un disque. L’entrée peut également révéler une défaillance de l’unité de disque ou du contrôleur IDE. DONNÉES DE DÉTAIL Status Validity and ATA Command Data Ces données contiennent des informations sur la commande qui n’a pas abouti et doit être analysée par les programmes de diagnostic. IDE DISK ERR3 Description de l’erreur : DISK FAILURE Cette entrée est enregistrée par le pilote de l’unité de disque IDE à la suite d’un incident ne provenant ni d’une erreur de support ni de l’interruption d’une commande. Elle peut être générée en cas de défaillance matérielle de l’unité de disque. DONNÉES DE DÉTAIL Status Validity and ATA Command Data Ces données contiennent des informations sur la commande qui n’a pas abouti et doit être analysée par les programmes de diagnostic. IDE DISK ERR4 Description de l’erreur : DISK FAILURE RECOVERED DURING RETRY Une erreur liée à un volume physique a été détectée. L’erreur a été résolue par le disque ou son programme pilote. DONNÉES DE DÉTAIL Status Validity and ATA Command Data Ces données contiennent des informations sur la commande qui n’a pas abouti et doit être analysée par les programmes de diagnostic. C-14 Guide de résolution des incidents et références DISKETTE DISKETTE ERR1 Description de l’erreur : DISKETTE OPERATION ERROR Cette entrée est enregistrée par le pilote de l’unité de disquette lorsqu’une erreur permanente est détectée. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. DISKETTE ERR2 Description de l’erreur : DISKETTE DEVICE FAILURE Un dépassement de délai a été détecté. Reportez-vous à Données de détail dans DISKETTE ERR1. DISKETTE ERR3 Description de l’erreur : DISKETTE MEDIA ERROR Il s’agit d’une erreur liée à une disquette. Reportez-vous à Données de détail dans DISKETTE ERR1. DISKETTE ERR4 Description de l’erreur : DISKETTE OPERATION ERROR Une erreur indéterminée liée à une disquette a été détectée. Reportez-vous à Données de détail dans DISKETTE ERR1. DISKETTE ERR5 Description de l’erreur : INPUT/OUTPUT DEVICE ERROR Une erreur PIO temporaire liée à une disquette a été détectée. Reportez-vous à Données de détail dans DISKETTE ERR1. DISKETTE ERR6 Description de l’erreur : INPUT/OUTPUT DEVICE ERROR Une erreur PIO permanente liée à une unité de disquette a été détectée. Reportez-vous à Données de détail dans DISKETTE ERR1. Identificateurs d’erreur C-15 ENT Error (Ethernet) ENT ERR1 Description de l’erreur : ADAPTER ERROR Une des erreurs matérielles permanentes ci-dessous est survenue : • Incompatibilité entre la version du microcode et le niveau de mémoire morte des données techniques essentielles (VPD). • Echec du lancement de la carte dans le délai imparti. • Une ou plusieurs zones des données techniques essentielles contiennent des valeurs incorrectes. • L’accès en entrée-sortie au bus MCA a échoué. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. ENT ERR2 Description de l’erreur : COMMUNICATION PROTOCOL ERROR Une des erreurs matérielles temporaires ci-dessous est survenue : • La carte a détecté une erreur de parité et l’a transmise au module de gestion d’unité. • L’une des erreurs de transmission suivantes s’est produite : nombre maximal de collisions, FIFO insuffisants, porteuses perdues, CTS perdus, délais d’attente, paquets trop courts ou paquets trop longs. • L’accès en entrée-sortie au bus MCA a échoué. Reportez-vous à Données de détail dans ENT ERR1. ENT ERR3 Description de l’erreur : ADAPTER ERROR Une des erreurs permanentes ci-dessous est survenue : • La commande Execute sur la carte a renvoyé un bit d’erreur. • La commande Execute sur la carte ”Report Configuration” a renvoyé des données incorrectes. Reportez-vous à Données de détail dans ENT ERR1. ENT ERR4 Description de l’erreur : ADAPTER ERROR • Incorrect VPD data. Reportez-vous à Données de détail dans ENT ERR1. ENT ERR5 Description de l’erreur : RESOURCE UNAVAILABLE Une des erreurs système ci-dessous a été détectée : • Les fonctions du noyau DMA n’ont pas abouti. • Les fonctions de la région DMA n’ont pas abouti. • Les fonctions de la mémoire tampon de réception (mbuf) n’ont pas abouti. Reportez-vous à Données de détail dans ENT ERR1. C-16 Guide de résolution des incidents et références ENT ERR6 Description de l’erreur : CSMA/CD LAN COMMUNICATIONS LOST Un message d’alerte indiquant la perte de données a été reçu. Reportez-vous à Données de détail dans ENT ERR1. Identificateurs d’erreur C-17 EPOW EPOW RES Description de l’erreur : ELECTRICAL POWER RESUMED Le signal de déconnexion d’urgence (EPOW) s’interrompt, indiquant que l’alimentation électrique est rétablie. DONNÉES DE DÉTAIL Power Status Register Contenu du registre d’état de l’alimentation conformément à /usr/include/sys/iocc.h. EPOW SUS Description de l’erreur : LOSS OF ELECTRICAL POWER Le signal de déconnexion d’urgence (EPOW) s’interrompt, indiquant que l’alimentation électrique principale faiblit. DONNÉES DE DÉTAIL Power Status Register Contenu du registre d’état de l’alimentation conformément à /usr/include/sys/iocc.h. C-18 Guide de résolution des incidents et références ERRLOG (démon error) ERRLOG OFF Description de l’erreur : ERRDEMON TURNED OFF Erreur consignée par le démon error et indiquant l’arrêt de la journalisation des erreurs. Le système désactive automatiquement la journalisation des erreurs pendant la procédure d’arrêt. ERRLOG ON Description de l’erreur : ERRDEMON TURNED ON Erreur consignée par le démon error et indiquant le lancement de la journalisation des erreurs. Le système active automatiquement la journalisation des erreurs pendant la procédure d’initialisation. Identificateurs d’erreur C-19 EU (unité d’extension asynchrone) EU BAD ADPT Description de l’erreur : EXPANSION UNIT ERROR Une carte incorrecte a été détectée lors de la configuration. DONNÉES DE DÉTAIL Expansion Unit Slot Number Emplacement d’unité d’extension où se trouve la carte défectueuse. EU CFG BUSY Description de l’erreur : CONFIGURATION FAILED: IN USE L’unité est en cours d’utilisation lors de la configuration. EU CFG GONE Description de l’erreur : CONFIGURATION FAILED: UNCONFIGURED L’unité est à l’état non configuré. EU CFG HERE Description de l’erreur : CONFIGURATION FAILED: ALREADY CONFIGURED L’unité est déjà configurée. EU CFG NADP Description de l’erreur : CONFIGURATION FAILED: ADAPTER MISSING La carte est absente lors de la configuration. EU CFG NPLN Description de l’erreur : CONFIGURATION FAILED: ADAPTER MISSING La carte est introuvable lors de la configuration. EU DIAG ACC Description de l’erreur : CANNOT PERFORM DESTRUCTIVE DIAGNOSTICS Le programme de diagnostic est requis alors que l’unité est en cours d’utilisation. EU DIAG MEM Description de l’erreur : CAN NOT ALLOCATE MEMORY: WRAP BUFFER Une commande malloc() relative à la mémoire tampon en boucle n’a pas abouti. C-20 Guide de résolution des incidents et références Anomalies/interruptions CHECKSTOP Description de l’erreur : CHECKSTOP Erreur consignée quand errdaemon est actif et que le compteur d’arrêts sur erreur en mémoire NVRAM indique qu’un arrêt (checkstop) s’est produit. errdaemon copie les données relatives aux arrêts sur erreur de la mémoire NVRAM vers un fichier et consigne dans l’entrée du journal des erreurs le chemin d’accès à ce fichier et le nombre des arrêts. errdaemon remet le compteur des arrêts sur erreur à zéro. Remarque : Lorsqu’il fait un arrêt sur erreur, le système essaie automatique de se réamorcer. S’il n’y parvient pas, il fait encore deux tentatives de réamorçage. Si ces tentatives n’aboutissent pas, le code 201 apparaît dans l’afficheur. Dans ce cas, prévenez le technicien de maintenance. DONNÉES DE DÉTAIL Checkstop Count Nombre des arrêts sur erreur enregistrés en mémoire NVRAM. Checkstop File Pathname Chemin d’accès au fichier renfermant les données relatives aux arrêts sur erreur. CORE DUMP Description de l’erreur : SOFTWARE PROGRAM ABNORMALLY TERMINATED Un programme a été interrompu de façon anormale et un cliché de processus a été lancé. DONNÉES DE DÉTAIL Signal Number Numéro du signal (valeur décimale) reçu lors de l’arrêt du programme. User’s Process ID utilisateur (valeur décimale) à partir duquel le programme était actif. ID File System Serial Number Numéro de série du système de fichiers (valeur décimale) ayant généré le fichier cliché de processus (core). I–node Number Numéro d’inode (valeur décimale) associé au fichier cliché de processus (core). Le numéro de série du système de fichiers est attribué lors du montage et correspond à l’ordre des montages. Il permet d’identifier le système de fichiers dans lequel le cliché de processus a été lancé. Le numéro d’inode identifie le répertoire contenant le fichier du cliché de processus. Les systèmes de fichiers montés sont associés à une liste de structures de systèmes de fichiers virtuels. Pour trouver le numéro de série du système de fichiers virtuel correspondant, choisissez l’une des deux méthodes suivantes : • Créez un programme donnant la liste des systèmes de fichiers montés et appelez le sous–programme stat pour chacun d’eux. Comparez les zones st_vfs de chaque système de fichiers avec le numéro de série du système de fichiers virtuel du journal des erreurs. OU • Exécutez le commande crash assortie de vfs pour obtenir la liste des systèmes de fichiers montés. Comparez ensuite les valeurs figurant dans la colonne NUMBER de la table VFS avec le numéro de série VFS du journal des erreurs. Remarque : Le numéro de série du système de fichiers dépendant de l’ordre de montage, il n’est pas toujours utile après réinitialisation du système. Identificateurs d’erreur C-21 CORRECTED SCRUB Description de l’erreur : MEMORY SCRUBBING CORRECTED ECC ERROR DONNÉES DE DÉTAIL Single Bit Signature/Syndrome Register Registre matériel renfermant des informations détaillées sur l’erreur. Single Bit Status Register Registre matériel renfermant le type d’erreur. Single Bit Address Register Adresse explicite où l’erreur est survenue. DMA ERR Description de l’erreur : UNDETERMINED ERROR Une erreur DMA indéterminée a été détectée. Consultez le journal des erreurs et vérifiez si cette erreur DMA concerne l’unité ou la carte. DONNÉES DE DÉTAIL Bus Number Contrôle du canal d’E/S du gestionnaire de mémoire virtuelle. Error Code Registre d’état de l’alimentation. DOUBLE PANIC Description de l’erreur : SOFTWARE PROGRAM ABNORMALLY TERMINATED Entrée enregistrée par le sous-programme panic du noyau lorsqu’un second incident de type panic survient alors que le premier est en cours de traitement. DONNÉES DE DÉTAIL Panic String Chaîne correspondant au dernier affichage du noyau précédant le premier incident de type panic. Lorsque la routine panic est appelée par la routine assert, cette chaîne contient le nom du fichier et le numéro de ligne à partir desquels la routine assert a été appelée. Panic String Chaîne du deuxième incident de type panic. DSI IOCC Description de l’erreur : DATA STORAGE INTERRUPT, IOCC Entrée enregistrée par le gestionnaire d’interruption lorsque le stockage des données de type contrôleur de canal d’entrée-sortie (IOCC) est interrompu. DONNÉES DE DÉTAIL Data Storage Interrupt Status Register (DSISR) Définit la cause de l’interruption de l’enregistrement des données (DSI). Data Status Address Register (DSAR) Adresse de l’accès en mémoire à l’origine de l’interruption DSI. Segment Register (SEGREG) Registre de segment de l’unité à l’origine de l’exception. Channel Status Register 15 (CSR15) Localise l’erreur. C-22 Guide de résolution des incidents et références DSI PROC Description de l’erreur : DATA STORAGE INTERRUPT, PROCESSOR Entrée enregistrée par le gestionnaire d’interruption lorsque le stockage des données de type processeur est interrompu. DONNÉES DE DÉTAIL Data Storage Interrupt Status Register Définit la cause de l’interruption de l’enregistrement des données (DSI). Data Status Address Register Adresse de l’accès en mémoire à l’origine de l’interruption DSI. Segment Register Registre de segment de l’unité à l’origine de l’exception. DSI SCU Description de l’erreur : DATA STORAGE INTERRUPT, SCU Entrée enregistrée par le gestionnaire d’interruption lorsque le stockage des données de type SCU (Storage Control Unit) est interrompu. DONNÉES DE DÉTAIL Data Storage Interrupt Status Register Définit la cause de l’interruption de l’enregistrement des données (DSI). Data Status Address Register Adresse de l’accès en mémoire à l’origine de l’interruption DSI. Data Storage Interrupt Reason Register Indique la raison de l’interruption DSI. Segment Register Registre de segment de l’unité à l’origine de l’exception. DSI SLA Description de l’erreur : DATA STORAGE INTERRUPT, SLA Entrée enregistrée par le gestionnaire d’interruption lorsque le stockage des données de type SLA (Serial Link Adapter) est interrompu. DONNÉES DE DÉTAIL Data Storage Interrupt Status Register Définit la cause de l’interruption de l’enregistrement des données (DSI). Data Status Address Register Adresse de l’accès en mémoire à l’origine de l’interruption DSI. Segment Registre de segment de l’unité à l’origine de l’exception. Register DUMP Description de l’erreur : DUMP DEVICE ERROR Entrée consignée par le pilote de pseudo unité de cliché lorsqu’il n’arrive pas à ouvrir l’unité de cliché. DONNÉES DE DÉTAIL Major/Minor Device Number Numéro des unités de cliché principale et secondaire. Error Code Code d’erreur système (voir sys/errno.h). Identificateurs d’erreur C-23 DUMP STATS Description de l’erreur : SYSTEM DUMP Cette entrée comprend les informations relatives à la commande sysdumpdev –L. DONNÉES DE DÉTAIL Major Device Number Numéro de l’unité principale. Minor Device Number Numéro de l’unité secondaire. Dump Size Taille du cliché (en octets). Time Heure à laquelle le cliché a été effectué. Dump Type Type primaire (1) ou secondaire (2) du cliché. Dump Status Dernier chiffre du code LED du cliché. EXCHECK DMA Description de l’erreur : External check, DMA Entrée enregistrée par le gestionnaire d’interruption lorsqu’une vérification externe de type DMA est effectuée. Cela peut siginifier qu’un emplacement en mémoire est défectueux. DONNÉES DE DÉTAIL External Check Error Status Register Source et type du contrôle externe. External Check Error Address Register Adresse d’une erreur de type non ECC indiquée dans EESR. External Check ECC Address Register Adresse d’une erreur de type ECC indiquée dans EESR. Memory Configuration Registers Registres de configuration 0, 2, 6, 8, 10, 12, 14. EXCHECK SCRUB Description de l’erreur : OPERATOR NOTIFICATION Une erreur mémoire 2 bits irrémédiable s’est produite. DONNÉES DE DÉTAIL External Check Error Status Register Source et type du contrôle externe. External Check Error Address Register Adresse d’une erreur de type non ECC indiquée dans EESR. External Check ECC Address Register Adresse d’une erreur de type ECC indiquée dans EESR. Memory Configuration Registers Registres de configuration 0, 2, 6, 8, 10, 12, 14. C-24 Guide de résolution des incidents et références FLPT UNAVAIL Description de l’erreur : FLOATING POINT UNAVAILABLE Entrée enregistrée par le gestionnaire d’interruption lorsqu’une interruption de type calcul en virgule flottante non disponible se produit lors d’un fonctionnement en mode noyau. Cela peut être dû à une tentative d’utilisation du processeur de calcul en virgule flottante alors qu’il est indisponible. DONNÉES DE DÉTAIL Segment Register Registre du segment à l’origine de l’anomalie. Machine Status Save/Restore Register 0 SRR0 permet d’enregistrer l’état de la machine lors des interruptions et de le restaurer lorsqu’une instruction de fin d’interruption est exécutée. Généralement ce registre contient l’adresse de l’instruction à l’origine de l’interruption ou de l’instruction à laquelle le système doit revenir, une fois l’interruption traitée. En l’occurrence, il s’agit de l’adresse de l’instruction à l’origine de l’interruption de type calcul en virgule flottante non disponible. Machine State Register Etat du processeur. INTR ERR Description de l’erreur : UNDETERMINED ERROR Une erreur indéterminée s’est produite. DONNÉES DE DÉTAIL Bus Number Gestionnaire de mémoire virtuelle (IOCC). Bus Status Code Niveau d’interruption. Error Code Registre EiS. INTRPPC ERR Description de l’erreur : UNDETERMINED ERROR Une erreur indéterminée s’est produite. DONNÉES DE DÉTAIL Bus Number Gestionnaire de mémoire virtuelle (IOCC). Bus Status Code Niveau d’interruption. Identificateurs d’erreur C-25 ISI PROC Description de l’erreur : INSTRUCTION STORAGE INTERRUPT Entrée enregistrée par le gestionnaire d’interruption lorsque le stockage des instructions est interrompu. DONNÉES DE DÉTAIL Instruction Storage Interrupt Status Register Définit la cause de l’interruption de l’enregistrement des données (DSI). Instruction Storage Save/Restore Register 0 Permet d’enregistrer l’état de la machine lors des interruptions et de le restaurer lorsqu’une instruction de fin d’interruption est exécutée. Généralement ce registre contient l’adresse de l’instruction à l’origine de l’interruption ou de l’instruction à laquelle le système doit revenir, une fois l’interruption traitée. En l’occurrence, il s’agit de l’adresse de l’instruction à l’origine de l’interruption de type calcul en virgule flottante non disponible. Segment Register Registre du segment à l’origine de l’anomalie. KERNEL PANIC Description de l’erreur : SOFTWARE PROGRAM ABNORMALLY TERMINATED Entrée enregistrée par la routine panic du noyau. Cette routine peut être appelée directement ou indirectement, à l’aide de la routine assert. Ces demandes sont lancées lorsque le noyau est altéré et qu’il ne peut pas être récupéré. DONNÉES DE DÉTAIL Assert String Lorsque la routine panic est appelée par la routine assert, cette chaîne contient le nom du fichier et le numéro de ligne à partir desquels la routine assert a été appelée. Panic String Chaîne correspondant au dernier affichage du noyau précédant l’incident de type panic. MACHINECHECK Entrée enregistrée par le gestionnaire de vérification de la machine. DONNÉES DE DÉTAIL Machine Check Error Status Register Contenu de MESR. Machine Check Error Address Register Contenu de MEAR. MEMORY Description de l’erreur : MEMORY FAILURE Un incident a été détecté par la mémoire morte IPL pendant la configuration du système. DONNÉES DE DÉTAIL Failing Module C-26 Module mémoire défectueux. Guide de résolution des incidents et références MISC ERR Description de l’erreur : MISCELLANEOUS INTERRUPT Entrée enregistrée par le gestionnaire d’interruption lors d’une vérification du canal ou du délai d’attente d’entrée-sortie du bus. DONNÉES DE DÉTAIL Bus Status Register Contenu du registre d’état du bus. Miscellaneous Interrupt Register Contenu du registre des interruptions diverses. PROGRAM INT Description de l’erreur : PROGRAM INTERRUPT Entrée enregistrée par le gestionnaire d’interruption quand l’interruption se produit lors d’un fonctionnement en mode noyau. DONNÉES DE DÉTAIL Segment Register Registre du segment à l’origine de l’anomalie. Machine Status Save/Restore Register 0 Permet d’enregistrer l’état de la machine lors des interruptions et de le restaurer lorsqu’une instruction de fin d’interruption est exécutée. Généralement ce registre contient l’adresse de l’instruction à l’origine de l’interruption ou de l’instruction à laquelle le système doit revenir, une fois l’interruption traitée. En l’occurrence, il s’agit de l’adresse de l’instruction à l’origine de l’interruption de type calcul en virgule flottante non disponible. Machine Status Save/Restore Register 1 SRR1 permet d’enregistrer l’état de la machine lors des interruptions et de le restaurer lorsqu’une instruction de fin d’interruption est exécutée. Les informations relatives à chaque interruption sont placées dans les bits 0 à 15 de ce registre. Les bits 16 à 31 du registre d’état de la machine (MSR) sont placés dans les bits 16 à 31 de ce registre. Machine State Register Etat du processeur. REBOOT ID Description de l’erreur : System shut down by user. La commande shutdown a été lancée. DONNÉES DE DÉTAIL User ID ID utilisateur de la session dans laquelle la commande shutdown a été lancée. Reboot Type Réamorçage de type forcé, non forcé ou planifié. Time to Reboot Sert uniquement dans le cas d’un réamorçage planifié (timed reboot) ; sinon, la valeur est 0. Identificateurs d’erreur C-27 SYS RESET Description de l’erreur : System Reset Interrupt received. Entrée enregistrée par le gestionnaire ou d’interruption lorsque le système est relancé. DONNÉES DE DÉTAIL Keymode Switch Position at Boot Time maintenance ou normal. Keymode Switch Position Currently maintenance ou normal. C-28 Guide de résolution des incidents et références Sous-système graphique GRAPHICS Description de l’erreur : SOFTWARE PROGRAM ERROR Entrée enregistrée par le sous-système graphique qui comprend les pilotes d’unités d’entrée et d’affichage graphique. Exemple d’une entrée LFT dans le journal des erreurs : ERROR LABEL: ERROR ID: GRAPHICS <an errorid> Date/Time: Sequence Number: Machine Id: Node Id: Class: Type: Resource Name: <time and date> <sequence number> <machine ID> <node ID> <class> <resource name> Error Description SOFTWARE PROGRAM ERROR Probable Causes SOFTWARE PROGRAM Failure Causes SOFTWARE PROGRAM Recommended Actions IF PROBLEM CONTINUES TO OCCUR REPEATEDLY THEN DO THE FOLLOWING CONTACT APPROPRIATE SERVICE REPRESENTATIVE REPORT DETAILED DATA Detail Data DETECTED FAILED RC ERROR LOCATION DONNÉES DÉTAILLÉES DETECTED Nom du programme où l’erreur s’est produite. FAILED Fonction appelée qui a retourné l’erreur. RC Code retour. ERROR Identificateur attribué à l’incident. LOCATION Identificateur unique (un par module) qui permet de localiser l’incident. Identificateurs d’erreur C-29 Tableau 1. Liste des erreurs du module lftconfig C-30 DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION lftconfig NULL 0 1000 1 LFT déjà initialisé. Pas de récupération – réamorçage lftconfig NULL 0 1001 2 LFT dans un état inconnu. Pas de récupération – réamorçage lftconfig xmalloc 0 1002 3 Impossible d’affecter la structure de données lft_ptr. lftconfig NULL 0 1003 4 Erreur dans la taille de transfert des données Espace utilisateur –> Espace noyau. lftconfig xmalloc 0 1002 5 Impossible d’affecter la structure dds. lftconfig copyin >0 1004 6 Echec de la copie de la structure dds. lftconfig NULL 0 1040 7 Pas de fichier de polices dans la structure dds. lftconfig xmalloc 0 1002 8 Pas d’espace pour les noms de fichier de polices. lftconfig copyin >0 1004 9 Impossible de copier les noms de fichier de polices. lftconfig lft _fonts _init >0 1041 10 Echec de l’initialisation des polices. lftconfig NULL 0 1030 11 Pas de pointeur de fichier mappe clavier dans structure dds. lftconfig xmalloc 0 1002 12 Pas d’espace pour les noms du fichier de mappe swkb. lftconfig copyin >0 1004 13 Impossible de copier les noms du fichier de mappe swkb. lftconfig lft– _swkbd– > 0 _init 1031 14 swkbd : initialisation échouée. lftconfig lft_init >0 1005 15 Echec de l’initialisation de lft. lftconfig lft_ STREAMS _init >0 1011 16 Echec de l’initialisation de lft STREAMS. Guide de résolution des incidents et références lftconfig pincode >0 1012 17 Impossible de placer le code. lftconfig NULL 0 1013 18 Echec de l’arrêt de lft. lftconfig NULL 0 1014 19 Commande non valide. Tableau 2. Liste des erreurs du module lftinit DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION lftinit fp_open– dev >0 1020 1 Impossible d’ouvrir un pilote d’unité d’affichage. lftinit get– _disp– _dataptr >0 1007 2 Pointeur de structure des données phys_display inaccessible. lftinit xmalloc 0 1002 3 Impossible d’affecter la structure vtm. lftinit vttinit >0 1060 4 Echec de l’initialisation du pilote d’unité d’affichage. lftinit vttact >0 1061 5 Echec de l’activation du pilote d’unité d’affichage. lftinit NULL 0 1008 6 Aucun écran initialisé. lftinit NULL 0 1009 7 Ecran par défaut non initialisé. lftinit devswqry >0 1010 8 Requête de la table devsw impossible. lftinit NULL 0 1007 9 Etat de l’unité erroné dans la table devsw ou dataptr=0. lftinit get– _devsw– _dataptr >0 1007 10 Pointeur de structure des données phys_display inaccessible. ERROR DESCRIPTION Echec de la désactivation du pilote d’unité d’affichage. Tableau 3. Liste des erreurs du module lftterm DETECTED FAILED RC ERROR LOCATION lftterm vttdact >0 1062 1 lftterm vttterm >0 1063 2 Echec de l’arrêt du pilote d’unité d’affichage. Identificateurs d’erreur C-31 Tableau 4. Liste des erreurs du module lftfonts DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION lftfonts xmalloc 0 1002 1 Impossible d’affecter de l’espace pour les polices. lftfonts fp_open >0 1021 2 Impossible d’ouvrir le fichier de polices. lftfonts NULL 0 1041 3 Aucune police chargée par lft. lftfonts create– _fkproc >0 1043 4 Impossible de créer le processus noyau des polices. lftfonts fp_fstat >0 1022 5 Impossible de lancer les stat du fichier de polices. lftfonts fp_fstat 0 1022 6 Taille du fichier de polices erronée. lftfonts fp_lseek >0 1023 7 Erreur de recherche du fichier de polices. lftfonts xmalloc 0 1002 8 Impossible d’affecter de l’espace pour les données des polices. lftfonts fp_read >0 1024 9 Erreur de lecture du fichier de polices. lftfonts NULL 0 1041 10 Polices proportionnelles non prises en charge. lftfonts NULL 0 1001 11 lft_ptr NULL. Tableau 5. Liste des erreurs du module lftswkbd C-32 DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION lftswkbd fp_open >0 1021 1 Impossible d’ouvrir le fichier mappe logiciel du clavier. lftswkbd fp_fstat >0 1022 2 Impossible de lancer les stat du fichier mappe swkbd. lftswkbd fp_lseek >0 1023 3 lftswkbd NULL 0 1002 4 Erreur de recherche du fichier swkbd. Impossible d’affecter de l’espace pour le fichier swkbd. lftswkbd fp_read >0 1024 5 Guide de résolution des incidents et références Echec de lecture du fichier mappe swkbd. Tableau 6. Liste des erreurs du module cfglft DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION cfglft odm– _get_list –1 1102 1 Impossible d’obtenir la lise des cartes de PdAt. cfglft odm– _get_list –1 1103 2 Echec d’ODM pour extraire la liste des écrans de CuDv. cfglft NULL 0 1105 3 Aucun écran disponible pour lft. cfglft malloc 0 1106 4 Impossible d’affecter de la mémoire pour la structure dds. cfglft getattr 0 1101 5 Aucun attribut font*_path dans CuAt et PdAt. cfglft NULL 0 1107 6 Aucune police dans l’ODM appartenant à lft. cfglft getattr 0 1101 7 Aucun attribut default_disp dans CuAt et PdAt. cfglft odm– _get_list –1 1103 8 Echec d’ODM pour extraire la liste des cartes de CuDv. cfglft get– _devno >0 1108 9 Echec d’obtention du numéro d’un écran. cfglft putattr –1 1101 10 Echec de la mise à jour de CuAt avec une nouvelle valeur default_disp. cfglft odm– _get_list –1 1102 11 Echec d’ODM pour extraire la liste des claviers de PdAt. cfglft odm– _get_obj –1 1103 12 Echec d’ODM pour extraire les info. sur les écrans de CuDv. cfglft get– _devno >0 1108 13 Echec d’obtention du numéro d’un clavier. cfglft NULL –1 1122 14 Aucun clavier système disponible. cfglft odm_get_list –1 1102 15 Echec d’ODM pour extraire la liste des attributs fkproc de PdAt. cfglft get– _attrval 0 1101 16 Aucun attribut swkb_path dans CuAt et PdAt. Identificateurs d’erreur C-33 C-34 cfglft odm– _get_first <= 0 1102 17 Aucun attribut swkb_path dans PdAt. cfglft open –1 1109 18 Echec d’ouverture du fichier clavier système. cfglft mknode >0 1110 19 Echec de mknode pour le fichier lft /dev/lft0. cfglft stat >0 1110 20 Echec de stat sur le fichier lft /dev/lft0. cfglft unlink >0 1110 21 Echec de unlink sur le fichier lft /dev/lft0. cfglft mknode >0 1110 22 Echec de mknode pour le fichier lft /dev/lft0 après l’avoir dissocié du précédent. cfglft NULL 0 1111 23 Paramètres interdits passés à cfglft. cfglft NULL 0 1112 24 Nom d’unité logique erroné passé à cfglft. cfglft odm_– initialize –1 1100 25 Echec d’initialisation d’ODM. cfglft odm– _get_first 0 1103 26 Echec d’obtention du nom logique pour lft dans CuDv. cfglft odm– _get_first –1 1103 27 Echec d’ODM pour extraire la nom logique de lft dans CuDv. cfglft odm– _get_first 0 1104 28 Echec d’obtention de la classe PdDv associée à lft. cfglft odm– _get_first –1 1104 29 Echec d’ODM pour extraire la classe PdDv pour lft. cfglft NULL 0 1113 30 lft est marqué absent dans la liste de CuDv. cfglft build_dds >0 1114 31 Erreur pendant l’exécution de la fonction build_dds. cfglft loadext 0 1115 32 Incident pendant la tentative de chargement du pilote lft. cfglft genmajor –1 1116 33 Incident de génération du numéro principal pour lft. cfglft genminor 0 1117 34 Incident de génération du numéro secondaire pour lft. Guide de résolution des incidents et références cfglft sysconfig –1 1118 35 Incident pendant l’initialisation du pilote lft. cfglft make– _special– _file >0 1110 36 Incident pendant la création du fichier lft spécialisé. cfglft lft_auto– push >0 1120 37 Incident pendant le chargement automatique des modules STREAMS. cfglft odm– _change _obj –1 1103 38 Incident pendant le passage de lft à l’état disponible. cfglft getattr 0 1101 39 Incident pendant l’obtention de l’attribut syscons. cfglft odm– _run– _meth– ods –1 1118 40 échec de odm_run_method pendant l’exécution de mkitab. cfglft sysconfig >0 1115 41 Incident pendant le chargement du module 1dterm. cfglft sysconfig >0 1115 42 Incident pendant le chargement du module tioc. cfglft stream– _ioctl >0 1115 43 Incident dans ioctl au niveau de SAD pour le chargement automatique des modules. cfglft loadext 0 1121 44 Incident pendant le déchargement du pilote lft. cfglft sysconfig –1 1119 45 Incident pendant l’arrêt du pilote lft. cfglft odm_run_m ethods –1 1118 46 échec de odm_run_methods pendant l’exécution de rmitab. Identificateurs d’erreur C-35 Tableau 7. Liste des erreurs du module startlft DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION startlft odm_– initialize –1 1200 1 Echec d’initialisation d’ODM. startlft odm_– get_first 0 1203 2 Aucune information sur le pilote lft dans la classe PdDv. startlft odm_– get_first –1 1203 3 Echec d’ODM pour extraire la classe PdDv pour lft. startlft odm_– get_first –1 1201 4 Echec d’ODM pour extraire des informations de la classe PdAt. startlft odm_– get_first –1 1202 5 Echec d’ODM pour extraire des informations de la classe CuDv. startlft NULL 0 1204 6 Aucun écran disponible pour lft. startlft odm_– run_– method >0 1205 7 Incident pendant la tentative de définition de lft. Tableau 8. Liste des erreurs du module ucfglft C-36 DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION pop_mod load_ext 0 1300 1 Echec d’obtention de kmid pour le module STREAMS. pop_mod NULL 0 1301 2 Module STREAMS inconnu. pop_mod sysconfig <0 1302 3 Echec de tentative de déconfiguration du module STREAMS par sysconfig. pop_mod loadext 0 1300 4 Echec de déchargement d’un module STREAMS. ucfglft odm_– open_– class –1 1303 1 Echec d’ouverture de la classe CuDv dans ODM. ucfglft odm_– get_first 0 1304 2 Echec pour trouver tout objet appartenant à LFT dans CuDv. Guide de résolution des incidents et références ucfglft odm_– get_first –1 1305 3 Incident ODM pendant l’extraction de l’objet de CuDv. ucfglft odm_– get_first 0 1306 4 Echec pour trouver tout objet appartenant à LFT dans PdDv. ucfglft odm_– get_first –1 1307 5 Incident ODM pendant l’extraction de l’objet de PdDv. ucfglft getmajor –1 1308 6 Incident pendant la tentative d’obtention du numéro principal pour LFT. ucfglft getminor 0 1309 7 Incident pendant la tentative d’obtention du numéro secondaire pour LFT. ucfglft loadext 0 1310 8 Incident pendant la tentative de déchargement du pilote LFT. ucfglft odm_– change_ obj –1 1311 9 Incident pendant le passage de LFT à l’état défini. ucfglft odm_– close_ class –1 1312 10 Incident à la fermeture de la classe CuDv de l’ODM. Tableau 9. Liste des erreurs du pilote d’unité GT1X DETECTE D FAILED RC ERROR LOCATION ERROR DESCRIPTION config.c xmalloc ENOMEM 1001 1 Impossible de définir xmalloc pour la structure de l’unité. define.c xmalloc ENOMEM 1001 1 Impossible de définir xmalloc pour la structure phys_display. define.c xmalloc ENOMEM 1001 2 Impossible de définir xmalloc pour la structure ddf. define.c dev– swadd >0 1003 3 Impossible d’ajouter le pilote à la table de commutation des unités. define.c NULL ENODEV 1007 4 Structure phys_display de l’unité introuvable. Identificateurs d’erreur C-37 C-38 open.c i_init >0 1006 1 Impossible d’enregistrer SLIH. open.c setjmpx EXCEPT– 1004 _IO_SGA 2 Impossible d’enregistrer le gestionnaire de parité. ioctl.c NULL EINVAL 1002 1 Commande ioctl non valide. interrupt.c setjmpx EXCEPT– 1004 _IO_SGA 1 Anomalie d’E/S du bus SGA. draw.c setjmpx EXCEPT– 1004 _IO_SGA 1 Anomalie d’E/S du bus SGA. draw.c setjmpx EXCEPT– 1004 _IO 2 Anomalie d’E/S du bus SGA. load_pal.c setjmpx EXCEPT– 1004 _IO_SGA 1 Anomalie d’E/S du bus SGA. reset.c setjmpx EXCEPT– 1004 _IO_SGA 1 Anomalie d’E/S du bus SGA. vtt_act.c NULL EINVAL 1000 1 Mode terminal spécifié non valide. vtt_defc.c xmalloc ENOMEM 1001 1 Impossible de définir xmalloc pour le bitmap du curseur. vtt_defc.c xmalloc ENOMEM 1001 2 Impossible de définir xmalloc pour le bitmap du curseur inversé. vtt_init.c xmalloc ENOMEM 1001 1 Impossible de définir xmalloc pour les données du pilote local (1d). vtt_init.c load– _font– _table EXCEPT– 1004 _IO_SGA 2 Impossible de charger les polices de caractères aix. vtt_init.c xmalloc ENOMEM 1001 3 Impossible de définir xmalloc pour la présentation de l’espace. vtt_init.c setjmpx EXCEPT– 1004 _IO_SGA 4 Anomalie d’E/S du bus SGA. vtt_scr.c setjmpx EXCEPT– 1004 _IO_SGA 1 Anomalie d’E/S du bus SGA. Guide de résolution des incidents et références Tableau 10. Liste des erreurs du pilote d’unité gda (couleur gda/Gray) dans le module vtt2drvr. DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION vtt2drvr setjmpx EXCEPT– _IO 1000 1 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 2 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 3 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 4 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 5 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 6 Impossible de définir le gestionnaire de parité. vtt2drvr NULL NULL 1002 7 Mode spécifié ni GRAPHICS ni KSR. vtt2drvr NULL !KSR– _MODE 1002 8 Absent dans KSR– _MODE vtt2drvr setjmpx EXCEPT– _IO 1000 9 Impossible de définir le gestionnaire de parité. vtt2drvr NULL NULL 1004 10 Commande spécifiée erronée. vtt2drvr setjmpx EXCEPT– _IO 1000 11 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 12 Impossible de définir le gestionnaire de parité. Identificateurs d’erreur C-39 C-40 vtt2drvr setjmpx EXCEPT– _IO 1000 13 Impossible de définir le gestionnaire de parité. vtt2drvr xmalloc NULL 1001 14 Impossible d’affecter de la mémoire pour les données locales. vtt2drvr xmalloc NULL 1001 15 Impossible d’affecter de la mémoire pour l’espace de présentation. vtt2drvr setjmpx EXCEPT– _IO 1000 16 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 17 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 18 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 19 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 20 Impossible de définir le gestionnaire de parité. vtt2drvr setjmpx EXCEPT– _IO 1000 21 Impossible de définir le gestionnaire de parité. vtt2drvr xmalloc NULL 1001 22 Impossible d’affecter de la mémoire pour pd. vtt2drvr xmalloc NULL 1001 23 Impossible de définir le gestionnaire de parité. vtt2drvr talloc NULL 1005 24 Impossible d’affecter un compteur pour l’unité. Guide de résolution des incidents et références vtt2drvr setjmpx EXCEPT– _IO 1000 25 Impossible de définir le gestionnaire de parité. vtt2drvr dev– swadd >0 1006 26 Ajout impossible dans la table de commutation des unités. vtt2drvr devswqry NULL 1007 27 Liste des écrans physiques nulle. vtt2drvr copyin !NULL 1008 28 Impossible de copier le tampon. vtt2drvr copyin !NULL 1008 29 Impossible de copier le tampon. vtt2drvr copyout !NULL 1009 30 Impossible de copier le tampon. vtt2drvr NULL NULL 1004 31 Option de requête non valide. vtt2drvr NULL NULL 1004 32 Commande non valide. vtt2drvr devswqry NULL 1007 33 Liste des écrans physiques nulle. vtt2drvr NULL DMA– _FAIL 1010 34 ID de canal DMA non valide. vtt2drvr i_init !INTR– _SUCC 1011 35 Impossible de définir les données d’interruption. vtt2drvr devswqry NULL 1007 36 Liste des écrans physiques nulle. vtt2drvr NULL NULL 1013 37 Unité occupée. vtt2drvr xmalloc NULL 1001 38 Impossible d’affecter stuff dds. vtt2drvr devswqry NULL 1007 39 Liste des écrans physiques nulle. vtt2drvr NULL NULL 1004 40 Commande non valide. vtt2drvr devswqry NULL 1007 41 Liste des écrans physiques nulle. vtt2drvr NULL NULL 1007 42 Ignore quel pd libérer. vtt2drvr devswdel >0 1014 43 Impossible de supprimer l’entrée dans la table devsw. Identificateurs d’erreur C-41 Tableau 11. Liste des erreurs du pilote d’unité gda (couleur gda/Gray) dans le module vtt2intr. C-42 DETECTED FAILED RC ERROR LOCATION ERROR DESCRIPTION vtt2intr setjmpx EXC EPT– _IO 1000 1 Impossible de définir le gestionnaire de parité. Guide de résolution des incidents et références HCON WHP0001 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur d’affectation mémoire a été détectée. DONNÉES DE DÉTAIL File Name Nom du fichier consigné dans le journal par HCON. IPC Id ID de la file de messages IPC. WHP0002 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de réception relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0003 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur d’émission relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0004 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de création relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0005 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de création relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0006 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de statistiques relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0007 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de définition relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0008 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de suppression relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. Identificateurs d’erreur C-43 WHP0009 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de connexion relative à la file d’attente des messages IPC s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0010 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de déconnexion relative au segment partagé s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0011 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur d’allocation relative au segment partagé s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0012 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de lancement relative au segment partagé s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0013 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de définition relative au segment partagé s’est produite. Reportez-vous à Données de détail dans WHP001. WHP0014 Description de l’erreur : SOFTWARE PROGRAM ERROR Une erreur de suppression relative au segment partagé s’est produite. Reportez-vous à Données de détail dans WHP001. C-44 Guide de résolution des incidents et références Identificateurs d’erreurs IDE ATAIDE ERR1 Description de l’erreur : IDE ADAPTER RESET FAILURE Cette entrée est enregistrée par le pilote d’unité de carte IDE lorsqu’une réinitialisation de bus ne rend pas disponibles les unités IDE. Il est peu probable qu’une opération quelconque sur la carte IDE puisse se poursuivre après une erreur de ce type. DONNÉES DE DÉTAIL IDE Bus and Command: Commande courante et état du bus IDE, analysés par les programmes de diagnostics. ATAIDE ERR2 Description de l’erreur : IDE DMA TRANSFER ERROR Un incident DMA temporaire est susceptible de se produire. Une ressource système, une erreur d’unité ou un incident matériel en serait l’origine. Cette erreur n’est pas bloquante pour la poursuite des opérations. IDE Bus and Command: Commande courante et état du bus IDE, analysés par les programmes de diagnostics. ATAIDE ERR3 Description de l’erreur : IDE DEVICE ERROR Cette entrée est consignée par le pilote de carte IDE lors d’une défaillance matérielle temporaire de la carte IDE, du bus d’E/S système et/ou du matériel associé. Les tentatives de répétition de l’opération sont interdites ou épuisées. Il est peu probable qu’une opération quelconque sur la carte IDE puisse se poursuivre après une erreur de ce type. IDE Bus and Command: Commande courante et état du bus IDE, analysés par les programmes de diagnostics. ATAIDE ERR4 Description de l’erreur : IDE COMMAND TIMEOUT ERROR Cette entrée est enregistrée par le pilote d’unité de carte IDE lorsqu’une commande échoue faute de réponse de l’unité IDE. Cette erreur n’est pas bloquante pour la poursuite des opérations. IDE Bus and Command: Commande courante et état du bus IDE, analysés par les programmes de diagnostics. Identificateurs d’erreur C-45 IENT (Ethernet intégré) IENT ERR1 Description de l’erreur : ADAPTER ERROR Un fonctionnement incorrect du contrôleur Ethernet a été détecté. DONNÉES DE DÉTAIL Return code Code défini dans le fichier /usr/include/sys/errno.h. Status Code A usage interne. Program Check Code A usage interne. IENT ERR2 Description de l’erreur : CONFIGURATION OR CUSTOMIZATION ERROR L’unité Ethernet n’a pas été activée faute des ressources nécessaires : canaux DMA, niveau d’interruption, et espace mémoire bus et système. DONNÉES DE DÉTAIL Return code Code défini dans le fichier /usr/include/sys/errno.h. Status Code A usage interne. IENT ERR3 Description de l’erreur : SOFTWARE DEVICE DRIVER Erreur Micro Channel de l’unité Ethernet pendant le cours normal de l’exploitation. Des données sont probablement perdues. DONNÉES DE DÉTAIL Return code A usage interne. Status Code A usage interne. Program Check Code A usage interne. IENT ERR4 Description de l’erreur : Le pilote Ethernet a détecté un manque de mémoire tampon de réception (clusters) au niveau système. OU Le pilote Ethernet a reçu un paquet de taille incorrrect. OU Le pilote Ethernet n’a pas pu libérer de la mémoire. OU Le pilote Ethernet a fait échouer une commande. C-46 Guide de résolution des incidents et références DONNÉES DE DÉTAIL Return code 816 Insuffisance de mémoire mbuffer/cluster. Vérifiez le niveau de la mémoire tampon de réception via la commande no. L’une des solutions est d’augmenter ce niveau jusqu’à disparition des erreurs (la contrepartie étant la mobilisation de la mémoire de réserve) : • lowclust • lowmbuf • thewall • mb_cl_hiwat. 683 Réception d’un paquet de taille incorrecte. 1407, 162 Impossible de libérer de la mémoire. 1829 Commande d’action échouée. Status Code Mot d’état ou de commande du bloc de contrôle système. Program Check Code Code retour. Pour plus d’information sur l’optimisation de la mémoire tampon de réception, reportez-vous à AIX - Guide d’optimisation, CEDOC 86 F2 72AP. IENT ERR5 Description de l’erreur : COMMUNICATIONS SUBSYSTEM FAILURE Un incident s’est produit lors d’une transmission. DONNÉES DE DÉTAIL Return code Code défini dans le fichier /usr/include/sys/entuser.h. Status Code Mot d’état du bloc de commande de transmission. Program Check Code Mot d’état du bloc de contrôle système. Identificateurs d’erreur C-47 LION (concentrateurs 64 ports) LION BOX DIED Description de l’erreur : LOST COMMUNICATION WITH 64-PORT CONCENTRATOR La communication est perdue. LION BUFFERO Description de l’erreur : BUFFER OVERRUN: 64-PORT CONCENTRATOR La mémoire tampon matérielle du concentrateur 64 ports est saturée. LION CHUNKNUMC Description de l’erreur : BAD CHUNK COUNT: 64-PORT CONTROLLER Le nombre de caractères d’un palier de mémoire ne correspond pas aux valeurs réelles de la mémoire tampon. LION HRDWRE Description de l’erreur : CANNOT ACCESS MEMORY ON 64-PORT CONTROLLER L’accès à la mémoire du contrôleur 64 ports est impossible. LION MEM ADAP Description de l’erreur : CANNOT ALLOCATE MEMORY: ADAP STRUCTURE Une demande malloc() pour la structure adap n’a pas abouti. LION MEM LIST Description de l’erreur : CANNOT ALLOCATE MEMORY: LI_ADAP Une demande malloc() pour la structure li_adap n’a pas abouti. LION UNKCHUNK Description de l’erreur : UNKNOWN ERROR CODE FROM THE 64-PORT CONCENTRATOR. DONNÉES DE DÉTAIL ERROR CODE C-48 Nombre de caractères en réception dans le palier de mémoire. Guide de résolution des incidents et références LVM (gestionnaire de volume logique) CMDLVM Description de l’erreur : DISK OPERATION ERROR Entrée enregistrée par le gestionnaire de volume logique (LVM). DONNÉES DE DÉTAIL Physical Volume ID du volume physique sur lequel l’erreur s’est produite. LVM BBDIR90 Description de l’erreur : BAD BLOCK DIRECTORY OVER 90% FULL Ce message est généré par le répertoire des blocs incorrects lorsqu’il est rempli à 90 % au cours d’une mise à jour. Quand ce répertoire est plein, les blocs incorrects ne peuvent pas être déplacés. DONNÉES DE DÉTAIL Current Number Of Entries Nombre d’entrée figurant dans le mauvais répertoire de blocs. LVM BBDIRBAD Description de l’erreur : BAD BLOCK RELOCATION FAILURE––PV NO LONGER RELOCATING NEW BAD BLOCKS La tentative de translation d’un bloc par le gestionnaire de volume logique a échoué. Le répertoire correspondant se trouvant sur le volume physique est altéré. DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. LVM BBDIRERR Description de l’erreur : BAD BLOCK RELOCATION FAILURE––PV NO LONGER RELOCATING NEW BAD BLOCKS La mise à jour du répertoire de blocs incorrects a échoué (voir code d’erreur). Les blocs défectueux se trouvant sur le disque DASD ne sont pas déplacés. DONNÉES DE DÉTAIL Directory Operation Opération en cours au moment de l’erreur. LVM BBDIRFUL Description de l’erreur : BAD BLOCK RELOCATION FAILURE La translation d’un bloc incorrect a échoué car le répertoire est plein. Les blocs défectueux se trouvant sur le disque DASD ne sont pas déplacés. LVM BBEPOOL Description de l’erreur : BAD BLOCK RELOCATION FAILURE––PV NO LONGER RELOCATING NEW BAD BLOCKS Le groupe de translation de blocs incorrects n’a plus de bloc disponible. Aussi, les blocs défectueux se trouvant sur le disque DASD ne seront pas déplacés. Identificateurs d’erreur C-49 LVM BBFAIL Description de l’erreur : BAD BLOCK RELOCATION FAILURE––PV NO LONGER RELOCATING NEW BAD BLOCKS La tentative de translation d’un bloc par le gestionnaire de volume logique a échoué. L’erreur n’est pas due au support (voir le code d’erreur). DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. LVM BBRELMAX Description de l’erreur : BAD BLOCK RELOCATION FAILURE––PV NO LONGER RELOCATING NEW BAD BLOCKS Les tentatives de translation matérielle et logicielle du bloc incorrect ont échoué. Aucun autre bloc ne sera déplacé sur ce volume physique. DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. LVM HWFAIL Description de l’erreur : HARDWARE DISK BLOCK RELOCATION FAILED La translation matérielle d’un bloc du disque par le gestionnaire de volume logique a échoué. Cela peut être dû au disque. DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. LVM HWREL Description de l’erreur : HARDWARE DISK BLOCK RELOCATION ACHIEVED La translation d’un bloc du disque a réussi. DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. LVM MISSPVADDED Description de l’erreur : PHYSICAL VOLUME DEFINED AS MISSING Un volume physique a été défini comme manquant au cours de la procédure de mise en fonction du groupe de volumes. Ce dernier peut être hors tension ou manquant. LVM MISSPVRET Description de l’erreur : PHYSICAL VOLUME IS NOW ACTIVE Le volume physique défini comme manquant a été activé. LVM MWCWFAIL Description de l’erreur : MIRROR CACHE WRITE FAILED Une opération de mise à jour de l’écriture miroir en antémémoire a échoué. DONNÉES DE DÉTAIL Block Number C-50 Numéro du bloc défectueux. Guide de résolution des incidents et références LVM SA FRESHPP Description de l’erreur : PHYSICAL PARTITION MARKED ACTIVE Une copie hors service d’une partition dupliquée a été marquée comme nouvelle. Cela peut être dû à son emplacement sur un volume physique manquant puis de nouveau disponible pour lequel la commande syncvg a été lancée. DONNÉES DE DÉTAIL Physical Volume Device Major/Minor Numéro d’unité du volume physique principal/secondaire. Logical Volume Device Major/Minor Numéro d’unité du volume logique principal/secondaire. LVM SA WRTERR Description de l’erreur : FAILED TO WRITE VOLUME GROUP STATUS AREA Une opération d’écriture de mise à jour de la zone d’état du groupe de volume a échoué. Cette zone contient l’état des partitions dupliquées et des volumes physiques. LVM SA PVMISS Description de l’erreur : PHYSICAL VOLUME DECLARED MISSING Un volume physique a été déclaré manquant alors que le système procédait à une écriture en zone d’état du groupe de volumes. Cette zone contient l’état des partitions dupliquées et des volumes physiques. LVM SA STALEPP Description de l’erreur : PHYSICAL PARTITION MARKED STALE Une copie d’une partition dupliquée a été marquée hors service. Cela peut être dû à sa situation sur un volume manquant lors de la mise à jour. DONNÉES DE DÉTAIL Physical Volume Device Major/Minor Numéro d’unité du volume physique principal/secondaire. Logical Volume Device Major/Minor Numéro d’unité du volume logique principal/secondaire. LVM SA QUORCLOSE Description de l’erreur : QUORUM LOST, VOLUME GROUP CLOSING Lorsqu’un certain nombre de zones d’état du groupe de volumes sont inactives, le groupe de volume est fermé. Le décompte de quorum est effectué chaque fois qu’un volume physique est déclaré manquant lors de la mise à jour d’une zone d’état. DONNÉES DE DÉTAIL Quorum Count Nombre de zones d’état résidant dans le groupe de volumes. Active Count Nombre de zones d’état actives résidant dans le groupe de volumes. LVM SWREL Description de l’erreur : SOFTWARE DISK BLOCK RELOCATION ACHIEVED La translation d’un bloc du disque a réussi. DONNÉES DE DÉTAIL Block Number Numéro du bloc défectueux. Identificateurs d’erreur C-51 MACHINE CHECK MACHINE CHECK 604 Description de l’erreur : MACHINE CHECK on a Power PC 604 type processor. Cette entrée est enregistrée lors d’une erreur de parité mémoire multiple, d’une erreur de parité de bus d’adresses ou de données ou d’une erreur de parité mémoire cache interne. DONNÉES DE DÉTAIL TIME STAMP Horodate l’erreur. MACHINE STATUS SAVE / RESTORE REGISTER 0 Registre où est consigné l’état de la machine. MACHINE STATUS SAVE / RESTORE REGISTER 1 Registre où est consigné l’état de la machine. C-52 Guide de résolution des incidents et références MEM MEM1 Description de l’erreur : MEMORY FAILURE Une carte mémoire est manquante. DONNÉES DE DÉTAIL Card Slot Emplacement de la carte mémoire affectée. MEM2 Description de l’erreur : MEMORY FAILURE Une carte mémoire contient jusqu’à deux SIMM défectueux. DONNÉES DE DÉTAIL Card Slot Emplacement de la carte mémoire affectée. Memory SIMM Number ID du ou des SIMM défectueux. MEM3 Description de l’erreur : MEMORY FAILURE Cette entrée indique qu’une carte mémoire est défectueuse. DONNÉES DE DÉTAIL Card Slot Emplacement de la carte mémoire affectée. Identificateurs d’erreur C-53 MPQP MPQP ADPERR Description de l’erreur : MPQP ADAPTER ERROR Les données renvoyées par le code de la carte sont incorrectes ou la carte ne fonctionne pas. DONNÉES DE DÉTAIL File Name Module et numéro de ligne où l’erreur s’est produite. Port Number Numéro du port à l’origine de l’erreur. Command Commande à l’origine de l’erreur. Receive Error Indique le type d’erreur à l’origine du dépassement du seuil d’erreur de réception. Reportez-vous à sys/mpqp.h pour les codes correspondant à chaque type d’erreur. MPQP ASWCHK Description de l’erreur : MPQP ADAPTER SOFTWARE CHECKSUM ERROR. Le total de contrôle effectué sur la carte MPQP est incorrect. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP BFR Description de l’erreur : MPQP BUFFER ALLOCATION Le système est incapable d’attribuer de la mémoire au pilote de périphérique MPQP. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP CTSDRP Description de l’erreur : MPQP CTS DROPPED DURING TRANSMIT Le signal Prêt à émettre (PAE) a disparu lors d’une transmission. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP CTSTO Description de l’erreur : COMMUNICATION PROTOCOL ERROR Le signal Prêt à émettre (PAE) n’est pas apparu pas lors d’une transmission. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP DSRDRP Description de l’erreur : MPQP DSR DROPPED Le signal Poste de données prêt (PDP) a disparu alors que le signal Terminal de données prêt (TDP) est toujours activé. Reportez-vous à Données de détail dans MPQP ADPERR. C-54 Guide de résolution des incidents et références MPQP DSROFFTO Description de l’erreur : MPQP DSR OFF TIMEOUT Un appel a été lancé alors que le signal Poste de données prêt (PDP) est activé. Si ce signal est toujours activé lorsque la carte achemine le signal Terminal de données prêt (TDP), cette dernière considère que le premier appel est encore en cours de traitement. Cette mesure de sécurité permet de ne pas lancer un appel tant que la session en cours n’est pas terminée. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP DSRTO Description de l’erreur : MPQP DSR TIMEOUT Le signal Poste de données prêt (PDP) n’est pas activé. Le modem n’a pas transmis l’état prêt. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP IPLTO Description de l’erreur : MPQP INITIAL PROGRAM LOAD TIMEOUT Erreur enregistrée par le pilote de périphérique MPQP. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP QUE Description de l’erreur : MPQP UNABLE TO ACCESS QUEUE Le pilote de périphérique MPQP ne peut pas accéder à une file d’attente de commandes ou de réponses gérée par le code de la carte ou du pilote. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP RCVERR Description de l’erreur : MPQP RECEIVE ERROR THRESHOLD EXCEEDED Les données ne sont pas reçues correctement. L’erreur peut être résolue par la retransmission. Certaines erreurs de réception sont normales et ne nécessitent aucune action, sauf si elles se répètent et entravent la transmission. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP RCVOVR Description de l’erreur : MPQP RECEIVE OVERRUN Le pilote de périphérique MPQP ne peut pas attribuer assez rapidement des mémoires tampons de transfert au code de la carte pour les données en entrée. Des données peuvent être perdues. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP X21CECLR Description de l’erreur : MPQP X21 CALL ESTABLISHMENT CLEAR Le réseau a libéré un appel en raison d’une erreur. Si des données en caractères par seconde sont renvoyées, vérifiez-en le nombre pour connaître la raison de la libération. Reportez-vous à Données de détail dans MPQP ADPERR. Identificateurs d’erreur C-55 MPQP X21CPS Description de l’erreur : MPQP X21 CALL PROGRESS SIGNAL Un signal de progression d’appel X.21 a été reçu. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP X21DTCLR Description de l’erreur : MPQP X21 DATA TRANSFER CLEAR Un signal de libération X.21 inattendu a été reçu lors du transfert de données. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP X21TO Description de l’erreur : MPQP X21 TIMEOUT Le sous-programme X21 n’a pas pu se terminer en raison de l’expiration du délai. Les horloges sont indiquées dans les Données de détail. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP XFTO Description de l’erreur : MPQP TRANSMIT FAILSAFE TIMEOUT La transmission n’a pas pu se terminer pour l’une des deux raisons suivantes : le signal Prêt à émettre (PAE) n’a pas été renvoyé par le modem ou les horloges n’ont pas été détectées par le port. Reportez-vous à Données de détail dans MPQP ADPERR. MPQP XMTUND Description de l’erreur : MPQP TRANSMIT UNDERRUN Le pilote ou le code de la carte n’arrive plus à suivre le rythme du protocole, ne pouvant pas transmettre assez rapidement des données au matériel de communication. Des caractères de synchronisation (SYN) seront insérés. Reportez-vous à Données de détail dans MPQP ADPERR. C-56 Guide de résolution des incidents et références MSLA MSLA ADAPTER Description de l’erreur : ADAPTER ERROR Une erreur ayant provoqué l’interruption de la carte MSLA s’est produite. DONNÉES DE DÉTAIL File Name Nom du fichier associé à l’erreur. Return code Code de retour du module défectueux (voir /sys/errno.h). Adresse de la ligne Adresse de la mémoire associée à la transmission des données. MSLA CLOSE Description de l’erreur : SOFTWARE PROGRAM ABNORMALLY TERMINATED Une erreur s’est produite lors du traitement d’une commande de fermeture (close) ou d’interruption (halt) du pilote de périphérique. Reportez-vous à Données de détail dans MSLA ADAPTER. MSLA INTR Description de l’erreur : COMMUNICATION PROTOCOL ERROR Une erreur s’est produite lors du traitement des interruptions provenant de la carte MSLA. Reportez-vous à Données de détail dans MSLA ADAPTER. MSLA PROTOCOL Description de l’erreur : COMMUNICATION PROTOCOL ERROR Le système a détecté une erreur d’établissement de liaison entre la carte et le pilote de périphérique ou entre la carte et le module de communication interne au pilote de périphérique. Reportez-vous à Données de détail dans MSLA ADAPTER. MSLA START Description de l’erreur : OUT OF RESOURCES Une erreur empêchant l’ouverture d’une session s’est produite. Il peut s’agir d’une erreur d’entrée-sortie permanente. Reportez-vous à Données de détail dans MSLA ADAPTER. MSLA WRITE Description de l’erreur : ADAPTER ERROR Une erreur d’écriture s’est produite lors de l’utilisation du pilote de périphérique. Reportez-vous à Données de détail dans MSLA ADAPTER. Identificateurs d’erreur C-57 NETBIOS NB1 Description de l’erreur : SOFTWARE PROGRAM ERROR Il n’y a plus de bloc d’état du programme (PSB) dans le gestionnaire d’interruption du système d’entrée-sortie de base du réseau local (NETBIOS). NB2 Description de l’erreur : SOFTWARE PROGRAM ERROR NETBIOS a rencontré un option de commande router inconnue. DONNÉES DE DÉTAIL Router Command Options Options de la commande router contenant l’option inconnue. NB3 Description de l’erreur : SOFTWARE PROGRAM ERROR NETBIOS ne dispose plus de mémoire tampon d’entrée-sortie. NB4 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl de désactivation du SAP (point d’accès au service) a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (voir /sys/errno.h). NB5 Description de l’erreur : SOFTWARE PROGRAM ERROR Le SAP (point d’accès au service) est déjà fermé. NB6 Description de l’erreur : SOFTWARE PROGRAM ERROR Un dépassement de la capacité de la mémoire tampon a été détecté. NB7 Description de l’erreur : SOFTWARE PROGRAM ERROR Inactivité sans indication de fin. NB8 Description de l’erreur : SOFTWARE PROGRAM ERROR Reprise d’activité. C-58 Guide de résolution des incidents et références NB9 Description de l’erreur : SOFTWARE PROGRAM ERROR Un indicateur de résultat n’est pas défini. DONNÉES DE DÉTAIL Result Code Résultat indéfini. NB10 Description de l’erreur : SOFTWARE PROGRAM ERROR Il n’y a plus de mémoire tampon d’entrée-sortie pour l’ouverture d’un poste de liaison. NB11 Description de l’erreur : SOFTWARE PROGRAM ERROR Il n’y a plus de mémoire tampon d’entrée-sortie pour la fin d’ouverture d’un poste de liaison. NB12 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl d’ouverture du poste de liaison a échoué. DONNÉES DE DÉTAIL Result Code Code d’erreur système (voir /sys/errno.h). NB13 Description de l’erreur : SOFTWARE PROGRAM ERROR Il n’y a plus de mémoire tampon d’entrée-sortie pour la connexion d’un poste de liaison. NB14 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl de contact a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). NB15 Description de l’erreur : SOFTWARE PROGRAM ERROR Les tentatives de connexion du poste de liaison sont épuisées. NB16 Description de l’erreur : SOFTWARE PROGRAM ERROR La connexion à un poste de liaison a échoué. NB17 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl d’arrêt d’un poste de liaison (HALT) a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). Identificateurs d’erreur C-59 NB18 Description de l’erreur : SOFTWARE PROGRAM ERROR Il n’y a plus de mémoire tampon d’entrée-sortie pour la commande IOCtl d’activation du SAP. NB19 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl d’activation du SAP a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). NB20 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande IOCtl d’écriture a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). NB21 Description de l’erreur : SOFTWARE PROGRAM ERROR Un EOR (résultat d’opérations erroné) a été reçu du LLC. DONNÉES DE DÉTAIL Result Code Résultat. NB22 Description de l’erreur : SOFTWARE PROGRAM ERROR Une corrélation utilisateur-SAP inconnue a été reçue dans le gestionnaire d’interruption. DONNÉES DE DÉTAIL SAP Correlator Corrélateur SAP inconnu. NB23 Description de l’erreur : SOFTWARE PROGRAM ERROR Une corrélation utilisateur-SAP inconnue a été reçue. DONNÉES DE DÉTAIL SAP Correlator Corrélateur SAP inconnu. NB24 Description de l’erreur : SOFTWARE PROGRAM ERROR Une corrélation non valide en provenance d’une réponse d’ouverture SAP/LS a été détectée. C-60 Guide de résolution des incidents et références NB25 Description de l’erreur : SOFTWARE PROGRAM ERROR Le sous-programme devswadd a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). NB26 Description de l’erreur : SOFTWARE PROGRAM ERROR Le sous-programme devswdel a échoué. DONNÉES DE DÉTAIL Return Code Code d’erreur système (/sys/errno.h). NB27 Description de l’erreur : SOFTWARE PROGRAM ERROR La commande d’ouverture est en attente de fin. NB28 Description de l’erreur : SOFTWARE PROGRAM ERROR Des options de configuration inconnues ont été détectées. DONNÉES DE DÉTAIL Configuration Option Option de configuration inconnue. NB29 Description de l’erreur : SOFTWARE PROGRAM ERROR Un appel à la fonction malloc a échoué. NB30 Description de l’erreur : SOFTWARE PROGRAM ERROR Un appel à la fonction palloc a échoué. Identificateurs d’erreur C-61 PSLA PSLA001 Description de l’erreur : DEVICE ERROR Entrée consignée par le pilote de la carte PSLA lorsque des incidents matériels (unités graphiques PSLA ou câble) se produisent. DONNÉES DE DÉTAIL DETECTING MODULE Nom du module qui détecte l’erreur. FAILING MODULE Nom du module défectueux. MAJOR/MINOR DEVICE NUMBER Numéros d’unité principale/secondaire ERROR CODE Code d’erreur système (voir sys/errno.h). REASON CODE Décrit le type de l’erreur. LOCATION Informations relatives à l’emplacement de l’erreur, destinées à la carte PSLA. SENSE DATA Données de détection relatives à l’incident, analysées par les programmes de diagnostic. PSLA002 Description de l’erreur : DEVICE ERROR Des erreurs liées à un pilote d’unité ou au microcode se sont produites. Reportez-vous à Données de détail dans PSLA001. PSLA003 Description de l’erreur : LINK ERROR Une erreur de liaison hôte s’est produite. Reportez-vous à Données de détail dans PSLA001. C-62 Guide de résolution des incidents et références RECOV ECC RECOV ECC ERR Description de l’erreur : MEMORY FAILURE Cette entrée est enregistrée lors d’une défaillance de barrette SIMM sur une carte mémoire ou en raison d’une carte mémoire défectueuse. DONNÉES DE DÉTAIL STATUS CODE Indique le type des erreurs de parité : 0500 Erreur de parité de bit unique 0501 Erreur de parité de bit multiple 0502 Pas d’erreur de parité mémoire 0503 Etat ASIC incohérent 0504 Table d’imbrication incohérente CARD NUMBER Numéro de la carte en cause (de 0 à 3). SIMM LOCATIONS Emplacement des barrettes SIMM défectueuses (jusqu’à 4 barrettes pouvant à la fois présenter une anomalie). Le bit le plus à gauche (de poids fort) représente le numéro de barrette 1 et celui le plus à droite (de poids faible) représente le numéro de barrette 16. PHYSICAL MEMORY ADDRESS Adresse de la mémoire physique où l’incident a été détecté. Remarques : 1. Les données CARD NUMBER et SIMM LOCATIONS ne sont valides que si STATUS CODE est égal à 0 ou 1. 2. L’identificateur d’erreur PEGA PARITY ERR s’applique aux systèmes dotés de modules mémoire SIMM ou DIMM. Identificateurs d’erreur C-63 RS RS 8 16 ARB Description de l’erreur : INVALID 8/16 PORT ARBITRATION REGISTER Entrée enregistrée par le pilote d’unité TTY lorsqu’un registre d’arbitrage du port 8/16 non valide est détecté. DONNÉES DE DÉTAIL Adapter Return Code Code retour de la carte. RS MEM EDGE Description de l’erreur : CANNOT ALLOCATE MEMORY: EDGE STRUCTURE Une fonction malloc() pour la structure TTY edge a échoué. RS MEM EDGEV Description de l’erreur : CANNOT ALLOCATE MEMORY: EDGE VECTOR Une fonction malloc() pour le vecteur edge a échoué. RS MEM IOCC Description de l’erreur : CANNOT ALLOCATE MEMORY: IOCC STRUCTURE Une fonction malloc() pour la structure TTY IOCC a échoué. RS MEM PVT Description de l’erreur : CANNOT ALLOCATE MEMORY: PRIV. STRUCTURE Une fonction malloc() pour la structure TTY private a échoué. RS PROG IOCC Description de l’erreur : SOFTWARE ERROR: IOCC NOT CONFIGURED Le contrôleur de canal d’entrée-sortie (IOCC) est à l’état non configuré. RS PROG SLIH Description de l’erreur : SOFTWARE ERROR: CANNOT FIND SLIH Entrée consignée par le pilote d’unité TTY lorsqu’il ne trouve pas sa structure slih. C-64 Guide de résolution des incidents et références SCSI SCSI ERR1 Description de l’erreur : ADAPTER ERROR Un incident matériel permanent lié à la carte SCSI, au bus d’entrée-sortie du système ou aux deux, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur empêche la poursuite des opérations. DONNÉES DE DÉTAIL Adapter Return Code: Données de détection relatives à l’incident, analysées par les programmes de diagnostic. SCSI ERR2 Description de l’erreur : ADAPTER ERROR Un incident matériel potentiellement grave, lié à la carte SCSI, au bus d’entrée-sortie du système ou aux deux, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur n’est pas bloquante pour la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR3 Description de l’erreur : MICROCODE PROGRAM ERROR Un incident permanent inconnu, lié au microcode de la carte, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur empêche la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR4 Description de l’erreur : MICROCODE PROGRAM ERROR Un incident inconnu potentiellement grave, lié au microcode de la carte, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur n’est pas bloquante pour la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR5 Description de l’erreur : SOFTWARE PROGRAM ERROR Un incident logique permanent grave, lié au pilote de périphérique, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur empêche la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR6 Description de l’erreur : SOFTWARE PROGRAM ERROR Un incident logique potentiellement grave, lié au pilote de périphérique, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur n’est pas bloquante pour la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. Identificateurs d’erreur C-65 SCSI ERR7 Description de l’erreur : UNDETERMINED ERROR Un incident potentiellement permanent, lié au sous-programme de service du noyau, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur empêche la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR8 Description de l’erreur : UNDETERMINED ERROR Un incident potentiellement permanent, lié au sous-programme de service du noyau, a été détecté. Les tentatives de répétition de l’opération sont interdites ou épuisées. Cette erreur n’est pas bloquante pour la poursuite des opérations. Reportez-vous à Données de détail dans SCSI ERR1. SCSI ERR9 Description de l’erreur : POTENTIAL DATA LOSS CONDITION Un équipement SCSI de niveau inférieur est probablement installé. Cela peut entraîner une perte de données. SCSI ERR10 Description de l’erreur : TEMPORARY SCSI BUS ERROR Un incident potentiellement grave, lié au bus SCSI (câblage, carte ou autre), a été détecté. Cette erreur n’est pas bloquante pour la poursuite des opérations. C-66 Guide de résolution des incidents et références SD SDA ERR1 Description de l’erreur : STORAGE SUBSYSTEM FAILURE Une erreur matérielle irrémédiable liée à la carte a été détectée. DONNÉES DE DÉTAIL SENSE DATA Données de détection relatives à l’incident, analysées par les programmes de diagnostic. SDA ERR2 Description de l’erreur : STORAGE SUBSYSTEM FAILURE Le système a détecté une erreur matérielle irrémédiable liée à la carte. Reportez-vous à Données de détail dans SDA ERR1. SDA ERR3 Description de l’erreur : UNDETERMINED ERROR Le système a détecté une erreur irrémédiable. Reportez-vous à Données de détail dans SDA ERR1. SDA ERR4 Description de l’erreur : UNDETERMINED ERROR Le système a détecté une erreur qui peut être résolue. Reportez-vous à Données de détail dans SDA ERR1. SDC ERR1 Description de l’erreur : LINK ERROR Une liaison série entre les contrôleurs et l’unité de stockage à accès direct (DASD) a échoué. Reportez-vous à Données de détail dans SDA ERR1. SDC ERR2 Description de l’erreur : STORAGE SUBSYSTEM FAILURE Une erreur matérielle irrémédiable liée à la carte a été détectée. Reportez-vous à Données de détail dans SDA ERR1. SDC ERR3 Description de l’erreur : STORAGE SUBSYSTEM FAILURE Une erreur matérielle irrécupérable liée au contrôleur a été détectée. Reportez-vous à Données de détail dans SDA ERR1. SDM ERR1 Description de l’erreur : MICROCODE PROGRAM ERROR Une erreur de microcode a été détectée. Reportez-vous à Données de détail dans SDA ERR1. Identificateurs d’erreur C-67 SLA SLA CRC ERR Description de l’erreur : SLA LINK CHECK CRC ERROR Le total de contrôle CRC d’une trame est incorrect. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les zones Status 1 et Status 2 sont valables. SLA DRIVER ERR Description de l’erreur : SLA LINK CHECK FAULT IN LASER DRIVE La carte optique a détecté une erreur liée au pilote de transmission. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les valeurs des zones d’état Status 1 et Status 2 sont correctes. SLA EXCEPT ERR Description de l’erreur : INTERNAL SERIAL LINK ADAPTER EXCEPTION Une anomalie PIO a été détectée. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les valeurs des zones d’état Status 1 et Status 2 sont pas incorrectes. SLA FRAME ERR Description de l’erreur : SLA LINK CHECK POSSIBLE LOST FRAME Une trame est perdue. L’erreur peut être liée au délai de réponse ou au décompte de transmission. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Si l’état Status 1 a pour valeur 0xFFFFFFFF et Status 2 0, un dépassement du délai de réponse a eu lieu. Par contre, lorsque ces valeurs sont inversées, l’erreur est liée au nombre d’émissions. SLA PARITY ERR Description de l’erreur : SLA BUFFER PARITY ERROR La carte SLA a détecté une erreur de parité dans le registre TAG ou dans la mémoire tampon. DONNÉES DE DÉTAIL Sense Data C-68 Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les zone Status 1 et Status 2 sont valables. Guide de résolution des incidents et références SLA PROG ERR Description de l’erreur : SLA PROGRAMMING CHECK La carte SLA a détecté une erreur de programmation. Cette erreur peut être liée à l’insuffisance d’espace attribué au message par le receveur ou à la présence d’un marqueur incorrect comme première zone de travail de l’horloge TOD. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les zones Status 1 et Status 2 sont valables. SLA SIG ERR Description de l’erreur : SLA LINK CHECK SIGNAL FAILURE La carte SLA a détecté une erreur liée au signal (dépassement de plus d’une seconde). DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Les zones Status 1 et Status 2 sont valables. Identificateurs d’erreur C-69 SNA SNA CLDF Description de l’erreur : CHILD PROCESS FAILURE Un des processus fils n’a pas abouti ou n’a pas démarré. DONNÉES DE DÉTAIL Component ID Nom du composant SNA. Detecting Module Module qui a détecté l’erreur. Module line number Ligne du module de détection. Error Code Numéro d’erreur système (voir /sys/errno.h). Failing Module Nom du processus qui a été arrêté. SNA CSA1 Description de l’erreur : INVALID XID RECEIVED Un module a détecté un XID reçu non valide. DONNÉES DE DÉTAIL Sense Data Données concernant l’incident signalé par l’erreur. Detecting Module Module qui a détecté l’erreur. Additional Subvector Sous-vecteur de l’alerte. SNA CSA2 Description de l’erreur : XID PROTOCOL ERROR Un module a détecté une erreur liée au protocole XID. Reportez-vous à Données de détail dans SNA CSA1. SNA DDCF Description de l’erreur : UNABLE TO CONFIGURE DEVICE DRIVER Un incident s’est produit pendant la configuration du pilote de périphérique. Reportez-vous à Données de détail dans SNA CLDF. SNA IPCF Description de l’erreur : SNA IPC FAILURE Une erreur liée au traitement de la communication inter-processus (IPC) s’est produite. Reportez-vous à Données de détail dans SNA CLDF. SNA OMDDF Description de l’erreur : OPEN TO SNA MDD FAILED L’ouverture du pilote de périphérique du gestionnaire SNA a échoué. Reportez-vous à Données de détail dans SNA CLDF. C-70 Guide de résolution des incidents et références SNA PRF Description de l’erreur : SNA PROFILE ERROR Une erreur liée à la base de données du profil SNA a été détectée. Reportez-vous à Données de détail dans SNA CLDF. SNA SECF Description de l’erreur : SNA SECURITY FAILURE Une erreur liée à la sécurité SNA a été détectée. Reportez-vous à Données de détail dans SNA CLDF. SNA SEMF Description de l’erreur : SNA SEMAPHORE FAILURE Une erreur liée au sémaphore a été détectée. Reportez-vous à Données de détail dans SNA CLDF. SNA SHMF Description de l’erreur : SNA SHARED SEGMENT FAILURE Un incident lié au segment partagé SNA a été détecté. Reportez-vous à Données de détail dans SNA CLDF. SNA SRCF Description de l’erreur : CALL TO SRC FAILED Un appel au contrôleur des ressources système (SRC) a échoué. Reportez-vous à Données de détail dans SNA CLDF. SNA SRF Description de l’erreur : SNA SYSTEM RESOURCE FAILURE Un incident lié aux ressources système s’est produit. Reportez-vous à Données de détail dans SNA CLDF. Identificateurs d’erreur C-71 TAPE (bande) TAPE ERR1 Description de l’erreur : TAPE OPERATION ERROR Une erreur liée au support de bande a été détectée. Les tentatives de répétition de l’opération sont interdites ou épuisées. Un support de bande défectueux ou des têtes de lecture/écriture sales peuvent être à l’origine de l’incident. Les opérations d’entrée-sortie sur l’unité de bande ne peuvent plus être effectuées. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. TAPE ERR2 Description de l’erreur : TAPE DRIVE FAILURE Un incident matériel permanent, lié à l’unité de bande, s’est produit. Les tentatives de répétition de l’opération sont interdites ou épuisées. Les opérations d’entrée-sortie sur l’unité de bande ne peuvent plus être effectuées. Reportez-vous à Données de détail dans TAPE ERR1. TAPE ERR3 Description de l’erreur : TAPE DRIVE FAILURE Un incident lié à l’unité ou au support de bande s’est produit. Cet incident peut être résolu. D’autres opérations peuvent donc être effectuées. Reportez-vous à Données de détail dans TAPE ERR1. TAPE ERR4 Description de l’erreur : TAPE DRIVE FAILURE Une erreur susceptible d’être liée à l’unité de bande, à la carte SCSI et au bus d’entrée-sortie du système a été détectée. Les tentatives de répétition de l’opération sont interdites ou épuisées. Les opérations d’entrée-sortie sur l’unité de bande ne peuvent plus être effectuées. Reportez-vous à Données de détail dans TAPE ERR1. TAPE ERR5 Description de l’erreur : UNDETERMINED ERROR Une erreur inconnue s’est produite. Un des éléments suivants est probablement à l’origine de cette erreur : unité de bande, carte SCSI, ou bus d’E/S système et matériel associé et/ou services du noyau. Les tentatives de répétition de l’opération sont interdites ou épuisées. Les opérations d’entrée-sortie sur l’unité de bande ne peuvent plus être effectuées. Reportez-vous à Données de détail dans TAPE ERR1. C-72 Guide de résolution des incidents et références TAPE ERR6 Description de l’erreur : TAPE OPERATION ERROR La bande n’a pas été nettoyée depuis 30 heures. L’unité reste opérationnelle, mais une bande de nettoyage doit être insérée dès que possible. Si l’unité n’est pas propre, d’autres erreurs logicielles se produiront, et ses commandes risquent de dysfonctionner. DONNÉES DE DÉTAIL Sense Data Données relatives à l’incident devant être communiquées au service de maintenance si l’anomalie requiert son intervention. Identificateurs d’erreur C-73 TMSCSI TMSCSI CMD ERR Description de l’erreur : ATTACHED SCSI TARGET DEVICE ERROR Une erreur matérielle s’est produite lors de l’émission d’une commande. Vous ne pouvez pas faire d’autre tentative. DONNÉES DE DÉTAIL SENSE DATA Données de détection relatives à l’incident, analysées par les programmes de diagnostic. TMSCSI READ ERR Description de l’erreur : ATTACHED SCSI INITIATOR DEVICE Une erreur matérielle s’est produite lors de la réception de données. Vous ne pouvez pas faire d’autre tentative. Reportez-vous à Données de détail dans TMSCSI CMD ERR. TMSCSI RECVRD ERR Description de l’erreur : ATTACHED SCSI TARGET DEVICE ERROR Une erreur résolue s’est de nouveau produite lors de l’émission d’une commande. Reportez-vous à Données de détail dans TMSCSI CMD ERR. TMSCSI UNKN SFW ERR Description de l’erreur : SOFTWARE PROGRAM ERROR Le pilote de périphérique a détecté une erreur logicielle. Reportez-vous à Données de détail dans TMSCSI CMD ERR. TMSCSI UNRECVRD ERR Description de l’erreur : ATTACHED SCSI TARGET DEVICE ERROR Une erreur non résolue s’est de nouveau produite lors de l’émission d’une commande. Reportez-vous à Données de détail dans TMSCSI CMD ERR. C-74 Guide de résolution des incidents et références TOK TOK ADAP CHK Description de l’erreur : ADAPTER ERROR Une erreur s’est produite sur la carte de réseau en anneau à jeton. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Additional Subvectors Sous-vecteurs supplémentaires d’alerte. TOK ADAP ERR Description de l’erreur : POTENTIAL DATA LOSS CONDITION La carte du réseau en anneau à jeton installée est probablement de niveau inférieur. Cela peut entraîner une perte de données. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK AUTO RMV Description de l’erreur : AUTO REMOVAL La carte appartient au domaine de signalisation d’incidents et a effectué une procédure de retrait automatique pour procéder à un auto-test, qui n’a pas abouti. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK BAD ASW Description de l’erreur : MICROCODE PROGRAM ERROR Le microcode et la carte sont incompatibles. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK BEACON1 Description de l’erreur : OPEN FAILURE La carte a détecté un incident sur l’anneau lors du processus d’insertion. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK BEACON2 Description de l’erreur : TOKEN–RING INOPERATIVE L’incident sur l’anneau a dépassé le délai imparti par l’horloge de détection des incident permanents. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK BEACON3 Description de l’erreur : TOKEN–RING TEMPORARY ERROR TOKEN-RING TEMPORARY ERROR L’incident sur l’anneau a duré moins de 52 secondes, puis a été résolu. Reportez-vous à Données de détail dans TOK ADAP CHK. Identificateurs d’erreur C-75 TOK CONGEST Description de l’erreur : COMMUNICATIONS OVERRUN Le moniteur d’erreurs sur l’anneau (REM) a détecté une surcharge des communications en provenance d’une carte de l’anneau. Cette surcharge entraîne la suppression de nombreuses trames. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK DOWNLOAD Description de l’erreur : MICROCODE PROGRAM ABNORMALLY TERMINATED Le téléchargement du microcode a échoué. TOK DUP ADDR Description de l’erreur : OPEN FAILURE La carte a détecté, lors du processus d’insertion, la présence sur l’anneau d’un poste identifié par son adresse individuelle. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK ERR5 Description de l’erreur : OPEN FAILURE Une erreur matérielle indéterminée, liée à la carte, s’est produite lors de la procédure d’insertion. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK ERR10 Description de l’erreur : AUTO REMOVAL Reportez-vous à Données de détail dans TOK ADAP CHK. TOK ERR15 Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton a détecté une erreur système indéterminée. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK ESERR Description de l’erreur : EXCESSIVE TOKEN-RING ERRORS Le moniteur d’erreur sur l’anneau (REM) a détecté un nombre d’erreurs temporaires trop élevé. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK MC ERR Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton a détecté une erreur Micro Channel. Reportez-vous à Données de détail dans TOK ADAP CHK. C-76 Guide de résolution des incidents et références TOK NOMBUFS Description de l’erreur : RESOURCE UNAVAILABLE Une demande de structure mbuf, provenant du gestionnaire d’unité de réseau en anneau à jeton, a été refusée. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK PIO ERR Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton a détecté une erreur d’entrée-sortie programmable. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK RCVRY ENTER Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton est entré en mode reprise réseau. TOK RCVRY EXIT Description de l’erreur : Le gestionnaire d’unité de réseau en anneau à jeton a quitté le mode reprise réseau. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK RCVRY TERM Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton a mis fin au mode reprise réseau. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK RMV ADAP1 Description de l’erreur : OPEN FAILURE La carte a reçu une trame de niveau MAC indiquant le retrait de carte. La carte n’est donc plus connectée logiquement au réseau. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK RMV ADAP2 Description de l’erreur : REMOVE ADAPTER COMMAND RECEIVED Le gestionnaire de réseau local a émis une commande de retrait de carte. La carte n’est donc plus connectée logiquement au réseau. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK TX ERR Description de l’erreur : ADAPTER ERROR Le gestionnaire d’unité de réseau en anneau à jeton a détecté une erreur de transmission. Reportez-vous à Données de détail dans TOK ADAP CHK. TOK WIRE FAULT Description de l’erreur : WIRE FAULT Une erreur liée à un câble a été détectée sur le réseau. Reportez-vous à Données de détail dans TOK ADAP CHK. Identificateurs d’erreur C-77 TOK WRAP TST Description de l’erreur : OPEN FAILURE La carte a détecté un incident sur son lobe pendant le test de bouclage effectué lors du processus d’insertion. Reportez-vous à Données de détail dans TOK ADAP CHK. C-78 Guide de résolution des incidents et références TTY Cette catégorie d’identificateurs contient les étiquettes d’erreur suivantes : TTY BADINPUT Description de l’erreur : BAD TTYINPUT RETURN La mémoire tampon du pilote TTY est saturée. Le flot de données en entrée ne peut plus être traité. DONNÉES DE DÉTAIL Error Code Code d’erreur système (voir sys/errno.h). TTY OVERRUN Description de l’erreur : RECEIVER OVERRUN ON INPUT L’unité émettrice ne contrôle pas le flot de données et surcharge le tampon matériel de la carte. La surcharge se produit avant l’accès du pilote au système FIFO. Reportez-vous à Données de détail dans TTY BADINPUT. TTY PARERR Description de l’erreur : PARITY/FRAMING ERROR ON INPUT Des erreurs de parité se sont produites sur les données acheminées vers les ports asynchrones. Le calcul est effectué caractère par caractère. Reportez-vous à Données de détail dans TTY BADINPUT. TTY PROG PTR Description de l’erreur : SOFTWARE ERROR: T_HPTR FIELD INVALID Le pointeur t_hptr est nul. Reportez-vous à Données de détail dans TTY BADINPUT. TTY TTYHOG Description de l’erreur : TTYHOG OVERRUN L’unité émettrice ignore le contrôle du flot de données. Cette erreur se produit après l’accès au système FIFO et l’écriture dans la mémoire tampon logicielle. Reportez-vous à Données de détail dans TTY BADINPUT. Identificateurs d’erreur C-79 VCA (carte de commande vocale) VCA INITZ Description de l’erreur : HOST INDEPENDENT INITIALIZATION FAILED Un incident matériel a été détecté lors de la configuration de la carte de commande vocale. DONNÉES DE DÉTAIL Line Number Numéro de ligne dans le code source correspondant à la journalisation de l’erreur. Detecting Module Nom de la fonction du code source à l’origine de la journalisation de l’erreur. Failing Module Nom de la fonction du code source où l’erreur s’est produite. Return Code Code transmis à l’utilisateur par le sous-programme perror. La définition de l’erreur figure dans le fichier /usr/include/sys/perror.h. VCA INTR1 Description de l’erreur : INTERRUPT HANDLER REGISTRATION CODE FAILED Les services du noyau intr_enable et i_init n’ont pas abouti. Le gestionnaire d’interruption n’a pas pu être correctement installé, mais le pilote de la carte de commande vocale fonctionne. Reportez-vous à Données de détail dans VCA INITZ. VCA INTR2 Description de l’erreur : UNEXPECTED INTERRUPT Une erreur matérielle s’est produite. La carte crée des interruptions inattendues. Reportez-vous à Données de détail dans VCA INITZ. VCA INTR3 Description de l’erreur : INVALID INTERRUPT Un équipement envoie des interruptions vers une piste incorrecte. Reportez-vous à Données de détail dans VCA INITZ. VCA INTR4 Description de l’erreur : INTERRUPT TIMED OUT Un équipement n’envoie pas l’interruption attendue. Reportez-vous à Données de détail dans VCA INITZ. VCA IOCTL1 Description de l’erreur : INVALID IOCTL REQUEST L’utilisateur a tenté d’émettre une demande IOCtl non prise en charge par le pilote d’unité. Reportez-vous à Données de détail dans VCA INITZ. C-80 Guide de résolution des incidents et références VCA IOCTL2 Description de l’erreur : INVALID IOCTL RESPONSE L’utilisateur a tenté d’émettre une demande IOCtl ne disposant pas des droits d’accès requis. Reportez-vous à Données de détail dans VCA INITZ. VCA MEM Description de l’erreur : FAILED PINNING MEMORY Le pilote de la carte de commande vocale n’a pas pu placer la structure current_vca ou la moitié inférieure du pilote lors de l’installation. Reportez-vous à Données de détail dans VCA INITZ. Identificateurs d’erreur C-81 X25 Cette catégorie d’identificateurs contient les étiquettes d’erreur suivantes : X25 ADAPT Description de l’erreur : ADAPTER ERROR La carte du bus est introuvable. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. X25 ALERT5 Description de l’erreur : X-5, MODEM FAILURE: DCD, DSR, CABLE La couche physique ne peut pas être établie pour le modem. Les lignes des signaux DP et PDP ne sont pas actives. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT7 Description de l’erreur : X-7, MODEM FAILURE: ACU NOT RESPONDING L’unité d’appel automatique (ACU) ne fonctionne pas. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT8 Description de l’erreur : X-8, X.21 NOT CONNECTED La connexion à un réseau X.21 échoue. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT9 Description de l’erreur : X-9, FRAME TYPE W RECEIVED Une trame FRMR de type W a été reçue. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT10 Description de l’erreur : X-10, FRAME TYPE X RECEIVED Une trame FRMR de type X a été reçue. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT11 Description de l’erreur : X-11, FRAME TYPE Y RECEIVED Une trame FRMR de type Y a été reçue. Reportez-vous à Données de détail dans X25 ADAPT. C-82 Guide de résolution des incidents et références X25 ALERT12 Description de l’erreur : X-12, FRAME TYPE Z RECEIVED Une trame FRMR de type Z a été reçue. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT13 Description de l’erreur : X-13, FRAME TYPE W TRANSMITTED Une trame FRMR de type W a été envoyée. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT14 Description de l’erreur : X-14, FRAME TYPE X TRANSMITTED Une trame FRMR de type X a été envoyée. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT15 Description de l’erreur : X-15, FRAME TYPE Y TRANSMITTED Une trame FRMR de type Y a été envoyée. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT16 Description de l’erreur : X-16, FRAME TYPE Z TRANSMITTED Une trame FRMR de type Z a été envoyée. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT17 Description de l’erreur : X-17, FRAME RETRY N2 REACHED Le nombre d’opérations de relance de la trame (N2) est atteint. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT18 Description de l’erreur : X-18, UNEXPECTED DISC RECEIVED Une demande inattendue de déconnexion de trame a été reçue. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT19 Description de l’erreur : X-19, DM RXD DURING LINK ACTIVATION Une trame DM a été reçue après l’émission d’un SABM. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT21 Description de l’erreur : X-21, CLEAR INDICATION RECEIVED Un paquet de libération, accompagné de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE), a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. Identificateurs d’erreur C-83 X25 ALERT22 Description de l’erreur : X-22, RESTART INDICATION RECEIVED Un paquet de reprise, accompagné de codes de diagnostic provenant de l’équipement terminal de données, a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT23 Description de l’erreur : X-23, RESET REQUEST BY X.25 ADAPTER Un paquet de demande de restauration a été envoyé automatiquement par la carte. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT24 Description de l’erreur : X-24, CLEAR REQUEST BY X.25 ADAPTER Le code de la carte a émis une demande de libération, accompagnée de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE). Cette demande de libération ne provient pas d’une couche supérieure. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT25 Description de l’erreur : X-25, RESTART REQUEST BY X.25 ADAPTER Une demande de reprise, accompagnée de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE), a été émise. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT26 Description de l’erreur : X-26, TIMEOUT ON RESTART REQUEST, T20 Le délai d’attente T20 a expiré avant la réception d’un paquet de confirmation de reprise. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT27 Description de l’erreur : X-27, TIMEOUT ON RESET REQUEST, T22 Le délai d’attente T22 a expiré avant la réception d’un paquet de confirmation de la reprise. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT28 Description de l’erreur : X-28, TIMEOUT ON CALL REQUEST, T21 Le délai d’attente T21 a expiré avant la réception d’une demande d’appel ou de confirmation de libération. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT29 Description de l’erreur : X-29, TIMEOUT ON CLEAR REQUEST, T23 Le délai d’attente T23 a expiré avant la réception d’un paquet de confirmation de libération. Reportez-vous à Données de détail dans X25 ADAPT. C-84 Guide de résolution des incidents et références X25 ALERT30 Description de l’erreur : X-30, DIAGNOSTIC PACKET RECEIVED Un paquet de diagnostic a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT31 Description de l’erreur : X-31, RESET INDICATION PACKET RECEIVED Un paquet de signaux de restauration, accompagné de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE), a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT32 Description de l’erreur : X-32, (DCE) CLEAR INDICATION BY X.25 ADAPTER Un signal de libération, accompagné de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE), a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT33 Description de l’erreur : X-33, (DCE) RESET INDICATION BY X.25 ADAPTER Un paquet de signal de reprise, accompagné de codes de diagnostic provenant de l’équipement terminal de traitement de données (DCE), a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT34 Description de l’erreur : X-34, (DCE) RESTART INDICATION BY X.25 ADAPTER Un paquet de signal de reprise, accompagné de codes de diagnostic provenant de l’équipement terminal de traitement de données, a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT35 Description de l’erreur : X-35, (DCE) RESTART REQUEST RECEIVED Une demande de reprise, accompagnée de codes de diagnostic provenant de l’équipement terminal de traitement de données, a été reçu. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT36 Description de l’erreur : X-36, (DCE) TIMEOUT ON RESTART INDICATION, T10 Le délai d’attente T10 expire avant la réception d’un paquet de confirmation de reprise. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT37 Description de l’erreur : X-37, (DCE) TIMEOUT ON RESET INDICATION, T12 Le délai d’attente T12 expire avant la réception d’un paquet de confirmation de restauration. Reportez-vous à Données de détail dans X25 ADAPT. Identificateurs d’erreur C-85 X25 ALERT38 Description de l’erreur : X-38, (DCE) TIMEOUT ON CALL INDICATION, T11 Le délai d’attente T11 expire avant la réception d’un paquet d’appel ou de confirmation de libération. Reportez-vous à Données de détail dans X25 ADAPT. X25 ALERT39 Description de l’erreur : X-39, (DCE) TIMEOUT ON CLEAR INDICATION, T13 Le délai d’attente T13 expire avant la réception d’un paquet de confirmation de libération. Reportez-vous à Données de détail dans X25 ADAPT. X25 CONFIG Description de l’erreur : X.25 CONFIGURATION ERROR La configuration interne de la carte a échoué. Reportez-vous à Données de détail dans X25 ADAPT. X25 IPL Description de l’erreur : ADAPTER ERROR Le délai d’attente de la carte a expiré pendant le processus de réinitialisation. Il s’agit d’un incident lié à l’installation, pouvant découler d’une installation incorrecte de l’équipement de communication ou d’une incompatibilité entre la carte et le microcode. Reportez-vous à Données de détail dans X25 ADAPT. X25 UCODE Description de l’erreur : X.25 MICROCODE ERROR Une interruption anormale du microcode de la carte s’est produite. Reportez-vous à Données de détail dans X25 ADAPT. C-86 Guide de résolution des incidents et références Identificateurs d’erreurs diverses CONSOLE Description de l’erreur : SOFTWARE PROGRAM ERROR Entrée enregistrée par le pilote du pupitre lorsqu’une erreur inattendue survient pendant la procédure d’appel d’un autre module. DONNÉES DE DÉTAIL Detecting Module Nom du module de détection. Failing Module Nom du module défectueux. Return code Code de retour du module défectueux (voir /sys/errno.h). Reason Code Indication d’erreur fournie au pilote de la console. LOST_EVENTS Description de l’erreur : ERROR LOGGING BUFFER OVERFLOW Origine probable : ENREGISTREMENT EXCESSIF PAR LE LOGICIEL Erreur d’installation : MEMOIRE TAMPON TROP PETITE Action recommandée : AUGMENTER LA TAILLE DE LA MEMOIRE TAMPON Anomalie : ENREGISTREMENT EXCESSIF PAR LE LOGICIEL Actions recommandées : identifier la composant logiciel incriminé, remédier au défaut, puis réessayer le composant. NLS BADMAP Description de l’erreur : SOFTWARE ERROR: NLS MAP CORRUPTER La mappe NLS (National Language Support) est résidante, mais n’est pas conforme au flot de données en entrée. DONNÉES DE DÉTAIL Error Code Code d’erreur système. Rule Index Numéro de la règle défectueuse dans la mappe NLS. Number Of Rules Nombre de règles NLS non respectées. Map Name Nom de la mappe NLS associée à un jeu de caractères particulier. NLS MAP Description de l’erreur : SOFTWARE PROGRAM ERROR La mappe NLS requise n’est pas résidente. DONNÉES DE DÉTAIL Error Code Code d’erreur système. Identificateurs d’erreur C-87 OPMSG Description de l’erreur : OPERATOR NOTIFICATION La commande errlogger est lancée. DONNÉES DE DÉTAIL Message From errlogger Command Texte entré via la commande errlogger. PGSP KILL Description de l’erreur : SOFTWARE PROGRAM ABNORMALLY TERMINATED DONNÉES DE DÉTAIL Program’s Paging Space Espace de pagination du programme en blocs de 1 ko. PPRINTER ERR1 Description de l’erreur : PRINTER ERROR Entrée enregistrée par le pilote de l’imprimante. Cette erreur n’est pas irrémédiable et survient assez rarement. DONNÉES DE DÉTAIL Sense Data Données de détection relatives à l’incident, analysées par les programmes de diagnostic. Adapter At Address Adresse du registre de contrôle de l’imprimante. Additional Information Informations complémentaires, relatives aux données transférées et aux opérations en cours. Device Address Adresse de l’unité. Generation Parameter Pointeur sur la structure interne de l’imprimante. RCMERR Description de l’erreur : SOFTWARE PROGRAM ERROR Entrée enregistrée par le gestionnaire de contexte lorsqu’une erreur irrémédiable est détectée. Ces erreurs n’empêchent pas forcément l’exécution des programmes mais peuvent avoir des conséquences imprévisibles. DONNÉES DE DÉTAIL Detecting Module Nom du module de détection. Failing Module Nom du module défectueux. Return code Code de retour du module défectueux (voir le fichier /sys/errno.h). Reason Code Indication d’erreur fournie au pilote de la console. REPLACED FRU Description de l’erreur : REPAIR ACTION Message d’information consigné par les programmes de diagnostic, indiquant qu’un élément matériel a été remplacé. C-88 Guide de résolution des incidents et références SRC Description de l’erreur : SOFTWARE PROGRAM ERROR Entrée enregistrée par le démon du contrôleur des ressources système (SRC) en cas de détection d’incidents. Ces derniers peuvent être classés en trois catégories : incidents relatifs aux sous-systèmes, incidents de communication et autres incidents. DONNÉES DE DÉTAIL Symptom Code Etat renvoyé par le sous-système défectueux. Etat de fin de traitement du processus fils renvoyé dans un paramètre par le sous-programme d’attente (voir sys/wait.h). Software Error Code Numéro d’erreur SRC (voir srcerrno.h). Error Code Numéro d’erreur système (errno). Si le numéro d’erreur SRC est SRC_ODMERR(–9090), le code d’erreur est configuré sur une erreur ODM (voir odmi.h). Detecting Module Nom du module qui détecte l’erreur. Failing Module Nom du sous-système défectueux ou de tout autre objet défectueux du SRC. SYSLOG Description de l’erreur : MESSAGE REDIRECTED FROM syslog Vous pouvez enregistrer cette erreur dans le journal des erreurs en spécifiant la valeur errlog comme destination dans /etc/syslog.conf. Le démon syslog réachemine les messages vers le journal des erreurs. DONNÉES DE DÉTAIL Syslog Message Texte du message syslog. Identificateurs d’erreur C-89 C-90 Guide de résolution des incidents et références Annexe D. Récupération de groupes de volumes Lorsque les entrées ODM d’un groupe de volumes sont altérées, l’un des symptômes suivants apparaît : • Les commandes lsvg, lslv et/ou lspv échouent. • Vous ne pouvez pas modifier la taille des systèmes de fichiers. • Le système ne trouve pas l’ID des groupes de volumes ou des unités. • Certaines zones en sortie de lsvg -l VGname comportent des points d’interrogation (?) ou sont vierges. Dans ce cas, lancez le script shell indiqué page D-2 pour réinitialiser les entrées ODM du groupe de volumes rootvg (groupe racine). Vous pouvez également modifier ce script pour réinitialiser un groupe de volumes défini par l’utilisateur. Il est inutile de réinitialiser le système après l’exécution du script. Reportez-vous aux sections suivantes pour récupérer des groupes de volumes : • Réinitialisation du groupe de volumes rootvg, page D-2 • Réinitialisation d’un groupe de volumes défini par l’utilisateur, page D-3 • Restauration de la version originale du gestionnaire d’objets ODM, page D-4. Remarque : Notez bien que les signes $$ dans les lignes de commande du script shell, page D-2, par exemple : cp /etc/objrepos/CuAt /etc/objrepos/CuAt.$$ indiquent l’ID process (PID) du script shell, créant un nom de fichier unique. Si après l’exécution du script, vous pouvez exécuter les commandes qui ont échoué auparavant, supprimez les fichiers Cu*.$$ dans le fichier /etc.objrepos ($$ étant un PID). Récupération de groupes de volumes D-1 Réinitialisation du groupe de volumes rootvg Pour réinitialiser le groupe de volumes rootvg, copiez le script shell dans /bin/rvgrecover et rendez-le exécutable via la commande : chmod +x /bin/rvgrecover Lancez ensuite : /bin/rvgrecover Pour réinitialiser les entrées ODM du groupe de volumes rootvg, exécutez le script shell : PV=/dev/ipldevice VG=rootvg cp /etc/objrepos/CuAt /etc/objrepos/CuAt.$$ cp /etc/objrepos/CuDep /etc/objrepos/CuDep.$$ cp /etc/objrepos/CuDv /etc/objrepos/CuDv.$$ cp /etc/objrepos/CuDvDr /etc/objrepos/CuDvDr.$$ lqueryvg -Lp $PV | awk ’{ print $2 }’ | while read LVname; do odmdelete -q ”name = $LVname” -o CuAt odmdelete -q ”name = $LVname” -o CuDv odmdelete -q ’value3 = $LVname’ –o CuDvDr done odmdelete -q ”name = $VG” -o CuAt odmdelete -q ”parent = $VG” -o CuDv odmdelete -q ”name = $VG” -o CuDv odmdelete -q ”name = $VG” -o CuDep odmdelete -q ”dependency = $VG” -o CuDep odmdelete –q ”value1 = 10” –o CuDvDr odmdelete -q ’value3 = $VG’ –o CuDvDr importvg -y $VG $PV # ignore lvaryoffvg errors varyonvg $VG D-2 Guide de résolution des incidents et références Réinitialisation d’un groupe de volumes défini par l’utilisateur Pour réinitialiser un groupe de volumes défini par l’utilisateur, copiez le script shell, page D-2 dans un nouveau fichier /bin/uvgrecover. Modifiez-le comme suit, puis lancez chmod +x /bin/uvgrecover. Après avoir copié le script shell dans /bin/uvgrecover, modifiez la commande : odmdelete –q ”value1 = 10” –o CuDvDr comme suit : odmdelete –q ”value1 = $VG” –o CuDvDr Les variables PV (volume physique) et VG (groupe de volumes) sur les deux premières lignes du script sont les valeurs par défaut du groupe de volumes rootvg. Le volume physique à la valeur /dev/ipldevice, synonyme de l’un des volumes physiques du groupe rootvg. Pour un groupe de volumes défini par l’utilisateur : • Modifiez la ligne PV= pour y indiquer le nom d’un des disques du groupe de volumes en question. Pour savoir à quel groupe appartient un volume physique, entrez : lsvg ‘lqueryvg -vp hdisk# ‘ | grep GROUP Remarque : Le signe ‘ est un accent grave et non une apostrophe. La touche correspondante est généralement située au–dessus de la touche de tabulation. • Modifiez la ligne VG= pour y indiquer le groupe de volumes en question. Par exemple : PV=/dev/hdisk1 VG=uservg Récupération de groupes de volumes D-3 Restauration de la version originale du gestionnaire d’objets ODM Les fichiers /etc/objrepos/Cu*.$$ permettent de revenir à la version originale du gestionnaire d’objets. Pour ce faire, entrez : cd /etc/objrepos ls -l Cu* Recherchez les fichiers Cu* dont l’extension est un PID (CuAt.31267, par exemple). Copiez les fichiers Cu*.31267 dans Cu*. Par exemple : cp cp cp cp D-4 CuAt.31267 CuAt CuDep.31267 CuDep CuDv.31267 CuDv CuDvDr.31267 CuDvDr Guide de résolution des incidents et références Index Nombres 200 (code sur l’afficheur), 9-12 260 (code sur l’afficheur), 9-12 261 (code sur l’afficheur), 9-12 262 (code sur l’afficheur), 9-12 A adresse IP, conversion du nom d’hôte, 7-2 afficheur, 9-12 alertes, 10-18 analyse du système, recherche d’informations, 9-16 architecture SNA Generic Alert, 10-18 arrêt de la fonction de suivi, 11-6 arrêt sur erreur (checkstop), C-21 autonome en mode maintenance, 9-3 B base SWVPD, B-1 bos.sysmgt.serv_aid, 1-5 C c31 (code sur l’afficheur), 9-12 cable COAX (coaxial), C-5 câbles, vérification des connexions, 5-2 canaux de suivi génériques, 11-4 cartes de communication, 7-8 CHRP, C-6 clavier, identification, 9-11 clavier LPFK (Lighted Programmable Function Keyboards), 9-7 cliché configuration des unités de cliché, 12-2 copie depuis un système sans données ou sans disque, copie sur autre support, 12-8 démarrage, 12-3 cliché système code 888 clignotant, 12-3 configuration des unités de cliché, 12-2 copie depuis un serveur, 12-9 copie depuis un système sans données ou sans disque, 12-8 copie sur autre support, 12-8 copie sur un poste avec données, 12-9 démarrage, 12-3 localisation, 12-8 vérification de l’état, codes d’état, 12-6 codes d’erreur, 9-12 codes d’état, cliché système, 12-6 combinaison de touches Ctrl-C, 2-3 commande arp, 7-8 commande backup, 6-2, 10-17 commande chdev, 5-4 commande chmod, 8-6 commande cpio, 6-2 commande cron, 10-16 commande crontab, 8-6 commande date, 4-3 commande dd, 6-2 commande df, 8-3 commande diag, 4-2, 7-9, 10-3 commande dosformat, 6-3 commande du, 8-6 commande enq, 8-5 commande errclear, 10-16 commande errmsg, 10-18 commande errpt, 10-3, 10-10, 10-15, 10-19 commande errstop, 10-16, 10-19 commande errupdate, 10-10, 10-19 commande format, 6-3 commande grep, 2-4, 8-3 commande host, 7-3 commande ifconfig, 7-3 commande kill, 2-4, 3-2 commande li, 6-2 commande lpq, 8-5 commande lprm, 8-5 commande lpstat, 8-3 commande ls, 10-17 commande lsattr, 5-3 commande lscfg, 9-16 commande lsdev, 5-3 commande mkdev, 5-4 commande mount, 8-7 commande mycmd, 11-4 commande netstat, 7-3, 7-8 commande pg, 3-2 commande ping, 7-2, 7-3 commande ps, 2-4, 3-2, 8-2, 8-3 commande pwd, 8-3 commande qcan, 8-5 commande renice, 3-2 commande rm, 8-3 commande setclock, 4-4 commande smit devices, 7-7 commande smit diag, 7-9 commande smit errclear, 10-16 commande smit errpt, 10-16 commande smit mount, 8-7 commande smit tcpip, 7-7 commande smit trace, 11-4 commande snap, 9-16 commande split, 8-5 commande startsrc, 8-2 commande tar, 6-2 commande tcopy, 6-2 commande telnet, 7-6 commande tic, 7-6 commande touch, 7-5 commande trace, 11-2, 11-4, 11-6 configuration, 11-2 commande trcrpt, 11-3, 11-4, 11-5 commande trcstop, 11-5 commande who, 3-2 commande ypwhich, 7-2 Index X-1 commandes arp, 7-8 backup, 6-2, 10-17 chdev, 5-4 chmod, 8-6 cpio, 6-2 cron, 10-16 crontab, 8-6 date, 4-3 dd, 6-2 df, 8-3 diag, 4-2, 7-9, 10-3 dosformat, 6-3 du, 8-6 enq, 8-5 errclear, 10-16 errdead, errdemon, errinstall, errlogger, 10-19 errmsg, 10-18 errpt, 10-3, 10-10, 10-15 errstop, 10-16 errupdate, 10-10 format, 6-3 grep, 2-4, 8-3 host, 7-3 kill, 2-4, 3-2 li, 6-2 lpq, 8-5 lprm, 8-5 lpstat, 8-3 ls, 10-17 lsattr, 5-3 lscfg, 9-16 lsdev, 5-3 mkdev, 5-4 mount, 8-7 mycmd, 11-4 netstat, 7-3, 7-8 pg, 3-2 ping, 7-2, 7-3 ps, 2-4, 3-2, 8-2, 8-3 pwd, 8-3 qcan, 8-5 renice, 3-2 rm, 8-3 setclock, 4-4 snap, 9-16 split, 8-5 startsrc, 8-2 tar, 6-2 tcopy, 6-2 telnet, 7-6 tic, 7-6 tn, 2-4 touch, 7-5 trace, 11-2, 11-4 trcdead, trcrpt, trcstop, trcupdate, 11-6 trcrpt, 11-3, 11-4, 11-5 trcstop, 11-5 who, 3-2 ypwhich, 7-2 X-2 Guide de résolution des incidents et références commandes de suivi, 11-6 configuration copie d’informations sur disquette, 9-16 informations sur le système, 9-16 configuration du système, 9-16 connexion telnet débogage, 7-6 manquante, 7-3 refusée, 7-4 D démon de file d’attente, réactivation, 8-2 démon inetd activation, 7-4 débogage, 7-5 démon telnetd, débogage, 7-6 descripteurs du journal d’erreurs, 10-3 diagnostics, 9-3 chargement d’un programme, 9-2 chargement en mode maintenance, 9-3 choix des diagnostics à charger, 9-2 choix des options, 9-9 contrôle du système d’exploitation, 9-2 courant ou autonome, 9-2 en ligne, mode concurrent, 9-2 identification du matériel, 9-11 mode concurrent, 9-2 sélection, 9-4 diagnostics du matériel choix des options, 9-9 identification du matériel, 9-11 routines, 9-4 disquette incidents des supports, 6-2 restauration des données, 6-4 données techniques essentielles (VPD), 10-3, 10-9 E écran console, identification, 9-11 erreur de journalisation, incidents des unités, 5-3 erreurs des données, incidents des supports, 6-2 F fichier /etc/resolv.conf mise à jour, 7-3 recherche, 7-2 fichiers, /usr/adm/ras/trcfile, 11-3 file d’attente d’impression définition des autorisations, 8-6 montage d’espace supplémentaire, 8-6 nettoyage, 8-3 partage d’un travail, 8-5 suppression d’un travail, 8-5 travail sur les fichiers, 8-6 utilisation de l’espace disque, 8-6 G gestionnaire ODM, 10-3 groupe de volumes rootvg, réinitialisation, D-2 H horloge, réinitialisation, 4-3 horloge système réinitialisation, 4-3 test de la pile, 4-2 I identificateur de point d’ancrage, 11-4 identificateur du journal d’erreurs correct scrub, C-22 identificateur du journal d’erreurs de cliché de processus, C-21 identificateur du journal d’erreurs diverses., C-27 identificateur du journal d’erreurs DMA, C-22 identificateur du journal d’erreurs DOUBLE PANIC, C-22 identificateur du journal d’erreurs DSI IOCC, C-22 identificateur du journal d’erreurs DSI PROC, C-23 identificateur du journal d’erreurs DSI SCU, C-23 identificateur du journal d’erreurs DSI SLA, C-23 identificateur du journal d’erreurs DUMP, C-23 identificateur du journal d’erreurs DUMP STATS, C-24 identificateur du journal d’erreurs EXCHECK DMA, C-24 identificateur du journal d’erreurs EXCHECK SCRUB, C-24 identificateur du journal d’erreurs FLPT UNAVAIL, C-25 identificateur du journal d’erreurs GRAPHICS, C-29 identificateur du journal d’erreurs internes, C-25 identificateur du journal d’erreurs INTRPPC ERR, C-25 identificateur du journal d’erreurs ISI PROC, C-26 identificateur du journal d’erreurs KERNEL PANIC, C-26 identificateur du journal d’erreurs MACHINECHECK, C-26 identificateur du journal d’erreurs MEMORY, C-26 identificateur du journal d’erreurs PROGRAM INT, C-27 identificateur du journal d’erreurs REBOOT ID, C-27 identificateur du journal d’erreurs RECOV ECC, C-63 identificateur du journal d’erreurs RS, C-64 identificateur du journal d’erreurs SYS RESET, C-28 identificateurs d’anomalies, C-21 identificateurs d’arrêt sur erreur, C-21 identificateurs d’erreur, lost_events, C-87 identificateurs d’erreur 128 ports, C-11 identificateurs d’erreur ATE, C-3 identificateurs d’erreur BADISK, C-4 identificateurs d’erreur C327, C-5 identificateurs d’erreur CAT, C-2 identificateurs d’erreur COM, C-8 identificateurs d’erreur console, C-87 identificateurs d’erreur CXMA, C-11 identificateurs d’erreur d’espace de pagination (PGSP), C-88 identificateurs d’erreur d’imprimante (PPRINTER), C-88 identificateurs d’erreur d’unité d’extension asynchrone, C-20 identificateurs d’erreur de carte de commande vocale (VCA), C-80 identificateurs d’erreur de carte de connexion 3270, C-5 identificateurs d’erreur de carte System/370, C-2 identificateurs d’erreur de réseau en anneau à jeton, C-75 identificateurs d’erreur des pilotes de console, C-88 identificateurs d’erreur des unités FRU remplacées, C-88 identificateurs d’erreur DISKETTE, C-15 identificateurs d’erreur du pilote d’unité de bande (TAPE), C-72 identificateurs d’erreur ENT (Ethernet), C-16 identificateurs d’erreur EPOW, C-18 identificateurs d’erreur ERRLOG, C-19, C-21 identificateurs d’erreur Ethernet (ENT), C-16 identificateurs d’erreur EU, C-20 identificateurs d’erreur gestionnaire de volume logique (LVM), C-49 identificateurs d’erreur LVM, C-49 identificateurs d’erreur LVM (gestionnaire de volume logique), C-49 identificateurs d’erreur MACHINE CHECK, C-52 identificateurs d’erreur MEM (mémoire), C-53 identificateurs d’erreur MPQP, C-54 identificateurs d’erreur MSLA (MultiSubchannel Line Access), C-57 identificateurs d’erreur MultiSubchannel Line Access (MSLA), C-57 identificateurs d’erreur NLS, C-87 identificateurs d’erreur opmsg, C-88 identificateurs d’erreur Primary system/Serial Link Adapter (PSLA), C-62 identificateurs d’erreur PSLA (Primary system/Serial Link Adapter), C-62 identificateurs d’erreur RCMERR, C-88 identificateurs d’erreur SNA, C-70 identificateurs d’erreur SRC (System Resource Controller), C-89 identificateurs d’erreur syslog, C-89 identificateurs d’erreur TAPE (pilote d’unité de bande), C-72 identificateurs d’erreur TOK (Token Ring), C-75 identificateurs d’erreur TTY (TeleTYpewriter), C-79 identificateurs d’erreur VCA (Voice Control Adapter), C-80 identificateurs d’erreur X.25, C-82 identificateurs d’erreurs diverses, C-87 Index X-3 identificateurs du journal d’erreurs, C-21, C-27 128 ports, C-11 anomalies/interruptions, C-21 ATE, C-3 BADISK, C-4 C327, C-5 carte parallèle System/370, C-2 CAT, C-2 CD–ROM, DISK, R/W OPTICAL, C-13 CHRP, C-6 cliché de processus, C-21 COM, C-8 console, C-87 correctd scrub, C-22 CXMA, C-11 DASD, C-67 DASD série, C-67 DISKETTE, C-15 divers, C-87 DMA ERR, C-22 DOUBLE PANIC, C-22 DSI IOCC, C-22 DSI PROC, C-23 DSI SCU, C-23 DSI SLA, C-23 DUMP, C-23 DUMP STATS, C-24 ENT, C-16 EPOW, C-18 ERRLOG, C-19 Ethernet intégré, C-46 EU, C-20 EXCHECK DMA, C-24 EXCHECK SCRUB, C-24 FLPT UNAVAIL, C-25 HCON, C-43 IDE, C-45 INTR ERR, C-25 INTRPPC ERR, C-25 ISI PROC, C-26 KERNEL PANIC, C-26 LION, C-48 LVM, C-49 MACHINE CHECK, C-52 MACHINECHECK, C-26 MEM, C-53 MEMORY, C-26 MISC ERR, C-27 MPQP, C-54 MSLA, C-57 NETBIOS, C-58 NLS badmap, C-87 NLS Map, C-87 opmsg, C-88 pgsp kill, C-88 pprinter err1, C-88 PROGRAM INT, C-27 PSLA, C-62 rcmerr, C-88 RECOV ECC, C-63 RS, C-64 SCSI, C-65, C-74 X-4 Guide de résolution des incidents et références SNA, C-70 sous-système graphique, C-29 SRC, C-89 SYS RESET, C-28 syslog, C-89 TAPE, C-72 TMSCSI, C-74 TOK, C-75 TTY, C-79 unité FRU remplacée, C-88 VCA, C-80 WHP, C-43 X.25, C-82 identificateurs du journal d’erreurs IDE, C-45 identificateurs du journal d’erreurs NETBIOS, C-58 identificateurs du journal d’erreurs SCSI, C-65 incidents liés à l’impression nettoyage de la file d’impression, 8-3 réaffectation des ressources de l’imprimante, 8-5 suppression de fichiers, 8-6 incidents liés au réseau cartes de communication, 7-8 correction du logiciel, 7-2 interface manquante, 7-3 mise à jour de /etc/resolv.conf, 7-3 mise au point du matériel, 7-7 recherche du fichier /etc/resolv.conf, 7-2 incidents liés au terminal, arrêt des processus bloquants, 3-2 index des symptômes, 1-3 informations sur le système, 9-16 interface, manquante, 7-3 J journalisation des erreurs, 10-1 ajout de messages, 10-18 alertes, 10-18 arrêt de la journalisation des erreurs, 10-16 commandes, 10-19 copie du journal des erreurs, 10-17 création d’un rapport, 10-15 exemple de rapport, 10-10, 10-15 fichiers, 10-19 gestion, 10-4 lecture d’un rapport d’erreurs, 10-8 présentation commande errpt, 10-3 fichier dev/error, 10-3 services de noyau, 10-19, 10-20 sous-routines, 10-19, 10-20 suppression d’entrées du journal des erreurs, 10-16 transfert sur un autre système, 10-4 L lancement de la fonction de suivi, 11-6 logiciel, incidents des unités, 5-3 LPFK (Lighted Programmable Function Keyboards), 9-10 LPFK (lighted programmable function keyboards), 9-7 M matériel, incidents des unités, 5-2 messages écran, réponse, 3-3 module Aides au service, 1-5 N nom d’hôte, conversion en adresse IP, 7-2 O outils de débogage, 11-1, 12-1 P panne système relance du système, 2-5 vérification des processus, 2-3 vérification du matériel, 2-2 pile de l’horloge, 4-2 pile système, 4-2 PIO (programmable input output), C-10 poste sans données, copie d’un cliché système, 12-8 R rapport d’erreurs création, 10-15 exemple de résumé, 10-15 exemple détaillé, 10-10 REBOOT ID, C-27 référentiel des fiches d’erreur, 10-3 réflectomètre de domaine (TDR), 7-7 relance du système, 2-5 répertoire de spoulage définition des autorisations, 8-6 montage d’espace supplémentaire, 8-6 travail sur les fichiers, 8-6 S serveur d’impression, distant, 8-2 sous-routines, errlog, errsave, 10-19 suivi arrêt, 11-5 configuration, 11-2 commandes, 11-6 création de rapports, 11-5 démarrage, 11-2, 11-4 enregistrement de données de suivi, 11-4 lancement de la fonction de suivi, 11-2 utilisation de canaux génériques, 11-4 support, écriture, 6-3 système d’exploitation, chargement, 2-6 système inactif relance du système, 2-5 vérification des processus, 2-3 vérification du matériel, 2-2 système inopérant relance du système, 2-5 vérification des processus, 2-3 vérification du matériel, 2-2 système sans disque, copie d’un cliché système, 12-8 systèmes sans disque configuration des unités de cliché, 12-2 unité de cliché, 12-2 T table de cliché maître, 12-2 TDR (Time Domain Reflectometer), 7-7 terminal verrouillé, 3-2 trace appels et sous-routines, 11-6 commandes, sous-commandes, création de rapports, démarrage, arrêt, 11-6 fichiers, 11-7 transfert du journal d’erreurs, 10-4 U unité de cliché, 12-2 distante pour système sans disque, 12-2 principale, 12-2 secondaire, 12-2 unité de contrôle (CU), C-5 unités contrôle de leur état, 5-3 contrôle des attributs, 5-3 définition, 5-4 lancement des diagnostics, 5-2 modification des attributs, 5-4 vérification de l’état Prêt, 5-2 vérification des connexions, 5-2 vérification du logiciel, 5-3 vérification du matériel, 5-2 V validation du logiciel, B-1 VGSA (zone d’état du groupe de volumes), C-51 Z zone d’état du groupe de volumes (VGSA), C-51 Index X-5 X-6 Guide de résolution des incidents et références Vos remarques sur ce document / Technical publication remark form Titre / Title : Bull AIX 4.3 Guide de résolution des incidents et références Nº Reférence / Reference Nº : 86 F2 32JX 02 Daté / Dated : Novembre 1999 ERREURS DETECTEES / ERRORS IN PUBLICATION AMELIORATIONS SUGGEREES / SUGGESTIONS FOR IMPROVEMENT TO PUBLICATION Vos remarques et suggestions seront examinées attentivement. Si vous désirez une réponse écrite, veuillez indiquer ci-après votre adresse postale complète. Your comments will be promptly investigated by qualified technical personnel and action will be taken as required. If you require a written reply, please furnish your complete mailing address below. NOM / NAME : SOCIETE / COMPANY : ADRESSE / ADDRESS : Remettez cet imprimé à un responsable BULL ou envoyez-le directement à : Please give this technical publication remark form to your BULL representative or mail to: BULL ELECTRONICS ANGERS CEDOC 34 Rue du Nid de Pie – BP 428 49004 ANGERS CEDEX 01 FRANCE Date : Technical Publications Ordering Form Bon de Commande de Documents Techniques To order additional publications, please fill up a copy of this form and send it via mail to: Pour commander des documents techniques, remplissez une copie de ce formulaire et envoyez-la à : BULL ELECTRONICS ANGERS CEDOC ATTN / MME DUMOULIN 34 Rue du Nid de Pie – BP 428 49004 ANGERS CEDEX 01 FRANCE Managers / Gestionnaires : Mrs. / Mme : C. DUMOULIN Mr. / M : L. CHERUBIN +33 (0) 2 41 73 76 65 +33 (0) 2 41 73 63 96 FAX : E–Mail / Courrier Electronique : +33 (0) 2 41 73 60 19 srv.Cedoc@franp.bull.fr Or visit our web site at: / Ou visitez notre site web à: http://www–frec.bull.com (PUBLICATIONS, Littérature Technique, Bon de Commande) CEDOC Reference # No Référence CEDOC Qty Qté CEDOC Reference # No Référence CEDOC Qty Qté CEDOC Reference # No Référence CEDOC __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] __ __ ____ _ [__] Qty Qté [ _ _ ] : no revision number means latest revision / pas de numéro de révision signifie révision la plus récente NOM / NAME : Date : SOCIETE / COMPANY : ADRESSE / ADDRESS : PHONE / TELEPHONE : FAX : E–MAIL : For Bull Subsidiaries / Pour les Filiales Bull : Identification: For Bull Affiliated Customers / Pour les Clients Affiliés Bull : Customer Code / Code Client : For Bull Internal Customers / Pour les Clients Internes Bull : Budgetary Section / Section Budgétaire : For Others / Pour les Autres : Please ask your Bull representative. / Merci de demander à votre contact Bull. 86 F2 32JX 02 PLACE BAR CODE IN LOWER LEFT CORNER BULL ELECTRONICS ANGERS CEDOC 34 Rue du Nid de Pie – BP 428 49004 ANGERS CEDEX 01 FRANCE Utiliser les marques de découpe pour obtenir les étiquettes. Use the cut marks to get the labels. AIX AIX 4.3 Guide de résolution des incidents et références 86 F2 32JX 02 AIX AIX 4.3 Guide de résolution des incidents et références 86 F2 32JX 02 AIX AIX 4.3 Guide de résolution des incidents et références 86 F2 32JX 02