Why is agent up/down not working in SCOM 2012R2 ur12?

Diagnose: Tavse Agenter i Dit IT-System

23/07/2006

Rating: 4.42 (5407 votes)

Forestil dig dit IT-netværk som en levende organisme. Management-serveren er hjernen, der konstant overvåger kroppens tilstand, og hver enkelt agent på dine servere er som et vitalt organ, der sender konstante signaler – eller hjerteslag – tilbage til hjernen for at bekræfte, at alt er i orden. Men hvad sker der, når et organ pludselig bliver tavst, og hjernen ikke engang opdager det? Dette er en farlig tilstand, som vi kan kalde 'Silent Agent Syndrome', en digital lidelse, der kan efterlade dit systems helbred i en alvorlig blind vinkel, især efter specifikke systemopdateringer som UR12 til SCOM 2012 R2.

Why is agent up/down not working in SCOM 2012R2 ur12?
This is an SCOM inbox MP. The Agent UP/DOWN was broken after SCOM 2012R2 UR12, basically when the heartbeat failure monitor is triggered, the ping to the diagnostics was failing. This issue has been fixed in this release of the MP. This is a hotfix for UR12. Import the mp file into SCOM machine to apply this fix.
Indholdsfortegnelse

Symptomerne: Hvordan Genkender Man 'Silent Agent Syndrome'?

Det primære og mest lumske symptom på denne tilstand er fraværet af symptomer. Normalt, hvis en agent – et overvåget system – går ned eller stopper med at kommunikere, vil 'hjernen' (din SCOM-server) øjeblikkeligt slå alarm. Du får en notifikation om, at 'agent down', hvilket giver dig mulighed for at reagere hurtigt. Men med 'Silent Agent Syndrome' sker dette ikke. Agenten kan være offline, have alvorlige problemer eller være helt stoppet med at sende sine livsvigtige hjerteslag, men systemet forbliver tavst. Du tror, alt er i orden, mens en kritisk del af din infrastruktur måske er ved at fejle.

Denne tilstand opstår ofte efter en specifik systembehandling, nemlig installationen af Update Rollup 12 (UR12) på et SCOM 2012 R2-miljø. Det er som en uventet bivirkning af en ellers nødvendig medicin, hvor kroppens evne til at mærke smerte i visse lemmer forsvinder.

Den Primære Kur: En Nødvendig 'Vaccination' til Systemet

Heldigvis findes der en direkte og effektiv behandling for denne lidelse. Løsningen er en målrettet hotfix, der leveres som en management pack-fil (.mp). Tænk på det som en specialudviklet vaccine, der skal injiceres direkte i systemets centrale nervesystem for at genoprette den tabte følelse og kommunikation.

Proceduren er ligetil:

  1. Anskaf den korrekte hotfix-fil.
  2. Importer denne management pack direkte ind i din SCOM-installation.

Når denne 'vaccine' er administreret, vil de fleste af dine 'patienter' (agenter) øjeblikkeligt genvinde deres evne til at kommunikere deres helbredstilstand korrekt. Din overvågning vil igen blive pålidelig, og alarmerne for 'agent up/down' vil fungere som forventet.

Særlige Tilfælde: Behandling af Patienter med Særlige Kommunikationsveje

Ikke alle dele af en kompleks organisme kommunikerer direkte med hjernen. Nogle signaler går gennem lokale nervecentre, især hvis de befinder sig bag beskyttende barrierer som en firewall, eller hvis de er geografisk adskilt. I SCOM-verdenen svarer disse nervecentre til Gateway-servere.

Agenter, der rapporterer gennem en Gateway-server, kræver en mere avanceret behandlingsplan. Standardvaccinen er ikke altid nok for disse særlige tilfælde, fordi kommunikationsvejen er mere kompleks. Her skal vi sikre, at den 'læge', der automatisk skal diagnosticere problemer, har de rette adgangsrettigheder overalt.

Den Avancerede Behandlingsplan: Korrekt Adgang for den Automatiske 'Læge'

I SCOM findes der en funktion kaldet 'Automatic Agent Management Account'. Dette er systemets automatiske 'læge', hvis opgave det er at diagnosticere fejl som manglende hjerteslag. For at denne læge kan undersøge patienter, der er tilknyttet en lokal klinik (Gateway-server), skal den have en universalnøgle – en såkaldt RunAs-konto.

Det afgørende er, at denne RunAs-konto skal have privilegier og adgang til både hovedhospitalet (Management Server) og den lokale klinik (Gateway-server). Uden denne dobbelte adgang kan den automatiske læge ikke nå frem til patienten for at stille en diagnose, og agenten vil fortsat være tavs. Dette er muligt i to primære scenarier, som kan sammenlignes med forskellige logistiske udfordringer i sundhedsvæsenet.

Sammenligning af Scenarier for Gateway-Patienter

For at gøre det lettere at forstå, hvornår denne avancerede behandling er nødvendig, har vi opstillet en sammenligningstabel:

Situation (Scenarie)Medicinsk AnalogiNøglekrav til 'Lægens Adgang' (RunAs-konto)
Gateway i et Trusted Forest (men uden for Kerberos)Klinikken (Gateway) ligger i et betroet nabolag (trusted forest), men personalet taler en anden dialekt (uden for Kerberos-domænet), som hospitalet ikke umiddelbart forstår.Lægen (RunAs-konto) skal være tosproget og have nøgler, der anerkendes i begge bygninger, for at kunne kommunikere frit.
Gateway i Samme ForestKlinikken (Gateway) ligger i samme by som hospitalet, men er adskilt af en høj sikkerhedsmur (firewall) for at beskytte den eller for at styre trafikken.Lægen (RunAs-konto) skal have en særlig universalnøgle, der giver adgang på begge sider af muren, så den kan bevæge sig frit mellem hospital og klinik.

Ofte Stillede Spørgsmål (OSS)

Hvad er det farligste ved 'Silent Agent Syndrome'?

Det farligste er den falske tryghed. Du tror, at din overvågning fungerer, men i virkeligheden kan kritiske servere være nede, uden at du ved det. Det kan føre til langvarige nedbrud og datatab, fordi du ikke bliver alarmeret i tide.

Er det svært at installere den nævnte hotfix?

Nej, processen med at importere en management pack er en standardprocedure i SCOM og betragtes som en sikker og rutinemæssig opgave for en systemadministrator. Det er en målrettet behandling med minimal risiko for bivirkninger.

Hvorfor er konfigurationen af en RunAs-konto så vigtig for Gateway-servere?

Fordi Gateway-serveren fungerer som en mellemmand. Uden en korrekt konfigureret RunAs-konto, der har tillid fra både Management Server og Gateway, kan det automatiske diagnosesystem ikke 'se' igennem mellemmanden og vurdere den endelige agents sundhed. Det er nøglen til at opretholde fuld synlighed i distribuerede netværk.

At opretholde et sundt IT-system kræver konstant opmærksomhed og den rette medicin, når sygdomme opstår. 'Silent Agent Syndrome' er en alvorlig, men helbredelig tilstand. Ved at anvende den korrekte 'vaccine' (hotfix) og sikre, at dine specialiserede 'læger' (RunAs-konti) har den rette adgang overalt, kan du sikre, at din organisations digitale nervesystem forbliver sundt, responsivt og pålideligt.

Hvis du vil læse andre artikler, der ligner Diagnose: Tavse Agenter i Dit IT-System, kan du besøge kategorien Sundhed.

Go up