1 / 26

Feilretting

Feilretting. SIF8076 Planlegging og drift av IT-systemer Anders Christensen, IDI. Feilsøking krever: Kreativitet Verktøykunnskap Systemoversikt Teknisk innsikt Generell erfaring. Feilretting krever: Nøyaktighet Systemforståelse Historisk kunnskap Lokal spesialkunnskap.

dotty
Télécharger la présentation

Feilretting

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Feilretting SIF8076 Planlegging og drift av IT-systemer Anders Christensen, IDI SIF8076 Planl/drift av IT-syst

  2. Feilsøking krever: Kreativitet Verktøykunnskap Systemoversikt Teknisk innsikt Generell erfaring Feilretting krever: Nøyaktighet Systemforståelse Historisk kunnskap Lokal spesialkunnskap Feilsøking og -retting SIF8076 Planl/drift av IT-syst

  3. Feilhåndtering og linjedelt drift (Prosjekter) 3.linje Retting Testing (”Drift”) Tilpassing 2.linje Feil- isolering Verifisering Dokument- asjon Reprodu- serbarhet Deploy- ment (Rutiner og brukerstøtte) 1.linje Feil- melding Tilbake- melding SIF8076 Planl/drift av IT-syst

  4. Hovedkategorier av feil • Brukerfeil eller misforståelse hos brukeren • Rutineoppgaver, f.eks brukeradm og restore og andre forutsigelige oppgaver • Feilsituasjon som skal rettes, der systemet har fått en feil • Konseptuell feil med systemet, der det må gis ny funksjonalitet for å håndtere oppgavene. SIF8076 Planl/drift av IT-syst

  5. Retting av feil 1.linje 2.linje 3.linje Veiledes Brukerfeil Rutineoppgave Utføres Feilsituasjon Verifiseres Rettes Konseptuell feil Verifiseres Feilsøkes Redesignes SIF8076 Planl/drift av IT-syst

  6. Retting og testing • Retting. Gjør rettingen permanent, og distribuer den til alle maskiner. • Testing. Test på mer enn en måte, fokuser fra mer enn en vinkel. Dobbelttest og trippeltest. • Dokumentasjon. Dokumenter hva du har gjort, og gi tilbakemelding til bruker SIF8076 Planl/drift av IT-syst

  7. Fire strategier for feilretting • Korrigere før feilen oppstår • Automatisk korrigere idet feilen oppstår • Manuell korrigering når de første symptomene melder seg • Opprydding når problemet er blitt merkbart SIF8076 Planl/drift av IT-syst

  8. Kostnader 4 Nede tid 3 2 1 Initielle driftsutgifter SIF8076 Planl/drift av IT-syst

  9. Akkumulative feil En kritisk feilsituasjon har sjelden bare ett enkelt problem som årsak. Dersom problemer korrigeres ASAP, kan man hindre at de blir delårsaker i komplekse feilsituasjoner. SIF8076 Planl/drift av IT-syst

  10. Spissformulering om testing! Noe du har gjort fungerer ikke fordi du har gjort det, men fordi du har testet det, dobbelttestet det, og trippeltestet det. SIF8076 Planl/drift av IT-syst

  11. Automatisering Automatisering vil si å generalisere en løsning for et sett av problemer på en slik måte at de kan løses senere, uten manuell inngripen for hverken oppstart eller utførelse. SIF8076 Planl/drift av IT-syst

  12. Spissformulering: Ingenting er så permanent som en temporær løsning som ser ut til å virke. SIF8076 Planl/drift av IT-syst

  13. Tre regler for automatisering • Ordne problemet for permanent! • Ikke finn opp hjulet på ny, gjenbruk! • Ordne problemet for alle maskiner på en gang! SIF8076 Planl/drift av IT-syst

  14. Hvorfor automatisere? • Forenkler skalerbarhet • Sikrer konsistens mellom maskiner • Bedre ressursutnyttelse • Gir repeterbare prosesser • Gir sporbare prosesser SIF8076 Planl/drift av IT-syst

  15. Scripting Kobler flere enkelthandlinger. Proceduralt ”Programmeringsspråk” Utfører et program Tilstandsbasert Regelbasert Komplekst Sammenlikner tilstander Dimensjon 1Metoder SIF8076 Planl/drift av IT-syst

  16. Defensivt Kvalitet i fokus Kontrollerer avvik Sjekker assumptions Sjekker resultatene Avbryter hvis uklart Spesialbehandling av farlige operasjoner Aggressivt Oppgavemål i fokus Få/ingen sjekker Vanligvis midlertidig Ignorerer spesialtilfeller Forventes brukt manuelt Ignorerer feilkoder Dimensjon 2Holdning SIF8076 Planl/drift av IT-syst

  17. Symptom For å få bort bieffekter Hvis midlertidig bruk Hvis ufarlig/uskadelig Hvis man ikke forstår hva som skjer Årsak For å løse problemer Permanent løsning Sikkerhetsrelatert Dimensjon 3Målskive SIF8076 Planl/drift av IT-syst

  18. De fire veiene • Reboot (brute force) • Manuelt (hele folket i arbeid) • Kontroll (Stasi-metoden) • Automatisering (’selvreparasjon’, eller immunologi) SIF8076 Planl/drift av IT-syst

  19. Enkel Krever lite kompetanse Rask å utføre Oftest lav TTR Lite proaktivitet Skalerer dårlig (lineært) Dårlig for klassefeil Gir ikke systeminnsikt Dårlig for tjenere Reboot-metoden Dersom noe ikke virker, hopp over all feilsøking, og gå rett på restart/reboot/reinstall. SIF8076 Planl/drift av IT-syst

  20. Ypperlig i små systemer Kan virke godt for små subsystemer Stor frihet Kan fungere: nærdrift Probl med nyansatte Gir personlige uvaner ”Partisjonerer” systemet Vanskelig å styre Vanskelig å linjedele Manuell drift Ansett ’tilstrekkelig’ med folk, la dem ta hver sin del av systemet (eller samarbeide om det). Gi dem nærmest full frihet i arbeidssituasjonen. SIF8076 Planl/drift av IT-syst

  21. Enkelt å kjøpe Gir felles rammeverk Skalerer brukbart Kan linjedeles Enkelt å få nye folk Ufleksibelt rammeverk Skjuler kompleksitet ”Information overflow” Binder til teknologivalg Begrenset funksjonaltet Kontrollmetoden Kjøp et verktøy for å drive maskinene. La verktøyet overvåke alt som skjer, og si ifra hva som må gjøres. Konfigurer systemet gjennom verktøyet, SIF8076 Planl/drift av IT-syst

  22. Automatisering Systemet skal settes opp inkrementelt av sysadm til å fikse problemer som måtte oppstå. Når et nytt problem oppstår, så fikses det generelt, og løsningen gjøres gjeldende for alle maskiner til all tid. Sysadm jobber bare med de ’nye’ problemene. SIF8076 Planl/drift av IT-syst

  23. Gjenbruk av løsninger Kort TTR Bare ’interessante’ jobber Sterk sublineær skalering Uten manuell intervensjon etter at det er satt opp Rette feil ’en gang for alle’ Krever mye lokal konfigurering Skaper nye komplekse systemer Begrenser endringstakten Brute-force løsning på en del problemer (selv om den er automatisert) Vanskelig å fase inn nye folk Krever høy kompetanse Automatisering – for og mot SIF8076 Planl/drift av IT-syst

  24. De fire driftsmetodene Manuell detektering Manuell drift Reboot- metoden Kontroll- metoden Automatisk detektering Automatisering Manuelt fikset Automatisk fikset SIF8076 Planl/drift av IT-syst

  25. Kvalitetbedring av automatisering • Test, dobbelttest og trippeltest • Gjennomgang med peer review • Tvungen dokumentasjon i forkant • Tvungen overføring til driftspersonell • Full verifisering av kapasitet SIF8076 Planl/drift av IT-syst

  26. Fordeler Bra ved feilsøking For midlertidige feil Løsning frem til et vedlikeholdsvindu Løsning frem til en permanent løsning Ulemper Blir lett permanent Inkrementent økende Vanedannende Tar fokus fra viktige oppgaver Skaper større behov for historisk kunnskap Temporær fiksing SIF8076 Planl/drift av IT-syst

More Related