Home

reboot before dist-upgrade

2009/06/21

[ Παρόλο το debianism του τίτλου, αυτό είναι ένα γενικότερο post ]

Πριν από δραστικές αλλαγές στο λειτουργικό σύστημα ενός server, καλό είναι να γίνεται ένα reboot. Ειδικά εάν έχουν περάσει αρκετές ημέρες (μήνες, χρόνια) από το προηγούμενο reboot. Οι εξαρτήσεις στο πολύπλοκο περιβάλλον που ζουν οι servers φτάνουν σε σημεία που δεν μπορούμε να ελένξουμε ή δεν θυμόμαστε πάντα από μνήμης (Documentation; Τι είναι αυτό;).

Για αυτό ένα reboot πριν μια θεμελιώδη αλλαγή επιβάλλεται. Downtime is an option, αρκεί να μπορούμε να έχουμε μια ιδέα τι το προκάλεσε. Μετά π.χ. από ένα dist-upgrade από Etch σε Lenny, δεν είναι σίγουρο πως θα μπορεί να εντοπιστεί το πιθανό πρόβλημα στην αναβάθμιση του software ή σε μια άλλη εξάρτηση που έχει προστεθεί στην πορεία και δεν μας περνάει από το μυαλό.

Αλλάζουμε μία μεταβλητή (από όσες ελέγχουμε) τη φορά και θυμόμαστε πως συνήθως εάν ένα ext3 filesystem δεν έχει γίνει fsck για περισσότερες από 30 μέρες, θα κάνει fsck στο επόμενο reboot. Είσαι σίγουρος πως αυτό θέλεις να είναι το reboot του dist-upgrade;

Fear of rebooting.

Advertisements

4 Responses to “reboot before dist-upgrade”

  1. Michael Iatrou Says:

    Well, there are projects like http://www.ksplice.com, and I am a huge fan of the concept: if you need to reboot, someone is doing something suboptimal or wrong.

  2. george Says:

    Χμχμχμχ χαριτωμένο χμχμ γκούι.. εεχμχμ.

    Reboot δεν κάνεις συνήθως στα updates (εκτός και εαν κάνεις αλλαγές σε πυρήνα όπου σε συστήματα παραγωγής δεν είναι και τόσο σύνηθες).
    Reboot θα κάνεις μια στο τόσο για να διασφαλίσεις οτι, την στιγμή που έχει φρικάρει η $DB μαζί με τον $APPSERVER και έχει πέσει και το δίκτυο και δεν βρίσκεις και την κάρτα να μπεις στο ντατασέντερ και σε παίρνει και τηλέφωνο η μάνα σου να σε ρωτήσει τι φαί να φτιάξει αύριο, το base σύστημα θα σηκωθεί χωρις πολλά-πολλά, και δεν θα κολήσει σε τίποτα χαζά dependency errors ή ένας θεός ξέρει τι. Το να έχεις critical downtime και να πρέπει να φτιάξεις χαζοπροβληματάκια παράλληλα δεν είναι και οτι καλύτερο. (Τι; δεν παίζουν στο boot τα NFS mounts και κολάει το σύστημα μεχρι να κάνει timeout; Που είναι ο NFS server; τον βγάλατε; άλλαξε IP; και τι mounts είναι αυτά που έχω εγω; Δεν υπάρχουν; το μηχάνημα έχει να γίνει rebooted 6 μήνες; οεο;).


    • Δεν είναι και τόσο σύνηθες; Το RHEL5 βγάζει ένα kernel update κάθε ~30-60 μέρες (http://rhn.redhat.com/errata/rhel-server-errata.html) .. βέβαια το αν το περνάς promptly είναι άλλο καπέλο, αλλά πάντα υπάρχει και ο δεύτερος server, right?

      Υπάρχει ένα unconformed urban legend που λέει ότι παλιά, στην Compulink κάθε Δευτέρα απόγευμα κλείναν _ΟΛΑ_ τα μηχανήματά τους (servers, routers, modems etc) για 30 λεπτά και μετά τα ανοίγαν πάλι… Αρχίζω να πιστεύω ότι ακόμα κι αν δεν είναι αλήθεια, ίσως τελικά να έχει νόημα στα όλο και πιο περίπλοκα περιβάλλοντά μας!

      Vote for “Reboot all systems with uptime>100 days” :)

  3. george Says:

    Ναι, για να κρυώσουν ίσως.


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: