Rootmanual:lysrdiff: Skillnad mellan sidversioner

Från Lysators datorhandbok, den ultimata referensen.
Hoppa till navigering Hoppa till sök
(Uppdaterat med aktuella kategorier och antalet underkategorier.)
(Uppdaterad status. Uppdaterade milstenar.)
Rad 62: Rad 62:
backup-one-task tar backup av ett backupjobb. backup-all loopar över alla backupjobb.
backup-one-task tar backup av ett backupjobb. backup-all loopar över alla backupjobb.


=== category ===
== category ==


För tillfället finns följande kategorier (antalet subkategorier 2007-01-16 inom parentes):
För tillfället finns följande kategorier (antalet subkategorier 2007-01-16 inom parentes):
Rad 82: Rad 82:
* hanna (1): Systemdisk för hanna
* hanna (1): Systemdisk för hanna


=== Status ===
Kommande kategorier:

Backup tas kontinuerligt. Det tar ca 23 timmar att köra igenom backupen en runda. Med de undantag som listas nedan tas det backup av allt i de kategorier som nämns ovan.

* mail: Det finns 1539 mailkataloger, men vi tar bara backup av 716 (nämligen de som börjar på någon av följande bokstäver: <tt>tvamqpojk</tt>. Det finns inte plats på den nuvarande backupdisken för mer.
* För många av systemdiskarna tas det bara mycket begränsade backuper. Målet är att ha backup av systemspecifik konfiguration, inte att kunna återställa systemen från backupen.

=== Kommande kategorier ===


* quota1 - användarnas quota-skyddade partitioner
* quota1 - användarnas quota-skyddade partitioner
Rad 88: Rad 95:
* ? - saker som ligger bland $HOME-katalogerna men inte finns i auto_home (om det finns något sådant)
* ? - saker som ligger bland $HOME-katalogerna men inte finns i auto_home (om det finns något sådant)
* ...och säkert en hel massa annat
* ...och säkert en hel massa annat

== Status ==

Lyckade backupjob: 2889
Misslyckade backupjob: 34 (alla hör till Manhattan)
Äldsta backup backupjobbet startade: 2006-10-25 22:07:05

För tillfället kör ceder backupscriptet manuellt med ojämna mellanrum:

* 2006-10-13 (bara ett fåtal jobb)
* 2006-10-14 (bara ett fåtal jobb)
* 2006-10-15 (bara ett fåtal jobb)
* 2006-10-16 (bara ett fåtal jobb)
* 2006-10-17 (bara ett fåtal jobb)
* 2006-10-18 (bara ett fåtal jobb)
* 2006-10-19 (alla lsvn- och lyscvs-projekt. Alla användare som börjar på "a", "b", "c" eller "d". Alla webanvändare som använder "common" och börjar på "c")
* 2006-10-20 (som ovan, plus de flesta användare till och med "linmi", utom de på manhattan, som kraschade under backupförsöket. Av 1106 beställda backupjob lyckades 1097.)
* 2006-10-25 (alla lsvn- och lyscvs-projekt. Alla hemkataloger utom de på manhattan. Alla lyswww- och roxen-hemsidor.)

Backup tas av mer och mer av Lysators system. Det är ännu långt kvar innan det tas backup av allt.

=== Status per kategori ===

* lsvn: alla projekt
* lyscvs: alla projekt
* lyswww: alla användare
* roxen: alla användare
* home: alla användare, utom lysdiskanvändare


== Milstenar ==
== Milstenar ==
Rad 136: Rad 115:


* 2006-10-22: Avslutad backup av alla hemkataloger, alla användar-web-kataloger (common och Roxen). Passerad 2006-10-26, med undantag för lysdisk-användare (på grund av hårdvaruproblem med Manhattan). Förseningen beror till största del på att det tog mer tid än väntat att kopiera stora mängder data, och till viss del på reparationsarbeten på Manhattan och en oplanerad omboot av sedesopim som skedde av misstag.
* 2006-10-22: Avslutad backup av alla hemkataloger, alla användar-web-kataloger (common och Roxen). Passerad 2006-10-26, med undantag för lysdisk-användare (på grund av hårdvaruproblem med Manhattan). Förseningen beror till största del på att det tog mer tid än väntat att kopiera stora mängder data, och till viss del på reparationsarbeten på Manhattan och en oplanerad omboot av sedesopim som skedde av misstag.

* 2006-12-01: Undersök om någon av de datorer Lysator redan har duger till att köra LYSrdiff. Resultat: nej, vi har ingen passande dator. Passerad 2007-01-16.

* 2006-10-29: Avslutad backup av LysKOM-databasen, projekt-web-kataloger, lysdiskar som inte är hemkataloger, /pkg/cfengine. Passerad 2007-01-16, mer eller mindre. Det finns inte kvar några lysdiskar, och /pkg/cfengine finns det inte plats för. I stället tas det backup av en massa annat (se ovan).


Planerade milstenar:
Planerade milstenar:

* 2006-10-29: Avslutad backup av LysKOM-databasen, projekt-web-kataloger, lysdiskar som inte är hemkataloger, /pkg/cfengine.


* 2006-11-05: Inventera vad annat som det bör tas backup av, och ta backup av det.
* 2006-11-05: Inventera vad annat som det bör tas backup av, och ta backup av det.

* 2006-12-01: Undersök om någon av de datorer Lysator redan har duger till att köra LYSrdiff.


* 2006-12-10: Skriva utvärderingsrapport om hur systemet har fungerat under försöksperioden fram till detta datum. Föreslå inköp av mer hårdvara för att få till spegling på backupservern, off-site-lagring av backuper, och att backupsystemet går på ett separat system i stället för på sedesopim.
* 2006-12-10: Skriva utvärderingsrapport om hur systemet har fungerat under försöksperioden fram till detta datum. Föreslå inköp av mer hårdvara för att få till spegling på backupservern, off-site-lagring av backuper, och att backupsystemet går på ett separat system i stället för på sedesopim.

Versionen från 16 januari 2007 kl. 14.01

Lathund

  • Skapa ny lista av backupjobb som ska köras:
    /nobackup/backup.lysator/bin/fetch-backup-work
  • Köra alla jobb som hör till vissa partitioner:
    /nobackup/backup.lysator/bin/backup-all 0 1
  • Läsa tillbaka den nyaste backupen av calles hemkatalog:
    rdiff-backup --force -r 0B --null-separator \
    --remote-schema 'ssh -a -k -x -i /root/.ssh/backupkey %s /usr/local/bin/rdiff-backup --server' \
    /lysrdiff/0/perm/lysrdiff/backups/home/calle/files home::/export/home/calle

    Flaggan --force behövs om katalogen redan finns.
  • Se status:
    ~ceder/rsvn/lysrdiff/lysrdiff-status

Bakgrund

Lysator har haft många backupsystem genom åren. En gemensam faktor är att de varit bandbaserade. En annan gemensam faktor är att banden och/eller bandarna strulat.

De två senaste backupsystemen har använt komplexa programvaror: Legato Networker och Bacula. Legato Networker kostar pengar. Lysator använde en begagnad licens till en gammal version av programvaran. Den fungerade inte så bra när man skulle läsa tillbaka ett stort filträd. Det tog timmar bara att bygga upp indexet. Det kunde dröja en dag innan man upptäckte att bandet var trasigt, så att man inte kunde läsa tillbaka sin backup.

Bacula är fri programvara. Det kostar utvecklingstid, ty det har fortfarande många barnsjukdomar. Det är precis som Networker väldigt långsamt när det ska läsa tillbaka filer.

Disk blir bara billigare och billigare. Det är numera ekonomiskt försvarbart att ta backup till disk. Tack vare billiga USB-diskar kan man till och med använda disk för off-site-backup.

I oktober 2006 hade Lysator varit utan fungerande backup ett tag. (Några ad-hoc-rsync-speglingar gjordes, så situationen var inte helt akut, men ändå inte acceptabel.) Ett förslag om att Lysator skulle investera drygt 35000 kronor på ett Linux-RAID-system för att köra TSM (en proprietär backuplösning) lades fram. Några stofilrötter tyckte det var för mycket pengar att lägga på ett system, som de trodde hade stora möjligheter att misslyckas. Och ceder trodde att man skulle kunna få till ett minst lika bra backupsystem för en bråkdel av kostnaden.

Detta är bakgrunden till backupsystemet LYSrdiff.

Filosofi

Disk är billigt.

rdiff-backup är en bra byggsten när man bygger ett backupsystem.

Lysator har många saker som det är värt att ta backup av. Ett backupsystem bör göras så att de olika backuperna är oberoende av varandra. Om t ex en användares namngivning av sina filer triggar en bugg i rdiff-backup ska det inte påverka alla andra användare -- isolera skadan!

RAID är komplext. Backupsystemet ska vara stabilt. Man får stabilitet genom att använda beprövad teknik, och hålla sig undan från sluten hårdvara eller mjukvaru-RAID som bara används av 0.3% av Linuxanvändarna. Det är bättre att använda ext3 som alla andra, och spegla diskar "manuellt" med rsync.

Ett backupsystem måste vara utbyggbart: man måste kunna stoppa in mer disk, man måste kunna dela upp backupjobbet på flera backupservrar om det visar sig att en backupserver inte räcker till för belastningen.

Implementation

Källkoden lagras i Subversion. Man kan checka ut den anonymt:

svn co http://lsvn.lysator.liu.se/svnroot/lysrdiff/trunk/lysrdiff

För tillfället finns lysrdiff installerat under /nobackup/backup.lysator. I framtiden kommer det nog att ligga under /opt/LYSrdiff i stället.

En central del är filen var/tasks. Varje rad beskriver ett backupjobb. Varje rad består av fyra delar:

  • category - kategori, t ex "home" eller "lyswww"
  • subcategory - de flesta kategorier har någon typ av underkategorier. För "home" är det t ex användarnamn.
  • server - den dator man ska logga in på för att komma åt disken.
  • serverpath - den katalog som det ska tas backup på.

Filen var/tasks skapas av fetch-backup-work.

backup-one-task tar backup av ett backupjobb. backup-all loopar över alla backupjobb.

category

För tillfället finns följande kategorier (antalet subkategorier 2007-01-16 inom parentes):

  • home (1493): användarkataloger, tagna från NIS-mappen auto_home
  • lyswww (962): användares websidor, tagna från /lysator/lyswww/users/common
  • mail (716): användarnas mailkataloger, tagna från /var/mail (lenin:/home)
  • roxen (220): användares websidor, tagna från /lysator/lyswww/users/roxen_only
  • lyscvs (219): CVS-projekt från stalingrad
  • ftp-pub (53): Filer publicerade på Lysators FTP-server
  • lsvn (45): Subversion-projekt från stalingrad
  • lyssvn (10): Subversion-projekt från poseidon
  • lenin (5): Systemdiskar för lenin
  • sedesopim (4): Systemdiskar för sedesopim
  • poseidon (2): Systemdiskar för poseidon
  • kilauea (2): Systemdiskar för kilauea
  • medreg (1): Medlemsregistret
  • lyskom (1): LysKOM-databasen
  • hanna (1): Systemdisk för hanna

Status

Backup tas kontinuerligt. Det tar ca 23 timmar att köra igenom backupen en runda. Med de undantag som listas nedan tas det backup av allt i de kategorier som nämns ovan.

  • mail: Det finns 1539 mailkataloger, men vi tar bara backup av 716 (nämligen de som börjar på någon av följande bokstäver: tvamqpojk. Det finns inte plats på den nuvarande backupdisken för mer.
  • För många av systemdiskarna tas det bara mycket begränsade backuper. Målet är att ha backup av systemspecifik konfiguration, inte att kunna återställa systemen från backupen.

Kommande kategorier

  • quota1 - användarnas quota-skyddade partitioner
  • lysdisk - lysdiskpartitioner som inte är $HOME, om det finns några sådana kvar
  • ? - saker som ligger bland $HOME-katalogerna men inte finns i auto_home (om det finns något sådant)
  • ...och säkert en hel massa annat

Milstenar

Redan passerade milstenar.

  • Skapa proof-of-concept-scripts på sedesopim, och kör dem på ledig disk som finns där. Passerad 2006-10-12.
  • Få styrelsen att finansiera inköp av en USB-disk. Passerad 2006-10-14.
  • Checka in lysrdiff i subversion. Passerad 2006-10-14.
  • 2006-10-15: Dokumentera lysrdiff på denna sida. Passerad 2006-10-15.
  • 2006-10-15: Beställ USB-disk. Passerad 2006-10-15.
  • 2006-10-18: Hämta ut USB-disken. Passerad 2006-10-18.
  • 2006-10-22: Avslutad backup av alla hemkataloger, alla användar-web-kataloger (common och Roxen). Passerad 2006-10-26, med undantag för lysdisk-användare (på grund av hårdvaruproblem med Manhattan). Förseningen beror till största del på att det tog mer tid än väntat att kopiera stora mängder data, och till viss del på reparationsarbeten på Manhattan och en oplanerad omboot av sedesopim som skedde av misstag.
  • 2006-12-01: Undersök om någon av de datorer Lysator redan har duger till att köra LYSrdiff. Resultat: nej, vi har ingen passande dator. Passerad 2007-01-16.
  • 2006-10-29: Avslutad backup av LysKOM-databasen, projekt-web-kataloger, lysdiskar som inte är hemkataloger, /pkg/cfengine. Passerad 2007-01-16, mer eller mindre. Det finns inte kvar några lysdiskar, och /pkg/cfengine finns det inte plats för. I stället tas det backup av en massa annat (se ovan).

Planerade milstenar:

  • 2006-11-05: Inventera vad annat som det bör tas backup av, och ta backup av det.
  • 2006-12-10: Skriva utvärderingsrapport om hur systemet har fungerat under försöksperioden fram till detta datum. Föreslå inköp av mer hårdvara för att få till spegling på backupservern, off-site-lagring av backuper, och att backupsystemet går på ett separat system i stället för på sedesopim.