Projekt Runeberg

Från Lysators datorhandbok, den ultimata referensen.
Hoppa till navigering Hoppa till sök

Projekt Runeberg (runeberg.org) är ett av många projekt inom LYSATOR, en stor webbplats full av klassisk nordisk litteratur, där upphovsrätten har gått ut, och som scannas och korrekturläses av frivilliga.

Projekt Runeberg driver en webbserver. Domännamnet http://runeberg.org/ förvaltas av grundaren Lars Aronsson och pekar på en server i FOO-hallen, tidigare Fatabur, senare Mirabell (inköpt 2008) och Stella (inköpt 2011), vars fullständiga domännamn är stella.runeberg.lysator.liu.se.

This information in English

Hur man hjälper till

Man behöver inte vara medlem av LYSATOR för att använda eller bidra till Projekt Runeberg. Alla kan läsa, ladda ner eller hjälpa till med scanning, OCR-tolkning, korrekturläsning och skrivandet av dokumentation. Så mycket som möjligt av interaktionen med användare och medhjälpare sköts med webbformulär, resten med e-post.

Kontaktväg: Projektets inre cirkel är en liten grupp LYSATOR-medlemmar som kallar sig "redaktionen". Dessa är med i LysKOM-mötet "Redaktion (för) Projekt Runeberg" och har login-konton på webbservern runeberg.org. Frivilliga medhjälpare och andra utomstående kan skicka e-post till hela gruppen på adress redaktionen@runeberg.org

LYSATOR:s årsmöte väljer en projektledare, som hittills har varit grundaren Lars Aronsson. Nuvarande eller tidigare redaktionsmedlemmar är: Martin Bergström, Björn Brenander, Anders Brun, Per Cederqvist (ceder), Lisa Hallingström, Erik M. Johansson, Erik S-O Johansson (esoj), Karl-Johan Karlsson (ka-ka), Hans Persson (unicorn), Joakim Ragnvaldsson (jr), Leif Stensson och Johan Tufvesson (tuben). Projekt Runebergs logotyp har utformats av Leif Nixon.

Historia

Projekt Runeberg grundades på kvällen den 13 december 1992 av Lars Aronsson, som behövde mer innehåll för att fylla upp LYSATOR:s Gopher-server. Gopher var en text- och menybaserad föregångare till World Wide Web. Inspirationen kom främst från det amerikanska Project Gutenberg. LYSATOR:s WWW-server startades i februari 1993 av Per Hedbor och Projekt Runeberg flyttade gradvis över till webben under 1993 och 1994. Några av de tidigt publicerde verken var Fänrik Ståls sägner (mars 1993), Bilder ur Nordens Flora (november 1994) och Bibeln på svenska (mars 1996). I början användes Projekt Runeberg ofta som exempel på vad webben kunde användas till.

I januari 1996 förlängdes den svenska upphovsrättslagen från 50 till 70 år efter författarens dödsår. Verk vars upphovsrätt skulle ha gått ut 1996, alltså de vars författare dött under 1945, kommer nu att förbli under upphovsrätt till slutet av 2015. Men i praktiken har upphovsrättens förlängning inte haft någon större inverkan på Projekt Runeberg, eftersom det finns gott om annan litteratur där upphovsrätten har gått ut. Allvarligare var den negativa propaganda som vid ungefär samma tid lanserades av litteraturforskare angående kvaliteten på texterna. Det tvingade Projekt Runeberg att under 1998 utveckla metoder för att publicera inscannade bilder av boksidorna, utöver den elektroniska texten.

Den 11 maj 2003 hade samtliga 20 + 38 band av de två första utgåvorna av Nordisk familjebok digitaliserats, det största uppslagsverk som någonsin publicerats på svenska. Med sina 45.000 sidor utgjorde det då nästan hälften av Projekt Runeberg. Den 18 januari 2006 omfattade Projekt Runebergs samlingar 400.000 boksidor i digital faksimil.

Den första egna servern Fatabur inköptes i november 2003, monterades i FOO-hallen i december 2003, men användes inledningsvis bara för delar av projektet. Textinnehållet av sajten låg kvar på Lysators webbserver Lenin, som i februari 2004 ersattes av Sherman. Det var först den 15 december 2004 som Projekt Runeberg helt flyttade över till sin egen domän och server, runeberg.org.

Den rackmonterade 4U-servern Mirabell inköptes i januari 2008 och installerades i FOO-hallen i februari.

Den rackmonterade 1U-servern Stella inköptes i augusti 2011 och installerades i FOO-hallen i september. Den användes inledningsvis bara som backup, men den 29 maj 2013 riktades webbdomänen runeberg.org om från Mirabell till Stella.

Den virtuella servern Ellen i Lysators moln sattes upp i november 2020. Förhoppningen är att Ellen ska ta över från Stella vid Lysators flytt i december 2020 från FOO-hallen till en mindre serverhall i A-huset. Ellen kör Ubuntu Linux, initialt version 18.04, men uppgraderas till 20.04.

Mer detaljer finns dokumenterade i Project Runeberg Timeline.

Teknik

De så kallade "redaktörerna" är egentligen programmerare, men Projekt Runeberg har gett dem chansen att arbeta under förutsättningar som är väldigt annorlunda än de flesta programmerare får uppleva. Under de tio första åren förlitade sig Projekt Runeberg nästan uteslutande på program i C, Pike och Perl som genererade statiska webbsidor (eller Gopher-menyer). Detta kombinerades med ett konservativt urval av enkla filformat: vanliga textfiler i ISO 8859-1, en enkel delmängd av HTML samt bilder i GIF, PNG, JPEG och TIFF G4. Detta gjorde webbplatsen mycket snabb och tillförlitlig. I en tid när nya spännande tekniker som Java och "push" introducerades i snabbt tempo, hade Projekt Runebergs elektroniska texter föga behov av uppdateringar och förändringar. All källtext hanteras under versionskontrollsystemet RCS. Länkarna för navigation inom webbplatsen är inte del av källtexten, utan läggs till automatisk av program.

Sedan 1998 publiceras de flesta nya böcker som inscannade bilder ("faksimil") i tillägg till OCR-texten. Standardformatet för de inscannade bilderna är 600 dpi TIFF G4. De frivilliga medhjälparna uppmanades ursprungligen att skicka in korrekturläst text med e-post, som sedan lades in på webbplatsen manuellt av redaktionen. Men detta skalade inte när det kom in mer text än redaktörerna orkade ta hand om. Sedan 2002 sköts korrekturläsning i stället via ett webbformulär, som liknar en wiki. De senaste ändringarna visas på sidan Recent Changes, och det finns funktioner för skillnader och versionshistorik.

Under 2005 och 2006 har mer funktioner förts över från statiska till dynamiska webbsidor. Nya böcker publiceras i teckenstandarden UTF-8 (Unicode) och äldre böcker omvandlas till detta format. En del nya böcker fångas med digital kamera som JPEG-bilder i stället för med scanner. Eftersom högupplösta (5 megapixel) digitalkameror har blivit överkomliga och mycket vanliga, blir det möjligt för fler att bidra än hittills.