SAOB blir en digital ordbok

För några månader sedan kom senaste bandet, det trettiosjätte i raden, av Svenska Akademiens ordbok (SAOB). Bandet innehåller uppslagsorden tynga – utsudda. Det är med andra ord inte många bokstäver kvar till Ö, och om allting går enligt planerna kan storverket SAOB bli komplett någon gång mellan 2017 och 2019. Men vad händer efter det?

Tisdagen den 9 april höll Anki Mattisson, ordbokschef på Svenska Akademiens ordbok, ett föredrag om SAOB:s framtid. Föredraget ägde rum i samband med Adolf Noreen-sällskapets årsmöte.

Den sista plurala verbformen finns i beskrivningen av ordet skötsel från 1976

SAOB kan visserligen bli komplett, men färdigskriven är en ordbok aldrig. Under de drygt hundra år som SAOB har varit under utgivning har många ord hunnit få nya betydelser medan andra har tillkommit eller försvunnit. De tidiga banden är helt enkelt föråldrade, vilket bland annat syns på stavningsregler (exempelvis afdagataga i band 1/1898), otidsenliga eller ibland direkt stötande orddefinitioner (exempelvis neger i band 18/1949), ålderdomligt språk i artiklarna och skiftande redaktionella principer.

Arbetsgång

SAOB har mycket höga kvalitetskrav. Här visar Anki Mattisson de olika stegen i arbetet med artiklarna.

Nydigitalisering på gång

Totalt kommer den tryckta ordboken att bestå av 38 band plus en komplett källförteckning. Ordboken kommer då att innehålla cirka 600 000 uppslagsord inklusive sammansättningar och avledningar. Efter det sista bandet kommer utgivningen att fortsätta i digital form, men redan nu jobbar redaktionen intensivt med att skapa de tekniska förutsättningar som krävs för detta.

Dagens digitala version av SAOB innehåller ungefär ett fel på 200 tecken

Den digitala version av SAOB som idag finns på nätet är redaktionen inte alls nöjd med. Texterna i webbversionen innehåller både formateringsfel, stavfel, stympade artiklar och felplacerade textbitar. För att råda bot på detta pågår för närvarande ett arbete med en nydigitalisering av de tryckta banden.

Varje band innehåller 4,5 miljoner tecken. Hela SAOB består av cirka 162 miljoner tecken.

Band 1–32 digitaliseras manuellt och i två uppsättningar i Kina. De två digitala råversionerna skickas sedan till Trier i Tyskland, där de jämförs och rättas. På så sätt kan man fånga upp många avskriftsfel och skicka en närmast felfri digitalisering tillbaka till redaktionen i Lund. Där strukturerar man sedan texterna med xml och anpassar dem för en typografiskt korrekt visning på webben.

Syftet med digitaliseringen

Digitaliseringen av de tryckta banden har två syften. För det första vill SAOB skapa en bättre och mer interaktiv presentation av artiklarna på webben. För det andra ska det nya digitala systemet bli ett verktyg för framtida tillägg och uppdateringar av ordboken. Efter färdigställandet av det tryckta verket kommer publiceringen av ordboken att fortsätta i detta webbaserade system.

SAOB förbereder sig för en helt digital framtid

SAOB förbereder sig alltså för en helt digital framtid. Redan 2015 ska en första version av den nya digitala ordboken bli tillgänglig för publiken. Just nu håller redaktionen på att lära upp nya medarbetare för att ersätta de många förestående pensionsavgångarna.

Svenska Akademiens satsning på SAOB fortsätter alltså, och vi kommer att kunna ha glädje av en aktuell och levande ordbok en lång tid framöver.

Liknande inlägg