Digitaliseringsprojektets
hjemmeside | DNLB Homepage
|
Digitalisering af danske naturvidenskabelige plancheværker
Slutrapport, januar 1998
|
Indhold:
Projektresumé
Indholdsfortegnelsen
- Titel
- Digitalisering af danske naturvidenskabelige plancheværker
- Ansøger
- Danmarks Natur- og Lægevidenskabelige Bibliotek
- Formål
- At gøre de væsentligste danske naturvidenskabelige plancheværker tilgængelige via
Internet/WWW.
- Målgruppe(r)
- Den naturvidenskabeligt, videnskabshistorisk og kunsthistorisk interesserede
offentlighed; videnskabshistorikere og kunsthistorikere.
- Indhold
- Digitalisering i farver af væsentlige danske naturhistoriske plancheværker samt
publicering på WWW. Oprettelse af søgbart register over billederne.
- Varighed
- Projektstart juni 1997. Publicering på nettet af væsentlige datamængder: 6 måneder
Derudover løbende udvidelser.
Projektet støttes som Kulturnet Danmark-projekt
af Kulturministeriet
Resultater
Indholdsfortegnelsen
Digitaliseringen af Flora Danica er en del af et projekt under Kulturnet Danmark, som gennemføres på Danmarks Natur-
og Lægevidenskabelige Bibliotek. Projektet har til hensigt at publicere danske
naturhistoriske plancheværker på World Wide Web.
Ved projektstart forsommeren 1997 er digitaliseringen af bogværket Flora Danica
påbegyndt. Ved afslutningen af den ministerielt støttede projektperiode pr den
31.12.1997 er følgende nået:
- 1.500 plancher (ud af 3.240) indscannet i farver, reformatteret til brug for WWW og
gjort tilgængelige.
- Ca. 3.000 (ud af skønnet 4.000) plantenavne inddateret efter Johan Langes Nomenclator.
Heraf er de 2.600 søgbare i Cosmos.
- Indberetning til databasen af nugældende videnskabelige navne samt af danske navne
påbegyndt
- Hjemmesidekompleks konstrueret. Hjemmesidekomplekset har, når projektet er afsluttet,
to indgange samt ledsagende tekster:
- Søgeindgang. Søgning på hver enkelt plante ved hjælp af danske såvel som
latinske navne.
- Browseindgang. "Bladring" gennem samtlige plancher hefter for
hefte.
- Uanset valgt indgang kan man hele tiden skifte mellem søgning og browsing.
- Ledsagende tekster. Der er skrevet forklarende tekster af forskellig karakter:
- Kortfattet historiske tekster om Flora Danica, både bogværk og porcelænssstel. Disse
tekster vil blive udvidet.
- Forklarende tekster om selve projektet. Når projektet er færdigt, vil det foreligge
fuldt dokumenteret med hensyn til trufne beslutninger vedrørende det faglige indhold af
databasen, ligesom der vil foreligge omfattende (men ikke fuldstændig) dokumentation for de tekniske løsninger

Digitaliseringen og opbygningen af databasen forventes færdiggjort i løbet af
sommeren 1998.
Herefter er det tanken løbende at digitalisere andre danske naturhistoriske
plancheværker og eventuelt andet billedmateriale i DNLB's besiddelse, såfremt der kan
findes ressourcer til det.
Logo: Flora Danicas afbildning af engblommen
(planche 133) er valgt som logo for projektet. Det er en af de meget smukke plancher i
bogværket, og samtidig en velkendt dansk blomst.
Selv inden projektet er offentliggjort, har der vist sig interesse for publiceringen af
Flora Danica-plancherne. Der er kommet positive reaktioner, bl.a. fra Københavns
Universitet med en meget grundig og konstruktiv kritik, der lægger op til yderligere
samarbejde med universitetet om eventuelle fremtidige udvidelser af databasen.
Projektforløb
Indholdsfortegnelsen
Den praktiske del af projektet påbegyndtes i forsommeren 1997. Indskanningen har ikke
helt nået det omfang, vi havde forventet; det skyldes forsinkelser omkring leveringen af
udstyret, at det indkøbte udstyr i praktisk brug var langsommere end de første tests
havde antydet, og at skanneren måtte til reparation undervejs.
Det nye i projektet har for DNLB dels været etablering af en skanningsfunktion, og
dels en ny kombination samt udvidet udnyttelse af i forvejen kendte teknikker. Der er
opbygget en vigtig know-how i biblioteket, lige som projektet har medvirket til en
forøget opmærksomhed om plancheværkerne som de kunstværker, de også er.
Samarbejdet de forskellige personalegrupper/afdelinger imellem har fungeret gnidningsfrit,
og de opståede problemer er blevet løst undervejs.
Selv om vi naturligvis ind imellem har måttet ændre trufne beslutninger, har det ikke
været nødvendigt at gentage allerede udført arbejde. Dog er der behov for ændring af
hjemmesidens tekniske opbygning; et arbejde, hvis resultat ikke vil kunne ses af brugerne.
På de første ca. 300 plancher sidder målestokken inden for billedkanten; dette blev
ændret, målestokken, hvis der er muligt, ligger uden for.
Netop for at undgå at gentage allerede udført arbejde, har opbygningen af
browsefunktionen været sat i stå. Dette afventer indberetning af nye videnskabelige samt
danske navne til databasen. Der er - trods automatiseringsrutiner - stadig meget manuelt
arbejde i opbygningen af disse sider.
Om plantenavnene
Indholdsfortegnelsen
Ud over de rent tekniske problemer - valg af udstyr, grafikformat m.v. - har det været
nødvendigt at tage stilling til, hvilke navne, som skulle være søgbare i databasen.
Når det kan volde problemer, skyldes det, at navngivningen er skiftet flere gange siden
udgivelsen af Flora Danica. Det gælder både de latinske og de danske navne.
Den væsentligste nøgle til Flora Danica er: Johan Lange: Nomenclator
"Florae Danicae", Hauniae (København) 1887. Heri anfører den sidste
af rækken af Flora Danica-redaktører, Johan Lange, planche for planche dels det navn,
som anføres i Flora Danica, og dels det navn, som var gældende videnskabeligt navn ved
udarbejdelsen af værket i midten af 1880-erne (Nomina emendata). Desuden er der en liste,
som er ordnet efter slægtsforhold og en alfabetisk liste. Nomenclator gengiver gældende
botanisk navngivning og opfattelse ved midten af 1880-erne. Selv om Nomenclator ofte ikke
er i overensstemmelse med den nutidige navngivning og opfattelse, bruges den stadig af
fagbotanikere som nøgle til Flora Danica
Følgende fire navne kan søges fra ca. marts 1998:
- Navnet som anført i Flora Danica. Kilde til dette navn er Lohan Langes Nomenclator.
- Det 'forbedrede' navn (Nomina emendata), fra Johan Langes Nomenclator.
- Det nugældende latinske navn. Som kilde til de nugældende latinske navne bruges Tutin,
T. G., D. M. Moore, G. Halliday & M. Beadle: Flora Europaea, 1-5, 1964-1980.
Hvor redaktørerne af disse navne har været opmærkson på, at der ikke er fuld enighed
om navngivningen af en plante, anføres også alternativ-navn(e).
- Det eller de nugældende danske navn(e). Som kilde til danske navne er alt overvejende
anvendt Mossberg, Bo, Lennart Stenberg & Stefan Ericsson: Den store
nordiske flora. Oversat og bearbejdet af Jon Feilberg og Bernt Løjtnant. København 1994.
For at gøre databasen til et effektivt søgeværktøj for ikke-botanikere indføres
mange populærnavne, også sådanne, som i virkeligheden er fællesbetegnelse for en lang
række arter. Der gøres ikke noget forsøg på at indføre samtlige danske navne i
databasen. Det skal bemærkes, at nogle mindre kendte planter ikke har et dansk navn.
For de højere planters vedkommende (karplanter) er indberetning til databasen af
nugældende videnskabelige navne samt danske navne lagt i hænderne på firmaet Biomedia
og udføres af Jon Feilberg og Henry Nielsen. Under udførelsen af arbejdet er det i
tvivlstilfælde nødvendigt at konsultere den originale tavle fra Flora Danica for at få
en så korrekt bestemmelse af planten som muligt. Selv denne konsultation vil i nogle få
tilfælde ikke kunne løse problemet; dette vil blive noteret i databasen.
Der arbejdes stadig på at få etableret mulighed for at opdatere basen med
videnskabelige og danske navne for de øvrige planter (svampe, mosser, alger m.v.).
Om det anvendte udstyr og programmel
Indholdsfortegnelsen
Til projektet anvendes følgende udstyr:
- Et 4×5" kamera med digitalt bagstykke
- Kort før årsskiftet er der anskaffet et nyt kamera, hvis tekniske løsning letter
digitaliseringsprocessen betydeligt.
- Et digitalt bagstykke, PhaseOne Studio Kit med tilhørende programmel. Kapaciteten er op
til 2.500×3.571 (8,9 millioner) punkter (pixels) pr. farve. Til sammenligning kan en
almindelig VGA skærm med 640×480 punkter vise 307.200 punkter. Bagstykket kan levere
filer på op til 25 Mb.
- Kort før årsskiftet er denne skanner udskiftet med den større skanner, PhaseOne
Powerphase, som har disse specifikationer: Kapacitet op til 7.000×7.000 punkter pr.
farve. Filstørrelse op til 140 MB.
- En pentium PC, 200 Mhz, 96 Mb RAM, 3 Gb harddisk.
- En CD-ROM brænder med tilhørende programmel.
- Adobe Photoshop.
- ALEPH, som er det programmel, DNLB's bibliotekssystem, Cosmos, afvikles under.
- Herudover anvendes standard programmel, fx til at skrive denne tekst i.
Om anvendelsen af programmellet
Indholdsfortegnelsen
- Adobe Photoshop
- Adobe Potoshop bruges primært til at formindske filerne med og til at konvertere de
formindskede filer til JPEG-formatet. Da der er tale om mange filer, drages der nytte af
makrofunktionen "Handlinger".
- Biblioteksprogrammet ALEPH
- DNLB's bibliotekssystem afvikles for tiden under programmet ALEPH. Dette programs
WWW-grænseflade er valgt til billeddatabasen. ALEPH's faciliteter udnyttes bedst muligt.
Der sker direkte fremvisning af billedfilerne ved søgning i ALEPH samtidig med at
oplysningerne om plantenavn, hæfte- og planchenummer m.v. vises frem. Det grafiske udtryk
af WWW-siderne kunne have været bedre, men merabejdet hermed ville langt overskygge
gevinsten i brugen af billeddatabasen. Da der er tale om en billeddatabase, som med tiden
skal rumme andet og mere end billeder af planter, er der valgt generelle beskrivelser af
de enkelte felter. Det er vort håb, at denne generalisering ikke forringer brugen af de
enkelte værker, som med tiden bliver digitaliseret til basen.
Om billedbehandlingen
Indholdsfortegnelsen
Plancherne i Flora Danica bliver efter indskanningen lagret som .TIF-filer. Disse filer
skal dels formindskes og dels konverteres til .JPG-filer inden de bliver lagt ud på
WWW-serveren.
Valget af formindskelsesgrad og billedkompression er resultatet af et kompromis mellem
hensynene til billedkvalitet og praktisk anvendelighed.
- Formindskelse af billederne
- De originale filer formindskes til ca 20% af den oprindelige bredde af billedet. Først
med en så kraftig formindskelse har billedet en størrelse, som tillader en fornuftig
fremvisning på en 1024×768-skærm. Også på en 800×600-skærm vil man kunne se det
meste af billedet, hvorimod opløsningen på standard VGA-skærme (640×480) er så lille,
at man i de fleste tilfælde kun kan have ca. halvdelen af billedet på skærmen. Når den
nye skanner tages i brug, vil de originale filer indeholde flere punkter, hvorfor der skal
vælges en anden (større) formindskelse af billedet; sker det ikke, vil billederne på
WWW blive for store til at være praktisk anvendelige.
- Billedkompression
- Billedkompressionen sker ved hjælp af formatet JPEG. Dette format er et af de for tiden
mest anvendte, og det giver en betydelig formindskelse af filstørrelsen uden
nævneværdig forskel i billedkvalitet. Eksempelvis fylder billedet med engblommen (Trollius
europaeus L.) 11.866 kb i TIF-formatet, mens det samme billede fylder 58 kb i JPEG.
Det betyder meget for den tid det tager at hente billedet.
- Når man gemmer i JPEG, kan man vælge mellem mange kompressionsgrader. Høj kompression
giver mindre filer, men også ringere billedkvalitet. Da billedkvaliteten er meget
væsentlig for dette projekt, har vi valgt en 'lille' kompression. 'Thumbnails', derimod,
komprimeres kraftigt hvorved filerne bliver væsentlige mindre. Det betyder meget når man
browser gennem hæfterne, da der skal hentes 20 thumbnails på hver side.
- De originale filer
- De originale .TIF-filer gemmes ukomprimeret på CD-ROM-plader. Det giver bl.a. mulighed
for at fremstille nye og større billeder til fremvisning via WWW, når
gennemsnitsskærmen om nogle år har større opløsning end i dag, og
transmissionshastighederne er øget. Der kan være mellem 30 og 40 filer på én CD-ROM.
Når det er valgt ikke at bruge nogen form for kompression skyldes det dels, at
filerne så kan læses direkte fra CD-ROM'erne, og dels, at vi undgår risikoen for
datatab.
- Præsentationen af billederne
- Selv om det er god tone i WWW-verdenen at fortælle filstørrelsen på billeder, der
skal nedhentes, og selv om billederne i billeddatabasen typisk har en størrelse på
mellem 60 og 90 kB, har vi valgt ikke at give denne oplysning. Det skyldes, at
oplysningen for samtlige 3.240 plancher i Flora Danica, plus hvad der kommer til, skulle
tilrettes i det øjeblik vi beslutter os for at forbedre billedkvaliteten ved at
nykonvertere de originale filer; det vil være så arbejdskrævende, at det i sig selv
ville være en alvorlig hindring for en nykonvertering.
Om farverne på skærmen
Indholdsfortegnelsen
For at sikre den bedst mulige farvelighed med plancherne i originalværket, publiceres
plancherne med 16 mio. farver. Gengivelsen af de mange farver er i øvrigt ganske
afhængig af modtagerens skærm. Er skærmen indstillet til 256 farver, eller er den
dårligt indstillet, kan farverne afvige meget fra originalerne.
Projektledelse
Indholdsfortegnelsen
Projektmedarbejdere:
Overassistent Ann-Katrine Christoffersen
Fotograf Bent Grøndahl
Bibliotekskonsulent Torsten Schlichtkrull (projektleder)
Overbibliotekar Mette Stockmarr (ledelsesmæssigt ansvarlig)
Samarbejdspartner:
Biomedia ved Jon Feilberg
Botaniske Centralbibliotek har ydet konsulentbistand
Torsten Schlichtkrull, ts@dnlb.dk
© Copyright 1998 Danmarks Natur- og Lægevidenskabelige Bibliotek