Forevisning af Norges program til visning af Noark3, samt overvejelser til program til visning af Noark4
Referat ved Lars Nygaard (N) og Peter Edelholt (DK)
Noark og ArkN3 ved Trond Sirevåg
Noark er den norske standarden for journalførings- og saksbehandlingssystemer til bruk hos offentlige myndigheter. Hovedfokus er rettet mot datastrukturen i systemene. Noark-1 kom i 1984, Noark-2 (utvidelser) i 1987, Noark-3 i 1994 og Noark-4 (med mulighet for elektroniske dokumenter) i 1999. Noark-4 er veldig detaljert, og utgjør i praksis en kravspesifikasjon for Noark4-systemenes overordnede funksjonalitet og dataeksport, bl.a. for produksjon av arkivversjoner. Noark-5 er nå under utarbeidelse og forventes ferdig i 2007. I Noark-5 er integrasjon mellom saksbehandlingssystemer og fagsystemer (offentlige registre/databaser) et hovedpoeng.
Til tross for detaljnivået i standarden har ikke eksporterte data fra Noark3- og Noark4-systemene vist seg å være så standardiserte som forutsatt. Re-import av eksporterte data fra et Noark4-system i et annet Noark4-system fungerer sjelden. Dette er også grunnen til at Elark-avdelingen i det norske Riksarkivet satser på utvikling av egne programmer for import, testing og tilgjengeliggjøring av uttrekk fra Noark3- og Noark4-systemer, henholdsvis ArkN3 og ArkN4.
ArkN3 er utviklet av Petter Svendsen i Elark. Det er programmert i Visual Basic over en Access 2000 database, og kjøres på vanlige PCer under Windows. ArkN3 er primært et program for enkel søking i og fremvisning av saks- og dokumentopplysninger (metadata) i journaldatabasen. Skjermbildene i ArkN3 ligner de tilsvarende i Noark3-systemene. Den forutgående importen utgjør i realiteten også en test av datauttrekket fra Noark3-systemet, bl.a. test av referanseintegritet (fremmed¬nøkler).
En Noark3-database består av fire tabeller. De to hovedtabellene inneholder opplysninger om hhv. saker og journalposter (dokumenter). Videre er det hjelptabeller for arkivkode og for avsendere/mottakere. Bare uttrekk fra det tre førstnevnte tabellene inngår i arkivversjonen. Fremmednøkkelkontrollen i noen av Noark3-systemene er dårlig. Det forekommer også andre variasjoner i uttrekkene fra de ulike systemene. Derfor har vi måttet redusere kravene ved import i ArkN3 (”tolerant import”).
Spørsmål 1: Er Doculive for Noark-3 og Noark-4 lik hverandre? Svar: De har visse likheter i skjermbildene, mener ellers ulike. Spørsmål 2: Var feilene/manglene i arkivuttrekkene fra Noark3-systemene kjent på forhånd? Svar: Noen få var kjent på forhånd (forventet), mens de fleste ble oppdaget ved forsøk på import i ArkN3 og ved test med et annet verktøy.
ArkN4 ved Tony Lærdahl
ArkN4 utvikles i samarbeid mellom Elark og firmaet Linpro AS. Det programmeres i Perl og PHP over en MySQL database og kjøres nå på Linux-servere (Open Source). ArkN4 skal bestå av tre moduler; en testmodul (ferdig), en databaseopplastingsmodul (ferdigstilles høsten 2006) og en søke- og fremvisningsmodul (ikke påbegynt).
Et arkivuttrekk fra et Noark4-system består av 50-95 XML-filer med data fra tabellene i den underliggende databasen, pluss to standardiserte rapporter (også som XML-filer) og eventuelle elektroniske dokumenter (én fil per dokument). Testingen av hver XML-fil skjer ved parsing og validering mot en tilhørende DTD. Også logiske avhengigheter mellom flere filer/tabeller (f.eks. referanseintegritet) kan testes i ArkN4. Testing av XML-filer på til sammen 500 MB vil typisk ta flere timer.
Erfaringene så langt er at det er mye feil også i Noark4-uttrekkene, til tross for at standarden spesifiserer uttrekkene i detalj. Dette skyldes bl.a. problemer ved konvertering fra Noark3-systemer, at Noark4-systemet bruker en avvikende datastruktur internt, og ulike metoder for uttrekk. Som for ArkN3 har vi lagt vekt på å få til en ”tolerant import”, dvs. at systemet kun melder feil ved import og testing uten å stoppe opp. Det er også viktig å kunne velge ”akseptansenivå” ved kjøring av testmodulen i ArkN4, for eksempel ved å skru av og på sjekking av referanseintegritet og datatyper for hver fil/tabell.
ArkN4 har flere potensielle brukergrupper: a) Utviklere av Noark4-systemer, som kan teste uttrekk fra sitt system. b) Arkivskapere (myndigheter), som kan teste sine uttrekk før avlevering til arkivinstitusjonen. c) Arkivinstitusjoner, som kan teste mottatte uttrekk og utnytte dem internt. d) Arkivinstitusjoner, som kan tilgjengeliggjøre uttrykk for publikum på egne medielesesaler eller via Internett.
Spørsmål 3: Sendes uttrekk med avdekkede feil tilbake til arkivskaperen? Svar: Ja, i utgangspunktet, men man kan ikke fortsette å be om nye uttrekk i all evighet. Til slutt må arkivinstitusjonen vurdere å rette opp feilene og dokumentere opprettingen.
Spørsmål 4: Hva skal søke- og fremvisningsmodulen (”vieweren”) i ArkN4 inneholde? Svar: Den vil i utgangspunktet tilby de samme mulighetene som ArkN4, dvs. skjermbilder og rapporter for fremvisning av saksopplysninger og tilhørende journalposter, men med fremvisning av de elektroniske dokumentene i tillegg. Senere kan vieweren utvides med flere funksjoner som det blir etterspørsel etter.Spørsmål 5: Hvilke planer har dere for å la sluttbrukerne ta i bruk ArkN3 og ArkN4 for søking i og utnyttelse av arkivmaterialet? Svar: Dette er meningen for ArkN4, som er web-basert, men det har foreløpig ingen hast, siden nesten alt hittil mottatt Noark-materiale er deponeringer.