Universitetet i Bergen : Doktorgrader : 2000 NY DOKTORGRAD Tekstsammendrag ved hjelp av datamaskin"Lexical cohesion-based text condensation. An evaluation of automatically produced summaries of research articles by comparison with author-written abstracts" Avhandlingen har to siktemål: Det første er å bidra til beskrivelsen av hvordan vitenskapelig tekst er strukturert, mens det andre er å vurdere om det er mulig å produsere et akseptabelt sammendrag av en vitenskapelig tekst ved hjelp av et dataprogram. Dette programmet er brukt til å produsere sammendrag som er analysert i avhandlingen. Det er utviklet ved University of Surrey, England og er blitt videreutviklet og testet i samarbeid med doktoranden. Programmet er knyttet til en teori om at såkalte ikke-narrative tekster – som f.eks. vitenskapelige artikler – er organisert ved hjelp av leksikalske mønster i teksten. Det identifiserer setninger som har et visst antall leksikalske enheter til felles. Artiklene som utgjør materialet i arbeidet er hentet fra det naturvitenskapelige området. De er skrevet av eksperter og for eksperter. Avhandlingen evaluerer om setningene som programmet plukker ut kan sies å representere et akseptabelt sammendrag av teksten. Oppfattelsen av hva som er et godt sammendrag av en gitt tekst kan variere fra person/situasjon til person/situasjon. I avhandlingen benyttes artikkelforfatterens eget sammendrag (abstract) som mal ved evalueringen av de datamaskin-genererte sammendragene. Resultatene av analysen indikerer at repetisjon av leksikalske enheter spiller en viktig rolle i oppbyggingen av vitenskapelige tekster, og at man ved hjelp av et dataprogram bygget på denne viten kan produsere sammendrag som gir en god indikasjon på hva teksten handler om. I noen tilfeller er sammendragene av så høy kvalitet at de kan erstatte forfatterens abstract. Personalia: Tidspunkt og sted for disputasen: Kontaktpersoner: |