Leddeling i Ordbanken - prinsipp og metode (innlegg på dugnadsgruppe 5)
Samansetningar utgjer ein stor og uavgrensa del av ordtilfanget i norsk, ettersom ein
alltid kan lage nye samansetningar. Etter arbeid i tidsrommet 2012 til 2015 ligg det
no føre informasjon om samansetjingsstatus for alle lemma i Ordbanken for Bokmål
og Nynorsk. Lemmainventaret på til saman over 120 000 lemma i nynorsk og over
160 000 lemma i bokmål er plassert i to hovudgrupper, simpleksord og toledda
samansetningar. Den siste gruppa har fått delepunkt og ei grammatisk tagging av
kvart ledd. Berre hovudfuga er markert i lemma som har tre eller fleire ledd, som t.d.
havfiske|flåte. Størstedelen av samansetningane er leksikalisert materiale, noko er
meir tilfeldige samansetningar.
Leddanalysearbeidet behandlar praktisk kvar grensene går i overgangen mellom
samansetningar, ordliknande etterledd og forledd, og reine affiks. Dette kan brukast
til teoriutvikling innanfor morfologi og semantikk. “Eingongsorda” er også viktige
vitne om orddanningsprosessane. Andre problemstillingar gjeld den
språkteknologiske sida av leddanalysen: Kan dette brukast i arbeidet med å lage ein
(betre) maskinell leddanalysator? Kan det vere nyttig for talesyntese? For å unngå
stavekontrollar som gir raud strek på samansette ord?
Eg vil i min presentasjon gå inn på bakgrunnen for leddelingsarbeidet, og vise
kva problem vi støytte på og korleis vi løyste dei. Vi hadde nytte av Faarlund,
Lie, og Vannebo (1997), Leira (1992), og Beito (1970) i dette arbeidet, men måtte
ofte ta avgjerder basert på materialet slik det framstod og den ordboksmessige
bruken leddanalysen skulle ha.
Eg fokuserer på to problemområde i analysearbeidet: tagging av førsteleddet
og samansette adjektiv.
Aasen, Ivar. 1864. Norsk grammatik. Omarbeidet Udgave af "Det norske Folkesprogs
Grammatik". Christiania: B.T. Mallings Forlagsboghandel.
Beito, Olav T. 1970. Nynorsk grammatikk: Lyd og ordlære. Oslo: Det norske
samlaget.
Faarlund, Jan Terje, Svein Lie, og Kjell Ivar Vannebo. 1997. Norsk
Referansegrammatikk. Oslo: Universitetsforlaget.
Leira, Vigleik. 1992. Ordlaging og ordelement i norsk. Oslo: Det Norske Samlaget.
alltid kan lage nye samansetningar. Etter arbeid i tidsrommet 2012 til 2015 ligg det
no føre informasjon om samansetjingsstatus for alle lemma i Ordbanken for Bokmål
og Nynorsk. Lemmainventaret på til saman over 120 000 lemma i nynorsk og over
160 000 lemma i bokmål er plassert i to hovudgrupper, simpleksord og toledda
samansetningar. Den siste gruppa har fått delepunkt og ei grammatisk tagging av
kvart ledd. Berre hovudfuga er markert i lemma som har tre eller fleire ledd, som t.d.
havfiske|flåte. Størstedelen av samansetningane er leksikalisert materiale, noko er
meir tilfeldige samansetningar.
Leddanalysearbeidet behandlar praktisk kvar grensene går i overgangen mellom
samansetningar, ordliknande etterledd og forledd, og reine affiks. Dette kan brukast
til teoriutvikling innanfor morfologi og semantikk. “Eingongsorda” er også viktige
vitne om orddanningsprosessane. Andre problemstillingar gjeld den
språkteknologiske sida av leddanalysen: Kan dette brukast i arbeidet med å lage ein
(betre) maskinell leddanalysator? Kan det vere nyttig for talesyntese? For å unngå
stavekontrollar som gir raud strek på samansette ord?
Eg vil i min presentasjon gå inn på bakgrunnen for leddelingsarbeidet, og vise
kva problem vi støytte på og korleis vi løyste dei. Vi hadde nytte av Faarlund,
Lie, og Vannebo (1997), Leira (1992), og Beito (1970) i dette arbeidet, men måtte
ofte ta avgjerder basert på materialet slik det framstod og den ordboksmessige
bruken leddanalysen skulle ha.
Eg fokuserer på to problemområde i analysearbeidet: tagging av førsteleddet
og samansette adjektiv.
Aasen, Ivar. 1864. Norsk grammatik. Omarbeidet Udgave af "Det norske Folkesprogs
Grammatik". Christiania: B.T. Mallings Forlagsboghandel.
Beito, Olav T. 1970. Nynorsk grammatikk: Lyd og ordlære. Oslo: Det norske
samlaget.
Faarlund, Jan Terje, Svein Lie, og Kjell Ivar Vannebo. 1997. Norsk
Referansegrammatikk. Oslo: Universitetsforlaget.
Leira, Vigleik. 1992. Ordlaging og ordelement i norsk. Oslo: Det Norske Samlaget.
Publisert i 16. Møte Om Norsk Språk, 2015
Les artikkelen her