Málvinnsla Stofnun Árna Magnússonar í íslenskum fræðum

Mörkun og lemmun

Vinnur úr texta. Vinsamlegast bíðið...

Markari: ABLTagger Heimild

Mörkunartól, eða málfræðilegir markarar (e. Part-of-Speech tagger), lesa inn texta og marka hvern tóka með textatreng sem segir til um orðflokk og t.d. fall, kyn og tíð, eftir því sem við á.

Hér er nýttur markarinn ABLTagger 3.0. Honum er viðhaldið af Mál- og raddtæknistofu Gervigreindarseturs HR (CADIA-LVL). Grundvöllur þessa tóls var tauganetsmarkarinn ABLTagger 1.0. Hann var upphaflega þróaður af Steinþóri Steingrímssyni, Örvari Kárasyni og Hrafni Loftssyni vorið 2019.

Lemmari: Nefnir Heimild

Á þessari síður eru mörkuð orð send áfram á í lemmald, eða lemmara (e. lemmatizer). Lemmari les inn markaðan texta og lemmar hann, þ.e. skráir uppflettimynd (lemmu) við hvert orð (t.d. hestur fyrir hests).

Lemmur orða eru sóttar með Nefni, sem var þróaður af Jóni Friðriki Daðasyni.

Málgreiningartól