Íslenskt textasafn

Umsjónarmaður: Þórdís Úlfarsdóttir

 

Íslenskt textasafn geymir rafræna texta sem nota má til orðaleitar og dæmasöfnunar. Söfnun texta hófst í kringum 1990 á vegum Orðabókar Háskólans, m.a. í tengslum við gerð Íslenskrar orðtíðnibókar (útg. 1992). Síðan hefur safnið vaxið jafnt og þétt og nú eru þar um 60 milljónir lesmálsorða.

Árið 2004 var tekinn í notkun vefaðgangur að safninu. Almennur aðgangur til leitar í safninu er takmarkaður við texta sem vegna aldurs síns eða eðlis eru ekki háðir höfundarrétti og texta sem leyfi hefur fengist til að nota í opinni leit. Hver sem er getur leitað í t.d. ýmsum fornritum, þ. á m. Íslendingasögum, í Lagasafninu, Biblíunni, dagblaðatextum, skáldritum og fleiri textum.

Í textasafninu eru gamlir og nýir textar af ýmsum toga, flestir þó útgefnir um 1985 eða síðar. Þeir eru flokkaðir eftir aldri, tegund og efni textanna í um 30 flokka, t.d. fornrit, trúmál, skáldverk, sagnfræði, raungreinar og dagblöð.

Textasafnið er mikilvægur efniviður við orðabókagerð og málfræðirannsóknir. Það nýtist t.d. þeim sem fást við rannsóknir á beygingu orða og setningagerð og er einnig grundvöllur ýmiss konar rannsókna á orðaforðanum, þ.á m. orðtíðnirannsókna.

Margir hafa lagt Orðabókinni lið við öflun texta, einkum forlög og prentsmiðjur, en auk þeirra má m.a. nefna Blindrabókasafnið, Netútgáfuna og Morgunblaðið.

Flokkuð skrá yfir texta í safninu.