O metapodatkih

Tukaj boste našli informacije o tem, katere metapodatke potrebujemo in kako jih razširjamo. Metapodatki so prosto dostopni in v javni lasti (pod licenco CC0). Pridržujemo si pravico do obveščenosti o komercialni rabi metapodatkov iz repozitorija CLARIN.SI in namenu njihove uporabe, ki jih sporočite na Pomoč uporabnikom.



Formati metapodatkov

Med postopkom vnašanja v repozitorij uporabniki izpolnijo metapodatkovna polja, ki se shranijo kot del zapisa. Metapodatke vnosov lahko razširjamo v različnih formatih, vključno s (vendar ne omejeno na) formatoma CMDI in oai_dc. Oglejte si seznam vseh podprtih formatov, vendar bodite pozorni, saj pri določenih vnosih nekaterih formatov ni možno uporabiti. Različni formati pomagajo pri promoviranju podatkov v številnih agregatorjih (in/ali spletnih iskalnikih)

CMDI

Za več informacij si preberite CLARIN-ov uvod v komponentne metapodatke.

Trenutni vnosi v repozitorij sledijo profilu/shemi clarin.eu:cr1:p_1403526079380.

Ta profil je dobro opremljen s povezavami do registra pojmov.

oai_dc

Uporabo formata oai_dc zahteva protokol OAI-PMH. O tem, kako vnose preslikamo v ta format, lahko preberete v poglavju o preslikavi metapodatkov.


Vneseni metapodatki

Spodnji seznam prikazuje vsa polja, ki se pojavijo med postopkom vnašanja v repozitorij. Seznam se bo zelo verjetno še spreminjal. Metapodatki se vnašajo v angleščini. Različni formati vsebujejo različno ustvarjene metapodatke (na primer imena v človeku razumljivem jeziku, ki spremljajo oznake ISO, identifikatorje ali druge podatke).

Ime polja Opis Status
Vrsta Vrsta vira: »Korpus" zajema besedilne, govorne in multimodalne korpuse. »Leksikalnokonceptualni vir« obsega leksikone, ontologije, slovarje, sezname besed itd. "Jezikovni opis" pokriva jezikovne modele in slovnice. "Tehnologija/orodje/storitev" se uporablja za orodja, sisteme, komponente sistemov itd. obvezno
Naslov Glavni naslov vnosa. obvezno
URL projekta Naslov URL vira/projekta, povezanega z vnosom (na primer spletna stran projekta). Nadzorovano z regularnimi izrazi (regexp, začne se s http/https). nadzorovano z regexp
Demo URL Demo, vzorci ali pri orodjih URL vzorčnega izhoda. Nadzorovano z regularnimi izrazi (regexp, začne se s http/https). nadzorovano z regexp
Datum objave Datum morebitne objave vnesenih podatkov, na primer 2014-01-21 ali vsaj leto. obvezno
Avtor Imena avtorjev vnosa. V primeru zbirk (na primer korpusov ali drugih večjih besedilnih baz) je priporočljivo vnesti imena ljudi, ki so sodelovali pri pripravi celotne zbirke, in ne avtorjev posameznih del. Osebna imena se shranjujejo na način priimek, vejica, ime (na primer "Smith, John Jr."). obvezno ponavljajoče
Založnik Ime organizacije/organa, ki je objavila katerokoli predhodno različico vnosa, ali ime matične institucije. obvezno ponavljajoče
Kontaktna oseba Oseba, na katero se obrnete v primeru težav z vnosom. Nekdo, ki lahko priskrbi informacije o viru, na primer eden izmed avtorjev vira ali avtor vnosa. Shranjeno kot strukturiran niz, ki zajema ime, priimek, e-poštni naslov in matično institucijo. obvezno ponavljajoče
Financiranje Sponzorji, ki so financirali delo, opisano v vnosu. Shranjeno kot strukturiran niz, ki zajema ime projekta, oznako projekta, financerja, vrsto sredstev (lastna/državna/evropska) in identifikator OpenAIRE (ta se shrani tudi v dc.relation) ponavljajoče
Opis Besedilni opis vnosa. obvezno
Jezik Jezik(i) glavne vsebine vnosa. Shranjeno kot oznaka ISO 639-3. Obvezno za korpuse, leksikalnokonceptualne vire in jezikovne opise. ponavljajoče obvezno glede na vrsto vira
Ključne besede Ključne besede, povezane z vsebino vnosa. ponavljajoče obvezno
Velikost Obseg vnesenih podatkov, na primer število pojavnic ali datotek. ponavljajoče
Vrsta medija Medij glavne vsebine vnosa, na primer besedilo ali zvočni zapis. Spustni seznam, obvezno za korpuse, jezikovne opise in leksikalnokonceptualne vire. spustni seznam obvezno glede na vrsto vira
Podrobneje o vrsti Podrobnejša klasifikacija vrste vira. Spustni seznam, obvezno za orodja, jezikovne opise in leksikalne konceptualne vire. spustni seznam obvezno glede na vrsto vira
Odvisnost od jezika Boolova vrednost, ki prikazuje, ali je določeno orodje/storitev odvisna od jezika. Obvezno za orodja. obvezno glede na vrsto orodja

Preslikava metapodatkov

Spodnja tabela prikazuje preslikavo vnosa v format oai_dc. Navedena so tudi nekatera pomembnejša polja, ki se ustvarijo samodejno.

Polje vnosa Preslikano polje
Vrsta dc.type
Naslov dc.title
URL projekta dc.source
Demo URL ni preslikano
Datum objave dc.date
Avtor dc.creator
Založnik dc.publisher
Kontaktna oseba ni preslikano
Financiranje ni preslikano
Opis dc.description
Jezik dc.language
Ključne besede dc.subject
Velikost ni preslikano
Vrsta medija ni preslikano
Podrobneje o vrsti ni preslikano
Samodejno ustvarjeno polje Opis
dc.identifier PID vira (trenutno handle).
dc.rights Ponavljajoče polje, ki lahko vsebuje ime licence, s katero so določeni pogoji distribucije vira, naslov URL do celotnega besedila licence in tako imenovano oznako (PUB, ACA, RES).