Tesourus (herwinning van inligting)
In die konteks van die inwin van inligting is 'n tesourus (meervoud: "thesauri") 'n vorm van beheerde woordeskat wat daarop gemik is om semantiese manifestasies van metadata te dikteer in die indeksering van inhoudsvoorwerpe. 'N Tesourus dien om semantiese dubbelsinnigheid te minimaliseer deur eenvormigheid en konsekwentheid in die stoor en herwinning van die manifestasies van inhoudsvoorwerpe te verseker. ANSI / NISO Z39.19-2005 definieer 'n inhoudsobjek as "enige item wat beskryf moet word vir opname in 'n inligtingstelsel, webwerf of ander inligtingsbron". [1] Die tesourus help met die toekenning van voorkeurterme om semantiese metadata oor te dra wat verband hou met die inhoudsvoorwerp. [2]
'N Tesourus dien om 'n indekseerder en 'n soeker te lei in die keuse van dieselfde voorkeurterm of kombinasie van voorkeurterme om 'n gegewe onderwerp voor te stel. ISO 25964 , die internasionale standaard vir die herwin van tesourie vir inligting, definieer 'n tesourus as 'n 'beheerde en gestruktureerde woordeskat waarin begrippe deur terme voorgestel word, so georganiseer dat verwantskappe tussen begrippe eksplisiet gemaak word, en voorkeurterme vergesel word van inleidingsinskrywings vir sinonieme of kwasi-sinonieme. ”
'N Tesourus bestaan uit minstens drie elemente: 1 - 'n lys woorde (of terme), 2 - die verhouding tussen die woorde (of terme), aangedui deur hul hiërargiese relatiewe posisie (bv. Ouer / breër term; kind / smaller term , sinoniem, ens.), 3-'n stel reëls oor hoe om die tesourus te gebruik.
Geskiedenis
Oral waar daar groot versameling inligting was, hetsy op papier of op rekenaars, het geleerdes voor 'n uitdaging te staan gekom om die items wat hulle soek, vas te stel. Die gebruik van klassifikasieskemas om die dokumente in volgorde te rangskik, was slegs 'n gedeeltelike oplossing. 'N Ander benadering was om die inhoud van die dokumente met behulp van woorde of terme te indekseer, eerder as klassifikasiekodes. In die veertiger- en vyftigerjare het sommige pioniers, soos Calvin Mooers , Charles L. Bernier, Evan J. Crane en Hans Peter Luhn , hul indeksvoorwaardes versamel in verskillende soorte lys wat hulle 'n 'tesourus' genoem het (na analogie van die put bekende tesourus ontwikkel deur Peter Roget ). [3] Die eerste lys wat ernstig gebruik is om inligting in te win, was die tesourus wat in 1959 by die EI Dupont de Nemours Company ontwikkel is. [4] [5]
Die eerste twee van hierdie lyste wat gepubliseer is, was die Thesaurus of ASTIA Descriptors (1960) en die Chemical Engineering Thesaurus van die American Institute of Chemical Engineers (1961), 'n afstammeling van die Dupont-tesourus. Meer het gevolg, wat uitgeloop het op die invloedryke Tesourus of Engineering and Scientific Terms (TEST) wat in 1967 gesamentlik deur die Engineers Joint Council en die Amerikaanse departement van verdediging gepubliseer is. TEST het meer as net as voorbeeld gedien; sy aanhangsel 1 bevat tesourusreëls en -konvensies wat sedertdien die tesourus-konstruksie gelei het. Honderde tesourusse is sedertdien vervaardig, miskien duisende. Die opvallendste innovasies sedert TEST was: (a) Uitbreiding van eentalige na veeltalige vermoëns; en (b) toevoeging van 'n konseptueel georganiseerde uitstalling tot die basiese alfabetiese aanbieding.
Hier noem ons slegs enkele van die nasionale en internasionale standaarde wat geleidelik voortgebou het op die basiese reëls soos uiteengesit in TEST:
- UNESCO- riglyne vir die daarstelling en ontwikkeling van eentalige tesourusse . 1970 (gevolg deur latere uitgawes in 1971 en 1981)
- DIN 1463 Riglyne vir die daarstelling en ontwikkeling van eentalige tesourusse . 1972 (gevolg deur latere uitgawes)
- ISO 2788 Riglyne vir die daarstelling en ontwikkeling van eentalige tesourusse . 1974 (hersien 1986)
- ANSI Amerikaanse nasionale standaard vir die struktuur, konstruksie en gebruik van die tesourus . 1974 (hersien 1980 en vervang deur ANSI / NISO Z39.19-1993)
- ISO 5964 Riglyne vir die daarstelling en ontwikkeling van veeltalige tesourusse . 1985
- ANSI / NISO Z39.19 Riglyne vir die konstruksie, formaat en bestuur van eentalige tesourusse . 1993 (hersiene 2005 en herdoop tot Riglyne vir die konstruksie, formaat en bestuur van eentalige beheerde woordeskat .)
- ISO 25964 tesourie en interoperabiliteit met ander woordeskat . Deel 1 ( Thesauri vir die inwin van inligting ) gepubliseer 2011; Deel 2 ( Interoperabiliteit met ander woordeskat ) gepubliseer 2013.
Die duidelikste sigbare tendens in hierdie geskiedenis van die ontwikkeling van die tesourus was vanaf die konteks van kleinskaalse isolasie tot 'n netwerk in 'n netwerk. [6] Toegang tot inligting is veral verbeter toe tesourusse die kloof tussen eentalige en meertalige toepassings oorgesteek het. Meer onlangs, soos blyk uit die titels van die nuutste ISO- en NISO-standaarde, is daar die erkenning dat tesourusse moet saamwerk met ander vorme van woordeskat of kennisorganisasie, soos vakopskrifskemas, klassifikasieskema's, taksonomieë en ontologieë. Die amptelike webwerf vir ISO 25964 bevat meer inligting, insluitend 'n leeslys. [7]
Doel
By die inwin van inligting kan 'n tesourus gebruik word as 'n vorm van beheerde woordeskat om te help met die indeksering van toepaslike metadata vir entiteite wat inligting dra. 'N Tesourus help om die manifestasies van 'n konsep op 'n voorgeskrewe manier uit te druk, om die akkuraatheid en herinnering te verbeter . Dit beteken dat die semantiese konseptuele uitdrukkings van inligtingdraende entiteite makliker opgespoor kan word as gevolg van die eenvormigheid van die taal. Daarbenewens word 'n tesourus gebruik vir die handhawing van 'n hiërargiese lys van terme, gewoonlik enkele woorde of gebonde frases, wat die indekseerder help om die terme te verskraal en semantiese dubbelsinnigheid te beperk.
Die Art & Architecture Thesaurus word byvoorbeeld deur talle museums regoor die wêreld gebruik om hul versamelings te katalogiseer. AGROVOC , die tesourus van die VN se Voedsel- en Landbou-organisasie , word gebruik om sy AGRIS-databasis van wêreldwye literatuur oor landbounavorsing te indekseer en / of te deursoek.
Struktuur
Tesourusse vir die inwin van inligting word formeel georganiseer sodat die bestaande verhoudings tussen konsepte duidelik word. "Sitrusvrugte" kan byvoorbeeld gekoppel wees aan die breër konsep van "vrugte" en aan die smaller van "lemoene", "suurlemoene", ens. As die terme aanlyn vertoon word, is die skakels tussen hulle baie maklik om blaai deur die tesourus en kies nuttige terme vir 'n soektog. Wanneer 'n enkele term meer as een betekenis kan hê, soos tabelle (meubels) of tabelle (data), word dit afsonderlik gelys sodat die gebruiker kan kies na watter konsep hy wil soek en om irrelevante resultate te verkry, vermy. Vir een of ander konsep word alle bekende sinonieme gelys, soos "mal koesiekte", "boviene spongiforme enkefalopatie", "BSE", ens. Die idee is om al die indeksers en al die soekers te lei om dieselfde term vir die dieselfde konsep, sodat soekresultate so volledig moontlik sal wees. As die tesourus meertalig is, word ekwivalente terme in ander tale ook getoon. Na aanleiding van internasionale standaarde word konsepte gewoonlik hiërargies gerangskik binne fasette of gegroepeer volgens temas of onderwerpe. Anders as 'n algemene tesourus wat vir literêre doeleindes gebruik word, fokus tesourusse op informasie-herwinning gewoonlik op een vakgebied, vak of vakgebied.
Sien ook
Verwysings
- ^ ANSI & NISO 2005, Riglyne vir die konstruksie, formaat en bestuur van eentalige beheerde woordeskat, NISO, Maryland, VSA, p.11
- ^ ANSI & NISO 2005, Riglyne vir die konstruksie, formaat en bestuur van eentalige beheerde woordeskat, NISO, Maryland, VSA, p.12
- ^ Roberts, N. Die voorgeskiedenis van die tesourus vir die inwin van inligting. Tydskrif vir Dokumentasie , 40 (4), 1984, p.271-285.
- ^ Aitchison, J. en Dextre Clarke, S. The thesaurus: a historical viewpoint, with a look to the future. Katalogisering en klassifikasie kwartaalliks , 37 (3/4), 2004, p.5-21.
- ^ Krooks, DA en Lancaster, FW Die ontwikkeling van riglyne vir die samestelling van die tesourus. Libri , 43 (4), 1993, p.326-342.
- ^ Dextre Clarke, Stella G. en Zeng, Marcia Lei. Van ISO 2788 tot ISO 25964: die evolusie van tesourusstandaarde in die rigting van interoperabiliteit en datamodellering Inligtingstandaarde kwartaalliks , 24 (1), 2012, p.20-26.
- ^ ISO 25964 - die internasionale standaard vir tesourie en interoperabiliteit met ander woordeskat. Nasionale Organisasie vir Standaarde vir Inligting, 2013.
Eksterne skakels
- Amptelike webwerf vir ISO 25964
- TemaTres - Webtoepassing vir formele voorstellings van kennis, tesourie, taksonomie en veeltalige woordeskat vir bestuur
- Taksonomie-pakhuis
- BARTOC , Basel Register of Thesaurs, Ontologies & Classification.