Infootsing andmebaasides
Vilve Seiler

2. Päringu koostamine

Päringu sõnastamisel on oluline otsingusõnade oskuslik kombineerimine, kasutades erinevaid tehnikaid, et piiritleda teema võimalikult selgelt ja täpselt. Otsingusõnade kombineerimiseks saab kasutada järgmisi tehnikaid.


2.1. Boole’i loogikaoperaatorid

Ühendades otsisõnu Boole’i loogikaoperaatoritega AND, OR või NOT saab otsingut piirata või laiendada.

AND
piirab otsingut, päringus sellega ühendatud sõnad peavad kõik leitavates dokumentides esinema.

Näide
television and violence – leitakse dokumendid, kus esinevad nii sõna television kui ka violence.

OR laiendab otsingut, leitavates dokumentides peab esinema kas üks või teine (vähemalt üks) päringus operaatoriga or ühendatud sõnadest.

Näide
violence or aggression – leitakse artiklid, kus esinevad ainult violence, ainult aggression, või nii violence kui ka aggression

Operaatoriga OR on otstarbekas ühendada

sünonüüme
student or pupil
erineva kirjaviisiga sõnu
organization or organisation
sarnase tähendusega / seotud sõnu ja fraase
children or adolescents
antisocial behavior or deviant behavior
antisocial or criminal

NOT kitsendab otsingut, esimene sõna peab esinema, teine ei tohi esineda. Nii saab välistada mõne sõna esinemist leitavates artiklites.

Näide
antisocial not criminal - leitakse dokumendid, kus esineb sõna antisocial, kuid jäetakse välja dokumendid, kus esineb sõna criminal.


2.2. Lähedusoperaatorid

Paljudes andmebaasides on kasutusel ka lähedusoperaatorid (NEAR, ADJ jne), mille abil saab täpsemini otsida, kuna saab ette anda, kui lähedal peavad otsitavad sõnad tekstis üksteisele olema. Nii on suurem tõenäosus, et otsitavad sõnad esinevad samas kontekstis. Sageli on otstarbekas asendada operaator AND lähedusoperaatoriga.

Näide
media N3 violence
leitakse dokumendid, kus sõnad media ja violence esinevad teineteisest 3 sõna kaugusel olenemata järjekorrast, nii leitakse nii media violence kui ka violence in media.

Lähedusoperaatorid ja nende funktsioonid võivad erinevates andmebaasides olla erinevad. Seetõttu tuleks andmebaasi esmakordsel kasutamisel kindlasti kasutada andmebaasi HELP funktsiooni võimalust, et need asjad üle vaadata.


2.3. Fraasiotsing

Otsitakse mingi kindlat väljendit või lauset sisaldavaid dokumente. Päringu esitamisel tuleb otsitav fraas tavaliselt panna jutumärkidesse.

Näide „media violence“
Leitakse dokumendid, kus on täpselt selline fraas.

Kui on tõenäoline, et samasisuline fraas võib esineda erineval kujul või kui te ei oska kindlat fraasi moodustada, kasutage samade sõnadega lähedusoperaatoritega otsingut.

Sageli otsitakse mitut sõna koos ka ilma jutumärkidesse panemata automaatselt kui fraasi, mõnikord aga ühendatakse need hoopis operaatoriga AND, st kõik peavad esinema olenemata asukohast. Enne otsingut või otsingu käigus peate veenduma, milline variant toimib.


2.4. Kärpimine ja maskimine

Kärpimine (ingl k truncation) võimaldab otsida samatüvelisi erinevate lõppudega sõnu.
Suvaline arv tähemärke sõna lõpus või ka alguses asendatakse sümboliga, enamasti on kasutusel * (tärn) või ? (küsimärk).

Näide:
question* leitakse ka questions, questioning
child* leitakse ka children, childhood

Sisuliselt asendab see erinevate vormide ühendamist operaatoriga OR.
Mõelge järele, millise tähe juurest on kõige otstarbekam sõna katkestada ja asendada lõpp sümboliga / metamärgiga. Kui panna metamärk liiga vara, võite saada palju mitterelevantseid tulemusi, kui liiga hilja, jäävad mõned sõnad otsingust välja (adolescent* - leitakse ka adolescents, kuid mitte adolescence, teacher* - ei leita teaching).


Maskimine (ingl k masking)
Sõna sees kasutatakse sümbolit tähe asemel, kui on võimalik kasutada erinevat kirjaviisi või kui te ei ole kindel, kuidas sõna täpselt kirjutatakse või kui tahate leida korraga mõlema tähega sõnu.

Näide
organi?ation - leitakse nii organization kui organisation
wom?n – leitakse nii woman kui women

Nende sümbolite kasutamine erinevates andmebaasides on erinev. Tutvuge iga andmebaasi puhul kindlasti eraldi selles kasutatavate metamärkidega.


2.5. Sulgude kasutamine päringu struktureerimiseks ehk pesastamine

Kui te kasutate ühes päringus erinevaid operaatoreid, tuleb arvestada, et operaatoritega NOT ja AND ühendatud avaldisi otsitakse enne, OR jääb kõige viimaseks. Seega, kui soovite seda järjekorda muuta, tuleb kasutada sulge. Sulgudes olevat avaldist otsitakse enne.

Näide.

Kasutades eelpool toodud otsingusõnade tabelit, ühendame sünonüümid ja sarnase tähendusega sõnad operaatoriga OR, eraldame need grupid sulgudega ning ühendame operaatoriga AND, et leida nende kõigi ühisosa. Kasutame ka kärpimist, et ei peaks välja kirjutama kõiki sama tüvega erinevate lõppudega sõnu.

(aggression or violence) and (tv or television) and (adolescen* or teenager*)


<< Eelmine Järgmine >>