Jak vyhledávat v databázích

Přestože má téměř každá databáze / elektronický zdroj vlastní vyhledávací rozhraní, stačí znát základní / běžné vyhledávací techniky, abyste byli schopni sestavit úspěšný vyhledávací dotaz v kterémkoliv prostředí.

Booleovské operátory tvoří základ databázové logiky a v případě vyhledávání Vám umožňují propojit klíčová slova tak, že Váš dotaz buď rozšíří nebo zúží záběr vyhledávání.

Existují tři základní booleovské operátory: AND, OR, NOT

AND (a zároveň)

  • Operátor AND nám umožňuje zúžit vyhledávání.
  • Používá se tehdy, když hledáte pouze takové záznamy, které obsahují všechna uvedená klíčová slova.
  • Příklad: cancer AND lung AND obesity –> vyhledávám záznamy, kde se vyskytuje slovo „cancer“ a zároveň „lung“ a zároveň „obesity“

OR (nebo)

  • Operátor OR nám umožňuje rozšířit vyhledávání.
  • Používá se tehdy, když hledáme záznamy obsahující jedno nebo druhé klíčové slovo nebo jejich kombinaci.
  • Příklad: cancer OR tumor OR neoplasm –> vyhledá záznamy, kde se vyskytuje slovo „cancer“ nebo „tumor“ nebo „neoplasm“ nebo jejich kombinace

NOT (ne)

  • Operátor NOT nám umožňuje zúžit vyhledávání.
  • Používá se tehdy, když potřebujeme z vyhledávání vyloučit určité klíčové slovo.
  • Příklad: cancer NOT lung –> vyhledá záznamy, kde se vyskytuje slovo „cancer“, ale ne „lung“

Databáze vyhledá přesně to, co do vyhledávacího pole zadáte. Je proto potřeba dbát na správné logické pořadí, ve kterém jsou klíčová slova poskládána a propojena booleovskými operátory. Pokud sestavujete dotaz pomocí operátoru AND a zároveň užíváte OR, nezapomeňte klíčová slova spojena OR dát do závorek.

  • Příklad 1: (cancer OR tumor) AND lung –> vyhledá záznamy, kde se vyskytuje slovo „cancer“ nebo „tumor“ nebo jejich kombinace a zároveň se vždy vyskytuje slovo „lung“
  • Příklad 2: (cancer OR tumor) AND (kidney OR renal) –> vyhledá záznamy, kde se vyskytuje slovo nebo kombinace slov „cancer“ nebo „tumor“ a zároveň slovo nebo kombinace slov „kidney“ nebo „renal“

V některých databázích se místo AND, OR, NOT můžete setkat s náhradou v podobě znaků + & (AND), – | (OR), ! (NOT).

Řada databází umožňuje využití tzv. proximitních operátorů, kterými můžeme specifikovat vzájemnou blízkost zadaných klíčových slov (např. jak daleko jsou od sebe).

NEAR (N#)

  • Operátor NEAR nám umožňuje konkretizovat, jak daleko mohou být v záznamu klíčová slova od sebe vzdálená, bez ohledu na jejich pořadí.
  • Maximální vzdálenost (počet slov) určíme nahrazením znaku # číslicí.
  • Příklad 1: lung N2 tumor –> vyhledá záznamy obsahující uvedená klíčová slova v jakémkoliv pořadí vzdálená od sebe maximálně o 2 jiná slova (např. „lung tumor“, „lung carcinoid tumor“, „tumor of lung“ atd.)

WITHIN (W#)

  • Operátor WITHIN nám umožňuje konkretizovat, jak daleko mohou být v záznamu klíčová slova od sebe vzdálená při zachování stanoveného pořadí.
  • Maximální vzdálenost (počet slov) určíme nahrazením znaku # číslicí.
  • Příklad 1: lung W2 tumor –> vyhledá záznamy obsahující klíčová slova v uvedeném pořadí vzdálená od sebe maximálně o 2 jiná slova (např. „lung tumor“, „lung carcinoid tumor“ atd., ale již ne „tumor of lung“)

Nabídka a způsob zápisu proximitních operátorů se v jednotlivých rozhraních může lišit. Některá rozhraní např. využívají proximitní operátor ADJACENT, FOLLOWED BY, PARAGRAPH atd. Pro upřesnění je vždy potřeba před vyhledáváním nahlédnout do nápovědy / help stránky dané databáze.

Při vyhledávání můžeme využít mj. také zástupné znaky.

? (otazník)

  • Otazník nám umožňuje nahrazení jednoho písmene ve slově.
  • V angličtině je pro tento znak někdy používáno označení Wildcards.
  • Příklad: wom?n –> vyhledá záznamy, kde se vyskytuje slovo „woman“ i „women“

* (hvězdička)

  • Hvězdička se využívá pro tzv. pravostranné krácení.
  • Umožňuje nám nahradit jedno a více písmen. V praxi tedy stačí uvést kořen slova následovaný hvězdičkou a databáze vyhledá všechny varianty slova obsahující daný kořen.
  • V angličtině je pro tento znak někdy používáno označení Truncation.
  • Příklad: child* –> vyhledá záznamy, kde se vyskytuje slovo „child“, „children“, „childhood“ atd.

V některých rozhraních se pro zástupné a krátící znaky používá vykřičník (!) nebo dolar ($), proto je potřeba před vyhledáváním nahlédnout do nápovědy / help stránky dané databáze.

Vyhledáváme-li v databázi pomocí víceslovného klíčové slova (např. cerebral palsy), mohou si zadaný vyhledávací dotaz jednotlivé databáze interpretovat různě. Některá rozhraní dotaz interpretují jako frázi a hledají v záznamech přesně takový výraz, jaký zadáváme. Jiná rozhraní automaticky doplní mezi jednotlivá slova operátor AND a hledají záznamy, kde jsou všechna slova přítomna, ale ne nutně u sebe a v uvedeném pořadí.

Chceme-li vyhledat víceslovné klíčové slovo nebo určitou frázi, lze použít uvozovky. Databáze následně vyhledává výraz tak, jak jsme jej zadali.

Příklad: „cerebral palsy“ –> vyhledá záznamy, kde se vyskytuje přesně klíčové slovo „cerebral palsy“

Pro úspěšné vyhledávání je kromě ovládnutí dotazovací logiky potřeba také volit vhodná klíčová slova. K tomu může pomoci např. lékařský předmětový heslář MeSH (český překlad naleznete na portálu Medvik > Témata).

 

Print Friendly