Indexácia digitalizovanej dokumentácie

Vďaka indexácii nájdete potrebný dokument rýchlo a jednoducho!

Čo je indexácia?

  • pomenovávanie zoskenovaných dokumentov
  • priradenie popisných informácií k zoskenovaným dokumentom
  • tvorba výstupnej adresárovej štruktúry

Samotné vytvorenie digitálneho obrazu je iba prvým krokom k efektívnemu používaniu digitálneho archívu. Bez priradenia popisných informácií dokumentu (niekedy nazývaných indexy, kľúčové slová, metadáta, ...) by nebolo možné žiadne vyhľadávanie v zdigitalizovaných dokumentoch. Preto je neoddeliteľnou súčasťou digitalizácie papierového dokumentu po vytvorení elektronického obrazu aj jeho zaindexovanie.

Príklad:

Po zoskenovaní šanonu s archivovanými cestovnými príkazmi zo zahraničných služobných ciest je vytvorených napr. 100 súborov vo formáte TIFF s pomenovaním pomocou jedinečného identifikátora DMS systému vo forme 9-miestneho čísla – t.j. 214002001.tif až 214002100.tif. Pokiaľ by do DMS systému nebola zavedená spolu so súborom 214002099.tif aj informácia, že je to „Cestovný príkaz“ zo „Zahraničná pracovná cesta“ z roku „2011“ (v tomto príklade 3 najjednoduchšie indexy), bol by tento zoskenovaný obraz daného cestovného príkazu takmer nevyhľadateľný.

Preto indexácii venujeme veľkú pozornosť a vytvárame ju podľa konkrétnych požiadaviek zákazníka. Tvorba indexov môže byť napojená a kontrolovaná priamo voči databázam zákazníka (napr. zákaznícke číslo, číslo diagnózy, kódy operácií, ...). V najjednoduchšom prípade sú indexy použité napríklad pre tvorbu výstupnej adresárovej štruktúry (podľa predošlého príkladu by bol vytvorený podľa indexu „rok“ adresár s názvom „2011“, v ňom vnorené podadresáre „Cestovný príkaz“ a „Zahraničná pracovná cesta“, v ktorých by boli podľa poradových čísiel uložené samotné digitálne obrazy jednotlivých cestovných príkazov).

Možnosti tvorby indexov

  • Automaticky – je možné indexovať systémové údaje (napr. dátum, rozmer, rozlíšenie, veľkosť, ...) alebo údaje snímané pomocou čiarových kódov alebo zónového OCR - optické rozpoznanie znakov vo vopred definovanej oblasti (napr. natlačené čísla zmluvy, formuláre identifikované čiarovým kódom, ISBN kódy publikácií, ...)
  • Poloautomaticky – indexovanie je vykonávané operátorom na základe výberu hodnôt z listingu prípadne flexibilným hľadaním informácií na dokumente pomocou technológie FlexiCapture s následným overovaním operátorom (napr. číslo dodacieho listu, dátum vytvorenia dokumentu, DIČ na pokladničnom bločku, ...)
  • Manuálne – jedná sa o nájdenie a identifikáciu informácie na dokumente vizuálne operátorom a jej manuálne zapísanie do systému (napr. autor dokumentu, stručný popis, ohodnotenie fyzického poškodenia, ...)

Príklady možností tvorby indexov

Príklady indexov pre šanón:
  • Názov – kód šanónu
  • Firma, prevádzka, oddelenie...
  • Rok
  • Typ šanónu (napr. výber z listingu)
    • 1 – Dodavatelske_faktury
    • 2 – Odberatelske_faktury
    • 3 – Pokladnicne_doklady
    • 4 – Bankove_doklady
    • ...
Príklad indexov pre zložku:
  • Typ_zložky (výber z listingu)
    • 1.1 – Domace_faktury
    • 1.2 – Zahranicne_faktury
    • 2.1 – Riadne_faktury
    • 2.2 – Zalohove_faktury
    • ...
Príklad indexov pre dokument:
  • Názov_dokumentu
    • Číslo faktúry
    • Číslo objednávky
    • Číslo dodacieho listu
    • ...
Príklad indexov pre knihu:
  • Názov knihy/publikácie
    • Názov 1. kapitoly
    • Názov 2. kapitoly
    • ...
  • Meno autora
  • Rok vydania
  • Žáner
  • ...