Indexácia digitalizovanej dokumentácie
Vďaka indexácii nájdete potrebný dokument rýchlo a jednoducho!
Čo je indexácia?
- pomenovávanie zoskenovaných dokumentov
- priradenie popisných informácií k zoskenovaným dokumentom
- tvorba výstupnej adresárovej štruktúry
Samotné vytvorenie digitálneho obrazu je iba prvým krokom k efektívnemu používaniu digitálneho archívu. Bez priradenia popisných informácií dokumentu (niekedy nazývaných indexy, kľúčové slová, metadáta, ...) by nebolo možné žiadne vyhľadávanie v zdigitalizovaných dokumentoch. Preto je neoddeliteľnou súčasťou digitalizácie papierového dokumentu po vytvorení elektronického obrazu aj jeho zaindexovanie.
Príklad:
Po zoskenovaní šanonu s archivovanými cestovnými príkazmi zo zahraničných služobných ciest je vytvorených napr. 100 súborov vo formáte TIFF s pomenovaním pomocou jedinečného identifikátora DMS systému vo forme 9-miestneho čísla – t.j. 214002001.tif až 214002100.tif. Pokiaľ by do DMS systému nebola zavedená spolu so súborom 214002099.tif aj informácia, že je to „Cestovný príkaz“ zo „Zahraničná pracovná cesta“ z roku „2011“ (v tomto príklade 3 najjednoduchšie indexy), bol by tento zoskenovaný obraz daného cestovného príkazu takmer nevyhľadateľný.
Preto indexácii venujeme veľkú pozornosť a vytvárame ju podľa konkrétnych požiadaviek zákazníka. Tvorba indexov môže byť napojená a kontrolovaná priamo voči databázam zákazníka (napr. zákaznícke číslo, číslo diagnózy, kódy operácií, ...). V najjednoduchšom prípade sú indexy použité napríklad pre tvorbu výstupnej adresárovej štruktúry (podľa predošlého príkladu by bol vytvorený podľa indexu „rok“ adresár s názvom „2011“, v ňom vnorené podadresáre „Cestovný príkaz“ a „Zahraničná pracovná cesta“, v ktorých by boli podľa poradových čísiel uložené samotné digitálne obrazy jednotlivých cestovných príkazov).
Možnosti tvorby indexov
- Automaticky – je možné indexovať systémové údaje (napr. dátum, rozmer, rozlíšenie, veľkosť, ...) alebo údaje snímané pomocou čiarových kódov alebo zónového OCR - optické rozpoznanie znakov vo vopred definovanej oblasti (napr. natlačené čísla zmluvy, formuláre identifikované čiarovým kódom, ISBN kódy publikácií, ...)
- Poloautomaticky – indexovanie je vykonávané operátorom na základe výberu hodnôt z listingu prípadne flexibilným hľadaním informácií na dokumente pomocou technológie FlexiCapture s následným overovaním operátorom (napr. číslo dodacieho listu, dátum vytvorenia dokumentu, DIČ na pokladničnom bločku, ...)
- Manuálne – jedná sa o nájdenie a identifikáciu informácie na dokumente vizuálne operátorom a jej manuálne zapísanie do systému (napr. autor dokumentu, stručný popis, ohodnotenie fyzického poškodenia, ...)
Príklady možností tvorby indexov
|
Príklady indexov pre šanón:
|
Príklad indexov pre zložku:
|
Príklad indexov pre dokument:
|
|
Príklad indexov pre knihu:
|
