Článek
„Vzniká digitální archiv dokumentů NKVD/KGB k československé historii, v němž bude možné vyhledávat díky softwaru kybernetiků,“ řekla mluvčí ZČU Šárka Stará. Má být hotový do konce roku 2022.
Celkem software zpracuje přes milion textů a fotografií, které ÚSTR digitalizoval v rozmezí let 2014 až 2020 zejména v ukrajinských a ruských archivech. Dokumenty se vztahují třeba k represím páchaným na krajanech od 20. do 50. let 20. století, k osudům Čechoslováků v gulagu, sovětizaci Podkarpatské Rusi po roce 1945 a invazi vojsk Varšavské smlouvy v roce 1968. „Cílem projektu je vytvořit archiv dokumentů sovětských bezpečnostních složek, který bude přístupný on-line a v němž bude možné vyhledávat podle konkrétního obsahu dokumentů, jména či jiných životopisných údajů osoby postižené represemi v SSSR, časového a místního zařazení a dalších kritérií,“ uvedla.
Už nyní jsou v jeho testovací verzi na https://archivkgb.zcu.cz zpřístupněny spisy k takzvanému charkovskému procesu. Dokumentaci zveřejnil ÚSTR k 90. výročí procesu, který se odehrál v Charkově od 12. do 14. června 1931 a je znám také jako soud s českými učiteli. „Cílem patrně bylo zlikvidovat kontakty české menšiny v Sovětském svazu s vlastí, přinutit ji k úplné sovětizaci a pokusit se i tím přimět vládu k diplomatickému uznání SSSR,“ řekl Adam Hradilek z ÚSTR. Šlo o do té doby největší vykonstruovaný proces proti českým krajanům v SSSR. Z 21 souzených lidí bylo 12 učitelů. Původně však tehdejší bezpečnostní služba pozatýkala desítky učitelů, vedoucích krajanských spolků, rolníků a předních činitelů českých komunit, kteří byli souzeni v navazujících procesech. Spis obsahuje 73 svazků s více než 10.000 stranami dokumentů sovětské bezpečnostní služby. „Byly zdigitalizovány ve Státním archivu Bezpečnostní služby Ukrajiny. Kromě vyšetřovacích spisů jednotlivých osob jsou k dispozici přepisy soudního líčení, dokumentace k rehabilitaci obětí z poloviny 60. let a zabavené dokumenty, dopisy, osobní doklady a fotografie souzených,“ uvedla mluvčí.
Software desetičlenného týmu z katedry kybernetiky a plzeňského výzkumného centra NTIS dokáže z naskenovaných dokumentů získat elektronický text, který pak uloží do databáze, v níž lze dobře vyhledávat. „Výzva spočívá především v tom, jak dostat co nejvíce smysluplného textu z dokumentů, které jsou zmuchlané, zažloutlé, naskenované nakřivo či v malém formátu a zároveň obsahují například směs strojopisu a ručně psaných poznámek a to vše je doplněno otisky razítek,“ řekl Marek Hrúz z katedry kybernetiky.