22 сентября в рамках Международного форума «Kazan Digital Week» прошла секция «Цифровые технологии в архивоведении и документоведении», в которой принял участие начальник Управления по науке Болгарской исламской академии Марат Тимуршин.
В рамках работы секции были рассмотрены практики использования в архивной отрасли таких «сквозных» цифровых технологий, как системы распределенного реестра в части управления интеллектуальными правами, искусственного интеллекта в части распознавания рукописных текстов метрических книг, в том числе на арабской графике. Участники дискуссии также отметили накопленный богатый опыт практической деятельности в сфере интеллектуальной собственности, международного и межведомственного взаимодействия, направленного на развитие системы интеллектуальной собственности.
Особое внимание было уделено вопросу использования искусственного интеллекта, что крайне важно для исторических исследований. Речь идёт о распознавании речи и компьютерной идентификации арабской графики. Стоит отметить, что подавляющая часть исторического наследия мусульман России представлена в арабографических рукописях на арабском, татарском и персидском языках. В этой связи особое значение приобретает задача машинного распознавания символов арабской графики. При этом, как отметили спикеры, необходимо предварительно восстанавливать текст документа, который утрачивает читаемость из-за воздействия воды и сырости, грибка, разрушения чернил и прочих внешних факторов.
По итогам дискуссии было принято решение создать платформу для машинного чтения арабографических рукописей, которая должна включать в себя эффективные модели распознавания текстов.