Главные новости Николаева
Николаев
Декабрь
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
28
29
30
31

Нейросети Яндекса помогут пользователям найти сведения о предках из Якутии

0

В сервисе Яндекса «Поиск по архивам» стали доступны документы из фондов Национального архива Якутии. Большая часть документов — метрические записи о важных событиях в жизни конкретных людей, включая крещение или заключение брака. Об этом в своем телеграм-канале сообщил глава республики Айсен Николаев.

По его словам, на сервисе уже доступны сканы 550 тысяч рукописных листов, предоставленных якутским архивом. Это около 3000 дел, каждое из которых содержит метрическую книгу одной и более церквей за год или несколько лет.

«Это поможет пользователям найти информацию о предках из Якутии, а исследователям — узнать больше о людях, которые в разное время жили в нашей республике», – подчеркнул Николаев.

Для работы с метрическими книгами сервис использует нейросети: они считывают старые рукописи и преобразуют их в печатный текст. Как проинформировали в Яндексе, Якутия не первый регион России, с которым работает «Поиск по архивам», — всего их уже 20. Например, это Москва, Московская, Омская и Оренбургская области, а также Чувашия. Каждый месяц сервис пополняет свою базу новыми историческими документами из разных регионов страны.

Фото с сайта sakha.gov.ru

«Поиск по архивам» — запущенный в начале 2023 года сервис Яндекса, который помогает быстро находить упоминания людей, населённых пунктов и событий в расшифрованных нейросетью рукописных документах XVIII–XX веков. В базе сервиса представлено более 16 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Астраханской и других областей, а также нескольких муниципальных архивов.

Кроме того, в сервисе можно искать информацию в архивах епархиальных ведомостей, дореволюционного «Коммерсанта», «Русского инвалида», «Советского спорта», «Вечерней Москвы», «Сенатских ведомостей», «Дагестанской правды» и «Красной звезды», а также в справочниках из фондов Национальной электронной библиотеки и Российской государственной библиотеки.

Для оцифровки исторических документов сервис использует технологию, основанную на оптическом распознавании символов. Нейросеть узнаёт неактуальные знаки — например, исчезнувшие из алфавита буквы, — учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в понятный печатный текст.