На поддомене scan.comtext.space разместил список сайтов-архиво со сканами книг, документов, журналов, рукописей и других материалов. Такой список полезен при поиске или выборе материалов для распознавания текста и дальнейшей оцифровки. Более-менее полного списка в рунете не нашел.
В этом списке есть следующие преимущества:
- Интерфейс с поиском, сортировкой
- Исходные данные в yaml доступны для автоматической обработки
Далее можно, например, автоматически проверять ссылки на работоспособность, так как во многих каталогах которые можно нагуглить часть ссылок уже недоступна.