Данные собраны из различных источников (ЕГРЮЛ, госзакупки, общедоступные открытые реестры).
Всего - 375449 фамилий, 32134 имён, 48274 отчеств. Чем ниже частота встречаемости тем ниже точность и качество данных. В записях с частотой 1 может быть очень много ошибок, применяйте с осторожностью.
Исходный код для работы с данными и документация по ссылке https://github.com/datacoon/russiannames