Доступ к API
API - это наиболее стандартный способ доступа к данным APICrafter'а. Для получения доступа к данным через API Вам необходимо зарегистрироваться , ключ будет доступен в личном кабинете.. Для некоммерческих пользователей ключ предоставляется с ограничением до 500 запросов в сутки, для коммерческого использования можно оформить подписку по одному из тарифов.Пример приложения по сбору данных о юридических лицах (apicrafter-example-orgprofile).
Открытые данные
Большая часть наборов данных собранных в проекте являются открытыми или же с открытыми первоисточниками. Формат публикации данных в первоисточнике может сильно варьироваться: CSV, JSON, JSON lines, DBF, XML, HTML и многие другие форматы. DataCrafter даёт возможность работать с ними через унифицированные интерфейсы API и скачивать их в виде пакетов данных преобразованных в формат BSON - формат электронного обмена цифровыми данными, основанный на JavaScript, бинарная форма представления простых структур данных и ассоциативных массивов. Является подмножеством JSON, включая дополнительно регулярные выражения, двоичные данные и даты. (см. Wikipedia BSON).Это позволяет обеспечить быструю и простую загрузку пакетов данных в СУБД совместимую с MongoDB - это могут быть MongoDB, Azure Cosmos DB, Amazon DocumentDB и другие. Мы выбрали BSON для простоты работы с MongoDB, большая часть нашей инфраструктуры построена на этой системе NoSQL и поскольку большая часть данных собранных в DataCrafter не являются табличными как CSV, а включают сложные иерархии.
Такие пакеты данных имеют значительный размер, поэтому в открытой части DataCrafter для как открытые данные выгрузки доступны данные небольшого объёма (до 10 МБ записей), данные справочников и классификаторов и ряд наборов данных для исследователей.