Api получить данные по инн

Опубликовано: 12.05.2024

Ищет компании и индивидуальных предпринимателей:

  • по ИНН, ОГРН и КПП;
  • названию (полному и краткому);
  • ФИО (для индивидуальных предпринимателей);
  • ФИО руководителя компании;
  • адресу до улицы.

Что умеет

✔️ Ищет по комбинации ИНН, названия и адреса в одном запросе («7736050003 Газ» → «ПАО Газпром», «вавилова сбер» → «ПАО Сбербанк»).

✔️ Находит конкретный филиал, если указать в запросе КПП («сбербанк 540602001» → «Сибирский банк ПАО Сбербанк»).

✔️ Понимает слитное и раздельное написание («альфабанк» = «Альфа-Банк»).

✔️ Ищет по частичному совпадению в ИНН / ОГРН («77094209» → «ООО Акварель») и названиях («росне» → «ПАО «НК «Роснефть»).

✔️ Подсказывает только организации или только ИП, или и тех и других. Умеет искать только в действующих или ликвидированных компаниях. Может ограничить подсказки кодом ОКВЭД или конкретным регионом России.

✔️ Учитывает, где вы находитесь (в связке с методом город по IP-адресу).

✔️ Возвращает основные реквизиты компании из ЕГРЮЛ: краткое и полное название, ОПФ, адрес, ОГРН, ИНН, КПП, ОКВЭД, статус организации, ФИО и должность руководителя.

✔️ В связке с методом организация по ИНН возвращает вагон дополнительной информации: количество сотрудников, все коды ОКВЭД, сведения о налоговой, ПФР и ФСС, документы и лицензии, учредители и руководители, финансовые показатели, реестр малого и среднего бизнеса.

❌ Для 50% компаний налоговая служба пока не сообщает КПП филиалов. Такие филиалы можно найти по ИНН, городу и улице филиала. Например, «7724261610 москва мясницкая» → «Филиал ФГУП "Почта России" (г Москва)».

Как вызвать

Чтобы вызвать метод, зарегистрируйтесь и подтвердите почту.

Укажите при вызове:

  • Content-Type: application/json или application/xml .
  • Accept — аналогично.
  • $ — API-ключ.

Тело запроса передавайте в кодировке UTF-8 .

Параметры запроса

Название Тип Обяз.? По умолч. Описание
query string Текст запроса
count number 10 Количество результатов (максимум — 20)
status array [string] Ограничение по статусу организации
type string Ограничение по типу организации
locations array [object] Ограничение по региону или городу
locations_boost array [object] Приоритет города при ранжировании

Что в ответе

Объект с массивом подсказок в поле suggestions :

Коды ответа на запрос

HTTP-код ответа Описание
200 Запрос успешно обработан
400 Некорректный запрос (невалидный JSON или XML)
401 В запросе отсутствует API-ключ
403 В запросе указан несуществующий API-ключ
Или не подтверждена почта
Или исчерпан дневной лимит по количеству запросов
405 Запрос сделан с методом, отличным от POST
413 Слишком большая длина запроса или слишком много условий
429 Слишком много запросов в секунду или новых соединений в минуту
5xx Произошла внутренняя ошибка сервиса

Примеры вызова

Ограничения

Количество условий в параметрах locations и locations_boost — не более 10.

Длина запроса (параметр query ) — не более 300 символов.

Количество запросов в день — в соответствии с тарифным планом.

Максимальная частота запросов — 20 в секунду.

Максимальная частота создания новых соединений — 60 в минуту.

Частые вопросы

По мере поступления обновлений от налоговой службы. Отставание от сайта налоговой (egrul.nalog.ru) не более 3 дней.

Почему не находится организация? Я точно знаю, она должна быть

Скорее всего, организация недавно зарегистрирована в ФНС, и мы еще не успели получить информацию о ней из налоговой. Отставание Дадаты от сайта налоговой (egrul.nalog.ru) не более 3 дней, так что организация скоро появится.

Подсказки не работают: ошибка 403 Forbidden (Feature SUGGESTIONS disabled for token)

  • Не подтверждён адрес эл. почты. Проверьте в личном кабинете. Если почта не подтверждена — посмотрите почтовый ящик и папку «спам», там должно быть письмо от «Дадаты».
  • В запросе указан неправильный API-ключ. Проверьте в личном кабинете
  • Исчерпан лимит запросов на день. Проверьте в личном кабинете
  • Вы делаете запросы с сервера, при этом настроена привязка к домену. Отключите привязку к домену, либо делайте запросы из браузера.
Что будет, если превысить 10 000 бесплатных запросов в день?

Подсказки перестанут подсказывать ツ До начала нового дня, затем снова заработают.

10 000 запросов считаются суммарно по всем видам подсказок: адреса, ФИО, организации, банки, емейлы.

Стоимость

Бесплатно до 10 тысяч запросов в день. Больше — в составе годовой подписки.

Актуальная информация из официальных источников обо всех организациях РФ
в Вашей информационной системе / Вашем программном обеспечении.
С помощью API Вы можете интегрировать информацию об организациях РФ
и другие сервисы портала в любое программное обеспечение (1С, СRM, SAP, Сайт и т.д.)
и максимально автоматизировать свою работу:

- получать полную информацию об организациях РФ;
- проверять Контрагентов и проявлять “Должную осмотрительность”;
- автоматически, без ошибок заполнять реквизиты;
- составлять базы данных организаций РФ с контактами;
- получать обновления и следить за изменениями в данных Контрагентов.

API ЗАЧЕСТНЫЙБИЗНЕС полностью автоматизирует получение информации о контрагентах, позволит правильно заполнять реквизиты, получать полную актуальную информацию из различных источников, мониторить изменения.

Формат выдачи данных JSON/XML

Оставьте заявку на консультацию по API
или свяжитесь с нами по тел.: +7(499)110-0772

Согласие на обработку персональных данных

При указании своих персональных данных на интернет портале https://zachestnyibiznes.ru/ я даю свое согласие Обществу с ограниченной ответственностью «АйБиКонсалт» ОГРН 1157746608645 (Администрация портала ЗАЧЕСТНЫЙБИЗНЕС - Оператор персональных данных, зарегистрированный в реестре операторов РОСКОМНАДЗОРА под номером 77-17- 006015), согласие на сбор и обработку своих персональных данных, указанных мной при регистрации.

Под персональными данными понимается любая информация, указываемая мной на интернет портале ЗАЧЕСТНЫЙБИЗНЕС https://zachestnyibiznes.ru/ Настоящее согласие предоставляется на осуществление любых действий в отношении персональных данных, которые необходимы для достижения вышеуказанной цели, включая, без ограничения, сбор, систематизацию, накопление, хранение, уточнение, использование, распространение (в том числе передача), обезличивание, блокирование, уничтожение, а также осуществление любых иных действий с персональными данными с учетом действующего законодательства Российской Федерации об обеспечении конфиденциальности персональных данных и безопасности персональных данных при их обработке.

Обработка персональных данных может быть осуществлена с использованием средств автоматизации, в том числе с использованием информационных технологий и технических средств, используя программные средства (операционные системы, системы управления базами данных и т. п.), средства защиты информации, применяемые в информационных системах, а также без использования средств автоматизации.

Настоящее согласие на обработку персональных данных дается бессрочно и может быть отозвано посредством направления письменного заявления. Отзыв на обработку персональных данных распространяется только на данные, указанные Пользователем на портале.

Настоящим признаю и подтверждаю, что с правами и обязанностями в соответствии с Федеральным законом «О персональных данных», в т. ч. порядком отзыва согласия на обработку персональных данных ознакомлен (-а).

Принимая условия, я соглашаюсь на обработку персональных данных и получение информационных сообщений от портала ЗАЧЕСТНЫЙБИЗНЕС.

Мы оказываем помощь с интеграцией данных и выплачиваем агентское вознаграждение!

Для проверки любых Контрагентов и получения актуальной информации по ним:

Безлимитное кол-во запросов по любым методам:
на 1 000 организаций (ЮЛ или ИП) за 1 год

(Безлимитное кол-во запросов по любым организациям и физическим лицам)


API ЗАЧЕСТНЫЙБИЗНЕС обслуживает собственный кластер из высокопроизводительных серверов (HP, IBM) в дата-центре с отказоустойчивостью Tier 3+.

Данные предоставляемые через API

Автозаполнение реквизитов организаций
По ИНН, БИК (для карточек контрагентов, договоров, счетов и др. документы)
Данные ФНС: ЕГРЮЛ / ЕГРИП
Наименование, статус, дата регистрации/ликвидации, реквизиты, адрес, руководители, учредители, виды деятельности, налоговый орган, фонды, выданные лицензии
Получение информации по схеме ФНС (ЕГРЮЛ/ЕГРИП)
Данные ФНС: Спецреестры
Сведения о юридических лицах, имеющих задолженность по уплате налогов и/или не представляющих налоговую отчетность более года, сведения о физических лицах, являющихся руководителями или учредителями (участниками) нескольких юридических лиц, "массовые" адреса
Среднесписочная численность сотрудников
Применяемый налоговый режим
Сведения о суммах недоимки и задолженности по пеням и штрафам
Сведения о налоговых правонарушениях и мерах ответственности за их совершение
Данные ФНС: Сервисы
Выписка ЕГРЮЛ/ЕГРИП с ЭЦП ФНС
Информация о предоставлении документов в налоговый орган при государственной регистрации (первичной или внесении изменений)
Получение ИНН по паспортным данным ФЛ
Проверка блокировки счетов организации
Информация из Реестра обеспечительных мер, проверка организации
Недействительные ИНН ЮЛ (Проверка ЮЛ)
Недействительные ИНН ФЛ (Проверка ФЛ)
Проверка статуса Самозанятого
Карточка Предпринимателя (Физического лица)
Участие в организациях (Директор/Учредитель), аффилированность, наличие в спецреестрах ФНС
Отчетность организаций
Показатели бухгалтерской отчетности за последние 5 лет (баланс форма 1,2)
Аффилированность по организации и руководителю
Связанные компании и ИП по организациям и руководителю
Аналитика
Рейтинг организации, Отчет “Оценка налоговых рисков” (Должная осмотрительность)
Фонд оплаты труда, Среднемесячная заработная плата
Дополнительная информация
Суды (Арбитражные дела)
Исполнительные производства (ФССП)
Единый Реестр Проверок (плановые/внеплановые проверки организаций)
ГосЗакупки (44-ФЗ, 223-ФЗ)
Реестр недобросовестных поставщиков (44-ФЗ, 223-ФЗ)
Реестр Товарных Знаков (Роспатент)
вхождение в государственные различные реестры, описание деятельности компании, другая информация
История изменений
Лента изменений по организациям
Проверка паспортов граждан РФ на действительность
(по данным ФМС РФ)
Контактная информация
Информация из официальных и открытых источников: телефоны, адрес местоположения, e-mail, сайт


Документация API ЗАЧЕСТНЫЙБИЗНЕС

Полное описание протокола взаимодействия вы можете увидеть пройдя по ссылке:
Документация API

ПО для ЭВМ “ ЗАЧЕСТНЫЙБИЗНЕС” зарегистрировано Федеральной службой по интеллектуальной собственности.
Cвидетельство о регистрации №2017661165

Тестовый доступ

API-ФНС предназначен для интеграции базы данных ФНС в любые информационные системы. Основная цель - автоматизация извлечения данных из Единого государственного реестра юридических лиц (ЕГРЮЛ) и Единого государственного реестра индивидуальных предпринимателей (ЕГРИП) для использования в своих информационных системах (например, 1С, CRM, другие бухгалтерские, банковские системы).

С помощью сервиса вы сможете автоматизировать заполнение реквизитов компаний, поиска компаний по различным параметрам, проявить должную осмотрительность, отслеживать изменения в параметрах ваших контрагентов.

Сервис предлагает получать любую информацию из базы ФНС по заданному запросу. Для получения информации используются запросы с параметрами GET или POST. На выходе - строка в формате JSON.

Для выбора методов и ввода параметров можно использовать единый адрес входа: https://api-fns.ru/api

API состоит из нескольких программных интерфейсов:

Название методаКомандаОписание
Поиск компанийsearchПозволяет получить список компаний, соответствующих указанному запросу
Получение данных о компанииegrПозволяет получить все актуальные и исторические данные из ЕГРЮЛ о юридическом лице (ЮЛ), или из ЕГРИП для индивидуального предпринимателя (ИП)
Реквизиты группы компанийmultinfoПозволяет получить базовые данные сразу о нескольких юридических лиц или индивидуальных предпринимателей
Проверка группы компанийmultcheckПозволяет провести базовую (упрощенную) проверку нескольких юридических лиц или индивидуальных предпринимателей
Проверка контрагента (признаки недобросовестности)checkПозволяет получать информацию о том, попало ли юридическое лицо в различные негативные реестры ФНС, отметки о недостоверных данных, признаки «массового» директора, учредителя, решений о ликвидации, реорганизации и прочие
Проверка блокировок счетаnalogbiЗапрос полной информации о действующих решениях ФНС о приостановлении операций по счетам
Проверка блокировок счета в виде файлаnalogbi_fileВывод полной информации о действующих решениях ФНС о приостановлении операций по счетам в виде файла zip с подписью ФНС
Отслеживание изменений параметров компанииchangesПозволяет получить те параметры компании, которые изменились, начиная с указанной даты
Мониторинг изменений по списку компанийmonФормирование списка компаний для мониторинга и отслеживание изменений в ЕГРЮЛ/ЕГРИП по этому списку
Выписка из ЕГРЮЛvypПозволяет получить заверенную выписку ФНС из ЕГРЮЛ или ЕГРИП
Бухгалтерская отчетностьboБухгалтерская отчетность организации по данным ФНС
Бухгалтерская отчетность в виде файлаbo_fileБухгалтерская отчетность организации в виде файла zip или pdf, заверенного подписью ФНС
Узнать ИНН по паспортным даннымinnflВозвращает ИНН физического лица на основании введенных паспортных данных
Проверка паспорта на недействительностьmvdpassПроверяет серию и номер паспорта по списку недействительных российских паспортов
Лицензии ФСРАРfsrarВозвращает информацию о лицензиях по данным ФСРАР
Статистика запросов (использования ключа)statВозвращает информацию статистику о количестве использованных и доступных запросов по каждому из методов

Поиск компаний

Позволяет получить список компаний по указанному запросу.

На входе подается текстовая поисковая строка, на выходе - строка JSON.

Поисковая строка может быть следующей:

  • ИНН или ОГРН организации.
  • ОГРН ИП.
  • ИНН физ. лица
  • ФИО физ. лица или его часть (пример: «Василий Гордиенко», «Гордиенко Василий Иванович»)
  • Название или часть названия организации.
  • Контактные данные (номер телефона, e-mail или web-сайт).
  • Адрес организации (для вывода организации по заданному адресу) (пример: «г. Москва, наб. Озерковская, д.52, стр.2»). Если задана начальная часть адреса, то выводятся все организации, соответствующие данному адресу: например, «г. Москва, наб. Озерковская, д.52» выдаст все организации с данным адресом, включая все строения и офисы.
  • Смешанный поиск: Часть ФИО и населенного пункта, Часть наименования организации и населенного пункта, Часть наименования организации и ФИО учредителя или директора.

Используется запрос GET или POST.

Параметры запроса:

ПараметрТип данных и примерОписание
qstring
q=Гордиенко Василий
Поисковая строка
pageinteger
page=2
Страница поиска (поиск выдает только первые 100 найденных значений, если их больше используйте page для отображения следующей порции найденных значений)

Возвращаемый документ (HTTP response) представляет собой структурированный документ JSON, содержащий список найденных организаций.

Фильтры

Просмотр недоступен!

Для просмотра необходимо подключить услугу
доступ к поисковой системе

Правила поиска по реквизитам

Поиск по реестру юридических лиц дает возможность найти организацию по ИНН и другим реквизитам ОГРН/ОГРНИП/ОКПО, наименованию предприятия, адресу, субъекту РФ.

Стоит отметить, что поиск по ИНН/ОГРН/ОГРНИП/ОКПО является «точным», поэтому результатом будет сразу карточка искомого юридического лица.

Помимо поисковых запросов по реквизитам по данному реестру юридических лиц можно осуществлять «поиск в одну строку». Например, при вводе Ф.И.О. руководителя и наименования компании, поиск будет идти только по тем карточкам, в которых встречаются эти два значения. Комбинация значений повышает релевантность выдачи поисковой системы (высокому совпадению введенного запроса с ответом на него), что дает возможность быстрее найти нужную вам компанию или физическое лицо.

Запросы «в одну строку» осуществляются по следующим комбинациям: адрес компании и Ф.И.О. руководителя, наименование компании и Ф.И.О. учредителя, Ф.И.О. учредителя и место его рождения, наименование организации и её адрес, Ф.И.О. прежнего руководителя и прежний адрес компании, прежнее наименование на английском и Ф.И.О. прежнего учредителя.

Поиск по физическим лицам осуществляется по Ф.И.О. учредителя/руководителя, месту рождения.

При запросе по наименованию компании, адресу, Ф.И.О. учредителя/руководителя, результатом поиска будет список карточек организаций, в которых найдено совпадение по введенному значению.

Правила поиска по существенным событиям

Для поиска сообщений юридических лиц, опубликованных в журнале «Вестник государственной регистрации», задайте в поисковую форму запрос, состоящий из ИНН/ОГРН или названия юридического лица.

В результатах поиска по ИНН/ОГРН поисковая система выдаст список сообщений, поданных данным юридическим лицом.

При поиске по названию организации, вы получите список сообщений, содержащих данный поисковый запрос. Обращайте ваше внимание, что название юридических лиц может совпадать.

Вы можете ознакомиться с полным текстом сообщений, при необходимости заказать копию страницы журнала «Вестник государственной регистрации» с данным сообщением. Для заказа необходимо войти в личный кабинет зарегистрироваться на сайте.

Правила поиска по имуществу должника

Для поиска имущества, задайте в поисковую форму запрос.

В результатах поиска по ИНН/ОГРН/Наименованию поисковая система выдаст список имущества, соответствущий критериям поиска. Обращайте ваше внимание, что название юридических лиц может совпадать или содержаться в тексте лота.

Правила поиска по залогам движимого имущества

Поисковая система «Информация о залогах» осуществляет сквозной поиск по базе залогового имущества.

Необходимо ввести в поисковую строку запрос. Например:

  • ключевое слово;
  • наименование компании;
  • ФИО;
  • ИНН;
  • ОГРН;
  • регистрационный номер (уведомления о возникновения залога) или его часть;
  • номер договора (если есть);
  • серию и номер паспорта (или данные иного документа, удостоверяющего личность);
  • идентификатор (VIN транспортного средства, идентификационный номер, регистрационный номер выпуска облигации).

Помимо сквозного поиска, есть возможность искать по определенным полям – по регистрационному номеру уведомления, по предмету залога, в отличии от ФНП, вы можете искать не только по залогодателю, но и по залогодержателю. Преимуществом также служит, что в результате поиска выводятся как действующие залоги, так и прекращенные.

Также вы можете сортировать информацию по определенным параметрам:

  • Статус залога (любой/действует/прекращен);
  • Субъект экономической деятельности (ФЛ/ЮЛ/иностранное ЮЛ);
  • Регионы (субъект РФ, в котором зарегистрировано или фактически проживает ФЛ – сторона договора);
  • Вид имущества (транспортное средство/иное имущество/облигации);

По временному отрезку:

  • Дата регистрации уведомления;
  • Дата заключения договора/регистрации облигации;
  • Сроку исполнения обязательства;
  • Дата рождения ФЛ – стороны договора.

Такая возможность поможет вам совершить максимально удобный и точный поиск, это позволит избежать вывода избыточной информации.
Введите запрос в поисковую строку и нажмите кнопку «Найти».
Выводится число с количеством найденных записей о залогах.
Ниже показаны результаты поиска в виде регистрационного номера уведомления в качестве заголовка и краткая информация – дата регистрации, залогодатель, залогодержатель и статус залога.
Кликнув по регистрационному номеру уведомления, вы перейдете на карточку залога, где получите полную информацию о залоге.

Правила поиска информации о патентах

Найти интересующую Вас информацию о патентах вы можете по номеру или названию патента, а так же по Ф.И.О. патентообладателя. Результатом поиска будет список всех карточек, в материалах которых найдено совпадение по введенному значению.

Можно ограничить результаты поиска по дате, выбрав соответствующий параметр «Дата подачи заявки» или «Дата публикации заявки».

В блоке «Параметры поиска» можно выбрать интересующие базы патентов, отметив их галочками. В таком случае поиск будет осуществляться только по ним.

Правила поиска по недействительным паспортам

Для проверки паспорта гражданина РФ задайте в поисковую форму запрос, содержащий серию и номер документа.

Правила поиска информации по новостям в СМИ

1. Сформулируйте запрос по вашему вопросу. Учитывайте при этом, что поиск является полнотекстовым и структурированным, что позволяет охватить больший объем информации и выделить основные интересующие вас позиции.

2. Не забывайте о том, что писать поисковый запрос нужно грамотно. От этого зависит качество выданной информации.

3. Нажмите на кнопку «Найти», после чего отобразится вся информация, соответствующая вашему запросу.

4. Воспользуйтесь функциями расширенного поиска, если вам нужны уточнения по типам источника или датам. Для этого следует нажать на кнопку «Фильтр», где отобразятся все возможности сужения поискового запроса.

Правила поиска по файлам эмитентов

Задайте в поисковую форму произвольную строку для поиска по файлам раскрываемым эмитентами.


Всем привет! В этой статье расскажу о работе с "API Федеральной Налоговой Службы". И чем это в итоге обернулось.

В одном из проектов была задача было получать данные Юридическом Лице(ООО, ИП, и т.д.)

Проект представляет собой POS-систему для кафе и рестаранов. Для обслуживания, процессинга и учета клиентов используется корпоративный портал. Портал позволяет управлять клиентами и хранит мнжество данных от Названия организации до ОКВЭД(Общероссийский классификатор видов экономической деятельности).

При подключении нового клиента у него приходится запрашивать очень много информации. И в какой-то момент возникло желание получать хотя бы часть этих данных автоматически.

Теоретически такую информацию предоставляет федеральная налоговая служба. Также в сети есть множество сайтов, где можно проверить контрагентов по ИНН. Скорее всего эти сайты также используют данные налоговой службы.

Обычно, когда мне нужно сделать что-то подобное, я смотрю не предоставляет ли данный сервис API для взаимодействия. И обычно, если это популярный и востребованный сервис, то api существует в том или ином виде. Например facebook api, vk api, ebay api и т.д.

Сразу же возникает вопрос, а нет ли чего-то подобного у федеральной налоговой службы. Но и ответ находится достаточно быстро. https://www.nalog.ru/rn77/service/egrip2/access_order/

Nalog.ru позволяет получить данные организаций в электронном виде через ftp. Либо через api(не подтверждено).

за годовое абонентское обслуживание одного рабочего места одного реестра (ЕГРЮЛ или ЕГРИП) - 150 тысяч рублей (НДС не облагается в соответствии с подпунктом 4 пункта 2 статьи 146 Налогового кодекса Российской Федерации);

за однократное предоставление открытых сведений в полном объеме одного реестра (ЕГРЮЛ или ЕГРИП) - 50 тысяч рублей (НДС не облагается в соответствии с подпунктом 4 пункта 2 статьи 146 Налогового кодекса Российской Федерации);

за однократное предоставление открытых обновленных сведений (в случае обновления уже полученных открытых сведений в полном объеме) – 5 тыс. рублей (НДС не облагается в соответствии с подпунктом 4 пункта 2 статьи 146 Налогового кодекса Российской Федерации).

В общем, и то и другое платно. Постоянный доступ - 150 000 р./год. для одного оператора. Либо 50 000 р. единовременно + 5 т.р. за каждое обновление. Цены ощутимые, учитывая что база обновляется каждый день(так написано на сайте налоговой). Правда это или нет - другой вопрос.


Скорее всего одного оператора достаточно, чтобы скачать данные, внести в свою БД и уже по ней вести поиск. Время от времени обновлять данные. Но в любом случае, в нашей компании не готовы были платить такие деньги. Оно и понятно.

К тому же сам процесс достаточно трудоемкий, предполагает получение Rutoken, настройка окружения для безопасного взаимодействия с системой. Затем нужно автоматизировать процесс загрузки файлов по ftp, парсинг и обновление локальной базы. Что заеняло бы много сил и времени.

В итоге был выбрран немножечко костыльный, но рабочий вариант. Наиболее оптимальный, как мне кажется.

При том, что получение доступа к базе организаций достаточно сложный и дорогой процесс, получить данные для одной организации достаточно просто. Предоставляется форма, которая позволяет вручную получить данные https://egrul.nalog.ru/.

Нужно указать данные организации. Инн, либо другие данные. Также нужно ввести капчу. В результате будет сгенерирован pdf файл



Обходом капчи заниматься не хотелось. Да и не силен я в этом. К тому же, пока мы подключаем не 1000 клиентов в день, это не так уж принципиально. Менеджер может перейти по ссылке, скачать pdf файл и загрузить в систему.

Update 2018-12-24: Сайт налоговой инспекции немного поменялся. В частности, теперь не нужно вводить капчу. Вместо этого добавили что-то вроде двухэтапной авторизации.

Примеры pdf документов для ИП и ООО:

Остается распарсить pdf и получить нужные данные. Я думал, что с этим возникнут проблемы, но на самом деле все оказалось не так сложно.

Конечно, многое зависит от формата pdf. Здесь он генерируется с помошью iText Java library.

Парсер разрабатывал на php, оформил в виде библиотеки. Выложил на github, можно установить через composer


Для парсинга использовал эту библиотеку https://github.com/smalot/pdfparser/

Парсит достаточно хорошо, получаем такой текст

Выглядит немного беспорядочно. Но в итоге можно распарсить по ключевым словам

Единственная проблема закрывающей кавычкой. Так и не решил ее. Но в итоге мне это не помешало распарсить почти все данные.

На github есть issue, у человека возникла такая же проблема: https://github.com/smalot/pdfparser/issues/138.

Примерный алгоритм парсинга такой:

Идти по строкам подряд. Если чтрока начинается с цифры, достаем заголовок поля. Поскольку заголовоки повторяются то вводим понятие разделов и ключевые слова для них

Названия полей выделяем по ключевым словам, заменяем в тексте.

Используем стоп слова, стобы убрать лишние данные.

Распарсить выписку для ООО можно таким образом:

В итоге получается примерно такой массив данных:

Читайте также: