Приводим в порядок

почтовые адреса и ФИО

исправление опечаток

г Милеуз, ул Цурупы
г Мелеуз, ул Цюрупы

актуализация данных

г Магнитогорск, ул Советская
г Магнитогорск, ул Алтайская

поиск дубликатов

РБ 450033, г. Уфа, Азовская, 13
Башкортостан, Уфа, ул. Азовская, дом 13

обогащение данных

Калужская Киров дивизии 13 249441, обл Калужская, р-н Кировский, г Киров, ул 330-й Стрелковой Дивизии, дом 13

детализация

7 Текстильщиков, 666 к.1, 999, Мск, РФ 109263, г, Москва, ,,,,,, ул, Текстильщиков 7-я, дом, 666, корпус, 1, квартира, 999

форматирование

 ,г Москва,
 ,Москва,г,
 ;город;Москва;
 ;Г;МОСКВА;

Услуги

Адреса

автоматическая обработка

  • 0,1 руб./запись
  • 200.000 записей в день
  • предельная детализация
  •  настройки форматирования

Адреса

ручная правка

  • 2,0 руб./запись
  • 1.000 записей в день
  • разбор вручную
  • 100% качество

ФИО

автоматическая обработка

  • 0,01 руб./запись
  • 1.000.000 записей в день
  • точность алгоритма > 98%
  • 1.000 - бесплатный тест

Онлайн-сервисы

Правильный адрес

Сервис для проверки одиночных адресов. Выяснит, есть адрес в базе или нет. Поможет найти правильный почтовый индекс и актуальное название улицы.

  • отдельный адрес
  • быстро проверить
  • в любое время
Адреса /100

Бесплатный сервис для автоматической обработки небольших пакетов адресов.

  • 100 адресов в файле
  • упрощённый алгоритм
  • для ознакомления
Адреса

Автоматическая обработка адресов.

Используются самые общие настройки алгоритма, позволяющие распознавать и исправлять наибольшее число ошибок. В результате обработки помимо очищенных адресов появляются дополнительные данные о качестве этих адресов, о необходимых исправлениях, а также о степени достоверности результатов.

правильный адрес

адреса /100

адреса

Технологии

Комплекс

Мы разработали программный комплекс для обработки почтовых адресов и ФИО. Заложенные в основу комплекса концепции позволили реализовать на практике оптимальный баланс между скоростью и качеством очистки данных, и успешно зарекомендовали себя в промышленной обработке.

Алгоритмы

В настоящее время в комплексе используются несколько разных алгоритмов: традиционных, где обработка жёстко закодирована, и искусственных, построенных с применением машинного обучения, опираясь на наблюдения за "правильной" обработкой и использование предыдущего опыта для создания обобщений.

Особенности

В силу особенностей предметной области добиться точного решения невозможно: качество 100% недостижимо. Другими словами, нельзя создать идеальный алгоритм для распознавания и исправления человеческих ошибок.

Вместо того, чтобы год за годом за счёт труда программистов улучшать точность на несущественные доли процента, мы сосредоточились на поиске новых идей. И в результате пришли к созданию алгоритмов, которые создают алгоритмы решения нужной задачи.

Качество

Высокое качество нашего решения достигнуто на сочетании наших алгоритмов. Каждый имеет свои сильные и слабые стороны, а при совместном использовании они дополняют друг друга, позволяя получать отличные показатели.

Дополнительный "плюс" в том, что один из алгоритмов после обучения напрямую реализует на практике те представления, которые заказчик считает правильным подходом в обработке своих данных.

Как начать