Откуда GeoIP сервисы получают данные для определения геолокации

GeoIP IT-технологии
GeoIP
GeoIP

Введение

Данные GeoIP являются основой любого сервиса геолокации по IP-адресу. Однако многие пользователи ошибочно полагают, что существует единый глобальный реестр, в котором для каждого IP уже заранее указан точный город и координаты.

На практике все гораздо сложнее. Современные GeoIP-сервисы формируют свои базы данных из множества источников, объединяют сетевую информацию, данные маршрутизации и сведения об IP-диапазонах, а затем постоянно актуализируют результаты.

В предыдущей статье мы разбирали, как устроены диапазоны IP адресов внутри GeoIP баз данных.

Теперь рассмотрим, откуда GeoIP сервисы получают данные и почему результаты разных поставщиков могут отличаться.


Существует ли единая база GeoIP

Короткий ответ — нет.

Не существует глобального справочника, в котором для каждого IP-адреса указано точное местоположение.

Вместо этого GeoIP-провайдеры собирают информацию из различных источников:

  • интернет-регистраторов;
  • сетевых маршрутов;
  • операторов связи;
  • открытых данных;
  • собственных механизмов анализа.

Каждый поставщик формирует собственную базу GeoIP.


Интернет-регистраторы как источник данных

Одним из основных источников являются региональные интернет-регистраторы.

Крупнейшие организации:

  • RIPE NCC;
  • ARIN;
  • APNIC;
  • AFRINIC;
  • LACNIC.

Именно они распределяют IP-адреса между провайдерами и организациями.

Например:

RIPE NCC

Провайдер

IP диапазон

Эта информация позволяет понять, кому принадлежит конкретный диапазон адресов.

Подробнее здесь.


BGP и маршрутизация

Еще один важный источник данных — BGP (Border Gateway Protocol).

BGP используется для обмена маршрутной информацией между автономными системами.

Схематично:

ASN

BGP маршруты

IP диапазоны

По данным маршрутизации можно определить:

  • владельца сети;
  • ASN;
  • сетевую инфраструктуру;
  • изменения в распределении адресов.

WHOIS данные

WHOIS остается одним из базовых источников информации об IP-адресах.

Через WHOIS можно получить сведения:

  • о владельце диапазона;
  • контактных данных;
  • стране регистрации;
  • ASN.

Однако WHOIS не всегда отражает реальное местоположение пользователей, поэтому используется только как один из элементов анализа.


Данные интернет-провайдеров

Некоторые GeoIP-поставщики сотрудничают с операторами связи и получают дополнительную информацию о сетях.

Это помогает:

  • точнее определять регионы;
  • обновлять данные быстрее;
  • корректнее обрабатывать новые диапазоны.

Однако подобные данные доступны далеко не всем поставщикам.


Собственная аналитика GeoIP сервисов

Современные GeoIP-провайдеры редко ограничиваются только открытыми источниками.

Обычно используются собственные механизмы анализа:

IP диапазон

Сбор информации

Проверка

GeoIP база

Благодаря этому данные постепенно уточняются и становятся более точными.


Почему данные разных сервисов отличаются

Даже если два сервиса используют одинаковые базовые источники, результаты могут различаться.

Причины:

  • разная частота обновлений;
  • различные алгоритмы обработки;
  • собственные методы валидации;
  • разные подходы к определению города.

Именно поэтому один сервис может показать:

Москва

а другой:

Тверь

для одного и того же IP-адреса.


Как обновляются данные GeoIP

Интернет постоянно меняется.

Происходит:

  • перераспределение IP-диапазонов;
  • запуск новых сетей;
  • изменение маршрутизации;
  • появление новых ASN.

Поэтому качественные GeoIP-базы регулярно обновляются.

Например:

Новые данные

Обработка

Обновление базы

Без обновлений качество геолокации постепенно ухудшается.


Почему определение города является самой сложной задачей

Определить страну относительно просто.

С городами ситуация сложнее.

На результат влияют:

  • мобильные сети;
  • NAT;
  • VPN;
  • корпоративные сети;
  • структура инфраструктуры провайдера.

Поэтому данные о городе обычно имеют меньшую точность, чем данные о стране или ASN.


Какие данные обычно содержит GeoIP база

Современная база GeoIP может включать:

  • страну;
  • регион;
  • город;
  • ASN;
  • интернет-провайдера;
  • timezone;
  • тип сети.

Чем больше данных использует сервис, тем шире становятся сценарии его применения.


Как проверить качество источников данных

При выборе GeoIP-сервиса полезно обратить внимание на:

  • частоту обновлений;
  • качество ASN-данных;
  • покрытие IPv6;
  • актуальность диапазонов;
  • прозрачность документации.

Это позволяет оценить надежность поставщика данных.


GeoIP от WildX

Для определения геолокации и сетевых параметров можно использовать GeoIP от WildX.:

Сервис предоставляет данные о:

  • стране;
  • городе;
  • ASN;
  • интернет-провайдере;
  • часовом поясе.

Полученные данные могут использоваться в аналитике, системах безопасности, персонализации и инфраструктурных решениях.


Полезно прочитать

Рекомендуем также ознакомиться:

  • Как устроены диапазоны IP адресов внутри GeoIP баз данных — в статье.
  • Что такое ASN в GeoIP и зачем он нужен бизнесу — в статье.
  • Как оценивать качество GeoIP данных в production-системах — в статье.

Дополнительные материалы

Подробнее о протоколе BGP можно прочитать в Википедии.


Заключение

Данные GeoIP формируются из множества источников: информации интернет-регистраторов, BGP-маршрутизации, WHOIS-записей и собственных механизмов анализа поставщиков.

Именно качество обработки этих данных определяет точность GeoIP-сервиса. Поэтому при выборе решения важно учитывать не только API и скорость работы, но и качество источников, регулярность обновлений и полноту базы данных.

Оцените статью
Добавить комментарий