
- Введение
- Существует ли единая база GeoIP
- Интернет-регистраторы как источник данных
- BGP и маршрутизация
- WHOIS данные
- Данные интернет-провайдеров
- Собственная аналитика GeoIP сервисов
- Почему данные разных сервисов отличаются
- Как обновляются данные GeoIP
- Почему определение города является самой сложной задачей
- Какие данные обычно содержит GeoIP база
- Как проверить качество источников данных
- GeoIP от WildX
- Полезно прочитать
- Дополнительные материалы
- Заключение
Введение
Данные GeoIP являются основой любого сервиса геолокации по IP-адресу. Однако многие пользователи ошибочно полагают, что существует единый глобальный реестр, в котором для каждого IP уже заранее указан точный город и координаты.
На практике все гораздо сложнее. Современные GeoIP-сервисы формируют свои базы данных из множества источников, объединяют сетевую информацию, данные маршрутизации и сведения об IP-диапазонах, а затем постоянно актуализируют результаты.
В предыдущей статье мы разбирали, как устроены диапазоны IP адресов внутри GeoIP баз данных.
Теперь рассмотрим, откуда GeoIP сервисы получают данные и почему результаты разных поставщиков могут отличаться.
Существует ли единая база GeoIP
Короткий ответ — нет.
Не существует глобального справочника, в котором для каждого IP-адреса указано точное местоположение.
Вместо этого GeoIP-провайдеры собирают информацию из различных источников:
- интернет-регистраторов;
- сетевых маршрутов;
- операторов связи;
- открытых данных;
- собственных механизмов анализа.
Каждый поставщик формирует собственную базу GeoIP.
Интернет-регистраторы как источник данных
Одним из основных источников являются региональные интернет-регистраторы.
Крупнейшие организации:
- RIPE NCC;
- ARIN;
- APNIC;
- AFRINIC;
- LACNIC.
Именно они распределяют IP-адреса между провайдерами и организациями.
Например:
RIPE NCC
↓
Провайдер
↓
IP диапазон
Эта информация позволяет понять, кому принадлежит конкретный диапазон адресов.
Подробнее здесь.
BGP и маршрутизация
Еще один важный источник данных — BGP (Border Gateway Protocol).
BGP используется для обмена маршрутной информацией между автономными системами.
Схематично:
ASN
↓
BGP маршруты
↓
IP диапазоны
По данным маршрутизации можно определить:
- владельца сети;
- ASN;
- сетевую инфраструктуру;
- изменения в распределении адресов.
WHOIS данные
WHOIS остается одним из базовых источников информации об IP-адресах.
Через WHOIS можно получить сведения:
- о владельце диапазона;
- контактных данных;
- стране регистрации;
- ASN.
Однако WHOIS не всегда отражает реальное местоположение пользователей, поэтому используется только как один из элементов анализа.
Данные интернет-провайдеров
Некоторые GeoIP-поставщики сотрудничают с операторами связи и получают дополнительную информацию о сетях.
Это помогает:
- точнее определять регионы;
- обновлять данные быстрее;
- корректнее обрабатывать новые диапазоны.
Однако подобные данные доступны далеко не всем поставщикам.
Собственная аналитика GeoIP сервисов
Современные GeoIP-провайдеры редко ограничиваются только открытыми источниками.
Обычно используются собственные механизмы анализа:
IP диапазон
↓
Сбор информации
↓
Проверка
↓
GeoIP база
Благодаря этому данные постепенно уточняются и становятся более точными.
Почему данные разных сервисов отличаются
Даже если два сервиса используют одинаковые базовые источники, результаты могут различаться.
Причины:
- разная частота обновлений;
- различные алгоритмы обработки;
- собственные методы валидации;
- разные подходы к определению города.
Именно поэтому один сервис может показать:
Москва
а другой:
Тверь
для одного и того же IP-адреса.
Как обновляются данные GeoIP
Интернет постоянно меняется.
Происходит:
- перераспределение IP-диапазонов;
- запуск новых сетей;
- изменение маршрутизации;
- появление новых ASN.
Поэтому качественные GeoIP-базы регулярно обновляются.
Например:
Новые данные
↓
Обработка
↓
Обновление базы
Без обновлений качество геолокации постепенно ухудшается.
Почему определение города является самой сложной задачей
Определить страну относительно просто.
С городами ситуация сложнее.
На результат влияют:
- мобильные сети;
- NAT;
- VPN;
- корпоративные сети;
- структура инфраструктуры провайдера.
Поэтому данные о городе обычно имеют меньшую точность, чем данные о стране или ASN.
Какие данные обычно содержит GeoIP база
Современная база GeoIP может включать:
- страну;
- регион;
- город;
- ASN;
- интернет-провайдера;
- timezone;
- тип сети.
Чем больше данных использует сервис, тем шире становятся сценарии его применения.
Как проверить качество источников данных
При выборе GeoIP-сервиса полезно обратить внимание на:
- частоту обновлений;
- качество ASN-данных;
- покрытие IPv6;
- актуальность диапазонов;
- прозрачность документации.
Это позволяет оценить надежность поставщика данных.
GeoIP от WildX
Для определения геолокации и сетевых параметров можно использовать GeoIP от WildX.:
Сервис предоставляет данные о:
- стране;
- городе;
- ASN;
- интернет-провайдере;
- часовом поясе.
Полученные данные могут использоваться в аналитике, системах безопасности, персонализации и инфраструктурных решениях.
Полезно прочитать
Рекомендуем также ознакомиться:
- Как устроены диапазоны IP адресов внутри GeoIP баз данных — в статье.
- Что такое ASN в GeoIP и зачем он нужен бизнесу — в статье.
- Как оценивать качество GeoIP данных в production-системах — в статье.
Дополнительные материалы
Подробнее о протоколе BGP можно прочитать в Википедии.
Заключение
Данные GeoIP формируются из множества источников: информации интернет-регистраторов, BGP-маршрутизации, WHOIS-записей и собственных механизмов анализа поставщиков.
Именно качество обработки этих данных определяет точность GeoIP-сервиса. Поэтому при выборе решения важно учитывать не только API и скорость работы, но и качество источников, регулярность обновлений и полноту базы данных.






