Cada dispositivo conectado à internet possui um endereço IP, e esse endereço IP contém mais informações do que a maioria das pessoas percebe. Não é apenas um identificador técnico para roteamento de pacotes de rede. É um marcador geográfico, uma impressão digital organizacional e um sinal comportamental que, quando adequadamente resolvido, responde questões fundamentais sobre quem está visitando um site, onde está localizado e como está conectado. O processo de resolver um endereço IP para seus metadados geográficos e organizacionais é chamado de busca GeoIP, e é uma daquelas tecnologias invisíveis que alimenta uma enorme quantidade da funcionalidade da internet sem que a maioria dos usuários saiba que ela existe. Quando um site exibe preços em moeda local, o GeoIP faz o trabalho. Quando um serviço de streaming restringe conteúdo por região, o GeoIP faz a determinação. Quando um sistema de detecção de fraude sinaliza uma transação porque o endereço de faturamento diz Londres mas o endereço IP diz Lagos, o GeoIP fornece a evidência.
A tecnologia em si é bem estabelecida. Múltiplas empresas mantêm bancos de dados GeoIP que mapeiam intervalos de endereços IP para localizações geográficas, e esses bancos de dados são atualizados regularmente conforme alocações de IP mudam e novos intervalos são atribuídos. O que não foi bem estabelecido, até recentemente, é o acesso acessível a esses bancos de dados para desenvolvedores e negócios que precisam de capacidade GeoIP mas não podem justificar os modelos de preço dos principais provedores. MaxMind, o jogador dominante no espaço GeoIP, cobra por licenças de banco de dados ou acesso por consulta com taxas que são razoáveis para clientes enterprise processando milhões de buscas diariamente mas desproporcionalmente caras para aplicações menores que precisam de alguns milhares de buscas por mês. As APIs GeoIP em YEB oferecem os mesmos três níveis de resolução geográfica (país, cidade e ASN) com preço por requisição que torna até casos de uso de baixo volume economicamente viáveis.
Os três níveis existem porque diferentes casos de uso requerem diferentes níveis de detalhe. Um sistema de localização de conteúdo que precisa exibir a língua e moeda corretas para um visitante apenas precisa de dados no nível do país. Uma calculadora de envio que precisa estimar custos de entrega com base na região do visitante precisa de dados no nível da cidade. Um sistema de segurança que precisa verificar se um endereço IP pertence a um provedor de hospedagem, um ISP residencial ou uma rede corporativa precisa de dados de ASN (Número do Sistema Autônomo). Oferecer todos os três níveis separadamente significa que aplicações pagam apenas pelo nível de detalhe que realmente usam, em vez de pagar por precisão no nível de cidade quando nível de país seria suficiente.
Busca no Nível do País e as Aplicações que Ela Alimenta
A API GeoIP no nível do país é o nível mais comumente usado e o mais acessível por requisição. Dado um endereço IP, ele retorna o código do país (ISO 3166-1 alfa-2), o nome do país e o continente. Esta é a informação geográfica mínima viável necessária para um número surpreendentemente grande de aplicações. Localização de conteúdo é a mais óbvia: determinando o país do visitante e servindo a linguagem apropriada, moeda e isenções de responsabilidade legais. Um site que opera em doze países precisa mostrar a política de privacidade correta no rodapé, o aviso VAT correto e as informações de contato corretas com base em onde o visitante está localizado. Fazer isso com JavaScript do lado do cliente (pedindo ao navegador a localização do usuário) é intrusivo, requer permissão explícita e falha quando o usuário nega. Fazer com GeoIP é invisível, instantâneo e funciona em cada requisição sem interação do usuário.
A conformidade regulatória é outro grande caso de uso que opera inteiramente no nível do país. GDPR se aplica a visitantes de estados membros da UE. CCPA se aplica a visitantes da Califórnia (que pode ser detectado com dados no nível de cidade, mas nível de país é suficiente para identificar visitantes dos EUA que podem estar sujeitos a CCPA). Restrições de conteúdo podem se aplicar a países específicos devido a acordos de licença, sanções ou leis locais. Plataformas de e-commerce podem precisar bloquear vendas para certos países devido a controles de exportação. Todas essas decisões requerem apenas o país, e a API GeoIP do país fornece pelo custo de uma fração do que uma assinatura mensal para um serviço de geolocalização completo custaria.
Plataformas de análise usam GeoIP no nível de país para construir relatórios de tráfego geográfico. O plugin de análise do WordPress descrito no artigo complementar usa exatamente esta API para resolver o endereço IP de cada visitante para um país, que popula a tabela de divisão de país no painel. Para um site recebendo 10.000 visitas por dia, são 10.000 buscas GeoIP por dia, e com preço por requisição, o custo diário total é medido em centavos em vez de dólares. Com preço de assinatura mensal de provedores GeoIP tradicionais, o mesmo volume custaria entre $20 e $50 por mês dependendo do nível do plano. Durante um ano, a diferença entre preço por requisição e preço de assinatura para este volume é substancial o suficiente para importar para qualquer negócio observando seus custos operacionais.
Busca no Nível da Cidade e Quando a Precisão Importa
A API GeoIP no nível da cidade retorna tudo que a API do país fornece mais o nome da cidade, região ou estado, código postal, latitude e longitude. Esta precisão adicional permite casos de uso que dados no nível de país não conseguem suportar. Diretórios de empresas locais que precisam mostrar resultados relevantes para a cidade do visitante dependem de geolocalização no nível de cidade. Widgets de clima que exibem condições locais precisam saber a cidade, não apenas o país. Plataformas de imóveis que mostram anúncios próximos, aplicativos de descoberta de restaurantes que trazem recomendações locais e sites de notícias que apresentam histórias regionais todos requerem resolução no nível de cidade para funcionar adequadamente.
A precisão de GeoIP no nível de cidade merece uma discussão honesta porque é um dos aspectos mais comumente mal-entendidos da tecnologia. Geolocalização no nível de cidade a partir de endereços IP não é precisão de nível GPS. Não aponta um edifício específico ou endereço de rua. Identifica a cidade ou área metropolitana associada ao intervalo de endereço IP, que é tipicamente a localização do ponto de presença do ISP em vez da localização exata do usuário final. Em áreas urbanas densas, isto é geralmente preciso para a cidade correta. Em áreas rurais servidas por ISPs regionais, a cidade resolvida pode ser a cidade maior mais próxima onde o ISP possui infraestrutura, que poderia estar cinquenta ou cem quilômetros da localização real do usuário. Para a vasta maioria dos casos de uso (personalização de conteúdo, estimativas de envio aproximadas, análise regional), este nível de precisão é mais que suficiente. Para casos de uso que requerem localização precisa (navegação, serviços de emergência, publicidade hiperlocal), GPS permanece a tecnologia apropriada.
Sistemas de detecção de fraude usam GeoIP no nível de cidade como um sinal entre muitos. Quando uma transação de cartão de crédito se origina de um endereço IP em Manila mas o endereço de faturamento do cartão está em Estocolmo, a incompatibilidade geográfica não indica necessariamente fraude (o titular do cartão poderia estar viajando), mas é um sinal forte o suficiente para ativar verificação adicional. Os dados no nível de cidade fornecem a especificidade necessária para tornar essa comparação significativa. Dados no nível de país sinalizariam qualquer transação onde o país do IP difere do país de faturamento, que é muito amplo para viajantes globais. Dados no nível de cidade permitem que o sistema considere cenários mais nuançados: um IP no mesmo país mas cidade diferente do endereço de faturamento pode indicar um titular de cartão que se mudou em vez de um cartão roubado, enquanto um IP em continente diferente é um sinal de fraude muito mais forte.
Busca de ASN e Entendendo Quem Possui a Rede
A API de ASN (Número do Sistema Autônomo) adiciona uma dimensão completamente diferente à inteligência de IP. Em vez de responder "onde está este IP?" ela responde "quem opera a rede à qual este IP pertence?" Um Sistema Autônomo é uma coleção de intervalos de endereços IP gerenciados por uma única organização, e o banco de dados de ASN mapeia cada endereço IP para sua organização operadora, incluindo o nome da organização, o número de ASN e o tipo de rede (ISP, provedor de hospedagem, empresa, instituição educacional, governo). Esta informação é inestimável para casos de uso onde a localização geográfica importa menos que a identidade da rede.
Detecção de bot é a aplicação mais imediatamente prática de dados de ASN. Crawlers legítimos de mecanismos de busca operam a partir de intervalos de IP possuídos por suas empresas-mãe: o crawler do Google vem do ASN do Google, o crawler do Bing vem do ASN da Microsoft. Uma requisição afirmando ser Googlebot mas originária de um endereço IP no ASN de um ISP residencial é quase certamente um bot falso. O plugin de análise do WordPress usa exatamente esta técnica, validando referência cruzada da identidade reivindicada do agente de usuário com a propriedade de ASN do IP de origem, para separar crawlers verificados de impostores. Esta validação é impossível apenas com dados geográficos, porque Google opera data centers em muitos países, então uma verificação geográfica não consegue distinguir entre um Googlebot real de um data center dos EUA e um falso de uma conexão de internet residencial nos EUA.
Sistemas de direcionamento de anúncios e prevenção de fraude usam dados de ASN para distinguir entre tráfego de redes residenciais (usuários reais), provedores de hospedagem (bots potenciais ou proxies) e redes corporativas (leads B2B potenciais). Um clique em um anúncio pago que se origina de um intervalo IP de um provedor de hospedagem é muito mais provável ser fraudulento (click bots, fraude de clique de concorrente) que um clique de um ISP residencial. Filtrar esses cliques antes de serem contados (e cobrados) pode economizar dinheiro significativo dos anunciantes. Similarmente, plataformas de marketing B2B usam dados de ASN para identificar quando visitantes vêm de redes corporativas, já que o nome da organização de ASN frequentemente revela a empresa, permitindo marketing baseado em conta sem exigir que o visitante se identifique.
Preço por Requisição e Por Que Muda a Matemática
A economia dos serviços GeoIP tem historicamente seguido o modelo de assinatura que domina a indústria SaaS. Planos mensais com limites de requisição em camadas, cobranças de excesso além desses limites, e contratos anuais que fixam um preço independentemente do uso real. Para aplicações com necessidades GeoIP previsíveis e de alto volume, esses planos são frequentemente razoáveis. Para aplicações com necessidades variáveis ou de baixo volume, eles representam um custo fixo que não tem relação com o valor extraído.
Considere uma loja de e-commerce sazonal que faz 80% do seu tráfego anual em um período de seis semanas de férias. Sob preço de assinatura, a loja paga a mesma taxa mensal durante os dez meses calmos que faz durante os dois meses de pico. Sob preço por requisição, os meses calmos custam quase nada enquanto os meses de pico custam proporcionalmente ao tráfego real processado. Durante um ano, o custo total sob preço por requisição é tipicamente 40% a 60% menor que o plano de assinatura equivalente, e a economia é ainda mais dramática para aplicações que têm padrões de tráfego imprevisíveis.
O modelo por requisição também elimina o overhead de planejamento que vem com planos de assinatura em camadas. Escolher entre um plano que permite 10.000 buscas por mês e um que permite 100.000 buscas por mês requer prever volumes de tráfego futuro, que é inerentemente incerto. Escolha muito baixo e cobranças de excesso se aplicam. Escolha muito alto e capacidade não-utilizada é desperdiçada. Preço por requisição remove este palpite completamente. Cada busca custa a mesma fração de centavo independentemente de se o total mensal terminar sendo 500 ou 500.000. A única variável é o uso real, e o custo escala linearmente com ele.
Para desenvolvedores avaliando opções de GeoIP, a questão prática não é qual banco de dados tem a maior precisão (os bancos de dados principais estão todos dentro de alguns pontos percentuais um do outro para a maioria das regiões) mas qual modelo de preço se alinha com o padrão de uso da aplicação. Aplicações com tráfego constante, previsível e de alto volume podem descobrir que um plano de assinatura oferece uma melhor taxa por requisição devido a descontos de volume. Aplicações com tráfego variável, imprevisível ou de baixo volume quase sempre encontrarão preço por requisição mais econômico. As APIs GeoIP descritas aqui servem a segunda categoria, e o fazem sem sacrificar qualidade de dados, velocidade de resposta ou amplitude de informação retornada por busca.
Perguntas Frequentes
Quão preciso é a geolocalização de IP no nível do país?
A precisão GeoIP no nível de país é tipicamente acima de 99% para ISPs maiores na maioria dos países. Casos extremos existem para intervalos de IP que são reassignados entre países ou para provedores de internet via satélite onde o gateway pode estar em país diferente do usuário, mas para a vasta maioria das buscas, a identificação de país é confiável.
GeoIP pode determinar o endereço exato da rua de um endereço IP?
Não. GeoIP resolve para o nível de cidade ou área metropolitana no máximo. As coordenadas retornadas por buscas no nível de cidade representam o centro aproximado da cidade identificada, não a localização física do dispositivo. Precisão no nível de rua requer GPS ou tecnologias de localização similares baseadas em dispositivo que envolvem permissão explícita do usuário.
O que é um ASN e por que é útil?
Um Número de Sistema Autônomo (ASN) identifica a organização que opera um bloco de endereços IP. Conhecer o ASN revela se um IP pertence a um ISP residencial, provedor de hospedagem, corporação ou rede governamental. Isto é útil para detecção de bot (verificando identidade de crawler), prevenção de fraude (sinalizando tráfego de IPs de hospedagem) e marketing B2B (identificando visitantes corporativos).
Com que frequência os bancos de dados GeoIP são atualizados?
Os bancos de dados são atualizados regularmente para refletir mudanças nas alocações de endereço IP. Novos intervalos de IP são atribuídos, intervalos existentes são reassignados entre organizações e mapeamentos geográficos mudam conforme ISPs expandem suas redes. Atualizações regulares garantem que resultados de busca permaneçam precisos conforme a paisagem de IP evolui.
Usar GeoIP requer consentimento de cookie sob GDPR?
Buscas GeoIP processam endereços IP, que são considerados dados pessoais sob GDPR. No entanto, se a busca é realizada no lado do servidor e o endereço IP não é armazenado ou compartilhado com terceiros, muitas interpretações de GDPR consideram isso um processamento de interesse legítimo que não requer consentimento explícito. Proprietários de website devem consultar conselho legal para orientação de conformidade específica para sua jurisdição e implementação.
GeoIP pode detectar uso de VPN ou proxy?
GeoIP pode indicar uso de VPN ou proxy indiretamente. Se um endereço IP pertence ao ASN de um provedor VPN conhecido, a busca de ASN identificará a organização como um serviço VPN. Similarmente, endereços IP de ASNs de provedores de hospedagem são mais prováveis serem proxies que conexões residenciais. No entanto, GeoIP sozinho não consegue detectar definitivamente todo uso de VPN, especialmente quando provedores VPN usam intervalos de IP residenciais.