IP til Land til By til ISP for en Brøkdel af en Cent Per Anmodning

Enhver enhed, der er forbundet til internettet, har en IP-adresse, og den pågældende IP-adresse indeholder mere information end de fleste mennesker indser. Det er ikke bare en teknisk identifikator til routing af netværkspakker. Det er en geografisk markør, et organisatorisk fingeraftryk og et adfærdssignal, som ved korrekt opløsning besvarer grundlæggende spørgsmål om, hvem der besøger et websted, hvor de befinder sig, og hvordan de er forbundet. Processen med at opløse en IP-adresse til dens geografiske og organisatoriske metadata kaldes GeoIP-søgning, og det er en af disse usynlige teknologier, der driver en enormt stor del af internetfunktionaliteten uden, at de fleste brugere overhovedet er klar over det. Når et websted viser priser i den lokale valuta, udfører GeoIP arbejdet. Når en streamingservice begrænser indhold efter region, foretager GeoIP bestemmelsen. Når et bedrageriopsporigssystem markerer en transaktion, fordi fakturaadresse siger London, men IP-adressen siger Lagos, leverer GeoIP beviserne.

Teknologien selv er velkendt. Flere virksomheder vedligeholder GeoIP-databaser, der kortlægger IP-adresseintervaller til geografiske steder, og disse databaser opdateres regelmæssigt, da IP-allokeringer ændres, og nye intervaller tildeles. Det, der ikke er blevet veletableret før for nylig, er billig adgang til disse databaser for udvikler og virksomheder, der har brug for GeoIP-kapacitet, men ikke kan retfærdiggøre prismodellerne fra de større udbydere. MaxMind, den dominerende aktør inden for GeoIP-området, opkrævning for databaselicenser eller per-query-adgang til takster, der er rimelige for virksomheder, der behandler millioner af søgninger dagligt, men uforholdsmæssigt dyre for mindre applikationer, der har brug for få tusinde søgninger pr. måned. GeoIP API'erne på YEB tilbyder de samme tre niveauer af geografisk opløsning (land, by og ASN) til prisbetaling pr. anmodning, som gør selv brugssager med lav volumen økonomisk levedygtige.

De tre niveauer eksisterer, fordi forskellige brugssager kræver forskellige detaljegradniveauer. Et indholdslokalisseringssystem, der kun har brug for at vise det korrekte sprog og valuta for en besøgende, har kun brug for data på landniveau. En forsendelseskalulator, der skal estimere leveringsomkostninger baseret på besøgendes region, har brug for data på byniveau. Et sikkerhedssystem, der skal verificere, om en IP-adresse tilhører en hostingudbyder, et boligligt ISP eller et virksomhedsnetværk, har brug for ASN-data (Autonomous System Number). Tilbud af alle tre niveauer separat betyder, at applikationer kun betaler for det detaljegradsniveau, de faktisk bruger, i stedet for at betale for præcision på byniveau, når landniveau ville være tilstrækkeligt.

Landsøgning på landniveau og de applikationer, det drives

GeoIP API på landniveau er det mest almindeligt brugte lag og det mest billigt pr. anmodning. Givet en IP-adresse returnerer den landekoden (ISO 3166-1 alpha-2), landets navn og kontinentet. Dette er de minimale levedygtige geografiske oplysninger, der er nødvendige for et overraskende stort antal applikationer. Indholdslokalisering er det mest indlysende: bestemmelse af besøgendes land og betjening af det passende sprog, valuta og juridisk ansvar. Et websted, der opererer i tolv lande, skal vise den korrekte persondatapolitik-footer, meddelelsen om den korrekte moms og de korrekte kontaktoplysninger baseret på, hvor besøgende befinder sig. At gøre dette med JavaScript på klientsiden (anmoder browserens lokation til brugeren) er påtrængende, kræver eksplicit tilladelse og mislykkes, når brugeren nægter. At gøre det med GeoIP er usynligt, øjeblikkeligt og fungerer på hver anmodning uden brugerinteraktion.

Regulatorisk overholdelse er et andet større brugsmønster, der opererer helt på landniveau. GDPR gælder besøgende fra EU-medlemsstater. CCPA gælder for besøgende fra Californien (som kan detekteres med data på byniveau, men landniveau er tilstrækkeligt til at identificere amerikanske besøgende, der kan falde ind under CCPA). Indholdsbegrænsninger kan gælde for bestemte lande på grund af licensaftaler, sanktioner eller lokale love. E-commerce-platforme kan have brug for at blokere salg til bestemte lande på grund af eksportkontrol. Alle disse beslutninger kræver kun landet, og GeoIP-landet API leverer det for en brøkdel af, hvad et månedligt abonnement på en fuldstændig geolokaliseringstjeneste ville koste.

Analyseplatforme bruger GeoIP på landniveau til at opbygge geografiske trafikrapporter. WordPress-analyseudvidelsen, der er beskrevet i den medfølgende artikel, bruger netop denne API til at løse hver besøgendes IP-adresse til et land, hvilket udfylder tabel over landopdeling på dashboardet. For et websted, der modtager 10.000 besøg pr. dag, er det 10.000 GeoIP-søgninger pr. dag, og til prisbetaling pr. anmodning er de samlede daglige omkostninger målt i cents snarere end dollars. Efter månedsabonnementspriser fra traditionelle GeoIP-udbydere ville det samme volumen koste mellem 20 og 50 dollars pr. måned afhængigt af plantrinnet. Over et år er forskellen mellem prisbetaling pr. anmodning og abonnementspriser for dette volumen stor nok til at betyde for enhver virksomhed, der holder øje med sine driftsomkostninger.

By-niveau søgning og hvornår præcision betyder noget

GeoIP API på byniveau returnerer alt, hvad landets API leverer, plus bynamnet, region eller stat, postnummer, breddegrad og længdegrad. Denne ekstra præcision muliggør brugssager, som data på landniveau ikke kan understøtte. Lokale erhvervskataloger, der skal vise resultater, der er relevante for besøgendes by, afhænger af geolokalisering på byniveau. Vejrudsigtswidgets, der viser lokale betingelser, skal kende byen, ikke blot landet. Ejendomsplatforme, der viser nærliggende annoncer, restaurantfindings-apps, der fremviser lokale anbefalinger, og nyhedssider, der har regionale historier, kræver alle opløsning på byniveau for at fungere korrekt.

Nøjagtigheden af GeoIP på byniveau fortjener en ærlig diskussion, fordi det er et af de mest misforståede aspekter af teknologien. By-niveau-geolokalisering fra IP-adresser er ikke GPS-niveau-præcision. Det pinpoint en bestemt bygning eller gadeadresse ikke. Det identificerer byen eller storbyområdet forbundet med IP-adresseintervallet, som typisk er stedet for ISP'ens tilstedeværelsestedet snarere end enhedens nøjagtige placering. I tæt beboede byområder er dette normalt præcist til den korrekte by. I landdistrikter serveret af regionale ISP'er kan den løste by være den nærmeste større by, hvor ISP har infrastruktur, som kunne være halvtreds eller hundrede kilometer fra brugerens faktiske placering. For langt de fleste brugssager (indholdspersonalisering, omtrentlige forsendelsesestimatker, regional analyse) er dette nøjagtighedsniveau mere end tilstrækkeligt. For brugssager, der kræver præcis lokation (navigation, nødejeneste, hyper-lokal annoncering), forbliver GPS den passende teknologi.

Bedrageriopsporigssystemer bruger GeoIP på byniveau som et signal blandt mange. Når en kreditkorttransaktion stammer fra en IP-adresse i Manila, men kortets fakturaadresse er i Stockholm, betyder det geografiske mismatch ikke nødvendigvis svig (kortholderen kunne rejse), men det er et stærkt nok signal til at udløse yderligere bekræftelse. Data på byniveau giver den specificitet, der er nødvendig for at gøre denne sammenligning meningsfuld. Data på landniveau ville markere enhver transaktion, hvor IP-landet adskiller sig fra fakturalandekode, hvilket er for bredt til globale rejsende. Data på byniveau giver systemet mulighed for at overveje mere nuancerede scenarier: en IP i det samme land, men en anden by end fakturaadresse, kan indikere en flyttet korteholder snarere end et stjålet kort, mens en IP på en anden kontinentkode er et meget stærkere bedragerisignal.

ASN-søgning og forståelse af hvem der ejer netværket

ASN-API (Autonomous System Number) tilføjer en helt anden dimension til IP-intelligens. I stedet for at besvare "hvor er denne IP?" besvarer det "hvem driver netværket, denne IP tilhører?" Et autonomt system er en samling af IP-adresseintervaller administreret af en enkelt organisation, og ASN-databasen kortlægger hver IP-adresse til dens driftsorganisation, herunder organisationens navn, ASN-nummeret og netværkets type (ISP, hostingudbyder, virksomhed, uddannelsesinstitution, regering). Disse oplysninger er af uvurderlig værdi for brugssager, hvor den geografiske placering betyder mindre end netværksidentiteten.

Botdetektering er det mest umiddelbar praktisk anvendelse af ASN-data. Legitime søgemaskine-crawlere opererer fra IP-intervaller ejet af deres moderselskaber: Googles crawler kommer fra Googles ASN, Bing's crawler kommer fra Microsofts ASN. En anmodning, der hævder at være Googlebot, men stammer fra en IP-adresse i et boligligt ISP's ASN, er næsten helt sikkert en falsk bot. WordPress-analyseudvidelsen bruger netop denne teknik, krydstjekker brugeragentens påstået identitet med ASN-ejerskabet af kilde-IP'en for at adskille verificerede crawlere fra impostorer. Denne validering er umulig med kun geografiske data, fordi Google opererer datacentre i mange lande, så et geografisk tjek kan ikke skelne mellem en rigtig Googlebot fra et amerikanske datacenter og en falsk fra en amerikansk hjemmenetforbindelse.

Annoncetargeting- og bedrageropspringsystemer bruger ASN-data til at skelne mellem trafik fra boligligt netværker (rigtige brugere), hostingudbydere (potentielle bots eller proxyer) og virksomhedsnetværker (potentielle B2B-leads). Et klik på en betalt annonce, som stammer fra en hostingudbyder IP-interval, er meget mere sandsynligt at være bedragerisk (klikbots, konkurrencer clickfraud) end et klik fra et boligligt ISP. Filtrering af disse klik, før de tælles (og faktureres), kan spare annonceringe betydelig penge. Ligeledes bruger B2B-markedsføringsplatforme ASN-data til at identificere, når besøgende kommer fra virksomhedsnetværker, da ASN-organisationens navn ofte afslører virksomheden, hvilket muliggør kontobaseret markedsføring uden at kræve, at besøgende identificerer sig selv.

Prisbetaling pr. anmodning og hvorfor det ændrer matematikken

Økonomien for GeoIP-tjenester har historisk fulgt abonnementsmodellen, der dominerer SaaS-industrien. Månedlige planer med lagdelte anmodningsgrænserne, overskridelsesgebyrer ud over disse grænser og årlige kontrakter, der låser en pris uanset faktisk forbrug. For applikationer med forudsigelig, høj-volumens GeoIP-behov er disse planer ofte rimelige. For applikationer med variabel eller lav-volumen-behov repræsenterer de en fast omkostning, der har ingen forhold til den værdi, der blev ekstraheret.

Overvej en sæsonbundet e-commerce-butik, der udfører 80% af dens årlige trafik i en seks-ugers-feriperiode. Under abonnementspriser betaler butikken det samme månedlige gebyr under de ti stille måneder, da den gør i løbet af de to spidsmoneder. Under prisbetaling pr. anmodning koster de stille måneder næsten intet, mens spidsmonederne koster proportionalt med den faktiske behandlede trafik. Over et år er de samlede omkostninger under prisbetaling pr. anmodning typisk 40% til 60% lavere end den tilsvarende abonnementsplan, og besparelsen er endnu mere dramatisk for applikationer, der har uforudsigelig trafikmønstre.

Prisbetaling pr. anmodning eliminerer også planlægningsomkostninger, der følger med lagdelte abonnementsplaner. Valg mellem en plan, der tillader 10.000 søgninger pr. måned og en, der tillader 100.000 søgninger pr. måned, kræver forudsigelse af fremtidigt trafikvolumener, hvilket er iboende usikker. Vælg for lavt, og overskridelsesgebyrer anvendes. Vælg for højt, og ubrugt kapacitet bliver spildt. Prisbetaling pr. anmodning fjerner dette gætteri helt. Hver søgning koster den samme brøkdel af en cent uanset, om det månedlige total ender med at være 500 eller 500.000. Den eneste variabel er faktisk forbrug, og omkostningen skalerer lineært med det.

For udviklere, der evaluerer GeoIP-optioner, er det praktiske spørgsmål ikke, hvilken database, der har den højeste nøjagtighed (de store databaser er alle inden for nogle få procentpoint fra hinanden for de fleste regioner), men hvilken prismodel der passer med applikationens brugsmønster. Applikationer med steady, forudsigelig, høj-volumens trafik kan finde, at en abonnementsplan tilbyder en bedre pris pr. anmodning på grund af volumrabatter. Applikationer med variabel, uforudsigelig eller lav-volumen-trafik vil næsten altid finde prisbetaling pr. anmodning mere økonomisk. GeoIP API'erne beskrevet her tjener den anden kategori, og de gør det uden at ofre datakvalitet, svartid eller bredden af information returneret pr. søgning.

Hyppigt stillede spørgsmål

Hvor præcis er IP-geolokalisering på landniveau?

Nøjagtighed af GeoIP på landniveau er typisk over 99% for store ISP'er i de fleste lande. Kantsager eksisterer for IP-intervaller, der bliver gentildelt mellem lande, eller for satellit-internetudbydere, hvor gatewayen kan være i et andet land end brugeren, men for langt de fleste søgninger, er landidentifikationen pålidelig.

Kan GeoIP bestemme den nøjagtige gadeadresse på en IP-adresse?

Nej. GeoIP løser til by- eller storbyområdeniveau højst. Koordinaterne returneret af søgninger på byniveau repræsenterer det omtrentlige centrum for den identificerede by, ikke den fysiske placering af enheden. Gade-niveau-præcision kræver GPS eller lignende enheds-baserede lokaliseringstekhnologier, der involverer eksplicit bruger tilladelse.

Hvad er en ASN, og hvorfor er det nyttigt?

Et Autonomous System Number (ASN) identificerer den organisation, der driver en blok IP-adresser. At kende ASN'en afslører, om en IP tilhører et boligligt ISP, en hostingudbyder, et selskab eller et regeringsnetværk. Dette er nyttigt til botdetektering (verificering af crawler-identitet), bedrageriopsporing (markering af trafik fra hosting-IP'er) og B2B-markedsføring (identificering af virksomhedsbesøgende).

Hvor ofte opdateres GeoIP-databaserne?

Databaserne opdateres regelmæssigt for at afspejle ændringer i IP-adresseallokering. Nye IP-intervaller tildeles, eksisterende intervaller gentildeles mellem organisationer, og geografiske kortlægninger ændres, efterhånden som ISP'er udvider deres netværker. Regelmæssige opdateringer sikrer, at søgeresultater forbliver præcise, mens IP-landskabet udvikler sig.

Kræver brugen af GeoIP cookie-samtykke under GDPR?

GeoIP-søgninger behandler IP-adresser, som anses for personlige data under GDPR. Imidlertid, hvis søgningen udføres på serversiden, og IP-adressen ikke gemmes eller deles med tredjeparter, betragter mange GDPR-fortolkninger dette som en legitim interessebehandling, der ikke kræver eksplicit samtykke. Webstedsejere skal rådføre juridisk rådgiver for overholdelsesføring specifik for deres jurisdiktion og implementering.

Kan GeoIP påvise VPN- eller proxy-brug?

GeoIP kan indirekte angive VPN- eller proxy-brug. Hvis en IP-adresse tilhører en kendt VPN-udbyders ASN, vil ASN-søgningen identificere organisationen som en VPN-tjeneste. Ligeledes er IP-adresser fra hosting-udbyder-ASN'er mere sandsynligt at være proxyer end boligligt forbindelser. GeoIP alene kan dog ikke endeligt påvise alt VPN-brug, især når VPN-udbydere bruger boligligt IP-intervaller.