IP đến Quốc gia đến Thành phố đến ISP với Chi phí chỉ là Một Phần Triệu của Một Đô la Mỗi Yêu cầu

Mỗi thiết bị kết nối với internet đều có một địa chỉ IP, và địa chỉ IP đó mang theo nhiều thông tin hơn mà hầu hết mọi người nhận ra. Nó không chỉ là một định danh kỹ thuật để định tuyến các gói tin mạng. Nó là một dấu hiệu địa lý, một dấu tay tổ chức, và một tín hiệu hành vi mà, khi được giải quyết đúng cách, trả lời những câu hỏi cơ bản về ai đang truy cập một trang web, họ ở đâu, và cách họ được kết nối. Quá trình giải quyết một địa chỉ IP sang siêu dữ liệu địa lý và tổ chức của nó được gọi là tra cứu GeoIP, và nó là một trong những công nghệ vô hình giúp cấp nguồn cho một lượng khổng lồ chức năng của internet mà hầu hết người dùng không bao giờ biết nó tồn tại. Khi một trang web hiển thị giá ở tiền tệ địa phương, GeoIP đang thực hiện công việc. Khi một dịch vụ phát trực tuyến hạn chế nội dung theo khu vực, GeoIP đưa ra quyết định. Khi một hệ thống phát hiện gian lận đánh dấu một giao dịch vì địa chỉ thanh toán nói London nhưng địa chỉ IP nói Lagos, GeoIP cung cấp bằng chứng.

Công nghệ tự nó đã được thiết lập tốt. Nhiều công ty duy trì cơ sở dữ liệu GeoIP ánh xạ các dải địa chỉ IP sang các vị trí địa lý, và các cơ sở dữ liệu này được cập nhật thường xuyên khi phân bổ IP thay đổi và các dải mới được gán. Điều chưa được thiết lập tốt cho đến gần đây là truy cập giá rẻ vào các cơ sở dữ liệu này cho các nhà phát triển và doanh nghiệp cần khả năng GeoIP nhưng không thể biện minh cho các mô hình giá của các nhà cung cấp lớn. MaxMind, người chơi chiếm ưu thế trong không gian GeoIP, tính phí cho các giấy phép cơ sở dữ liệu hoặc truy cập theo yêu cầu với các tỷ lệ hợp lý cho khách hàng doanh nghiệp xử lý hàng triệu tra cứu hàng ngày nhưng quá đắt cho các ứng dụng nhỏ hơn cần hàng ngàn tra cứu mỗi tháng. Các API GeoIP tại YEB cung cấp ba tầng giải quyết địa lý giống nhau (quốc gia, thành phố và ASN) với giá tính theo yêu cầu giúp thậm chí các trường hợp sử dụng khối lượng thấp cũng khả thi về kinh tế.

Ba tầng tồn tại vì các trường hợp sử dụng khác nhau yêu cầu các mức độ chi tiết khác nhau. Một hệ thống bản địa hóa nội dung chỉ cần hiển thị ngôn ngữ và tiền tệ chính xác cho khách truy cập chỉ cần dữ liệu cấp quốc gia. Một máy tính giao hàng cần ước tính chi phí giao hàng dựa trên khu vực của khách truy cập cần dữ liệu cấp thành phố. Một hệ thống bảo mật cần xác minh xem liệu một địa chỉ IP có thuộc về nhà cung cấp lưu trữ, ISP dân cư, hay mạng công ty cần dữ liệu ASN (Số Hệ thống Tự trị). Cung cấp cả ba tầng riêng biệt có nghĩa là các ứng dụng chỉ trả tiền cho mức độ chi tiết mà chúng thực sự sử dụng, thay vì trả tiền cho độ chính xác cấp thành phố khi cấp quốc gia sẽ đủ.

Tra cứu Cấp Quốc gia và Các Ứng dụng Mà Nó Hỗ trợ

Các API GeoIP cấp quốc gia là tầng được sử dụng phổ biến nhất và giá rẻ nhất cho mỗi yêu cầu. Cho một địa chỉ IP, nó trả về mã quốc gia (ISO 3166-1 alpha-2), tên quốc gia và lục địa. Đây là thông tin địa lý tối thiểu cần thiết cho một số lượng lớn ứng dụng có vẻ ngạc nhiên. Bản địa hóa nội dung là điều rõ ràng nhất: xác định quốc gia của khách truy cập và phục vụ ngôn ngữ, tiền tệ và tuyên bố pháp lý thích hợp. Một trang web hoạt động ở mười hai quốc gia cần hiển thị chân trang chính sách bảo mật chính xác, thông báo VAT chính xác và thông tin liên hệ chính xác dựa trên vị trí của khách truy cập. Làm điều này với JavaScript phía máy khách (yêu cầu trình duyệt cung cấp vị trí của người dùng) là xâm phạm, yêu cầu quyền rõ ràng và không thành công khi người dùng từ chối. Làm điều này với GeoIP là vô hình, tức thời và hoạt động trên mỗi yêu cầu mà không cần tương tác của người dùng.

Tuân thủ quy định là một trường hợp sử dụng chính khác hoạt động hoàn toàn ở cấp quốc gia. GDPR áp dụng cho khách truy cập từ các quốc gia thành viên EU. CCPA áp dụng cho khách truy cập từ California (có thể được phát hiện bằng dữ liệu cấp thành phố, nhưng cấp quốc gia là đủ để xác định khách truy cập từ Mỹ có thể thuộc về CCPA). Các hạn chế nội dung có thể áp dụng cho các quốc gia cụ thể do các thỏa thuận cấp phép, lệnh trừng phạt hoặc luật địa phương. Các nền tảng thương mại điện tử có thể cần chặn bán hàng cho một số quốc gia do kiểm soát xuất khẩu. Tất cả các quyết định này chỉ yêu cầu quốc gia, và API quốc gia GeoIP cung cấp nó với chi phí là một phần nhỏ so với những gì một dịch vụ địa định vị đầy đủ sẽ chi phí hàng tháng.

Các nền tảng phân tích sử dụng GeoIP cấp quốc gia để xây dựng các báo cáo lưu lượng địa lý. Plugin phân tích WordPress được mô tả trong bài viết đi kèm sử dụng chính xác API này để giải quyết từng địa chỉ IP của khách truy cập sang một quốc gia, điều này điền vào bảng phân tích quốc gia trên bảng điều khiển. Đối với một trang web nhận 10.000 lượt truy cập mỗi ngày, đó là 10.000 tra cứu GeoIP mỗi ngày, và với giá tính theo yêu cầu, tổng chi phí hàng ngày được đo bằng xu chứ không phải đô la. Với giá đăng ký hàng tháng từ các nhà cung cấp GeoIP truyền thống, cùng khối lượng sẽ chi phí từ 20 đến 50 đô la mỗi tháng tùy thuộc vào tầng kế hoạch. Trong một năm, sự khác biệt giữa giá tính theo yêu cầu và giá đăng ký cho khối lượng này là đủ lớn để quan trọng đối với bất kỳ doanh nghiệp nào theo dõi chi phí hoạt động của nó.

Tra cứu Cấp Thành phố và Thời điểm Độ chính xác Quan trọng

Các API GeoIP cấp thành phố trả về mọi thứ mà API quốc gia cung cấp cộng với tên thành phố, khu vực hoặc bang, mã bưu chính, vĩ độ và kinh độ. Độ chính xác bổ sung này cho phép các trường hợp sử dụng mà dữ liệu cấp quốc gia không thể hỗ trợ. Các thư mục kinh doanh địa phương cần hiển thị kết quả liên quan đến thành phố của khách truy cập phụ thuộc vào định vị địa lý cấp thành phố. Các tiện ích thời tiết hiển thị các điều kiện địa phương cần biết thành phố, không chỉ quốc gia. Các nền tảng bất động sản hiển thị các danh sách gần đó, các ứng dụng khám phá nhà hàng bề mặt các đề xuất địa phương và các trang tin tức có tính năng các câu chuyện khu vực tất cả đều yêu cầu giải quyết cấp thành phố để hoạt động đúng cách.

Độ chính xác của GeoIP cấp thành phố xứng đáng được thảo luận trung thực vì nó là một trong những khía cạnh được hiểu sai nhiều nhất của công nghệ. Định vị địa lý cấp thành phố từ các địa chỉ IP không phải là độ chính xác ở mức GPS. Nó không xác định một tòa nhà hoặc địa chỉ đường phố cụ thể. Nó xác định thành phố hoặc khu vực đô thị liên quan đến dải địa chỉ IP, đó thường là vị trí của điểm hiện diện của ISP chứ không phải vị trí chính xác của người dùng cuối. Trong các khu vực đô thị dày đặc, điều này thường chính xác ở thành phố chính xác. Trong các khu vực nông thôn được phục vụ bởi các ISP khu vực, thành phố được giải quyết có thể là thành phố lớn gần nhất nơi ISP có cơ sở hạ tầng, điều này có thể cách vị trí thực tế của người dùng năm mươi hoặc một trăm km. Đối với phần lớn các trường hợp sử dụng (cá nhân hóa nội dung, ước tính giao hàng xấp xỉ, phân tích khu vực), mức độ độ chính xác này là hơn đủ. Đối với các trường hợp sử dụng yêu cầu vị trí chính xác (điều hướng, dịch vụ khẩn cấp, quảng cáo cực kỳ địa phương), GPS vẫn là công nghệ thích hợp.

Các hệ thống phát hiện gian lận sử dụng GeoIP cấp thành phố như một tín hiệu trong số nhiều. Khi giao dịch thẻ tín dụng bắt nguồn từ một địa chỉ IP ở Manila nhưng địa chỉ thanh toán của thẻ ở Stockholm, sự không khớp địa lý không nhất thiết chỉ ra gian lận (chủ thẻ có thể đang đi du lịch), nhưng nó là một tín hiệu đủ mạnh để kích hoạt xác minh bổ sung. Dữ liệu cấp thành phố cung cấp độ chi tiết cần thiết để so sánh có ý nghĩa này. Dữ liệu cấp quốc gia sẽ đánh dấu bất kỳ giao dịch nào trong đó quốc gia IP khác với quốc gia thanh toán, quá rộng cho những người du lịch toàn cầu. Dữ liệu cấp thành phố cho phép hệ thống xem xét các kịch bản tinh tế hơn: một IP ở cùng quốc gia nhưng thành phố khác với địa chỉ thanh toán có thể chỉ ra một chủ thẻ đã chuyển chứ không phải một thẻ bị đánh cắp, trong khi một IP ở một lục địa khác là một tín hiệu gian lận mạnh hơn nhiều.

Tra cứu ASN và Hiểu Người Sở hữu Mạng

API ASN (Số Hệ thống Tự trị) thêm một chiều hoàn toàn khác vào trí thông minh IP. Thay vì trả lời "IP này ở đâu?" nó trả lời "ai vận hành mạng mà IP này thuộc về?" Một Hệ thống Tự trị là một bộ sưu tập các dải địa chỉ IP được quản lý bởi một tổ chức duy nhất, và cơ sở dữ liệu ASN ánh xạ mọi địa chỉ IP sang tổ chức vận hành của nó, bao gồm tên tổ chức, số ASN và loại mạng (ISP, nhà cung cấp lưu trữ, doanh nghiệp, tổ chức giáo dục, chính phủ). Thông tin này vô giá cho các trường hợp sử dụng trong đó danh tính mạng quan trọng hơn vị trí địa lý.

Phát hiện bot là ứng dụng thực tế hữu ích nhất của dữ liệu ASN. Các trình thu thập dữ liệu công cụ tìm kiếm hợp pháp hoạt động từ các dải IP sở hữu bởi công ty mẹ của chúng: trình thu thập dữ liệu của Google đến từ ASN của Google, trình thu thập dữ liệu của Bing đến từ ASN của Microsoft. Một yêu cầu tuyên bố là Googlebot nhưng bắt nguồn từ một địa chỉ IP trong ASN của một ISP dân cư gần như chắc chắn là một bot giả. Plugin phân tích WordPress sử dụng chính xác kỹ thuật này, tham chiếu chéo danh tính được tuyên bố của tác nhân người dùng với quyền sở hữu ASN của IP nguồn, để tách các trình thu thập dữ liệu được xác minh khỏi những người giả mạo. Xác thực này là không thể chỉ với dữ liệu địa lý, vì Google hoạt động các trung tâm dữ liệu ở nhiều quốc gia, vì vậy một kiểm tra địa lý không thể phân biệt giữa một Googlebot thực từ trung tâm dữ liệu Mỹ và một giả từ kết nối internet nhà ở Mỹ.

Các hệ thống nhắm mục tiêu quảng cáo và phòng chống gian lận sử dụng dữ liệu ASN để phân biệt giữa lưu lượng từ các mạng dân cư (người dùng thực), nhà cung cấp lưu trữ (bot hoặc proxy tiềm năng) và mạng công ty (khách hàng B2B tiềm năng). Một cú nhấp chuột trên quảng cáo trả tiền bắt nguồn từ dải IP của nhà cung cấp lưu trữ có khả năng gian lận cao hơn nhiều (click bot, gian lận nhấp chuột đối thủ cạnh tranh) so với cú nhấp từ ISP dân cư. Lọc các cú nhấp này trước khi chúng được đếm (và tính hóa đơn) có thể tiết kiệm cho các nhà quảng cáo một khoản tiền đáng kể. Tương tự như vậy, các nền tảng tiếp thị B2B sử dụng dữ liệu ASN để xác định khi khách truy cập đến từ các mạng công ty, vì tên tổ chức ASN thường tiết lộ công ty, cho phép tiếp thị dựa trên tài khoản mà không yêu cầu khách truy cập xác định chính họ.

Giá Tính theo Yêu cầu và Lý do Nó Thay đổi Phép tính

Kinh tế của các dịch vụ GeoIP trong lịch sử đã theo sau mô hình đăng ký chiếm ưu thế trong ngành công nghiệp SaaS. Các kế hoạch hàng tháng với giới hạn yêu cầu phân tầng, phí vượt quá những giới hạn đó và các hợp đồng hàng năm khóa giá bất kể sử dụng thực tế. Đối với các ứng dụng có nhu cầu GeoIP khối lượng cao, có thể dự đoán được, các kế hoạch này thường hợp lý. Đối với các ứng dụng có nhu cầu thay đổi hoặc khối lượng thấp, chúng đại diện cho chi phí cố định không liên quan đến giá trị được chiết xuất.

Xem xét một cửa hàng thương mại điện tử theo mùa đó có 80% lưu lượng hàng năm của nó trong sáu tuần lễ kỳ nghỉ. Theo giá đăng ký, cửa hàng trả cùng một khoản phí hàng tháng trong mười tháng im lặng khi nó thực hiện trong hai tháng cao điểm. Theo giá tính theo yêu cầu, những tháng im lặng chi phí gần như không có gì trong khi những tháng cao điểm chi phí tương xứng với lưu lượng thực tế được xử lý. Trong một năm, tổng chi phí theo giá tính theo yêu cầu điển hình là 40% đến 60% thấp hơn so với kế hoạch đăng ký tương đương, và tiết kiệm thậm chí còn đáng kể hơn đối với các ứng dụng có các mẫu lưu lượng không thể dự đoán được.

Mô hình tính theo yêu cầu cũng loại bỏ chi phí lập kế hoạch đi kèm với các kế hoạch đăng ký phân tầng. Chọn giữa một kế hoạch cho phép 10.000 tra cứu mỗi tháng và một kế hoạch cho phép 100.000 tra cứu mỗi tháng yêu cầu dự đoán khối lượng lưu lượng trong tương lai, điều này vốn không chắc chắn. Chọn quá thấp và phí vượt quá áp dụng. Chọn quá cao và dung lượng không sử dụng bị lãng phí. Giá tính theo yêu cầu loại bỏ hoàn toàn phỏng đoán này. Mỗi tra cứu chi phí cùng một phần nhỏ của một xu bất kể liệu tổng hàng tháng kết thúc là 500 hay 500.000. Biến duy nhất là sử dụng thực tế, và chi phí tính theo tuyến tính với nó.

Đối với các nhà phát triển đánh giá các tùy chọn GeoIP, câu hỏi thực tế không phải là cơ sở dữ liệu nào có độ chính xác cao nhất (các cơ sở dữ liệu chính đều nằm trong vài điểm phần trăm của nhau đối với hầu hết các khu vực) nhưng mô hình giá nào phù hợp với mẫu sử dụng của ứng dụng. Các ứng dụng có lưu lượng ổn định, có thể dự đoán được, khối lượng cao có thể thấy rằng một kế hoạch đăng ký cung cấp tỷ lệ tính theo yêu cầu tốt hơn do giảm giá khối lượng. Các ứng dụng có lưu lượng thay đổi, không thể dự đoán được hoặc khối lượng thấp sẽ gần như luôn luôn tìm thấy giá tính theo yêu cầu kinh tế hơn. Các API GeoIP được mô tả ở đây phục vụ danh mục thứ hai, và chúng làm như vậy mà không hy sinh chất lượng dữ liệu, tốc độ phản hồi hoặc độ rộng của thông tin được trả về cho mỗi tra cứu.

Các Câu hỏi Thường gặp

Độ chính xác của địa định vị IP ở cấp quốc gia là bao nhiêu?

Độ chính xác GeoIP cấp quốc gia thường trên 99% cho các ISP chính ở hầu hết các quốc gia. Các trường hợp biên tồn tại cho các dải IP được gán lại giữa các quốc gia hoặc cho các nhà cung cấp internet vệ tinh trong đó cổng có thể ở một quốc gia khác với người dùng, nhưng đối với phần lớn các tra cứu, việc xác định quốc gia là đáng tin cậy.

Có thể GeoIP xác định địa chỉ đường phố chính xác của một địa chỉ IP không?

Không. GeoIP giải quyết thành phố hoặc cấp độ khu vực đô thị tốt nhất. Các tọa độ được trả về bởi tra cứu cấp thành phố đại diện cho trung tâm xấp xỉ của thành phố được xác định, không phải vị trí vật lý của thiết bị. Độ chính xác ở mức đường phố yêu cầu GPS hoặc các công nghệ vị trí dựa trên thiết bị tương tự liên quan đến quyền rõ ràng của người dùng.

ASN là gì và tại sao nó hữu ích?

Số Hệ thống Tự trị (ASN) xác định tổ chức vận hành một khối địa chỉ IP. Biết ASN tiết lộ liệu một IP thuộc về ISP dân cư, nhà cung cấp lưu trữ, công ty hay mạng chính phủ. Điều này hữu ích cho phát hiện bot (xác minh danh tính trình thu thập dữ liệu), phòng chống gian lận (đánh dấu lưu lượng từ IP lưu trữ) và tiếp thị B2B (xác định khách truy cập công ty).

Cơ sở dữ liệu GeoIP được cập nhật bao thường xuyên?

Các cơ sở dữ liệu được cập nhật thường xuyên để phản ánh các thay đổi trong phân bổ địa chỉ IP. Các dải IP mới được gán, các dải hiện có được gán lại giữa các tổ chức và ánh xạ địa lý thay đổi khi ISP mở rộng mạng của họ. Các cập nhật thường xuyên đảm bảo rằng kết quả tra cứu vẫn chính xác khi bộ cảnh IP phát triển.

Sử dụng GeoIP có yêu cầu sự đồng ý cookie theo GDPR không?

Tra cứu GeoIP xử lý các địa chỉ IP, được coi là dữ liệu cá nhân theo GDPR. Tuy nhiên, nếu tra cứu được thực hiện phía máy chủ và địa chỉ IP không được lưu trữ hoặc chia sẻ với bên thứ ba, nhiều diễn giải GDPR coi đây là xử lý lợi ích hợp pháp không yêu cầu sự đồng ý rõ ràng. Chủ sở hữu trang web nên tham khảo ý kiến pháp lý về hướng dẫn tuân thủ cụ thể cho yêm vực pháp lý và triển khai của họ.

GeoIP có thể phát hiện sử dụng VPN hoặc proxy không?

GeoIP có thể chỉ ra sử dụng VPN hoặc proxy gián tiếp. Nếu một địa chỉ IP thuộc về ASN của nhà cung cấp VPN được biết, tra cứu ASN sẽ xác định tổ chức là dịch vụ VPN. Tương tự, các địa chỉ IP từ các ASN nhà cung cấp lưu trữ có khả năng là proxy hơn các kết nối dân cư. Tuy nhiên, GeoIP một mình không thể xác định rõ ràng tất cả sử dụng VPN, đặc biệt khi các nhà cung cấp VPN sử dụng các dải IP dân cư.