IP לארץ, עיר ו-ISP בשבריר סנט לכל בקשה
לכל מכשיר המחובר לאינטרנט יש כתובת IP, וכתובת ה-IP הזו מכילה יותר מידע ממה שרוב האנשים מבינים. זה לא רק מזהה טכני לניתוב חבילות רשת. זהו סימן גיאוגרפי, טביעת אצבע ארגונית וסימן התנהגותי שכאשר מחוזרים כראוי, עונים על שאלות יסודיות לגבי מי מבקר באתר אינטרנט, איפה הם נמצאים וכיצד הם מחוברים. התהליך של חזרה לכתובת IP על מטא-נתונים גיאוגרפיים וארגוניים נקרא חיפוש GeoIP, והוא אחת מאותן טכנולוגיות בלתי נראות הנותנות כוח לכמות ענקית של פונקציונליות האינטרנט ללא שרוב המשתמשים יודעים שהיא קיימת. כאשר אתר אינטרנט מציג מחירים בתמורה המקומית, GeoIP עושה את העבודה. כאשר שירות סטרימינג מגביל תוכן לפי אזור, GeoIP קובע. כאשר מערכת גילוי הונאה מסמנת עסקה מכיוון שכתובת החיוב אומרת לונדון אבל כתובת ה-IP אומרת לגוס, GeoIP מספקת את הראיות.
הטכנולוגיה עצמה מוקמה היטב. מספר חברות שומרות מסדי נתונים של GeoIP הממפים טווחי כתובות IP למיקומים גיאוגרפיים, ומסדי נתונים אלה מתעדכנים באופן קבוע כאשר הקצאות IP משתנות וטווחים חדשים מוקצים. מה שלא היה מוקמה היטב, עד לאחרונה, היא גישה משתלמת למסדי נתונים אלה עבור מפתחים ועסקים שצריכים יכולת GeoIP אך לא יכולים להצדיק את מודלי התמחור של ספקי ההשירות הגדולים. MaxMind, השחקן הדומיננטי בחלל GeoIP, גובה עבור רישיונות מסדי נתונים או גישה לכל שאילתה בשיעורים הסבירים לחברות ארגוניות העיבוד מיליוני חיפושים יומיים אך יקר באופן לא פרופורציונלי עבור יישומים קטנים יותר שצריכים כמה אלפי חיפושים בחודש. ה-GeoIP APIs ב-YEB מציעים את אותם שלוש שכבות של רזולוציה גיאוגרפית (ארץ, עיר ו-ASN) בתמחור לכל בקשה שהופך גם מקרי שימוש בנפח נמוך לכלכלית בר קיימא.
שלוש שכבות קיימות מכיוון שמקרי שימוש שונים דורשים רמות פרטים שונות. מערכת מקומיזציה של תוכן שצריכה להציג את השפה והמטבע הנכונים למבקר צריכה רק נתונים ברמת ארץ. מחשבון משלוח שצריך להעריך עלויות משלוח על בסיס אזור המבקר צריך נתונים ברמת עיר. מערכת אבטחה שצריכה לאמת אם כתובת IP שייכת לספק אירוח, ISP למגורים או רשת תאגידית צריכה נתונים של ASN (מספר מערכת אוטונומית). הצעת כל שלוש שכבות בנפרד פירושה שיישומים משלמים רק עבור רמת הפרטים שהם בעצם משתמשים, במקום לשלם עבור דיוק ברמת עיר כאשר דיוק ברמת ארץ יספיק.
חיפוש ברמת ארץ ויישומים שהוא נותן כוח
ה-GeoIP API ברמת ארץ הוא השכבה הנפוצה ביותר והזולה ביותר לכל בקשה. בהינתן כתובת IP, הוא מחזיר את קוד המדינה (ISO 3166-1 alpha-2), שם המדינה והיבשת. זהו המידע הגיאוגרפי המינימלי המקובל הדרוש למספר גדול של יישומים. מקומיזציה של תוכן היא הברורה ביותר: קביעת ארץ המבקר והגשת השפה הנכונה, המטבע ושיוויי משפטיים. אתר שפועל בשתים עשרה מדינות צריך להציג את מדיניות הפרטיות הנכונה, הודעת VAT הנכונה ומידע קשר נכון בהתאם למקום בו המבקר נמצא. לעשות זאת ב-JavaScript בצד הלקוח (בקשה מהדפדפן עבור מיקום המשתמש) הוא התעסקות, דורש הרשאה מפורשת ונכשל כאשר המשתמש מסרב. לעשות זאת עם GeoIP הוא בלתי נראה, מיידי ועובד בכל בקשה ללא אינטראקציה של משתמש.
ציות רגולטורי הוא מקרה שימוש גדול נוסף שפועל בשלמותו ברמת הארץ. GDPR חל על מבקרים ממדינות החברות ב-EU. CCPA חל על מבקרים מקליפורניה (שניתן לגלות עם נתונים ברמת עיר, אך רמת ארץ מספיקה כדי לזהות מבקרים בארה"ב שעלולים להיות בחזקת CCPA). הגבלות תוכן עשויות להחול על מדינות ספציפיות בשל הסכמי רישיון, סנקציות או חוקים מקומיים. פלטפורמות ה-commerce עלולות להיצטרך לחסום מכירות למדינות מסוימות בגלל בקרות ייצוא. כל ההחלטות הללו דורשות רק את הארץ, וה-GeoIP country API מספק אותה עבור שבריר ממה שהנוי החודשי למערכת גיאוקיוביות מלאה יעלה.
פלטפורמות ניתוח משתמשים GeoIP ברמת ארץ לבניית דוחות תעבורה גיאוגרפיים. תוסף הניתוח של WordPress המתואר בכתבה הלווה משתמש ב-API בדיוק זה כדי לחזור לכל כתובת ה-IP של המבקר לארץ, שמולאה את טבלת פירוק הארץ בלוח המחוונים. עבור אתר המקבל 10,000 ביקורים ליום, זה 10,000 חיפושי GeoIP ליום, ובתמחור לכל בקשה, סך העלות היומית נמדדת בסנטים ולא בדולרים. בתמחור מנוי חודשי מספקי GeoIP מסורתיים, אותו נפח יעלה בין 20 ל-50 דולר בחודש בהתאם לרמת התוכנית. לאורך שנה, ההבדל בין תמחור לכל בקשה ותמחור מנוי לנפח זה משמעותי מספיק כדי להיות חשוב לכל עסק שמשקיף על עלויות התפעול שלו.
חיפוש ברמת עיר ומתי דיוק חשוב
ה-GeoIP API ברמת עיר מחזיר הכל שה-API הארץ מספק בתוספת שם העיר, אזור או מדינה, קוד דואר, קו רוחב וקו אורך. דיוק נוסף זה מאפשר מקרי שימוש שנתונים ברמת ארץ לא יכולים לתמוך בהם. ספריות עסקים מקומיות שצריכות להציג תוצאות הרלוונטיות לעיר המבקר תלויות בגיאולוקציה ברמת עיר. ווידג'טים של מזג אוויר שמציגים תנאים מקומיים צריכים לדעת את העיר, לא רק את הארץ. פלטפורמות נדלן שמציגות רישומים סמוכים, אפליקציות גילוי מסעדות המציגות המלצות מקומיות וערוצי חדשות שמציגים סיפורים אזוריים דורשים את כולם רזולוציה ברמת עיר בכדי לתפקד כראוי.
הדיוק של גיאולוקציה ברמת עיר GeoIP ראוי לדיון כן מכיוון שהוא אחד ההיבטים המוגנים ביותר של הטכנולוגיה. גיאולוקציה ברמת עיר מכתובות IP אינה דיוק ברמת GPS. זה לא מצביע על בניין ספציפי או כתובת רחוב. זה מזהה את העיר או האזור המטרופוליני הקשור לטווח כתובות ה-IP, וזה בדרך כלל המיקום של נקודת הנוכחות של ה-ISP ולא המיקום המדויק של המשתמש הסופי. בעיירות עירוניות צפופות, זה בדרך כלל מדויק לעיר הנכונה. בשטחים כפריים המשרתים ISPs אזוריים, העיר שחוזרה עלייה עלולה להיות העיר הגדולה הקרובה ביותר שבה ל-ISP יש תשתיות, שעלולה להיות חמישים או מאה קילומטרים מהמיקום בפועל של המשתמש. עבור הרוב המכריע של מקרי השימוש (ייצור תוכן אישי, הערכות משלוח משוער, ניתוח אזוריים), רמת דיוק זה היא יותר מספיקה. עבור מקרים בהם נדרש מיקום מדויק (ניווט, שירותים לשעה של חירום, פרסום היפרלוקלי), GPS נשאר הטכנולוגיה המתאימה.
מערכות גילוי הונאה משתמשות GeoIP ברמת עיר כאות אחת בקרב אחרות רבות. כאשר עסקת כרטיס אשראי מקורה מכתובת IP בעיר מנילה אך כתובת החיוב של הכרטיס בעיר שטוקהולם, האי-התאמה הגיאוגרפית לא בהכרח מצביעה על הונאה (בעל הכרטיס עלול להיות נוסע), אך היא סימן חזק מספיק כדי להפעיל אימות נוסף. נתונים ברמת עיר מספקים את הספציפיות הדרוש כדי להפוך השוואה זו למשמעותית. נתונים ברמת ארץ היו מסמנים כל עסקה שבה ארץ ה-IP שונה מארץ החיוב, שהיא רחבה מדי עבור נוסעים גלובליים. נתונים ברמת עיר מאפשרים למערכת לשקול תרחישים מדורגים יותר: IP באותה ארץ אך בעיר שונה מכתובת החיוב עלול להיות מעיד על בעל כרטיס שעבר במקום כרטיס גנוב, בעוד IP בחצי כדור שונה הוא סימן הונאה חזק הרבה יותר.
חיפוש ASN והבנת מי הוא בעלים של הרשת
ה-API (ASN - Autonomous System Number) מוסיף ממד שונה לחלוטין לאינטליגנציית IP. במקום לענות "איפה כתובת IP זו?" זה עונה "מי מפעיל את הרשת שכתובת ה-IP הזו שייכת אליה?" מערכת אוטונומית היא אוסף של טווחי כתובות IP המנוהלים על ידי ארגון יחיד, ומסד נתונים ASN ממפה כל כתובת IP לארגון הפעל שלה, כולל שם הארגון, מספר ASN וסוג הרשת (ISP, ספק אירוח, ארגוני, מוסד חינוכי, ממשלה). מידע זה היקר בלתי ערוך עבור מקרי שימוש שבהם זהות הרשת חשובה פחות מהמיקום הגיאוגרפי.
גילוי בוטים הוא היישום הפרקטי המיידי ביותר של נתונים ASN. זחלים חוקיים של מנועי חיפוש פועלים מטווחי IP בעלות חברות ההורים שלהם: הזחל של Google מגיע מ-Google ASN, הזחל של Bing מגיע מ-Microsoft ASN. בקשה שטוענת להיות Googlebot אך מקורה מכתובת IP ב-ASN של ISP למגורים היא כמעט בוודאות בוט מזויף. תוסף הניתוח של WordPress משתמש בטכניקה זו בדיוק, הודעת חיצונית של זהות הטוען של סוכן המשתמש עם בעלות ASN של ה-IP המקור, כדי להפריד בין זחלים מאומתים לבין מתעמתים. ההתיימות הזו בלתי אפשרית עם נתונים גיאוגרפיים בלבד, מכיוון ש-Google מפעילה מרכזי נתונים בתחומים רבים, כך שבדיקה גיאוגרפית לא יכולה להבחין בין Googlebot אמיתי ממרכז נתונים בארה"ב לבין אחד מזויף ממחבר ביתי בארה"ב.
מערכות קביעת מטרה פרסומיות וגילוי הונאה משתמשות בנתונים ASN כדי להבחין בין תעבורה מרשתות למגורים (משתמשים אמיתיים), ספקי אירוח (בוטים או פרוקסי פוטנציאלים) ורשתות תאגידיות (B2B הפוטנציאל חוקלים). קליק על פרסום ממוגדר שמקורו מטווח IP של ספק אירוח הוא הרבה יותר אפשר להיות הונאתי (בוטים ביט, הונאת קליק של מתחרה) מאשר קליק מ-ISP למגורים. סינון קליקים אלה לפני שהם נספרים (וחויבים) יכול לחסוך למפרסמים כסף משמעותי. באופן דומה, פלטפורמות שיווק B2B משתמשות בנתונים ASN כדי לזהות כאשר מבקרים מגיעים מרשתות תאגידיות, מכיוון ששם הארגון ASN לעתים קרובות חושף את החברה, המאפשר שיווק מבוסס חשבון ללא דרישה למבקר לזהות את עצמו.
תמחור לכל בקשה ולמה זה משנה את המתמטיקה
הכלכלה של שירותי GeoIP ביססו באופן היסטורי את מודל ההנויות השולט בתעשיית SaaS. תוכניות חודשיות עם גבולות בקשה משורגים, חיובי יתרה מעבר לגבולות אלה ההסכמים השנתיים הנעולים בתוך מחיר ללא קשר לשימוש בפועל. עבור יישומים עם צרכי GeoIP צפויים וגבוהים בנפח, תוכניות אלה לעתים קרובות סבירות. עבור יישומים עם צרכים משתנים או בנפח נמוך, הם מייצגים עלות קבועה שאין לה כל קשר לערך המופק.
שקול חנות ה-commerce עונתית שעושה 80% מהתנועה השנתית שלה בתקופת חופשי שש שבועות. בתמחור מנוי, החנות משלמת את אותה תשלום חודשי במהלך עשרת החודשים השקטים כמו שהוא עושה במהלך שני החודשים שיא. בתמחור לכל בקשה, החודשים השקטים עלו כמעט שום דבר בעוד חודשי שיא עלויות פרופורציונליות לתנועה בפועל המעובדת. לאורך שנה, סה"כ עלות תחת תמחור לכל בקשה בדרך כלל 40% עד 60% נמוך מתוכנית המנוי המקבילה, והחיסכון הוא בפרט בהרבה יותר דרמטי עבור יישומים שיש דפוסי תעבורה בלתי צפויים.
מודל התשלום לכל בקשה גם מוחה את עלות התכנון שמגיעה עם תוכניות מנוי משורגות. בחירה בין תוכנית המאפשרת 10,000 חיפושים בחודש לאחת המאפשרת 100,000 חיפושים בחודש דורשת ניבוי של נפחי תנועה עתידיים, וזה בטבעו לא בטוח. בחר הרבה נמוך וחיובי יתרה מתקבלים. בחר הרבה גבוה וקיבולת שלא משתמש בו מתבזבزת. תמחור לכל בקשה מסיר כמו משחק זה לחלוטין. כל חיפוש עולה אותו שבריר סנט ללא קשר אם החודשי סה"כ מסיים כשהוא 500 או 500,000. המשתנה היחיד הוא שימוש בפועל, והעלות מדרגות ליניארית איתו.
עבור מפתחים שמעריכים אפשרויות GeoIP, השאלה הפרקטית אינה איזו מסד נתונים עם הדיוק הגבוה ביותר (מסדי נתונים גדולים כולם בתחום כמה נקודות אחוז זה של זה עבור רוב האזורים) אלא איזה מודל תמחור מתיישר עם דפוס השימוש של היישום. יישומים עם תנועה יציבה, צפויה וגבוהה בנפח עלולים למצוא כי תוכנית מנוי מציעה שיעור טוב יותר לכל בקשה בשל הנחות נפח. יישומים עם משתנים, בלתי צפויים, או תנועה בנפח נמוך כמעט תמיד ימצאו תמחור לכל בקשה יותר כלכלי. ה-GeoIP APIs המתוארת כאן משרתות את הקטגוריה השנייה, וכן ללא הקרבת איכות נתונים, מהירות תגובה, או הרוחב של מידע המוחזר לכל חיפוש.
שאלות נפוצות
כמה מדויקת גיאולוקציה IP ברמת הארץ?
דיוק GeoIP ברמת ארץ בדרך כלל מעל 99% עבור ISPs גדולים ברוב המדינות. מקרים קצה קיימים עבור טווחי IP שהוקצו מחדש בין מדינות או עבור ספקי אינטרנט דורים לווין שבהם השער עלול להיות בארץ שונה מהמשתמש, אך עבור הרוב המכריע של חיפושים, זיהוי הארץ אמין.
האם GeoIP יכול לקבוע את כתובת הרחוב המדויקת של כתובת IP?
לא. GeoIP מחליט לרמת העיר או האזור המטרופוליני בטוב יותר. הקואורדינטות המוחזרות על ידי חיפושים ברמת עיר מייצגות את המרכז המקורב של העיר שזוהתה, לא המיקום הפיזי של המכשיר. דיוק ברמת רחוב דורש GPS או טכנולוגיות חוקה מבוססות מכשירים דומות שכוללות הרשאה מפורשת של המשתמש.
מה זה ASN ולמה זה שימושי?
מספר מערכת אוטונומית (ASN) מזהה את הארגון שמפעיל בלוק של כתובות IP. ידיעת ASN חושפת אם כתובת IP שייכת ל-ISP למגורים, ספק אירוח, תאגיד או רשת ממשלתית. זה שימושי עבור גילוי בוט (אימות זהות זחל), מניעת הונאה (תעבורה דגלון מ-IPs אירוח) ו-B2B שיווק (זיהוי מבקרים תאגידיים).
כמה לעתים קרובות מסדי נתונים GeoIP מתעדכנים?
מסדי נתונים מתעדכנים באופן קבוע כדי לשקף שינויים בהקצאות כתובות IP. טווחי IP חדשים הוקצו, הטווחים הקיימים הוקצו מחדש בין ארגונים, וקביעות גיאוגרפיות משתנות כאשר ISPs מרחיבים את הרשתות שלהם. עדכונים קבועים משכנעים כי תוצאות חיפוש נשארות מדויקות כאשר נוף ה-IP מתפתח.
האם שימוש ב-GeoIP דורש הסכמה לעוגיות תחת GDPR?
חיפושי GeoIP מעבדים כתובות IP, הנחשבות לנתונים אישיים תחת GDPR. עם זאת, אם החיפוש מבוצע בצד השרת וכתובת ה-IP לא מאוחסנת או משותפת עם צדדים שלישיים, בהרבה פירושים GDPR שוקלים זה עניין חוקי עיבוד שלא דורש הסכמה מפורשת. בעלי אתרים צריכים להתייעץ עם יעוץ משפטי לקבלת הנחיות ציות ספציפיות לתחום שיפטם ויישום שלהם.
האם GeoIP יכול לזהות שימוש ב-VPN או proxy?
GeoIP יכול להצביע על שימוש ב-VPN או proxy בעקיפין. אם כתובת IP שייכת ל-ASN של ספק VPN ידוע, חיפוש ASN יזהה את הארגון כשירות VPN. באופן דומה, כתובות IP מ-ASNs של ספקי אירוח סבורות להיות פרוקסיים יותר מתחברות למגורים. עם זאת, GeoIP לבדו לא יכול לגלות בחד משמעות את כל שימוש ב-VPN, במיוחד כאשר ספקי VPN משתמשים בטווחי IP למגורים.