False Positive: מי שלא קופץ בשר משומר

לעיתים, כאשר אנו בוחרים כלל, משפטי או לאו, אנו מודעים לכך שעל כל כלל יתקיים False Positive כלשהו (משתנה חיובי שגוי), מה הדבר אומר, בעצם? חיובי שגוי, או חיובי שלילי, אומר שהתקבלה למבחן תוצאה חיובית כלשהי כאשר לא היתה צריכה להנתן תוצאה חיובית. הדוגמא הקלאסית היא מתחום הרפואה, בבדיקות הריון או איידס לדוגמא, כאשר בשלב הראשון נערכות בדיקות אשר עשויות להיות פחות מדויקות ולהניב תוצאות חיוביות (של הריון או איידס) למרות שהתוצאה בפועל שלילית. לשם השגת תוצאות אלו, מציבים רף גבוה בו אף תוצאה חיובית לא נכשלת, אך חלק מהתוצאות השליליות עוברות (ומונע משתנים שליליים שליליים).

דוגמא לשימוש שגוי בכלל זה היא פסק הדין בנוגע לחוק האזרחות והכניסה לישראל שניתן השבוע, כאשר ברור שהכלל מונע את כל המחבלים, אך הוא מונע גם משתנים חיוביים אחרים. אולם, השימוש העיקרי בתחום טכנולוגיות המידע בניתוח תוצאות חיוביות שליליות הוא דווקא בנושא הספאם. מסתבר, שלמרות שמנגנוני הספאם לאחרונה חמורים מדי, עדיין יש טעויות לשני הכיוונים. כיוון שלא משנה כמה גבוה יהיה הרף (ויצור יותר משתנים חיוביים שליליים) עדיין יהיו טעויות, החליטה חברת AOL לעשות את המהלך הנכון, ולהתחיל לגבות כסף עבור משלוח דואר אלקטרוני.

כמובן, שהעניין הפעוט של פגיעה בחופש אינו מהותי כאן, וגם לא הבעיה של עודף בFalse Positives, אלא דווקא הפגיעה בחופש הרשת. אם עד היום עניין הרשת היה נייטרלי לחלוטין, ולא היה צריך להיות נינג'ה כדי להבין זאת, אז דווקא עכשיו הנייטרליות של ספקיות האינטרנט מוטלת בספק. כללי הFalse Positive מאפשרים לנו להבין זאת בקלות, על ידי ניסוח השאלה הערכית, ובחינת התוצאות כדי לראות האם הבחירה היתה נכונה.

כמובן, ויחלקו עליי רבים, שהכלל צריך להיות שהמבחנים בוחנים מה _לא_ ראוי, ולא מה ראוי, שכן מבחן שבוחן מה ראוי מניח מראש שהכל פסול. אפילו מתנגדים לספאם כמו בלו סקיורטי זכרונה לברכה, שהצליחה למנוע בצורה יעילה משלוח דואר זבל, הניחה כי כל הדואר המתקבל הוא לגיטימי, ורק לאחר בחינה היא החליטה להלחם בזבלן. הכלל, אם כן, יהיה כי כל הדואר הנשלח הוא לגיטימי.

כך בוחן גם אתר SpamOrHam את הדואר שמתקבל ומאפשר למשתמשים לבדוק ולאמן את מערכת הבינה המלאכותית שמניעה אותו. המשתמשים, מצד שני, הוכיחו שגם הם לא טובים בגילוי דואר זבל, עד כדי כך שהם נפלו קורבן ב83% מהמקרים לדיוג. הבעיה העיקרית של הפילטרים כיום היא מספר החיוביים השליליים, וזו הסיבה גם שרוב המשתמשים בוחנים את תאי הזבל שלהם לדואר לגיטמי.

בעולם תיאורטי, בו לא היו חוזים מקפחים ולא היו חוזים מפלים, אז מסנני ספאם מסחריים היו נושאים באחריות על טעויות שנגרמו מהבחינה השגויה, כמו שחברות המזון רמדיה שילמה מחיר יקר על טעויות, לנו נגרם, כצרכנים, נזק מדי יום עקב מסנני ספאם. כל מכתב שנאבד הוא פוטנציאל עסקי שלא צומח, התראה לפני סגירת חשבון משתמש באתר, מכתב אהבה מחברה ישנה. אין מחיר לסודות שלנו ולתכתובות שלנו, אולם, אנו מפקירים את חופש הביטוי של הציבור בפני מסננת, שכלל לא בטוח שהיא מונעת מאיתנו רק זבל. אם נדמיין מצב בו חברה מסחרית, ולא שירות קוד פתוח (שפטור תחת הGNU/GPL מאחריות) אז ניתן היה להטיל עליו אחריות לכך (אם רק היינו מגלים מה אבד לנו).

דמיינו שאתם מקבלים צ'ק בדואר, אך הדואר נאבד. האם הדואר חייב לפצותכם?

אולם, כמה כאן עוד בעיה, רוב מסנני דואר הזבל מבוססים על למידה מצד הקליינט. התוכנות לומדות את התנהגותנו, ולא רק מתוכנתות על ידי החברה שהפיקה אותן. למרות שהן לא בינה מלאכותית אמיתית, הן תבוניות. לעיתים הן מכירות אותנו כל כך טוב ויודעות מה אנו אוהבים. לעיתים, הן פשוט רוצות לחסוך מאיתנו את מכתב הפרידה או הבגידה שמעולם לא ראינו. אבל, ככל שהמשפט מעורב, היכן שיש נזק יש מזיק ונזוק, היכן שיש ניזוק ומזיק, עשוי להיות פיצוי תחת משטר אחריות כלשהו. מעניין מה יקרה כאן ברגע שמשהו חשוב באמת יאבד.

3 תגובות ל-“False Positive: מי שלא קופץ בשר משומר

  1. מסנן דואר "לומד" בסך הכל אוסף מידע סטטיסטי על מאפייני הדואר שלך, ואז מיחס לפיהם הסתברות לכך שהודעה חדשה שייכת לקטגוריה זאת או אחרת. אין בזה שום אינטליגנציה. אחת הבעיות של הגישה הזאת היא שדוקא הדואר החשוב ביותר שלך לא בהכרח ישא מאפיינים של ה-ham האופייני שלך (כמה הצעות עבודה טובות אתה מקבל באימייל. רוב הסיכויים שהמאפיינים שלהן די שונים מרוב הדואר הלגיטימי שאתה מקבל באופן יומ-יומי, ואין סיבה מיוחדת שפילטר "לומד" ידע לזהות אותן …)

לא ניתן להגיב