False Positive: מי שלא קופץ בשר משומר

מאתיהונתן קלינגר 17 במאי 2006

לעיתים, כאשר אנו בוחרים כלל, משפטי או לאו, אנו מודעים לכך שעל כל כלל יתקיים False Positive כלשהו (משתנה חיובי שגוי), מה הדבר אומר, בעצם? חיובי שגוי, או חיובי שלילי, אומר שהתקבלה למבחן תוצאה חיובית כלשהי כאשר לא היתה צריכה להנתן תוצאה חיובית. הדוגמא הקלאסית היא מתחום הרפואה, בבדיקות הריון או איידס לדוגמא, כאשר בשלב הראשון נערכות בדיקות אשר עשויות להיות פחות מדויקות ולהניב תוצאות חיוביות (של הריון או איידס) למרות שהתוצאה בפועל שלילית. לשם השגת תוצאות אלו, מציבים רף גבוה בו אף תוצאה חיובית לא נכשלת, אך חלק מהתוצאות השליליות עוברות (ומונע משתנים שליליים שליליים).

דוגמא לשימוש שגוי בכלל זה היא פסק הדין בנוגע לחוק האזרחות והכניסה לישראל שניתן השבוע, כאשר ברור שהכלל מונע את כל המחבלים, אך הוא מונע גם משתנים חיוביים אחרים. אולם, השימוש העיקרי בתחום טכנולוגיות המידע בניתוח תוצאות חיוביות שליליות הוא דווקא בנושא הספאם. מסתבר, שלמרות שמנגנוני הספאם לאחרונה חמורים מדי, עדיין יש טעויות לשני הכיוונים. כיוון שלא משנה כמה גבוה יהיה הרף (ויצור יותר משתנים חיוביים שליליים) עדיין יהיו טעויות, החליטה חברת AOL לעשות את המהלך הנכון, ולהתחיל לגבות כסף עבור משלוח דואר אלקטרוני.

כמובן, שהעניין הפעוט של פגיעה בחופש אינו מהותי כאן, וגם לא הבעיה של עודף בFalse Positives, אלא דווקא הפגיעה בחופש הרשת. אם עד היום עניין הרשת היה נייטרלי לחלוטין, ולא היה צריך להיות נינג'ה כדי להבין זאת, אז דווקא עכשיו הנייטרליות של ספקיות האינטרנט מוטלת בספק. כללי הFalse Positive מאפשרים לנו להבין זאת בקלות, על ידי ניסוח השאלה הערכית, ובחינת התוצאות כדי לראות האם הבחירה היתה נכונה.

כמובן, ויחלקו עליי רבים, שהכלל צריך להיות שהמבחנים בוחנים מה _לא_ ראוי, ולא מה ראוי, שכן מבחן שבוחן מה ראוי מניח מראש שהכל פסול. אפילו מתנגדים לספאם כמו בלו סקיורטי זכרונה לברכה, שהצליחה למנוע בצורה יעילה משלוח דואר זבל, הניחה כי כל הדואר המתקבל הוא לגיטימי, ורק לאחר בחינה היא החליטה להלחם בזבלן. הכלל, אם כן, יהיה כי כל הדואר הנשלח הוא לגיטימי.

כך בוחן גם אתר SpamOrHam את הדואר שמתקבל ומאפשר למשתמשים לבדוק ולאמן את מערכת הבינה המלאכותית שמניעה אותו. המשתמשים, מצד שני, הוכיחו שגם הם לא טובים בגילוי דואר זבל, עד כדי כך שהם נפלו קורבן ב83% מהמקרים לדיוג. הבעיה העיקרית של הפילטרים כיום היא מספר החיוביים השליליים, וזו הסיבה גם שרוב המשתמשים בוחנים את תאי הזבל שלהם לדואר לגיטמי.

בעולם תיאורטי, בו לא היו חוזים מקפחים ולא היו חוזים מפלים, אז מסנני ספאם מסחריים היו נושאים באחריות על טעויות שנגרמו מהבחינה השגויה, כמו שחברות המזון רמדיה שילמה מחיר יקר על טעויות, לנו נגרם, כצרכנים, נזק מדי יום עקב מסנני ספאם. כל מכתב שנאבד הוא פוטנציאל עסקי שלא צומח, התראה לפני סגירת חשבון משתמש באתר, מכתב אהבה מחברה ישנה. אין מחיר לסודות שלנו ולתכתובות שלנו, אולם, אנו מפקירים את חופש הביטוי של הציבור בפני מסננת, שכלל לא בטוח שהיא מונעת מאיתנו רק זבל. אם נדמיין מצב בו חברה מסחרית, ולא שירות קוד פתוח (שפטור תחת הGNU/GPL מאחריות) אז ניתן היה להטיל עליו אחריות לכך (אם רק היינו מגלים מה אבד לנו).

דמיינו שאתם מקבלים צ'ק בדואר, אך הדואר נאבד. האם הדואר חייב לפצותכם?

אולם, כמה כאן עוד בעיה, רוב מסנני דואר הזבל מבוססים על למידה מצד הקליינט. התוכנות לומדות את התנהגותנו, ולא רק מתוכנתות על ידי החברה שהפיקה אותן. למרות שהן לא בינה מלאכותית אמיתית, הן תבוניות. לעיתים הן מכירות אותנו כל כך טוב ויודעות מה אנו אוהבים. לעיתים, הן פשוט רוצות לחסוך מאיתנו את מכתב הפרידה או הבגידה שמעולם לא ראינו. אבל, ככל שהמשפט מעורב, היכן שיש נזק יש מזיק ונזוק, היכן שיש ניזוק ומזיק, עשוי להיות פיצוי תחת משטר אחריות כלשהו. מעניין מה יקרה כאן ברגע שמשהו חשוב באמת יאבד.

זכויות יוצרים | קוד פתוח

איך להמנע מטרולי פטנטים: הדרך היחידה לנצח היא להלחם.
מאתיהונתן קלינגר 4 באוגוסט 20114 באוגוסט 2011

פטנטים בתוכנה הם בעיה, ולא פתרון; לכן, כאשר רשם הפטנטים הישראלי רצה לשמוע את דעת הציבור עליהם, אנו (בעמותת המקור, תנועת הקוד הפתוח והתוכנה החופשית של ישראל) פרסמנו נייר עמדה מפורט על עמדתנו כנגד הפטנטים; בסופו של דבר, רשם הפטנטים הסכים עם עמדתנו (ועמדתם של אחרים) ונתן החלטה סופית שתוכנה, לכשעצמה, אינה כשירה לפטנט, אלא,…

להמשך קריאה איך להמנע מטרולי פטנטים: הדרך היחידה לנצח היא להלחם.
פשערשת

קול אל ערב, קול למגרב
מאתיהונתן קלינגר 21 בנובמבר 2006

דומה שיש בעולם איזור נידח, דיקטטורי וכוחני. איזור שכופה על התושבים את אורחות החיים שלו ומונע מהם חופש דעה וביטוי. דומה שיש איזו דהלגיטימציה של אותו איזור באמצעים תקשורתיים, לרבות האינטרנט. האינטרנט, אותה מדיה שכה אוהבים לדבר על כמה מדינות חשוכות נוהגות לצנזר, משמשת את אותם המצונזרים על מנת להביא את קולם – או, למצער,…

להמשך קריאה קול אל ערב, קול למגרב
קוד פתוח

כשהמספרים משתנים: מדוע צריך להשקיע בתאימות.
מאתיהונתן קלינגר 16 במאי 201315 במאי 2013

בחודשים האחרונים פרסם TheMarker מספר כתבות על מגזר טכנולוגיות המידע בישראל; האח החורג של ההיי-טק; לפי הכתבות, המגזר שמספק שירותי מחשוב, אירוח, תשתית וכדומה, לוקה בחוסר חדשנות, קבעון וחוסר רצון לעבור לשירותים מתקדמים יותר. חלק מכך, לפחות על פי כתבות אחרות, נובע מכך שישראל היא מדינה שמתנגדת, בבסיסה, לקוד פתוח. בזמן שישראל מייצאת את הטכנולוגיות…

להמשך קריאה כשהמספרים משתנים: מדוע צריך להשקיע בתאימות.
אבטחת מידע | פרטיות

אז כמה קל לעקוף את הביומטריה של ביטוח לאומי?
מאתיהונתן קלינגר 15 ביולי 2010

0. בעיית אבטחת המידע הגדולה ביותר היא בדרך כלל הבעיה האנושית. אלברט אוחיון, עובד הביטוח הלאומי, הורשע השבוע בשלל עבירות על פי הודאתו, המראה כמה נהלי אבטחת המידע, ובמיוחד אלה שסובבים סביב מידע ביומטרי, הם בדיחה ככל שמדינת ישראל קובעת אותם. בגזר הדין (תפ 1056-09 מדינת ישראל נ' אלברט אוחיון) מגולל בית המשפט את המסכת…

להמשך קריאה אז כמה קל לעקוף את הביומטריה של ביטוח לאומי?
אבטחת מידע | פרטיות

מתלהבים מפריזם? בעפולה הייתם?
מאתיהונתן קלינגר 9 ביוני 201330 בנובמבר 2014

כנראה שכל מי שנדהם, נפעם, נחרד או זועזע ממשמע כי סוכנות הבטחון האמריקאית (NSA) עקבה אחרי מיליוני אזרחים אמריקאים וזכתה לשיתוף פעולה נרחב מספקיות אינטרנט, חברות תקשורת ושירותי אירוח מקוון לא טרח לקרוא את העיתונות בעשור האחרון ולראות דיווחים על חיפושים במחשבים, ועל הדרך שבה רשויות השלטון מתנהלות. לנו, כישראלים, יש רק לקנא בכך שהציבור…

להמשך קריאה מתלהבים מפריזם? בעפולה הייתם?
דברי ימי הצנזורה | הזכות לגלוש | זכויות אדם | חופש ביטוי | כלכלה | לשון הרע | משפט חוקתי | פשיעה | שיתוף קבצים

זה רק הכסף | דרעאקנט | הסרת אתר היא פגיעה מהותית בדמוקרטיה
מאתיהונתן קלינגר 4 במרץ 20084 במרץ 2008

0. בהוראת בית המשפט היום חסמו המשיבות הפורמאליות 2-4, ספקיות האינטרנט, את אתר הנתבע, Ynet, לאחר שפרסם פרסום אשר מוציא את לשון הרע של התובע בכך שטוען כי זה שוכב עם עדר עיזים חולות בנידה. הפרסום, שהתבצע בטוקבק אנונימי מספר 34, הוסר, אך לדברי התובע, איש בעל שם ידוע, המערכת המובנית של Ynet שמאפשרת תגובות…

להמשך קריאה זה רק הכסף | דרעאקנט | הסרת אתר היא פגיעה מהותית בדמוקרטיה

3 Comments

פלי הגיב:

17 במאי 2006 בשעה 21:28

איה, מילים כדורבנות.
פינגבאק: Intellect or Insanity | הבלוג של יהונתן קלינגר |
pepepere הגיב:

14 באוגוסט 2007 בשעה 9:07

מסנן דואר "לומד" בסך הכל אוסף מידע סטטיסטי על מאפייני הדואר שלך, ואז מיחס לפיהם הסתברות לכך שהודעה חדשה שייכת לקטגוריה זאת או אחרת. אין בזה שום אינטליגנציה. אחת הבעיות של הגישה הזאת היא שדוקא הדואר החשוב ביותר שלך לא בהכרח ישא מאפיינים של ה-ham האופייני שלך (כמה הצעות עבודה טובות אתה מקבל באימייל. רוב הסיכויים שהמאפיינים שלהן די שונים מרוב הדואר הלגיטימי שאתה מקבל באופן יומ-יומי, ואין סיבה מיוחדת שפילטר "לומד" ידע לזהות אותן …)

Comments are closed.

Similar Posts

3 Comments