נתונים פתוחים או סגורים? Open or Closed?

ברגע זה עולה במוחך רעיון, הוא מתחיל להתהוות וככל שהוא מתגבש הוא מעלה אצלך שאלות, שאלות טובות. דקה לאחר מכן, הסמארטפון בידך והמסע לחיפוש התשובות מתחיל.

 

אז מהו המסע הזה ולאן הוא לוקח אותנו? היינו רוצים לחשוב שהמסלול כבר תלוי בנו (האמנם?) אבל דבר אחד ודאי - ככל שנעמיק יותר, נקבל יותר. אז לפני שנגיע לתובנות, יש לי שאלה גדולה ופתוחה בשבילכם: מתי אנחנו שולטים במידע? כשאנחנו קונים אותו או מקבלים אותו בחינם? האם חשוב לנו לא רק המידע שאנחנו מקבלים, אלא גם המידע שאנחנו לא מקבלים? לראות את התמונה הגדולה יותר - אם תרצו.

 

בואו נתחיל לענות על השאלה בלהבין מה מייצג המושג Data. ובכן זה פשוט מאוד. Data, או נתונים בתרגום חופשי, זה הנפט החדש של ממלכת האינטרנט. מדובר במשאב חיוני שעליו אנחנו נשענים בשביל כמעט כל דבר, ולכן הוא רק הולך ומתעצם ככל שמערכת היחסים שלנו עם הטכנולוגיה מעמיקה. אבל איך נדע להפיק ממנו ידע? לפני שנענה על זה, בואו נבין קצת את הבסיס.

 

קצת רקע וסדר במונחי עולם ה- Data
כידוע עולמנו הוירטואלי משתנה מרגע לרגע אבל מה שנשאר קבוע הוא הרעב המהיר לידע רלוונטי. בתחילת שנות ה- 2000, נפל האסימון והבינו שכל המידע הזה שפשוט נאגר ונאגר בבור ללא התחתית הזה שנקרא האינטרנט, חייב להיות בחלקו בעל ערך רב. אז מישהו חכם קם ואמר: "מישהו צריך לעשות משהו עם כל המידע הזה." וכך נולד הבאזוורד הידוע וחביב הקהל הנצחי - Big Data (נתוני עתק בעברית).

 

התובנות הפוטנציאליות שהבטיח רעיון ה- Big Data עודדו ארגונים קטנים וגדולים כאחד, לצבור ולנתח כמויות אדירות של נתונים שמהם ניתן יהיה להפיק ידע בעל ערך מקסימלי. הידע יעזור בין היתר, לבניית אסטרטגיה טובה יותר וייעול תהליכים לצורך הגדלת ההון. מאמצע שנות ה- 2000 נולדו מושגים נוספים מאותה משפחה כמו Open Data, Closed Data ועוד. לפני שנתקדם חשוב להבהיר כי ישנה מחלוקת טרמינולוגית מתמדת סביב פרשנות המונחים.

 

לאכול את העוגה ולהשאיר אותה אינסופית
אם ה- Big Data הייתה עוגת שכבות, היא כנראה הייתה בסגנון עוגות הקונפטי הטרנדיות שרואים באינסטגרם. ובמילים אחרות: רב שכבתית, עשירה, עצומה בגודלה באופן בלתי נתפס, צבעונית וכבדה, מאד כבדה. שכבה אחת של העוגה הייתה Open Data, אחרת הייתה Closed Data וכן הלאה.

 

ואם נחזור רגע לשאלה "איך מפיקים מ- Data ידע?" התשובה היא: בעזרת שימוש ב- Open Data, נתונים פתוחים וב- Closed Data, נתונים סגורים. לפני שנתונים מוגדרים פתוחים או סגורים הם קודם כל מידע. ההחלטה בנוגע לדרך שבה אנחנו, המשתמשים, נקבל את המידע (או שלא נקבל), נשתף אותו (או שלא נוכל לשתף), נעתיק אותו (או שלא נוכל להעתיק), ועוד וריאציות שונות של שימוש בו (הבנתם את הנקודה), היא כבר בחירה של זה המחזיק אותו.

 

האמת האוניברסלית של ה- Open Data
הרעיון העומד מאחורי Open Data הוא זמינות לכל אדם, לא משנה מי הוא, מהו תפקידו או מקצועו, איפה הוא נמצא או מה הוא מתכנן לעשות עם המידע. ככלל נתונים פתוחים ניתנים לשימוש ולהפצה מחדש בצורה חופשית, ללא מגבלות כמו זכויות יוצרים. אם זה נשמע לכם טוב מדי, חשבו שנית כי גם ל- Open Data יש חסרונות שנגע בהם בהמשך.

 

Open Data: קווים לדמותו
על המידע להיות זמין ללא עלות, או לפחות בעלות סבירה. כמובן שעליו להיות דיגיטלי ובפורמט מונגש בשביל שיהיה ידידותי למשתמש. הכוונה שיהיה קל למצוא את מקורו בקלות, שיהיה זמין לשיתוף ורצוי גם שיהיה זמין להורדה בשביל לעבד ולשנות אותו כאוות נפשו של המשתמש. ולמה? כי אחרת אותו משתמש לא יוכל לנצל את כוחם המלא של הנתונים. הרי בשביל מה הם שם? בשביל שנוכל להפיק מהם ידע!

 

לסיכום: שלושת החוקים של Open Data:

  1. זמינות וגישה: כולם יכולים לקבל את המידע
  2. שימוש חוזר והפצה מחדש: אפשר לעשות שימוש חוזר בנתונים ולשתף אותם
  3. אוניברסליות: ידע פתוח ושמיש לכל אחד, מסביב לעולם

לצבור ידע בעולם מושלם 

אם ננטרל רגע שימוש ב- Data מתוך כוונה זדונית (כמו ניסיונות להשתלט על העולם) ונסתכל רק על מניעים חיוביים ובריאים - מה היינו מקבלים אם כל ה- Data בעולם היה פתוח עבורנו? התשובה הקצרה היא הזדמנות להפיק מידע רב שיעזור לנו בקבלת החלטות מהירות ונכונות יותר, יאיץ את הקצב והעומק של גילויים חדשים, ירחיב שיתופי פעולה ויעזור לנו להתפתח ולהשתפר כבני אדם וכחברה. אבל לצערנו, זה לא עובד ככה.

 

האמת האוניברסלית של ה- Closed Data
כהגדרה, מידע סגור הוא כזה הנגיש אך ורק למחזיק/ים שלו, ה- Data Holder. אם נחזור לנקודת הפתיחה של הסקירה, החיפוש המוכר ברשת לא פעם נקטע כשלפתע נגלה לעינינו מחסום המופיע כהודעת Access denied. במקרה הטוב, נוכל לשלם בשביל שהמידע יהיה זמין לנו ובמקרה הפחות טוב, לא נוכל להיכנס מכיוון שאנחנו פשוט לא מורשים לעשות זאת לפי מחזיק הנתונים.

 

Closed Data: קווים לדמותו
כולנו חסומים בפני מאגרי מידע רבים. מספיק שאיננו משתייכים לארגון מסוים, אוניברסיטה, מקצוע או אפילו צוות ונחסמנו דיפולטיבית. אז נכון. יש הגיון בעובדה שלא כל פיסת ידע ב- Web חשופה לכולם. מספיק שנציין סיבות כמו: פרטיות, ביטחון ואינטרסים כלכליים וכבר קיבלנו תמונה די אפלה בראש.

 

עוד מכשול גדול של Closed Data בא לידי ביטוי בתנאים המגבילים שמציבים מחזיקי הנתונים בנוגע לשימוש במידע שלהם. לרוב נקבל תנאים אלו כחלק מהסכם השימוש, אבל בשונה מהסכם סטנדרטי בו העסקה אמורה להתקבל על ידי שני הצדדים, כאן לא יתנהל משא ומתן.

 

לרוב התנאים יכללו:

  • הגבלת השימוש בנתונים באופן מסחרי
  • הגבלת הזמן המותר לאחסון המידע
  • הגבלת הגישה לנתונים
  • הגבלת אופן הצגת הנתונים

לסיכום: שלושת החוקים של Closed Data:

 

  1. גישה מוגבלת: המידע אינו זמין לכולם
  2. שימוש והפצה: שיתוף, העתקה או כל שימוש אחר במידע מוגבלים במידה משתנה, ובייחוד אם המידע מוגן בפטנט (Proprietary) או בזכויות יוצרים
  3. בעל המאה הוא בעל הדעה: מחזיק הנתונים הוא זה שמקבל את כל ההחלטות בנוגע לנכס שלו, ה- Data

 

הבהרה
חשוב להבין ש- Closed Data לא חייב להיות חסום לחלוטין. לעתים ניתן לשתף נתונים (או חלק מהם) אבל לא להעתיק אותם או להשתמש בהם (קריאה בלבד לדוגמה). מהצד השני, גם ל- Open Data יכולות להיות הגבלות, כמו שימוש המותנה בקרדיט למחבר או למחזיק הידע.

הקונפליקט העסקי של חשיפת ה- Data
אין ספק כי נתונים הם ערך עליון עבור כל ארגון. עכשיו חשבו על ארגון שהחליט לתת אותם 'במתנה' למשתמשים שלו (נתונים פתוחים). מדובר בהצהרה חזקה שמייצגת בין היתר שקיפות ואחריות. עם זאת, מרבית העסקים מגנים על המשאב הזה למרות שהוא עשוי להגביר פוטנציאל כלכלי.

 

Open Data: נתונים ציבוריים
מומחים שונים המשתייכים לתנועה בשם ״תנועת המידע הפתוח״ (Open data movement) אומרים כי חשיפת נתונים ציבוריים היא לטובת הכלל ומציגים מנגד את הבעייתיות הקיימת בהסתרת נתונים בטענה כי זה גורם לקיבוע התפתחותי. אחת המטרות העיקריות של תנועת הנתונים הפתוחים היא לעודד ממשלות להקים אתרי נתונים פתוחים כמו Data.gov. אגב, על פי אתר הנתונים הפתוחים של ארצות הברית, נכון ל- 2019 יש ל- 53 ממשלות ברחבי העולם אתרי נתונים פתוחים.

 

לעיריית תל אביב יש אתר נתונים פתוחים בשם TLV OpenData. מדובר באוצר וירטואלי מקומי לתושבי העיר המאפשר לדעת באיזו תחנת 'תל אופן' יש אופניים זמינים להשכרה, מהו אולם הספורט הקרוב למקום המגורים ואפילו מתי מתוכנן שיפוץ הרחוב.
נתונים אלו כמובן מיועדים לשימוש חופשי ולניתוח, בתקווה שיהוו בסיס לפיתוח אפליקציות עירוניות עבור תושבי העיר שימשיכו לסייע לחייהם.

Transit Data: מהפכה תחבורתית שנולדה בזכות Open Data
בואו נדבר על השדרוג הרציני שקיבלו נוסעי התחבורה הציבורית לאחר שהתאפשרה הורדת נתוני GTFS מאתר משרד התחבורה. GTFS (ראשי תיבות של General Transit Feed Specification), הוא פורמט נפוץ של Open Data הקשור לתחבורה ותחבורה ציבורית בעיקר. לפתע התחילו להופיע אפליקציות חדשות עם מידע ששווה את מחירו בזמן יקר, כמו מתי יגיע לתחנה קו האוטובוס הבא לעבודה, או איזה מסלול הכי מומלץ לקחת.

Closed Data: גישה למחקרים מדעיים
אם מחקרים ומאמרים מדעיים מעניינים אתכם, בטח יצא לכם להיכנס לאתר PubMed ולהתאכזב שלא תמיד מתאפשרת לכם גישה למאמר המלא (ל- Full Text) ללא מנוי. זוהי דוגמה קלאסית לחוסר מימוש ידע בייחוד עבור אנשים הצמאים לנתונים חדשים בנוגע לנושאים רפואיים אקטואלים.

 

באותו נושא נולדה הקריאה 'Open Access' הפונה לכתבי עת מדעיים לפרסם בחינם מחקרים מדעיים לציבור. היות והיום בזכות הדיגיטציה עלויות ההפצה זולות משמעותית ולא ברורה ההצדקה למחיר יקר.


ניצול לרעה של Open Data
האם לטכנולוגיה ולדיגיטציה השפעה על פערים חברתיים? דוגמה מעניינת המתועדת היטב לתופעה של העצמת המועצמים (Empowering of the Empowered) ניתן למצוא בעבודתם של חוקר הידע העולמי סולי בנג'מין וחבריו, שבוחנת את ההשפעה של הדיגיטציה על רשומות אדמה בבנגלור. על פי הממצאים שלהם, אדמות שהיו שייכות לאנשים מהמעמד הנמוך פשוט נגנבו כ"שוד לאור היום" על ידי אליטה מקומית לאחר פתיחת נתוני קרקעות באמצעים דיגיטליים.

 

במקרה הזה נוצלה לרעה גישת ה- Open Data ויצרה תוצאה הפוכה. ברגע שהנתונים התפרסמו באופן פומבי החל כיפוף הכללים. האליטה שכרה עורכי דין ושמאי מקרקעין כדי שיזהו פערים בחוק וטעויות תיעוד שנעשו ברישום השטחים ואפילו מצאה מטרות שוחד שונות.

 

לסיכום
חוקר טכנולוגיה איטלקי בשם פאולו מגרסי אמר כי ״נתונים, בין אם פתוחים או סגורים, יודו על כל דבר ברגע שיעונו מספיק.״

 

עם כל הכבוד למר מגרסי, אמירה זו נאיבית מדי. על אף שהיינו רוצים לחשוב שאנחנו שולטים בנתונים, כל הממצאים מצביעים בדיוק על ההפך. רובנו נכנסים למבוך הסבוך הזה שלא סתם נקרא Web, מנסים את מזלנו במציאת הכיוון הנכון ונתקלים במעצורים. כשאנחנו ניצבים מול קיר בטון וירטואלי, רוב הסיכויים שנחזור על צעדינו ונמצא נתיב אחר במקום לנסות לשבור אותו או לשלם דמי כניסה.

 

אגב, האירוניה לא חמקה מעיני שבשביל הכנת כתבה זו ניצלתי את כוחם של הנתונים הפתוחים למקסימום. בהחלט פריווילגיה.