אודות מאגר הנתונים

מאגר הנתונים אוסף, מעבד, מפיץ ומשמר גופי נתונים שיש בהם ענין מחקרי בתחומים השונים במדעי החברה. מאז הקמתו בסוף שנות ה-70 התפתח המאגר למרכז ארצי לנתונים ממוחשבים והחל מ- 1994 הוא משרת את כל האוניברסיטאות במסגרת הסדרי מנוי. בין צרכני הנתונים נמצאים גם מכוני מחקר, מכללות ומוסדות ציבור. כמו כן מספק המאגר נתונים על ישראל לחוקרים בארצות אחרות. בוועדה המייעצת המנחה את עבודת המאגר, משתתפים נציגי המוסדות המנויים ונציג הלשכה המרכזית לסטטיסטיקה.

מטרות המאגר

  • עידוד המחקר האמפירי במדעי החברה ע"י הגברת השימוש המשני (secondary analysis) בנתוני אמת לצרכי מחקר והוראה
  • הצלת נתונים חשובים טרם אובדנם באמצעות איתור, איסוף, השבחה ושימור של קבצים בעלי ערך
  • ניהול ספרית נתונים אמינה ויעילה
  • ריכוז מידע על מצאי הנתונים הרלבנטיים בארץ, סוגיהם ושיטות הבניה שלהם
  • בנית סדרות מצרפיות ומסדי נתונים בתחומים שאינם מטופלים ע"י מוסדות אחרים
  • ייצוג צרכני הנתונים בישראל בפני מאגרים ויצרני נתונים חשובים בחו"ל

 

המאגר הוא המקום היחיד בארץ בו נאספים ונשמרים, במצב תקין וזמין, נתוני מיקרו על החברה והכלכלה בישראל ואחד המרכזים הבודדים המטפל באופן שוטף בארגון ושימור נתוני מקרו. לספרית הנתונים של המאגר אין אח בארץ, לא בהיקף הנתונים וטווח הזמן שהם מייצגים (למעלה מ-30 שנה) ולא בטכנולוגיות שימור ושרות למשתמשים.

ספרית המאגר מכילה כ-1000 גופי נתונים (dataset) הכוללים סקרי דגימה, סקרים מקומיים, מפקדי אוכלוסין, רשומות אדמיניסטרטיביות ונתוני מקרו. מרבית הקבצים הם נתוני מיקרו אנונימיים וחלקם הקטן מכיל מצרפים, בד"כ סדרות עיתיות. המאגר מייחס חשיבות גבוהה לשמירה על סודיות נתוני הפרט בקבצים ושומר על סטנדרטים בינלאומיים בנושא זה. המקורות העיקריים לנתונים הם הלשכה המרכזית לסטטיסטיקההמוסד לביטוח לאומי , מכוני מחקר, חוקרים באוניברסיטאות ומשרדי ממשלה. מ- 1995 פועל המאגר גם כמשווק מורשה של נתוני הלמ"ס. מקורות עיקריים לנתוני חוץ הינם תוכנית ה- ICPSR במישיגן, בו מייצג המאגר את ישראל כ- 
Official Representative of the ICPSR Israeli membership, ותוכנית ה- ISSP.

אגרת למפקיד הנתונים

ברוך הבא ותודה לך על העניין שלך בהפקדת נתונים עם ISDC. ISDC מעודד יצרני נתונים- רשויות ממשלתיות, ציבוריות ומקומיות, כמו גם מוסדות אקדמיים- להפקיד את הנתונים הממוחשבים שלהם בארכיון לצורך שימור ארוך טווח, ולשימוש בניתוח משני על ידי חוקרים אחרים ממדעי החברה. ה-ISDC מחפש נתונים מתוך סקרים או רשומות מנהלתיות, שיש להם פוטנציאל שימוש במדעי החברה. מערכות הנתונים האלה מוכנים אז לשימוש לניתוח משני וכן לשימור ארוך טווח, על פי סטנדרטים בינלאומיים של מאגרי נתונים במדעי החברה. למותר לציין כי הכנת המאגר לשימוש כוללת אמצעי בקרה על הגילוי כמו הסרת כל פרטי הזיהוי.

יתרונות הפקדת הנתונים במאגר:

 מבטיח את שמירת הנתונים בבטחה.

 מקדם מחקר חדש ומאפשר בדיקה של שיטות מחקר חדשות או חלופיות.

 מפחית עלויות על ידי הימנעות מאיסוף נתונים כפול.

 מספק הכרה פומבית של בעל מחקר הנתונים ופעילויות מקצועיות.

 מאפשר לבעלי המידע להימנע ממטלות אדמיניסטרטיביות הקשורות במשתמשים חיצוניים ולדרישותיהם.

 לחוקרים להדגים שימוש ממושך בנתונים אחרי שהמחקר המקורי הושלם, דבר שיכול להשפיע על סוכנויות המימון לספק מימון נוסף למחקר.

 

אחסון הנתונים ב-ISDC מאפשר הטבות נוספות לחוקרים ראשיים:

 תיאור המחקר של החוקר נכלל באתר האינטרנט של המרכז 

 שמירה על גיבויים קבועים של הנתונים הן באתר והן מחוץ לאתר

 צוות המאגר בוחנים את הנתונים כדי לקבוע את רמת הסודיות הסטטיסטית, ולאחר התייעצות עם בעל הנתונים, לעשות את השינויים הנדרשים כדי להבטיח את חשאיות המשיב

 

 

בעל הנתונים יכול לשלוט בשימוש בנתונים על ידי הקצאת אחד ממצבי הגישה הבאים:

דרגה 1 : מערך הנתונים נתון לשימוש חופשי, אך המשתמש צריך להכיר במקור שלו (של בעל הנתונים). 

דרגה 2 : מערך הנתונים נתון לשימוש חופשי ובעל הנתונים מקבל דו"ח שימוש תקופתי.

דרגה 3 : כל שימוש במערך הנתונים מצריך אישור בכתב של בעל הנתונים.

דרגה 4 : מאגר הנתונים יהיה פתוח לשימוש חופשי לאחר שבעל הנתונים מפרסם את תוצאותיו. 

 

עלות הקליטה של קובץ נתונים היא פונקציה של מערך המחקר, מורכבות הקובץ (ריבוי יחידות חקירה והיאררכיה ביניהן) , מספר המשתנים ואיכות התיעוד. קבצי נתונים "חמים" נקלטים במאגר ללא מימון חיצוני. לגבי קבצים אחרים, רצוי לטפל בגיוס תקציב בשלב הכנת הצעת המחקר. נשמח לסייע לך בתימחור והכנת הסעיפים התקציביים הרלבנטיים.

סודיות מידע סטטיסטי

מאגר הנתונים מייחס חשיבות רבה לשמירה על צנעת הפרט (פרטים, משפחות, עסקים וכד') במסגרת השרות הניתן לקהילית המחקר במדעי החברה. המאגר מחויב להגנה על צנעת הפרט בקבצים הנמסרים למשתמשים.

במסגרת הכנת קבצי נתונים לשימוש, נמחקים כל הפרטים המזהים: שם, מספר זהות, כתובת ומספרי טלפון. יתרה מכך, אם לאחר מחיקת הפרטים האלה קיים עדיין חשש מזיהוי עקיף ע"י הצלבת נתונים אחרים בקובץ, ננקטות פעולות נוספות להגנה על צנעת הפרט: מחיקה, הקבצה או מיסוך משתנים והחלפת ערכים בין רשומות. במקרים בודדים, כאשר קובץ נתונים מכיל פרטים רגישים, הוא מסווג בקטגורית נגישות נמוכה כמו דרגת זמינות 3 של המאגר או קובץ MUC של הלשכה המרכזית לסטטיסטיקה. פעולות אלה נעשות בנסיון לא לפגוע בערך המחקרי של הנתונים.

 

כל נסיון לזהות או להפיץ נתונים אודות "נחקר" (case) מתוך נתוני המאגר הינו הפרה של התחיבות המשתמש כלפי המאגר ושל חוק הגנת הפרטיות, תשמ"א- 1981. נסיון כזה מפר גם את ההתחיבות שנתן המאגר למקור הנתונים ועלול לפגוע בנכונות הציבור להשתתף בפעולות סטטיסטיות. משום כך מתחייב כל אדם המקבל נתונים מהמאגר :

  •  להשתמש בנתונים אך ורק לניתוח ודווח סטטיסטי
  •  לא לעשות בנתונים עיבוד שאינו סטטיסטי ולא לנסות לזהות אנשים, משפחות וחברות עיסקיות
  •  לא לזווג בין קבצים שונים ממאגר הנתונים ובין קבצי מאגר לקבצים ממקור אחר
  •  לא למסור את הנתונים או חלק מהם לאדם אחר
  •  לדאוג לכך שקובצי הנתונים והתיעוד הנלווה יהיו שמורים כך שלא תתאפשר אליהם גישה לאנשים שאינם מורשים לכך
  •  לכבד מיגבלות נוספות, אם ישנן כאלה, המוטלות ע"י מקור הנתונים

 

מוסדות המנויים לשרותי המאגר

צוות המאגר

 

פרופ יונה סכלקנס   יושב ראש                   02-588-3336       jona@mail.huji.ac.il

 

עוזרי מחקר:

   
נטליה וולצקינה 02-588-1170 natasha@mail.huji.ac.il
סיגל נאור 02-588-3008 isdc@savion.huji.ac.il
יצחק שחר   yitzchak.shachar@mail.huji.ac.il