כיצד קהילת ה Data Science מסייעת במלחמה נגד קורונה?

יובל נוח הררי אמר לאחרונה שהאנושות מעולם לא הייתה מוכנה יותר מאשר היום להתמודד עם המגפה. הקידמה הטכנולוגית שמאפיינת את העידן בו אנו חיים לכאורה צריכה להיות לצידנו ולעזור לנו לצלוח את המשבר. יחד עם זאת, המגפה תפסה אותנו לגמרי לא מוכנים.

מי שעוסק בעולם הנתונים לא יכל שלא להיות מתוסכל מהאופן בו החלטות נלקחות בעולם. נדמה שאין מספיק הישענות על נתונים, או מודלים טובים של ניבוי. עם כל ההתקדמות הטכנולוגית האדירה בעולם ה big data ו AI, לא היינו צריכים להיות עכשיו במקום אחר? איך זה קרה? ומדוע אותו AI נודע לשמצה כמי שעתיד למחוק את האנושות – לא מגיע עכשיו ומציל את העולם?

המשבר הזה חשף את גודל הפער העצום בין ההבטחה הגדולה של עולם הדאטה למציאות, שבה אנחנו לוקחים החלטות ולא מסתמכים על נתונים.

אחת הדוגמאות הבולטות לכך היא היערכות והצטיידות. איך קורה שמישהו ביחידת הרכש לא יודעת להצטייד בציוד מספק? למה אנחנו לא רואים יותר החלטות מבוססות דאטה במשבר הנוכחי?

אפשר בהחלט להתנחם ביכולות הדאטה המצוינות שיש למשרד הבריאות שלנו, שמהווה פורץ דרך בכל עולם הנתונים, ביג דאטה ו Data Science כבר לפני שנים. אך מה קורה בעולם? התחושה היא שמדינות אינן נשענות מספיק על נתונים בקבלת ההחלטות, החל מהבנת תמונת המצב דרך נקיטת פעולות ובוודאי מניעה. וזה בהחלט מתסכל, כי אנחנו נמצאים בנקודת זמן בה היכולות הטכנולוגיות והדיגיטליות קיימות וזמינות ויש כל כך הרבה שניתן לעשות כדי לסייע באמצעות נתונים.

ואכן – בחודש האחרון אנחנו רואים התגייסות אדירה של קהיליית מדעני הנתונים לסייע באתגר.  ה קהיליות מאורגנות כמו לדוגמה Data Natives (כ 80K מדעני נתונים), Kaggle (גוגל) ודומיהן כבר "על זה" ומריצות האקטונים – דוגמת #HACKCORONA, תחרויות ואתגרים שקשורים למלחמה בנגיף. הרווארד פתחה קורס ייעודי ל Data Science for Covid19 ועוד שלל דוגמאות.

אז למה בכל זאת קיים הפער הכואב הזה, בין הפוטנציאל והיכולת של עולם הנתונים והמימוש שלו בפועל? באופן מעניין, ניתן להקביל את הסיבות לפער הזה למצב הקיים בארגונים כיום.

הסיבה העיקרית היא היעדר דאטה. או יותר נכון – היעדר Data governance!

הבעיה היא שהנגיף נכנס לחיינו רק לפני מספר חודשים ספורים ופשוט אין מספיק "היסטוריה". בנוסף, הנתונים שנאספים אינם "סטנדרטיים" משום שמדובר במגפה עולמית וכל אחד מגדיר נתונים טיפה אחרת (לדוגמה, נושא הבדיקות – כל מדינה נוקטת במדיניות שונה. חלק בודקים הרבה, חלק % קטן מהאוכלוסיה, חלק בכלל לא). במצב זה קשה לחזות אחוזי חולי/ תמותה, וכתוצאה מכך גם להיערך ולהצטייד בהתאם. במצב זה, בו אין מספיק נתונים אמינים ואין "אמת אחת" קשה מאוד לבסס מודלים, כפי שאנחנו מכירים היטב מהעולם הארגוני.

החדשות המעודדות הן שיש התקדמות אדירה ומואצת בימים אלה ממש. קהילת ה data science כבר "על זה" ומנסה להתארגן על מקורות מידע טובים. יש כמה יוזמות מעניינות בתחום זה שמנסות להנגיש data sets לכל העולם, כמו לדוגמה Cord 19 – דאטה סט פתוח של Allen Institute המכיל 30K מאמרים ומחקרים בנושא; יוזמות רבות נוספות כמו זו של הבית הלבן בשיתוף עם Kaggle ומיקרוסופט ועוד רבות נוספות שואפות לכנס את קהילת ה AI ומדע הנתונים ולנסות לקדם אתגרים באמצעות אלגוריתמים.

מהם סוגי הפתרונות להם ניתן לצפות משימוש ב Data Science בהקשר של הקורונה?

  • בראש ובראשונה, הבנת הבעיה (במלים אחרות, איסוף נתונים והנגשתם למי שצריך):  היכן ההתפרצויות? מה היקף ההתפרצות? מה אחוז החולי?  טכנולוגיות רלוונטיות: ויזואליזציה, דשבורדים, GIS. המחסור העיקרי כאן הוא בתמונת מצב ברורה סוג של Data governance עם "אמת אחת".
  • סיוע באבחון: אחת הדוגמאות המעניינות כאן היא סיוע באבחון בשלבים מוקדמים, כדוגמת Project Baseline של חברת האחות של גוגל Verily שמציע (כרגע לתושבי קליפורניה) ערכת בדיקה אונליין ל Covid19.

 לקריאה נוספת: https://www.projectbaseline.com/study/covid-19/

בעולם העיבוד החזותי וספציפית דימות, נעשתה עוד לפני התפרצות הנגיף התקדמות אדירה בפענוח תצלומי רנטגן. כיום data scientists מתחילים להיות מסוגלים לזהות את הנגיף בהתבסס על תמונות דימות בלבד. גם כאן ישנה בעיית זמינות נתונים לאימון המודלים, שמתחילה להשתפר.

בתמונה – מודל המזהה בדיוק של 90-92% באמצעות Keras, TensorFlow ו Deep Learning. המודל למד בעצמו, ללא נתונים גיאוגרפיים או דמוגרפיים. המודל מתבסס על data set שפורסם על ידי רופא במונטריאול ב GitHub (לינק ל data set כאן) והושוו מול Data Set קיים של Kaggle לצילומי חזה.  עליבאבא פיתחה מודל שמזהה את הנגיף בסריקות CT באחוז דיוק של 96%. המודל אומן על 5000 דוגמאות והמערכת אומצה על ידי 100 בתי חולים בסין וזהו לא המודל היחיד. מודל נוסף פותח באמצעות Deep Learning (תוך שימוש ב 45K סריקות CT) על ידי אוניב' בווהאן – גם שם אחוז הדיוק עמד על 95%.

יש גם התקדמות בשימוש בטכנולוגיות זיהוי פנים לטובת אבחון כפי שאנו רואים בסין וברוסיה, שמסוגלות לבדוק חום גוף וכן להתגבר על בעיות כמו חבישת מסכה לטובת זיהוי פנים.

בהקשר למניעה/מציאת חיסון –  בהחלט יש ציפייה ש AI יאיץ את התהליך (שתאורטית לוקח 12 שנה). DeepMind של גוגל הכריזו על שימוש ב Deep Learning על מנת לזרז את הבנת מבנה הנגיף ותהליך קיפול החלבונים באמצעות פרויקט AlphaFold שלה – מערכת שיודעת לנבא מבנה חלבון.

בתוך שלל הדוגמאות לסטארטאפים בעולם AI בתחום מגפות/ COVID19, בולט הסטארטאפ Blue Dot שכבר היום יכול לצפות מראש היכן המגפה תתפשט (כך אכן עשה בסין לאחר ההתפרצות בווהאן כך שניתן היה להזהיר את הערים הבאות בתור. כמו כן, האלגוריתם מבוסס ML למד את דפוסי התנועה של אנשים ויכל לנבא לאיזה ארצות ייסעו).

דרך נוספת ויצירתית במיוחד לסייע קשורה לכוח מחשובי. לניתוח נתונים בסדר גודל כזה נדרש כוח מחשובי עצום. NVIDIA פנתה לקהיליית הגיימרים בבקשה לתרום את כוחות העיבוד המחשובי שלהם:

לסיכום

רוב קהילת הנתונים מאמינה של AI יש פוטנציאל רב בסיוע במלחמה נגד קורונה, אבל זה ייקח זמן – המודלים זקוקים לתשתית נתונים טובה, ולזמן אימון. לכן לא תולים בכך הרבה תקוות בעתיד הקרוב.

המפתח ליכולות אנליטיות נעוץ בשכבת נתונים טובה. ככל שמאגרי הנתונים ישתפרו ותהיה "יד מכוונת" (התאגדות של ממשלות לצורך העניין) נוכל לראות יותר פריצות דרך בניסיון לצלוח את המשבר הזה.

כך או כך, אין ספק של AI יש הזדמנות פז להפוך את המוניטין הרע שקיבל מזה שרוצה להשמיד את האנושות לזה שיעזור להציל אותה.

בברכת בריאות טובה לכולם וחזרה במהרה לשגרה "משעממת".

צוות המחקר של STKI.

כיצד קהילת ה Data Science מסייעת במלחמה נגד קורונה?

האבולוציה של אנליטיקה בארגון

Data is the new Oil

כך לפחות נהוג להגיד. Data הפכה להיות שיחת היום בקרב הנהלות ארגונים, והנושא מתחיל לקבל את החשיבות הראויה לו כ Enabler של מהלכים עסקיים, כאמצעי לעמידה ברגולציות מחייבות, וגם כתחום משמעותי לצורך הישרדות בשנים הקרובות.

חברות כיום מוערכות כלכלית יותר ויותר על סמך הדאטה שברשותן, וגם על סמך הדאטה הפונטנציאלי שעשוי להיות ברשותן (המנגנונים שהן מצליחות לייצר ולקלוט דאטה/ "קולטני מידע") ועל סמך היכולת שלהן להעשיר ולנהל את הנתונים שבבעלותן.

אולם ככל שארגונים אוגרים ואוספים יותר ויותר דאטה, וככל שיכולות איסוף, אחסון, עיבוד וניהול הדאטה (Big Data) משתכללות, מתבהרת גם ההבנה שאיסוף דאטה זהו רק תנאי הבסיס.

Data Driven Businesses

ארגונים שואפים להפוך ולהיות Data-Driven, מה זה בדיוק אומר?

Data -> Insights -> Action

  1. DATA: להיות מסוגלים לנהל היטב דאטה, לאסוף, לאגור, לחבר תשתיות נתונים שונות, להעשיר את הדאטה כל הזמן ולייצר שכבת דאטה אמינה, מנוהלת, עם מעטפת של Data Governance.
  2. INSIGHTS: לייצר תובנות על סמך אותה שכבת דאטה, יצירת מודלים אנליטיים ואלגוריתמים על ידי אנליסטים ו Data Scientists תוך שימוש בכלי אנליטיקה ואנליטיקה מתקדמת.
  3. ACTION: אין ספק שזהו השלב המאתגר והחמקמק ביותר. לייצר מנגנונים תפעוליים שיאפשרו לארגון לפעול כל הזמן על סמך אותן תובנות (ולא על סמך "תחושת בטן" לדוגמה), כל יום ובכל נקודת החלטה.

1

לכולנו ברור שאנחנו לא ממצים את פוטנציאל הדאטה במובן של ההחלטות והפעולות שאנו נוקטים, אשר אינן מתבססות על דאטה אלא יותר על רגשות, כוח האינרציה (כך פועלים בארגון שלנו), העדפות פרסונליות ועוד. אבל עד כמה אנחנו לא מספיק פועלים על סמך הדאטה ש*פוטנציאלית* יכול היה להוות הבסיס לפעולה? על פי מחקר של חברת Pivotal, רק כ-0.5% מהData בעולם הנו Operationalized Data! הפוטנציאל הוא כמעט אינסופי (כמות הדאטה הפוטנציאלית היא כמעט אינסופית, והאופן בו נוכל להסתמך על דאטה בקבלת החלטות תלוי בעיקר בדמיון שלנו, ביצירתיות המחשבתית, ובהבנה כיצד דאטה ותובנות יכולים להשפיע בארגון שלנו).

AI, AI, AI! מה הייתה השאלה?

למרות שהמונח AI הפך להיות המונח השיווקי החם ביותר כיום (מחליף את המונח ביג דאטה שעד לא מזמן כיכב בראש מצעד הבאזוורדים), טכנולוגיות בינה מלאכותית (AI) ומחשוב קוגניטיבי הן תוצאה של התפתחות אבולוציונית רבת שנים ולא מהפכה שהתרחשה רק בשנים האחרונות. אולם כן ישנה הרגשה שטכנולוגיות AI הגיעו לנקודת ציון משמעותית לאחרונה, בשל צירוף של שתי תופעות טכנולוגיות:

  • זמינות גבוהה של כמויות נתונים משמעותיות (Data Sets גדולים) שהפכו להיות זמינים לנו רק לאחרונה. קיומם של Data Sets עצומים הנו תנאי בסיס להתקדמות משמעותית בתחום.
  • יכולות עיבוד וכוח חישובי זמין וזול יחסית

AI הנו מונח רחב וגמיש מאוד, תחתיו נכנסים עוד הרבה תתי-תחומים, חלקם קיבלו דחיפה משמעותית וזכו לפריצות דרך של ממש לאחרונה, כמו תחום העיבוד החזותי, עיבוד שפה ועוד.

2

בתוך עולם ה-AI טכנולוגיות מבוססות רשתות נוירונים, ובמיוחד תחום ה-Deep Learning-  DL, מהווה התחום הצומח ביותר עם אחוזי גידול של 200-300% בקצב האימוץ על ידי Data Scientists. על פי סקר של KD Nuggets, ב 2016, 18% מ Data Scientists כבר עשו שימוש ב DL לפחות בפרויקט עובד אחד. על פי תחזית גרטנר, עד 2018 אצל כ-80% מה Data Scienists בעולם, השימוש ב Deep Learning יהפוך להיות עוד כלי סטנדרטי בארגז הכלים שלהם.

היכן אנו מצויים ברצף ההתפתחות האבולוציונית של עולם האנליטיקה?

כבר ברור כי שלב ה"BI הקלאסי" מוצה ברוב הארגונים בתעשיות השונות, ובתחומים השונים בארגון (פיננסים, שיווק, לוגיסטיקה, תפעול, משאבי אנוש – התחום האחרון שנכנס לנושא רק לאחרונה), כלומר, אנו לרוב כן יכולים לשאול "מה קרה בעבר"? ולקבל תשובה טובה. רובנו גם התקדמנו ליכולת לבצע Analysis, חיתוכים והתסכלות מעמיקה על הנתונים בחתכים שונים כדי לענות גם על השאלה "מדוע זה קרה"? חלקנו עושים זאת באמצעות קוביות, חלקנו באמצעות סביבות של ויזואליזציה ו Data Discovery אולם עדיין מדובר על נתוני עבר והסתכלות רטרוספקטיבית.

השלב הבא באבולוציה היווה קפיצה משמעותית מבחינת הערך והתועלת העסקית בארגונים, והוא תחום ה Predictive Analytics: היכולת לשאול "מה עתיד לקרות"? זהו תחום ותיק שניתן למצוא שימושים מסוימים שלו בלא מעט ארגונים, אולם המפגש של תחום זה עם עולם הביג דאטה ועם תחום ה-ML (השלב האבולוציוני הבא) מאפשר לנו להבין יותר טוב את הדאטה, וזו תועלת משמעותית ככל שאנו עובדים עם מגוון יותר גדול של נתונים (חלקם לא מובנים) ונפחי נתונים משמעותיים. כתוצאה מהבנת הדאטה, הישויות, הנושאים, הקשרים, ה Features, אנו יכולים להבין איזה סוג שאלות אנחנו יכולים בכלל לשאול ומה כדאי לנו להמשיך ולחקור. כאן סוג המחקר הוא יותר Exploratory: אנו פחות נדע מראש מה השאלה, נגלה אותה תוך כדי מחקר ושיטוטים בדאטה. David McCandless ("Data Jounalist" ואמן נתונים שעוסק בויזואליזציה והצגה מתוחכמת של נתונים בדרכים המובילות לפעולה) טען ש Data is not the new Oil, לדעתו הגדרה מדויקת יותר היא Data is the new Soil (אדמה). בדאטה יש לשחק, לחפור, עד שמגיעים למשהו מעניין ומתוכו ניתן להצמיח נבטים של תובנות משמעותיות מאוד.

בשלב זה אנחנו כבר מתחילים להתקרב לשלב ה-Prescriptive (תנסו להגיד את המלה הזו 5 פעמים ברציפות, נראה אתכם). Prescriptive Analytics עונה על השאלה: "כיצד יש לפעול על סמך הדאטה"? מה צריך לעשות? דאטה שמוביל לפעולה.

מהי הקפיצה הבאה, אליה עדיין לא הגענו? Autonomous Decisions – מכונות שלא רק ישאלו את השאלות בעצמן, אלא גם יחליטו על סמך התשובות בעצמן ויבצעו את הפעולה בעצמן. Data-insights-actions באופן אוטונומי. ישנם תהליכים מסוימים ב Domain מצומצם שכבר עובדים בתצורת Autonomous decisions, אולם באופן כללי לא הגענו לרמת חוכמת AI "כללית" (General AI) שאינה צריכה שאנו, האנשים, נאכיל אותה – במבנה הדאטה, במשמעות ובמנגנון ההסקה והפעולה.

3

במפגש שולחן עגול שקיימנו לאחרונה בנושא, עלה כי התחום בישראל מעניין ארגונים רבים אבל כמעט כולם מרגישים ש"הם עוד לא שם", ה Use Case כלל לא ברור (החסם העיקרי בעולם כיום לאימוץ AI בארגונים – לכל מי שעוסק בתחום הביג דאטה זה יישמע מאוד מוכר מהשלב ההתחלתי שאפיין את השוק לפני שנתיים). עלתה התחושה הכללית שפוטנציאל הדאטה לא ממומש, כי הארגון "עוד לא שם" ושהם עדיין די רחוקים מהדגמת איזשהו ערך עסקי מוחשי. רוב הארגונים כבר עברו (או עוברים בימים אלה) מBI קלאסי להוספת ממד ה Data Discovery ו Self Service (בנוסף לדוחות הקלאסיים). כמחצית מהארגונים כבר מתנסים כיום ב Predictive Analytics אולם באזורים מאוד ספציפיים בארגון (ניהול סיכונים/ מניעת נטישה/ גילוי הונאה וכד').

כלים טכנולוגיים:

בעוד שבעולם ה-BI הקלאסי ישנה שאיפה לסטנדרטיזציה עם כלי ארגוני סטנדרטי אחד (או לפחות ניסיון משמעותי להפחתת מספר הכלים השונים, בניסיון להשיג יותר שליטה על השכבה הסמנטית ועל אופן השימוש בנתונים), בתחום ה-Data Science – היותר חדש, ישנה נכונות גדולה יותר לנסות מגוון של כלים ולתת למשתמשים יותר עצמאות באופן ניתוח במידע, גם אם זה אומר שימוש במספר כלים שונים וויתור מסוים על רמת השליטה באופן השימוש בנתונים לעת עתה.

כלומר ישנו שינוי תפיסתי בהתייחסות לכלים הטכנולוגיים – בשכבת אחזור המידע.

על פי סקר של KD Nuggets, כ-18% מ Data Scientists שנשאלו בסקר ענו כי הם כבר התנסו בפועל בפרויקט המערב יכולות מבוססות Deep Learning (עלייה של 200% לעומת השנה שעברה). DS משתמשים בממוצע בכ-3 כלים שונים לוויזואליזציה וניתוח המידע.

על פי סקר של KDNuggets על הכלים בהם DS מעידים כי הם עושים שימוש:

4

 Data Management, Data Governance ומה שביניהם

במפגש שערכנו בנושא Data Driven Businesses לאחרונה עסקנו בחשיבות של ניהול ומשילות נתונים באופן מרכזי בארגון.

ה CDOs – Chief Data Officers

מה עדיין חסר?

עם כל ההשקעה שנעשתה באיסוף דאטה וגזירת תובנות על מנת לשפר מהלכים והחלטות עסקיות, מה עדיין חסר? ולמה רוב הארגונים לא באמת פועלים על סמך הדאטה?

אין ספק שהפכנו להיות אלופים באיסוף דאטה. טכנולוגיות ביג דאטה מאפשרות לנו לעשות את זה אפילו יותר טוב, וארגונים מתארגנים כיום עם אנשים (CDOs, Data Governance organizations) וכלים (כלי ניהול נתונים, EIM, Data Governance Tools) על מנת לנהל יותר טוב את שכבת הדאטה ולהפוך אותה לבסיס טוב לקבלת החלטות והסתמכות על נתונים.

אנחנו גם לא רעים ביכולת לגזור תובנות ומודלים אנליטיים על סמך הדאטה שברשותנו. וניתן לראות שאנו מתקדמים ונעים במסלול הזה בכיוון טוב. אנליסטים עוברים הכשרות להפוך להיות Data Scientists, יותר אנשים בארגון מעוניינים בגישת ה Self Service ובאופן כללי התחום נע בכיוון החיובי.

הבעייתיות נעוצה בשלב ה Action. וזה נובע לטעמנו משתי סיבות שונות:

  1. סיבה "פסיכולוגית" – אנשים מרגישים יותר בנוח להסתמך על תחושת הבטן שלהם לקבלת החלטות מאשר על נתונים. להפוך להיות ארגון Data Driven זה לא רק טכנולוגיה, זו תפיסה, תרבות, וזה תהליך שלוקח זמן.
  2. סיבה תפעולית – בארגונים כיום לא קיימת התשתית התהליכית שמתרגמת תובנות לפעולות. האוטומציה נעצרת איפשהוא בשלב גזירת התובנות. כיצד נוודא שתובנה מסוימת מפעילה פעולה בצורה אוטומטית? בתחום ה AI אחד התחומים המעניינים ביותר כיום הוא תחום ה Decision Management – תחום שכולל בתוכו כלים בסגנון מנועי CEP – Complex Event Processing, מנועי חוקה וכלים נוספים המניעים לכיוון יישום התובנות בקבלת החלטות וביצוע פעולות. בנוסף, ספקי מערכות עסקיות (ERP, CRM, Marketing automation, Supply Chain Management) יקלו על החיבור הזה בעתיד מכיוון שבבסיס של מערכות אלה תהיה שכבת AI שתסייע להניע תהליכים "יותר חכמים" תוך חיבור בין עולם התוכן התפעולי ואנליטי – Embedded analytics בתוך תהליכים.

5

ואם מישהו מרגיש שלא שמענו על מספיק תפקידי מטה חדשים ברמת C-Level, אל דאגה! ה (CAOs (Chief Analytics Officers בדרך. ותפקידם לוודא שאנליטיקה "תעלה מדרגה" ברמת השימוש שלה בקבלת ההחלטות בארגון. יש כאלה שיגידו שזה לא תפקיד נוסף אלא התקדמות בתפקידו של ה CDO (ה Data Officer הארגוני) או פונקציה שקיימת במקום אחר בארגון, אבל מה שיותר חשוב הוא שמדובר על סוג של "אנליסט/ית בכיר/ה" שמקבל כסא בחדר הדיונים של ההנהלה, היא/הוא מעורים במטרות ובאתגרים העסקיים ויודעים למנף את היכולות האנליטיות בארגון באופן אקטיבי ולפעול לכך שקבלת החלטות יומיומיות יישענו על תובנות אנליטיות, ולא על תחושות בטן, במיוחד ברמת ההנהלה הבכירה.

6

7

שיטה נוספת להידוק הלולאה בין Data – Insights – Action היא שימוש במתודולוגיית DataOps ששואבת השראה רבה מתחום ה DevOps. עצם העניין כאן הוא יצירת תצורת עבודה המבטיחה שיתופיות בין אנשי ה Data לאנשי ה Analytics ואנשי התהליכים, במקום שכל אחד מהם יפעל בנפרד.

8

 הרבה שיטות לאותה המטרה, בדרך להפוך להיות Data Driven Business.

 לסיכום:

תחום ה-AI כיום מראה תוצאות מיטביות בשילוב עם אנשים/ Data Scientists / אנליסטים. אין לנו עדיין "אלגוריתמים אוטומטיים". הכלים כיום מסייעים לנו בהבנת הדאטה, ב"ראייה" של דפוסים ובמציאת קורלציות בדאטה.

החסמים העיקריים: הערך העסקי וה Use Cases עוד לא ברורים; מחסור משמעותי באנשים ובכישורים מתאימים בארגון; פלטפורמת דאטה לא מספיק "מוכנה" (אי אפשר להסתמך על הנתונים לקבלת החלטות "בשטח", אין מספיק Governance" איכות נתונים נמוכה מדי, או תשתית נתונים מיושנת מדי).

יחד עם זאת, ברור שהפוטנציאל הוא עצום ושכדאי להתחיל לבחון וללמוד את הנושא, ללמד את האנליסטים בארגון ולהכשיר אותם לסביבות טכנולוגיות חדשות לחלוטין, לעתים ניאלץ גם לגייס כ"א חיצוני שמגיע מתחום ה Data Science, לנהל את תשתית הדאטה ככזו שאמורה לתמוך בתפעול היומיומי של הארגון ובקבלת החלטות קריטיות בזמן אמיתי / קרוב לכך.

התעלמות מתחום זה – יש בה סיכון של ממש, שכן האיומים החדשים על תעשיות הפכו להיות לא המתחרים הישירים שלהם אלא המתחרים הפוטנציאליים – אלה שיצליחו לאתר אלגוריתמים יותר חכמים ויעילים מהמערך הקיים בארגון כיום. מספיק לדמיין מה היה קורה אילו לאחרת מ"ענקיות הדאטה" היה מתחשק מחר בבוקר להיכנס כמתחרה בוורטיקל בו הארגון פועל, וזה תרחיש לחלוטין לא דמיוני.

אסור לשכוח שאת כל זה נושא ניהול הנתונים ו Data Governance חייב לעטוף. זהו תנאי מהותי להצלחה, בלעדיו לא ניתן יהיה לייצר תשתית אמינה וניתנת לניהול שנוכל להסתמך עליה בהחלטות התפעוליות של הארגון.

אז האם Data is the new Oil? לא בטוח, אנחנו יותר מתחברים להגדרה של David McCandless – Data is the new Soil (אדמה). באדמה צריך לשחק, להתלכלך, להתייחס לנושא לעתים כאל מגרש משחקים, להצטייד באנשים ובכלים שיכולים למצוא שם דברים בעלי ערך ולשתול את הזרעים למה שעתיד להשפיע מהותית על פעילות הארגון.

 

האבולוציה של אנליטיקה בארגון