בשנה האחרונה, אנו עדים למערכות AI אשר מאפשרות לאנשים ללא רקע ב-Data Science וכתיבת קוד להפיק תועלות מטכנולוגיות שונות בתחום ה-.AI כלים כגון ChatGPT המפורסם, Bard של חברת גוגל וכלי AutoML של מיקרוסופט המסייעים למערכות ML לנהל תהליכי “למידה”, וכלי No Code ו-Low Code כגון GitHub Copilot מקדמים בצעדי ענק את העידן שכלי AI יבצעו את רוב תהליכי AI ללא צורך במיומנות מיוחדת של כוח אדם. ההצלחה היא תוצאה של ניצול מדהים של מאגרי נתונים אדירים מכל הסוגים ובכל הנושאים הכלליים. יש לפלטפורמה גישה לכמויות מידע אין סופיות מסוגים שונים ובכל נושא. כמו כן, הכלים הללו משתפרים ביעילותם ככל שיש יותר מידע ויותר שימוש בהם.
האתגר המהותי הוא, לנצל כלים כגון ChatGPT, כלי AI, וסימולציה נוספים לטובת ארגונים שונים כאשר הנתונים הספציפיים הנדרשים לטובת כלי ה-AI שונים לחלוטין מאחר והמידע חייב להיות רלוונטי לפעילות הארגון. אם בעבר הסתפקו ארגונים במאגרים מובנים מסוג מחסני נתונים או מאגרים מבוססים Hadoop או מאגרי אובייקטים, כיום, כלי AI חכמים דורשים מגוון רחב יותר של סוגי מידע, חלקם בזמן אמת ובדרך כלל גם יש צורך בביצוע אונטולוגיה כגון יחסים וקשרים מיוחדים בין פריטי מידע, הבנת השפעה של פריט מידע על פריטי מידע אחרים, הבנת הקונטקסט, וניתוח סוגי מידע יותר מורכבים כגון ווידאו, קול, ותמונות. להלן דוגמה של קשרים אונטולוגים בין סוגי מידע:
ישנם משקלים שונים לרלוונטיות של המידע עבור כל ארגון וארגון. כמו כן, ישנם דרישות שונות לניהול, הגנה ו”משילות” של המידע הארגוני. לכן, עידן מחסני נתונים רגילים עם מידע סטטי ארגוני, לא מאפשר שימוש רחב בכלי AI מתקדמים מאחר ולא כל המידע זמין, ובד”כ הוא לא מתעדכן בזמן אמת. כמו כן, יש צורך בגישה מאובטחת למאגרי מידע מחוץ לארגון ומאגרים של שותפים עסקיים לפעמים בזמן אמת (streaming). ככל שי יותר מידע, כלי ה-generative AI או הכלים שמסוגלים להמציא תובנות הגיוניות יהיו יותר יעילים ומדויקים. לפי אנליסטים בגרטנר, כל ארגון חייב מגוון רחב של נתונים:
כאשר כל המידע הרלוונטי קיים, ומסודר לפי קונטקסט עם קשרי ייחוס בין פריטי המידע, ניתן להפעיל מערכות מסוג generative AI (ומערכות AI/ML אחרות) עם כלים מתקדמים.
נושא נוסף שעולה בחשיבותו הוא “משילות” על המידע או .Data Governance מעקב אחרי המידע, מקורו, ורגישותו. חשוב לעקוב אחרי מקור המידע, הגנה על מידע חסוי, מניעת שינוי המידע וכמובן הקונטקסט. ישנם מגוון כלים מסוג זה בשוק אשר עוקבים אחרי תזוזות מידע, גישות ורלוונטיות של המידע בכל עט.
אולם, אנו עדים היום למערכות המכונות “Data Operating System” או מערכות המיועדות לקלוט, לאחסן ולשלב מידע ברמת אבטחת מידע מדהימה ו”למשול” במידע בדומה למערכות המתוארות ליל. מערכות אלו מתוכננות מראש לספק מענה לשאלות מגוונות באופן מהיר וברור. הן מאפשרות שילוב נתונים לניתוח גמיש, ויזואליזציה, בניית מודלים, קבלת החלטות תפעוליות ושמירת מסקנות מופקות מהמידע לשימוש חוזר. במילים אחרות, פלטפורמות אלו מיועדות ל-data driven decision making או קבלת החלטות מונעת נתונים.
בעבר, מערכות מסוג זה צמחו בגופי מודיעין כאשר לא תמיד היה ברור מה מחפשים או איך מתייעלים. הצורך הזה קיים כבר אצל ארגונים רבים ולכן הכלים הללו כבר בשימוש נרחב בארגונים.
לדוגמה, חברת Palantir מספקת מערכות מסוג זה. לפני מספר שנים, היא פיתחה מערכת בשם Gotham לגופי מודיעין. כיום קיימת מערכת מקבילה בשם Foundry לממשלות (למשל המערכת לניהול תגובות ל-COVID בארה”ב) וחברות ענקיות כגון Airbus לניהול כל שרשרת האספקה והספקים.
ה-Data Operating System בשילוב עם כלי AI מתקדמים יניעו גם את החברות והארגונים לעידן חדש של ניצול מערכות מידע.
המאמר נכתב ע”י צבי ברונר, יועץ ראשי מלם תים