נגישות
[wpa_toolbar]
שפות
main-pic

ענן ציבורי – התשתית האולטימטיבית ליישומי ML/AI

בעשור האחרון, נולדה אמירה פופולרית, לפיה: “Every Business is an IT Business”. רוצה לומר, ה-IT הינו בליבת העסקים ובעל השפעה מכרעת בהצלחת העסק. בזמן האחרון, האמירה אף התעדכנה והופכת בהדרגה ל-Every Business is an AI Business.

כיום, יותר ויותר ארגונים משתמשים ביישומי ML/AI כחלק מיישומי ה-IT המרכזיים של הארגון. את הטענה הזו מחזקים הנתונים המופיעים בדוח גרטנר האחרון, לפיהם אימוץ AI על-ידי ארגונים גדל ב- 270% בארבע השנים האחרונות ו- 37% מכלל החברות מיישמות AI באופן כלשהו.

בהתאם לכך, היבטים עסקיים כדוגמת בקרת תהליכים, פיתוח עסקי, גיוס ושימור לקוחות, תחזוקה מונעת, ניתוח דיבור, אופטימיזציה בייצור או בקידום מוצרים וגילוי אנומליות, הם כולם תהליכים אשר התקדמו באופן מרשים באמצעות יישום מודלים המבוססים על טכנולוגיות ML/AI. הדבר בולט במיוחד בתעשיית הרכבים האוטונומיים, שבה קיימת התפתחות מואצת, ניטור ובקרת חיישנים מרובים (IoT) וקבלת החלטות לפי מצב החיישנים, רק בזכות אינטליגנציה מלאכותית.

יחד עם זאת, האתגר המרכזי נובע מכך שהטכנולוגיה ליישום מערכות אלה מורכבת במיוחד ודורשת ידע, משאבי מחשוב משמעותיים וכלים מגוונים.

כוח מחשוב ונפח אחסון

יישום טכנולוגיית AI מבוסס על מספר שלבים:

איסוף DATA – לשם כך נדרשת כמות משמעותית של נתונים אשר אולי רלוונטיים ואולי לא.
ניתוח הנתונים – בעזרת סט של אלגוריתמים, לצד ניסוי וטעיה בהוספת פרמטרים מיוחדים אשר ישפרו את המודל כדי שישקף את הדיוק שלו. תהליך זה מכונה “supervised learning”, או לימוד מבוקר. ישנם כלים ותהלכי AI אשר מסיקים מסקנות בעצמם, על-ידי גילוי קשרים לוגיים או משמעות אחרת מתוך המידע, ללא צורך בבקרה מקדימה, אבל דורשים בתמורה עוד כוח מחשוב משמעותי.

אימות המודל – מתבצע כדי לברר האם המודל הנבחר הוא אכן המודל המשקף את תכליתו בעזרת בדיקות מול נתונים נוספים.

השלבים הללו דורשים כוח מחשוב ונפח אחסון משמעותי לצורך התנעת  התהליך, עד לשלב המאמת את המודל באופן סופי. השלב האמצעי אשר בו לומדת המערכת את הנתונים ובהתאם לכך מתאימה את המודל, הוא שלב שעשוי להיות ארוך במיוחד, מאחר ויש צורך במספר רב של אינטראקציות עם אלגוריתמים ופרמטרים שונים עד שנוצר מודל אופטימלי.

ביישומים בהם מערכות ה-ML/AI מנטרות חיישנים רבים, התעשייה מוסיפה אינטליגנציה ויכולות ML/AI כבר במכשירי הקצה. לדוגמא, כיום פרוסות מספר רב של מצלמות “חכמות”, אשר מבצעות חלק מתהליך הזיהוי כבר בתוך המצלמה. מצד שני, לאור התפתחויות בטכנולוגיית התקשורת ולאור הורדת עלויות בחיישני קצה, זרימת המידע למערכות העיבוד המרכזיות הולך וגדל.

כוח עיבוד לניתוח המידע 

חברות הענן הציבורי המובילות – Amazon AWS, Microsoft Azure ו-Google – זיהו את ההזדמנות וכבר לפני שלוש שנים התחילו את המסע המכונה בפיהם “The Democratization of AI” (דמוקרטיזציה של הבינה המלאכותית), שנועד לספק תשתיות וכלים, אשר יקלו על פיתוח ויישום מערכות ML/AI באופן שיהפוך את הטכנולוגיות הללו ל”שוות לכל נפש”. למרות שכל העננים הללו דומים בתכולה וביכולות שלהם,  מפאת חוסר המקום, אתרכז בענן של AWS.

עוד לפני ההתאמות שביצעו בעננים הציבוריים לעיל, אלה האחרונים מתאימים מראש ליישום מערכות ML/AI ממספר סיבות:

תהליך היישום דורש כוח מחשוב משמעותי לפרקי זמן קצרים יחסית וזה בדיוק אחד היתרונות המרכזיים בשימוש בענן ציבורי. כמו כן, חלק מהאלגוריתמים מתאימים במיוחד להפעלתם באופן מקבילי מול מספר רב של נתונים. בדיוק לשם כך העננים הציבוריים מספקים שרתים ווירטואליים אשר מחוברים ל-Graphic Processing Unit (GPU)  – כוח מחשוב ייעודי, אוFloating-point Gate Array (FPGA)  לעיבוד מקבילי של נתונים.

הליך ML/AI הוא עתיר נתונים, כאשר נפח הנתונים משתנה לפי צורך. בענן משלמים רק לפי צריכה. לכן, לאורך זמן, שימוש באחסון לא יקר של הענן כולל מנגנוני ארכיב גמישים במיוחד.

לעיתים קרובות, תהליכי ML/AI משולבים עם נתונים רבים הזורמים בזמן אמת (למשל ניתוח מערכות ווידיאו, או הפיכת מלל לטקסט או לתרגום בזמן אמת). לעננים ציבוריים ישנם כלים אשר תוכננו לקלוט נתונים בזמן אמת ולארגן כוח עיבוד הולם לניתוח המידע.

כאמור התשלום עבור המשאבים הוא רק לפי השימוש בפועל.

תשתיות ליישום

מעבר “לטבעיות”  בשימוש בענן ציבורי לטובת יישום מערכות ML/AI, ספקי עננים ציבוריים מובילים משקיעים משאבים משמעותיים כדי לעמוד מאחורי המגמה של דמוקרטיזציה של הבינה המלאכותית (Democratization of AI) וכדי להקל מאוד על יישום מערכות מסוג זה. ב-AWS, ניתן לחלק את ההשקעות וסלי מוצרים הללו למספר קטגוריות:

Machine Learning Services – או סט כלים המאפשרים בנייה והקמת יישומים באופן מהיר במיוחד בעזרת כלים מובנים ואלגוריתמים בנויים מראש, אשר כבר עברו אופטימיזציה לסביבת AWS. כדי להקל על יישום מערכות Machine Learning וכדי לייעל את תהליך ה”לימוד” ולאפשר לימוד מקבילי, מספקתAWS   מוצר שירות (Service) בשם SageMaker. מוצר זה ממכן ומייעל את כל מחזור החיים של יישום מודלים והפעלתם ומאפשר בדיקת המודל, כולל בחירה והצמדת parameter hyper- או כיול למודל כדי שיהיה מנורמל ו”רגיש” מספיק לנתונים הנבדקים.

כל התהליך להקמת התשתית עבור היישום מתבצע באחריות SageMaker. תשתית SageMaker גם מאפשרת הקמת Jupyter Notebook Instance או את סביבת המשתמש שדרכו מנהל החוקר את כל התהליך. חשוב לציין שתשתית זו מאפשרת הפעלת תהליכי בדיקה ואימות המודל באופן מקבילי על פני מספר שרתים בו-זמנית ובחירת הנוסחה המתאימה למודל בזמן אופטימלי. כמו כן, ה- DATA יכולה להישמר בענן מוכן למודלים ולמחקרים נוספים. כל ספריות האלגוריתמים הפופולריים, כגון TensorFlow ,MXnet ו-Caffe2, נתמכים על-ידי SageMaker.

AI Services או ארגז כלים אשר ניתן לשלב בתוך אפליקציה וכבר כולל פתרונות מבוססיםML/AI, כגון זיהוי פנים וניתוח ווידיאו (Rekognition), מתן המלצות (Personalize), ניתוח תחזיות (Forecast), ניתוח טקסטואלי (Comprehend), המרת טקסט לדיבור (Polly), המרת דיבור לטקסט (Transcribe) ועוד כלים אשר מוכרזים לעיתים קרובות. החברה אף הכריזה על מספר סוגי חומרה לנושא כגון Chip בשם Inferentia אשר ישפר את ביצועי תהליכי AI בסדר גודל, מצלמה ייעודית  בשם DeepLens  לבדיקות בתחום ניתוח הווידיאו ו-DeepRacer – מכונית צעצוע ליישום AI ברכבים אוטונומיים.

האוסף העשיר של פלטפורמות, כלים, ממשקים ועזרים אחרים, הופכים את הענן כתשתית  טבעית שעליו ניתן לפתח את פתרונות ה-ML/AI שכל ארגון תאב חיים וצמיחה זקוק לו.

הכותב הוא סמנכ”ל טכנולוגיות בקבוצת מלם תים.

 

פורסם ע”י “The Marker”

חזרה לכל החדשות
איך אנחנו יכולים לעזור לך?
בכל שאלה, בקשה ועניין, אנו פה עבורכם. מלאו את פרטיכם ונשמח לשוב אליכם בהקדם