re:Invent December 2019

היום ב-Keynote של אנדי ג’סי ב-re:Invent נחשפו הרבה מוצרים חדשים שאמזון השיקה ב-AWS בתחום ה-ML (רובם זמינים החל מהיום).

כמיטב המסורת, בעוד שההכרזות הן חדשות מעולות ללקוחות של AWS, יהיו לא מעט חברות (כולל כמה שאני מכיר ואוהב בארץ) שיצטרכו להמציא את עצמן מחדש בעקבות המוצרים החדשים שדומים מאוד לכמה מהמוצרים של סטארט אפים בתחום תשתיות ה-ML.

ערכתי תקציר מעומלק למדי של הדברים שהוכרזו לפי קטגוריות למי שמעוניין (תרגישו חופשי לשאול אם רוצים להעמיק באחד השירותים).

בתחום ה-AI Services:

  1. נחשף Amazon Fraud Detector – מעלים קובץ עם דטה מתוייג היסטורי, בוחרים מודל, עושים קצת קונפיגורציה ומקבלים API שמחזיר בזמן אמת Fraud Score. המודל יודע לזהות מספר סוגים שונים של נסיונות זדוניים (יצירת חשבון, נסיון תשלום וכו’). שירות מעניין – בונה על הנסיון ארוך השנים של אמזון ריטייל בתחום.

 

  1. נחשף Amazon Kendra – מערכת חיפוש שיודעת לקרוא דטה ממגוון מקורות (S3, Salesforce וכו’) ולייצר ממשק לתשאול באמצעות שפה טבעית, עם תשובות מאוד ממוקדות – בסגנון פיצ’ר השאלות שאפשר לשאול את מנוע החיפוש של גוגל, רק על דטה שלכם.

 

  1. נחשף Amazon CodeGuru – שירות ממש חמוד שיודע להתחבר ל-GitHub ולעשות Code Review אוטומטי באמצעות סטטיק אנליסיס מבוסס ML. עובד על ידי המלצות על best practices, שיפורי ביצועים ותופס באגים (למשל קטעי קוד שעובדים concurrent בלי lockים)

 

  1. המוצר Amazon Connect קיבל סט יכולות מטורף בשם Contact Lens, מערכת אנליטיקס שיודעת לנתח התקשרויות עם לקוחות (שיחות וטקסטים) ולזהות פיצ’רים כמו “זמן שבו אף אחד לא מדבר בשיחה”, “סוכן שמדבר מהר מידי”, וכו’, ולייצר דוחות והמלצות מעל מרחב הפיצ’רים הזה.

 

בעולם של SageMaker:

 

  1. נחשף SageMaker Autopilot – מערכת AutoML שלמה (בסגנון של DataRobot ואחרים) שיודעת לבנות מודל end-to-end: זורקים CSV / מעלים דטה טבולרי והפלטפורמה יודעת לנקות אותו קצת, לייצר פיצ’רים בסיסיים, לאמן סדר גודל של 50 מודלים שונים בסביבה מבוזרת (כולל hyperparameter tuning), ולהמליץ על מכונה ל-deployment שמתאימה ל-inference. ממשק פייתוני נחמד מתוך SageMaker Notebooks – יכול להשתלב בקלות בעבודה ג’ופיטר-סטייל.

 

  1. נחשף SageMaker Studio – גירסה Webית ל-IDE עשיר לניהול יותר אפקטיבי של הפיתוח ב-notebooks. יודע להתממשק עם כל מיני שירותים חדשים נחמדים אחרים כדי לרכז את העבודה על המודל במקום אחד (לא רק כתיבה של מודלים אלא גם הרצת ניסויים, ניטור וכו’).

 

  1. נחשף SageMaker Model Monitor – מערכת לניטור ביצועים של מודלים בפרודקשן (בעיקר כדי לזהות Concept Drift). השירות הזה עובד על ידי התממשקות ל-Inference Endpoint של SageMaker, יצירת סטטיסטיקות ל-Baseline ואז ניטור של ה-Inference ביחס אליו. מתממשק ל-CloudWatch כדי לייצר התראות (זה נוח גם כי אפשר לקרוא את הלוגים מה-SageMaker Studio החדש ואז לנטר את המודל משם).

 

  1. נחשף SageMaker Experiments – מערכת לניהול והרצה של ניסויים (מודלים בתצורות שונות וכו’), מוצר שנראה שיכול לעזור המון בעשיית סדר ויודע לעבוד עם ה-SageMaker Studio החדש

 

  1. נחשף SageMaker Debugger – כל המודלים שנתמכים בהרצה על ידי SageMaker Estimator יכולים לקבל עכשיו flag שמבקש מהם לשמור State בזמן ה-Train. ברגע שיש output של Train (נשמר בצורה של Tensors) אפשר להריץ Debug Job על הטנזורים שנוצרו על ידי הדיבאגר ולגלות דברים מעניינים (למשל אם יש hyperparameter מסויים שקיבל ערך שמחרפן את הרשת).

 

  1. באופן כללי SageMaker Notebooks קיבלו שיפורים שהופכים אותך להרבה יותר דומים ל-Google Colab (דבר טוב!), בין אם זה דברים בסיסיים שהיו חסרים עד עכשיו (כמו היכולת לשנות את גודל המכונה של ה-notebook בקלות ושיתוף פרוייקטים).