Serving - איך מודל מתחיל “לדבר עם העולם”

👤 אפרת בדיל 📅 7.1.2026 ⏱️ 2 דקות קריאה

תוכן עניינים

אימנתם מודל? מצוין. אבל עכשיו מגיע השלב שבו הוא צריך להתחיל לענות לאנשים אמיתיים. כאן נכנס Serving - הדרך להפוך מודל מאומן לשירות חי.

מה זה Serving?

כשמדברים על “Serving”, מתכוונים לשלב שבו המודל:

זה בעצם השירות שמאפשר לכל מערכת אחרת להשתמש במודל - דרך API פשוטה.

כשצריך תשובה עכשיו. לדוגמה: משתמש שואל צ’אטבוט → המודל עונה מיד. הדגש: מהירות תגובה (Latency).

כשמעבדים הרבה נתונים בבת אחת. לדוגמה: עדכון תחזיות לכל המשתמשים פעם ביום. הדגש: יעילות ו-Throughput גבוה.

כי מודל מעולה בלי Serving - הוא רק קובץ יפה. Serving הוא זה שהופך אותו לחלק ממערכת אמיתית, שמשרתת אנשים, אפליקציות וארגונים.

Serving הוא השלב שבו AI הופך למוצר. בלי זה, המודל נשאר במעבדה. עם זה - הוא מדבר, מגיב, ומספק ערך אמיתי.

פוסט קודם: ./mlops-production.md פוסט הבא: אין