כל הפוסטים

C++ בעולם ה-Machine Learning - מאחורי הקלעים של הביצועים

⏱️ 2 דקות שפות תכנות #C++

Concurrency - איך גורמים למערכת לעבוד על כמה דברים במקביל

⏱️ 2 דקות אופטימיזציית הסקה #Concurrency

CUDA - הכלי שהפך את ה-GPU לנגיש לכולם

⏱️ 2 דקות 📚 חומרת AI & תשתיות - חלק 3 תוכנה #CUDA #תכנות מקבילי

Data Center, AI Server, GPU Cluster - שלושה מושגים שכל מי שמתעסק בבינה מלאכותית חייב להבין

⏱️ 2 דקות 📚 חומרת AI & תשתיות - חלק 6 תשתיות #מרכז נתונים #שרת AI

TTM - למה Time To Market הוא חלק קריטי בהנדסת Inference ופתרונות AI?

⏱️ 3 דקות Business Strategy #TTM

vLLM - איך גורמים למודלים לדבר מהר, בלי לבזבז זיכרון

⏱️ 2 דקות vLLM #מנוע הסקה #Serving

איך בונים סביבת Benchmarking עם Docker (כולל GPU)

⏱️ 2 דקות 📚 Docker למדידת ביצועים - חלק 3 תשתיות #Docker #ביצועים

איך בכלל 'כותבים' חומרה? הצעד הראשון להבנת RTL ועולם ה-Frontend

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 3 עיצוב שבבים #RTL #Frontend

איך מגדילים תפוקה בלי להאט את המערכת? (Batching, Stream Scheduling ו-Offload)

⏱️ 2 דקות אופטימיזציית הסקה #ביצועים #Throughput

איך מודדים מהירות של מודל בינה מלאכותית?

⏱️ 1 דקות מדדי ביצועים #Throughput #Latency

איך משלבים Docker ב-CI/CD להרצת Inference Benchmarking אוטומטי

⏱️ 2 דקות 📚 Docker למדידת ביצועים - חלק 5 תשתיות #Docker #CI/CD

איך עובד Inference בפועל?

⏱️ 2 דקות 📚 מסע אל עולם ההסקה - חלק 2 תהליך הסקה #אופטימיזציה

איך קונטיינרים תורמים לביצועים ולמדידה מדויקת ב-Inference Benchmarking

⏱️ 2 דקות 📚 Docker למדידת ביצועים - חלק 4 תשתיות #Docker #ביצועים

גרף דינמי או גרף סטטי - איך המודל שלך חושב?

⏱️ 2 דקות גרפים #גרף דינמי

האתגרים ב- Scaling - ולמה לפעמים “יותר” זה דווקא פחות?

⏱️ 2 דקות אופטימיזציית חומרה #סקיילינג

הוספת Backend ל-PyTorch - למה זה חשוב ואיך זה עובד?

⏱️ 3 דקות Pytorch #Python #AI Framworks

חלקת ליבות איך לנהל נכון את כח העיבוד שלך

⏱️ 2 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 5 חומרה #ניהול ליבות #אופטימיזציה

למה בכלל צריך להבין חומרה כשעוסקים באופטימיזציות Inference?

⏱️ 2 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 1 חומרה #אופטימיזציה #הסקה

למה המודל שלך “מרגיש איטי”?

⏱️ 2 דקות Profiling #מדידת ביצועים #צוואר בקבוק

למה המודל שלך לא מספיק? - Scaling ב-AI

⏱️ 2 דקות אופטימיזציית חומרה #סקיילינג #הסקה

למה המודל שלך לא רץ מהר כמו שציפית? Bottlenecks באינפרנס

⏱️ 2 דקות 📚 מסע אל עולם ההסקה - חלק 4 אתגרי הסקה #צווארי בקבוק #אופטימיזציה

למה כולם מדברים על Python כשמדברים על Machine Learning?

⏱️ 2 דקות שפות תכנות #Python

מבוא לסדרה: איך שבב נולד? - מסע מלא מרעיון ועד ייצור

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 0 עיצוב שבבים #מבוא #סקירה

מה זה Cache ולמה הוא משנה הכל?

⏱️ 1 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 4 חומרה #זיכרון מטמון #אופטימיזציה

מה זה Docker ולמה כולם משתמשים בו?

⏱️ 2 דקות 📚 Docker למדידת ביצועים - חלק 1 תשתיות #Docker #קונטיינרים

מה זה Kernel Fusion - ואיך הוא מאיץ את המודל שלך בלי לשנות אותו

⏱️ 2 דקות אופטימיזציית הסקה #קרנל

מה זה NUMA ולמה זה חשוב באופטימיזציות Inference?

⏱️ 2 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 2 חומרה #NUMA #הסקה

מה זה Place & Route - ואיך ממצבים את השערים על השבב ומחברים ביניהם?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 9 עיצוב שבבים #Place & Route #Backend

מה זה STA - Static Timing Analysis - ואיך מוודאים שהשבב יעבוד בתדר הנכון?

⏱️ 4 דקות 📚 מסע לעולם עיצוב השבבים - חלק 10 עיצוב שבבים #STA #Timing

מה זה Tapeout - והאם באמת שולחים קלטת לייצור?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 12 עיצוב שבבים #Tapeout #Production

מה זה Verification - ולמה 70% מפיתוח שבבים הוא בדיקות?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 7 עיצוב שבבים #Verification #בדיקות

מה זה בעצם Docker, Image ו-Container?

⏱️ 2 דקות 📚 Docker למדידת ביצועים - חלק 2 תשתיות #Docker #קונטיינרים

מה זה בעצם Inference Benchmarking - ולמה זה כל כך חשוב?

⏱️ 2 דקות מדידת הסקה #ביצועים #Throughput #Latency

מה זה בעצם Pipeline של מודל?

⏱️ 2 דקות למידת מכונה #Model Pipeline #MLOps

מה זה בעצם ViT - ולמה הוא שינוי תפיסתי בעולם הראייה הממוחשבת?

⏱️ 3 דקות ראייה ממוחשבת #טרנספורמר #ViT

מה זה בעצם אקו-סיסטם בעולם הטכנולוגיה וה-AI?

⏱️ 2 דקות 📚 חומרת AI & תשתיות - חלק 7 תשתיות #אקוסיסטם #מסגרות עבודה

מה זה בעצם מאיץ (Accelerator)?

⏱️ 2 דקות 📚 חומרת AI & תשתיות - חלק 4 חומרה #מאיץ #GPU

מה זה בעצם מנוע Inference - ולמה הוא כל כך חשוב?

⏱️ 2 דקות 📚 מסע אל עולם ההסקה - חלק 6 אופטימיזציית הסקה #מנועים #vLLM

מה זה ליבות (Cores) ו-Threads?

⏱️ 1 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 3 חומרה #ליבות #תהליכונים

מה זה שבב? ההסבר הפשוט ביותר להתחלה בעולם החומרה

⏱️ 2 דקות 📚 מסע לעולם עיצוב השבבים - חלק 1 עיצוב שבבים #שבבים #חומרה

מה קורה מאחורי הקלעים כשהמודל עונה לך? (Prefill, Decoding ו-KV Cache)

⏱️ 2 דקות 📚 מסע אל עולם ההסקה - חלק 3 הסקה #Prefill #Decode #KV Cache

מהו “ארגז חול” ולמה הוא חיוני ל-AI?

⏱️ 3 דקות כלי פיתוח #סביבות בדיקה

מהו Frontend בעולם השבבים?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 4 עיצוב שבבים #Frontend #תכנון לוגי

מהו Inference ולמה הוא קורה אחרי Training?

⏱️ 2 דקות 📚 מסע אל עולם ההסקה - חלק 1 הסקה #אימון מודלים

מהו Kernel?

⏱️ 3 דקות האצת חומרה #קרנל #חישוב מקבילי

מהי Synthesis - וכיצד RTL הופך לשערים אמיתיים בשבב?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 8 עיצוב שבבים #Synthesis #Backend

מהי ארכיטקטורת שבב - ולמה היא השלב שבו מחליטים מה השבב באמת יהיה?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 6 עיצוב שבבים #ארכיטקטורה #תכנון מערכת

מהי מערכת על שבב (SoC) - ולמה שבב אחד יכול להכיל עולם שלם בתוכו?

⏱️ 3 דקות 📚 מסע לעולם עיצוב השבבים - חלק 2 עיצוב שבבים #SoC #ארכיטקטורה

מצאתם צוואר בקבוק? הנה מה עושים עכשיו

⏱️ 2 דקות Profiling #צווארי בקבוק #אופטימיזציית הסקה

סיכום הסדרה: המסע המלא מרעיון לשבב - כל השלבים במבט אחד

⏱️ 5 דקות 📚 מסע לעולם עיצוב השבבים - חלק 14 עיצוב שבבים #סיכום #סקירה

סיכום הסדרה: מ-NUMA ועד Throughput - איך אופטימיזציה הופכת חומרה לביצועים

⏱️ 2 דקות 📚 אופטימיזציה של חומרת הסקה - חלק 9 למידת מכונה חומרה #אופטימיזציה #NUMA #הצמדת תהליכים #ניהול משאבים