בלוג
דף הבית
כל הפוסטים
קטגוריות
תגיות
סדרות
אודות
צור קשר
אזור אישי
English
כל הפוסטים
69 פוסטים
חיפוש
קטגוריה
כל הקטגוריות
AI Framworks
Business Strategy
Profiling
Pytorch
vLLM
אופטימיזציית הסקה
אופטימיזציית חומרה
אתגרי הסקה
ביצועים
גרפים
האצת חומרה
הסקה
חומרה
כלי פיתוח
למידת מכונה
מדדי ביצועים
מדידת הסקה
עיצוב שבבים
פרודקשן
ראייה ממוחשבת
שפות תכנות
תהליך הסקה
תוכנה
תקשורת
תשתיות
תגית
כל התגיות
AI Framworks
Backend
Batching
C++
CI/CD
CUDA
Concurrency
Decode
Docker
FAB
FPGA
Frontend
GPU
InternViT
KV Cache
Latency
MLOps
Model Pipeline
NUMA
NVIDIA
ONNX
Place & Route
Post-Silicon
Prefill
Production
Protobuf
Provisioning
Python
Quantization
RTL
STA
Serving
Simulation
SoC
Synthesis
TTM
Tapeout
Throughput
Timing
Verification
Verilog
ViT
gRPC
vLLM
אופטימיזציה
אופטימיזציית הסקה
אימון מודלים
אקוסיסטם
ארכיטקטורה
אשכול GPU
בדיקות
ביצוע מיידי
ביצועים
גרף דינמי
הסקה
הצמדת תהליכים
זיכרון מטמון
חומרה
חישוב מקבילי
חלוקת משאבים
טרנספורמר
ליבות
מאיץ
מבוא
מדידת ביצועים
מודלים
מנוע הסקה
מנועים
מסגרות עבודה
מרכז נתונים
מרכזי נתונים
משאבים
ניהול ליבות
ניהול משאבים
ניטור
סביבות בדיקה
סיכום
סקיילינג
סקירה
צוואר בקבוק
צווארי בקבוק
קונטיינרים
קרנל
שבבים
שרת AI
תאימות
תהליכונים
תכנון לוגי
תכנון מערכת
תכנות מקבילי
תשתיות AI
סדרה
כל הסדרות
Docker למדידת ביצועים
אופטימיזציה של חומרת הסקה
חומרת AI & תשתיות
מסע אל עולם ההסקה
מסע לעולם עיצוב השבבים
נקה סינונים
❤️
🔖
C++ בעולם ה-Machine Learning - מאחורי הקלעים של הביצועים
⏱️ 2 דקות
שפות תכנות
#C++
❤️
🔖
Concurrency - איך גורמים למערכת לעבוד על כמה דברים במקביל
⏱️ 2 דקות
אופטימיזציית הסקה
#Concurrency
❤️
🔖
CUDA - הכלי שהפך את ה-GPU לנגיש לכולם
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 3
תוכנה
#CUDA
#תכנות מקבילי
❤️
🔖
Data Center, AI Server, GPU Cluster - שלושה מושגים שכל מי שמתעסק בבינה מלאכותית חייב להבין
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 6
תשתיות
#מרכז נתונים
#שרת AI
❤️
🔖
Data Centers - הבית של כל הבינה המלאכותית
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 1
תשתיות
#מרכזי נתונים
#תשתיות AI
❤️
🔖
Divided Resources - איך מחלקים משאבים בין מודלים או תהליכים
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 7
למידת מכונה
חומרה
#חלוקת משאבים
#אופטימיזציה
#הסקה
❤️
🔖
Eager Execution - כשמודלים מתחילים לחשוב בזמן אמת
⏱️ 1 דקות
ביצועים
#ביצוע מיידי
#גרף דינמי
❤️
🔖
FAB, Bring-Up ו-Post-Silicon - איך השבב הופך לחי?
⏱️ 4 דקות
📚 מסע לעולם עיצוב השבבים - חלק 13
עיצוב שבבים
#FAB
#Post-Silicon
❤️
🔖
GPU Cluster - איך מלמדים מאות כרטיסים לעבוד כמו מוח אחד
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 5
תשתיות
#אשכול GPU
#מרכזי נתונים
❤️
🔖
gRPC - איך מערכות ה-AI “מדברות” זו עם זו
⏱️ 2 דקות
תקשורת
#gRPC
#Protobuf
❤️
🔖
Inference Optimization - לגרום למודלים לעבוד מהר יותר, לא רק טוב יותר
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 5
אופטימיזציית הסקה
#Quantization
#Batching
❤️
🔖
InternViT - השלב הבא אחרי ViT
⏱️ 3 דקות
ראייה ממוחשבת
#InternViT
#מודלים
❤️
🔖
MLOps - איך מודל טוב באמת מגיע לפרודקשן
⏱️ 2 דקות
פרודקשן
#MLOps
#ניטור
❤️
🔖
NVIDIA - איך חברת כרטיסי מסך הפכה למלכת ה-AI
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 2
חומרה
#NVIDIA
#GPU
❤️
🔖
ONNX - איך מודלים סוף סוף מדברים באותה שפה
⏱️ 2 דקות
AI Framworks
#ONNX
#תאימות
❤️
🔖
Parallelism - איך מריצים מודלים במקביל?
⏱️ 2 דקות
אופטימיזציית הסקה
#חישוב מקבילי
❤️
🔖
Provisioning - הכנת הקרקע לפני שמריצים מודלים
⏱️ 2 דקות
תהליך הסקה
#Provisioning
#משאבים
❤️
🔖
Resource Optimization - איך כל הגורמים משפיעים בפועל על Latency ו-TPS
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 8
למידת מכונה
חומרה
#אופטימיזציה
#NUMA
#הסקה
❤️
🔖
RTL למתחילים - מה זה Verilog/VHDL?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 5
עיצוב שבבים
#RTL
#Verilog
❤️
🔖
Serving - איך מודל מתחיל “לדבר עם העולם”
⏱️ 2 דקות
תהליך הסקה
#Serving
#Batching
❤️
🔖
Simulation, FPGA, Emulation - איך בודקים את השבב לפני הייצור?
⏱️ 4 דקות
📚 מסע לעולם עיצוב השבבים - חלק 11
עיצוב שבבים
#Simulation
#FPGA
❤️
🔖
Thread Affinity - How to Bind Cores Smartly
⏱️ 3 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 6
למידת מכונה
חומרה
#הצמדת תהליכים
#אופטימיזציה
#הסקה
❤️
🔖
TTM - למה Time To Market הוא חלק קריטי בהנדסת Inference ופתרונות AI?
⏱️ 3 דקות
Business Strategy
#TTM
❤️
🔖
vLLM - איך גורמים למודלים לדבר מהר, בלי לבזבז זיכרון
⏱️ 2 דקות
vLLM
#מנוע הסקה
#Serving
❤️
🔖
איך בונים סביבת Benchmarking עם Docker (כולל GPU)
⏱️ 2 דקות
📚 Docker למדידת ביצועים - חלק 3
תשתיות
#Docker
#ביצועים
❤️
🔖
איך בכלל 'כותבים' חומרה? הצעד הראשון להבנת RTL ועולם ה-Frontend
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 3
עיצוב שבבים
#RTL
#Frontend
❤️
🔖
איך מגדילים תפוקה בלי להאט את המערכת? (Batching, Stream Scheduling ו-Offload)
⏱️ 2 דקות
אופטימיזציית הסקה
#ביצועים
#Throughput
❤️
🔖
איך מודדים מהירות של מודל בינה מלאכותית?
⏱️ 1 דקות
מדדי ביצועים
#Throughput
#Latency
❤️
🔖
איך משלבים Docker ב-CI/CD להרצת Inference Benchmarking אוטומטי
⏱️ 2 דקות
📚 Docker למדידת ביצועים - חלק 5
תשתיות
#Docker
#CI/CD
❤️
🔖
איך עובד Inference בפועל?
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 2
תהליך הסקה
#אופטימיזציה
❤️
🔖
איך קונטיינרים תורמים לביצועים ולמדידה מדויקת ב-Inference Benchmarking
⏱️ 2 דקות
📚 Docker למדידת ביצועים - חלק 4
תשתיות
#Docker
#ביצועים
❤️
🔖
גרף דינמי או גרף סטטי - איך המודל שלך חושב?
⏱️ 2 דקות
גרפים
#גרף דינמי
❤️
🔖
האתגרים ב- Scaling - ולמה לפעמים “יותר” זה דווקא פחות?
⏱️ 2 דקות
אופטימיזציית חומרה
#סקיילינג
❤️
🔖
הוספת Backend ל-PyTorch - למה זה חשוב ואיך זה עובד?
⏱️ 3 דקות
Pytorch
#Python
#AI Framworks
❤️
🔖
חלקת ליבות איך לנהל נכון את כח העיבוד שלך
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 5
חומרה
#ניהול ליבות
#אופטימיזציה
❤️
🔖
למה בכלל צריך להבין חומרה כשעוסקים באופטימיזציות Inference?
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 1
חומרה
#אופטימיזציה
#הסקה
❤️
🔖
למה המודל שלך “מרגיש איטי”?
⏱️ 2 דקות
Profiling
#מדידת ביצועים
#צוואר בקבוק
❤️
🔖
למה המודל שלך לא מספיק? - Scaling ב-AI
⏱️ 2 דקות
אופטימיזציית חומרה
#סקיילינג
#הסקה
❤️
🔖
למה המודל שלך לא רץ מהר כמו שציפית? Bottlenecks באינפרנס
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 4
אתגרי הסקה
#צווארי בקבוק
#אופטימיזציה
❤️
🔖
למה כולם מדברים על Python כשמדברים על Machine Learning?
⏱️ 2 דקות
שפות תכנות
#Python
❤️
🔖
מבוא לסדרה: איך שבב נולד? - מסע מלא מרעיון ועד ייצור
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 0
עיצוב שבבים
#מבוא
#סקירה
❤️
🔖
מה זה Cache ולמה הוא משנה הכל?
⏱️ 1 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 4
חומרה
#זיכרון מטמון
#אופטימיזציה
❤️
🔖
מה זה Docker ולמה כולם משתמשים בו?
⏱️ 2 דקות
📚 Docker למדידת ביצועים - חלק 1
תשתיות
#Docker
#קונטיינרים
❤️
🔖
מה זה Kernel Fusion - ואיך הוא מאיץ את המודל שלך בלי לשנות אותו
⏱️ 2 דקות
אופטימיזציית הסקה
#קרנל
❤️
🔖
מה זה NUMA ולמה זה חשוב באופטימיזציות Inference?
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 2
חומרה
#NUMA
#הסקה
❤️
🔖
מה זה Place & Route - ואיך ממצבים את השערים על השבב ומחברים ביניהם?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 9
עיצוב שבבים
#Place & Route
#Backend
❤️
🔖
מה זה STA - Static Timing Analysis - ואיך מוודאים שהשבב יעבוד בתדר הנכון?
⏱️ 4 דקות
📚 מסע לעולם עיצוב השבבים - חלק 10
עיצוב שבבים
#STA
#Timing
❤️
🔖
מה זה Tapeout - והאם באמת שולחים קלטת לייצור?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 12
עיצוב שבבים
#Tapeout
#Production
❤️
🔖
מה זה Verification - ולמה 70% מפיתוח שבבים הוא בדיקות?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 7
עיצוב שבבים
#Verification
#בדיקות
❤️
🔖
מה זה בעצם Docker, Image ו-Container?
⏱️ 2 דקות
📚 Docker למדידת ביצועים - חלק 2
תשתיות
#Docker
#קונטיינרים
❤️
🔖
מה זה בעצם Inference Benchmarking - ולמה זה כל כך חשוב?
⏱️ 2 דקות
מדידת הסקה
#ביצועים
#Throughput
#Latency
❤️
🔖
מה זה בעצם Pipeline של מודל?
⏱️ 2 דקות
למידת מכונה
#Model Pipeline
#MLOps
❤️
🔖
מה זה בעצם ViT - ולמה הוא שינוי תפיסתי בעולם הראייה הממוחשבת?
⏱️ 3 דקות
ראייה ממוחשבת
#טרנספורמר
#ViT
❤️
🔖
מה זה בעצם אקו-סיסטם בעולם הטכנולוגיה וה-AI?
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 7
תשתיות
#אקוסיסטם
#מסגרות עבודה
❤️
🔖
מה זה בעצם מאיץ (Accelerator)?
⏱️ 2 דקות
📚 חומרת AI & תשתיות - חלק 4
חומרה
#מאיץ
#GPU
❤️
🔖
מה זה בעצם מנוע Inference - ולמה הוא כל כך חשוב?
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 6
אופטימיזציית הסקה
#מנועים
#vLLM
❤️
🔖
מה זה ליבות (Cores) ו-Threads?
⏱️ 1 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 3
חומרה
#ליבות
#תהליכונים
❤️
🔖
מה זה שבב? ההסבר הפשוט ביותר להתחלה בעולם החומרה
⏱️ 2 דקות
📚 מסע לעולם עיצוב השבבים - חלק 1
עיצוב שבבים
#שבבים
#חומרה
❤️
🔖
מה קורה מאחורי הקלעים כשהמודל עונה לך? (Prefill, Decoding ו-KV Cache)
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 3
הסקה
#Prefill
#Decode
#KV Cache
❤️
🔖
מהו “ארגז חול” ולמה הוא חיוני ל-AI?
⏱️ 3 דקות
כלי פיתוח
#סביבות בדיקה
❤️
🔖
מהו Frontend בעולם השבבים?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 4
עיצוב שבבים
#Frontend
#תכנון לוגי
❤️
🔖
מהו Inference ולמה הוא קורה אחרי Training?
⏱️ 2 דקות
📚 מסע אל עולם ההסקה - חלק 1
הסקה
#אימון מודלים
❤️
🔖
מהו Kernel?
⏱️ 3 דקות
האצת חומרה
#קרנל
#חישוב מקבילי
❤️
🔖
מהי Synthesis - וכיצד RTL הופך לשערים אמיתיים בשבב?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 8
עיצוב שבבים
#Synthesis
#Backend
❤️
🔖
מהי ארכיטקטורת שבב - ולמה היא השלב שבו מחליטים מה השבב באמת יהיה?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 6
עיצוב שבבים
#ארכיטקטורה
#תכנון מערכת
❤️
🔖
מהי מערכת על שבב (SoC) - ולמה שבב אחד יכול להכיל עולם שלם בתוכו?
⏱️ 3 דקות
📚 מסע לעולם עיצוב השבבים - חלק 2
עיצוב שבבים
#SoC
#ארכיטקטורה
❤️
🔖
מצאתם צוואר בקבוק? הנה מה עושים עכשיו
⏱️ 2 דקות
Profiling
#צווארי בקבוק
#אופטימיזציית הסקה
❤️
🔖
סיכום הסדרה: המסע המלא מרעיון לשבב - כל השלבים במבט אחד
⏱️ 5 דקות
📚 מסע לעולם עיצוב השבבים - חלק 14
עיצוב שבבים
#סיכום
#סקירה
❤️
🔖
סיכום הסדרה: מ-NUMA ועד Throughput - איך אופטימיזציה הופכת חומרה לביצועים
⏱️ 2 דקות
📚 אופטימיזציה של חומרת הסקה - חלק 9
למידת מכונה
חומרה
#אופטימיזציה
#NUMA
#הצמדת תהליכים
#ניהול משאבים
לא נמצאו פוסטים התואמים את החיפוש