תלמד/י להריץ מודלי LLM ב-$0 אמיתי — מ-Inference APIs חינמיים שמריצים 70B ללא GPU, דרך GPU notebooks שלא מאבדים עבודה, local inference עם Ollama ו-GGUF, ועד שיגור pipeline שלם מ-prototype ל-deployment בלי לשלם שקל.