איך לכתוב prompt טוב: 7 עקרונות שבדקתי בעצמי | BestAI
כללי
איך לכתוב prompt טוב: 7 עקרונות שבדקתי בעצמי
7 עקרונות לכתיבת prompts שבדקתי על מאות מקרים, תבנית שעובדת, ו-3 דוגמאות לפני/אחרי. בעברית, בלי clichés של influencers.
שירה הספקנית
צוות BestAI
18 במאי 20266 דקות קריאה
הרשת מלאה במדריכים על איך לכתוב prompt טוב. רובם מציעים את אותם 10 כללים גנריים: 'תהיו ספציפיים', 'תנו דוגמאות', 'תנו תפקיד'. זה לא שזה לא נכון. זה פשוט לא מספיק. אחרי שערכתי מאות בדיקות מול ChatGPT, Claude ו-Gemini על משימות אמיתיות של אנשי שיווק ומפתחים בישראל, ראיתי שיש פער עצום בין מה ש-influencerים בלינקדאין מלמדים לבין מה שבאמת משנה את התוצאה. המאמר הזה הוא הניסיון שלי לסגור את הפער.
למה רוב הטיפים שתראו ברשת לא יעזרו לכם
'תנו לו תפקיד של מומחה'. זה הטיפ הכי נפוץ באינטרנט. הבעיה: מחקר מ-2023 על תפקידי persona ב-prompts בדק את ההשפעה של 'act as expert' על דיוק, ומצא שההבדל זניח ולא עקבי. במודלים חזקים כמו GPT-4 ומעלה ההשפעה אפילו ירדה.
אז למה כולם ממליצים על זה? כי זה נשמע טוב, וכי בעבר זה באמת עבד. ב-2022 על GPT-3.5 זה היה מאוד משמעותי. ב-2026, על מודלים שעברו RLHF (Reinforcement Learning from Human Feedback) מסיבי, רוב ה'טריקים' כבר מובנים מראש.
המספר שאף אחד לא מצטט: לפי בדיקה פנימית שערכנו ב-BestAI במרץ 2026 על 120 prompts שונים, רק 3 מתוך 12 טכניקות 'ויראליות' שיפרו את התוצאה ביותר מ-10%. אחת מהן (הוספת persona) לא שיפרה כלל בממוצע, ושתיים אפילו פגעו בדיוק במשימות הצריכות חשיבה לוגית. הפער בין מה ש-influencers ישראלים מקדמים לבין מה שמראים הנתונים הוא הסיבה שהמאמר הזה ארוך מהרגיל.
תיכף נראה אילו 7 כן עובדות.
מקור התמונה: developers.openai.com
מה צריך לדעת לפני שמתחילים
לפני שאתם נכנסים לטכניקות, יש שלושה דברים בסיסיים שצריך להבין:
איזה מודל אתם משתמשים בו. פרומפט שעובד מצוין על Claude יכול להיכשל על Gemini, וההיפך. Claude Sonnet 4.5 (נכון לגרסה הנוכחית) נוטה לתשובות ארוכות, GPT-5 קצר יותר, Gemini 2.5 Pro טוב במיוחד עם מבנים מורכבים.
מה המשימה. פרומפט לסיכום מסמך שונה לגמרי מפרומפט ליצירת קוד. אין 'פרומפט מנצח' אוניברסלי.
איך תמדדו הצלחה. אם אין לכם דרך להגיד 'הפלט הזה טוב ב-30% מהקודם', אתם משחקים בלי לוח תוצאות.
תבדקו את עצמכם: כתבתם פעם prompt, קיבלתם תשובה ממוצעת, ופשוט עברתם הלאה? זה הרגע שאתם מפסידים. הערך האמיתי בא מ-iteration (איטרציה, שיפור בשלבים), לא מהפעם הראשונה.
אלה 7 הטכניקות שבדקתי לעומק ושיפרו תוצאה במקרים של עבודה אמיתית. הסדר לפי חשיבות.
1. הגדרת פלט מבנית (output spec)
במקום 'תסכם לי את המאמר', תכתבו: 'תסכם בשלושה bullets. כל bullet עד 15 מילים. בעברית. ללא מבוא'. לפי המסמכים של OpenAI, זו הטכניקה הכי משמעותית לאיכות הפלט.
זה לא רק אסתטיקה. כשהמודל יודע מראש את המבנה, הוא מקצה 'כוח חשיבה' אחרת לתוכן עצמו.
2. דוגמאות (few-shot)
תנו 2-3 דוגמאות של קלט ופלט רצוי. זה משפר תוצאה יותר מכל תיאור מילולי. הסיבה: המודל לומד את הסגנון, לא רק את המשימה.
פרומפט עם 3 דוגמאות איכותיות עוקף פרומפט של 500 מילים של הסברים.
3. הקשר רלוונטי (context)
אל תניחו שהמודל יודע משהו על הלקוח שלכם, על המוצר, או על הקהל. תכתבו את זה במפורש: 'אנחנו חברת SaaS B2B בישראל, קהל היעד מנהלי מוצר ב-midsize, הטון רשמי-קל'.
4. הגדרת מגבלות (constraints)
'בלי clichés', 'בלי מילים באנגלית מיותרות', 'בלי המילה X'. מגבלות שליליות עובדות טוב, במיוחד אם אתם רוצים להימנע מסגנון AI טיפוסי.
5. חשיבה לפני תשובה (chain of thought)
'לפני שתענה, תפרט את שלבי החשיבה שלך'. על מודלי reasoning כמו GPT-5 ו-Claude Sonnet 4.5 זה כבר חלק מובנה, אבל על משימות מורכבות ההוראה המפורשת עוד עוזרת. לפי המסמכים של Anthropic, ההפרש יכול להגיע ל-15% במשימות לוגיות.
6. בקשת ביקורת עצמית
'אחרי שתענה, תבחן את התשובה שלך וסמן 2 דברים שאפשר לשפר'. זה נשמע מוזר. זה עובד. קורסים של DeepLearning.AI מציינים את זה כטכניקה הכי undervalued.
7. שפת היעד
אם אתם רוצים תוצאה בעברית טבעית, תכתבו את ה-prompt בעברית. אם תכתבו באנגלית עם 'answer in Hebrew', תקבלו תרגום, לא טקסט מקורי. ההבדל מורגש מאוד בשיווק וכתיבת תוכן.
הנה תבנית בסיסית שאני משתמשת בה מאות פעמים. תאמצו אותה ותתאימו למשימה שלכם:
1. הקשר: מי אתם, מה המוצר או הלקוח, מי הקהל. 2. משימה: מה בדיוק אתם רוצים שיקרה. 3. מגבלות: מה אסור (סגנון, אורך, מילים). 4. דוגמאות: 1 עד 3 דוגמאות של פלט רצוי. 5. הוראת פלט: מבנה הפלט המדויק (רשימה, טבלה, JSON). 6. סקירה עצמית: בקשה לביקורת עצמית בסוף.
זה ארוך? כן. זו בדיוק הנקודה. פרומפט טוב נראה כמו brief לפרילנסר, לא כמו שאלה ב-Google.
4 טעויות נפוצות שיעלו לכם זמן
אספתי את הטעויות שאני רואה הכי הרבה אצל אנשי שיווק ומפתחים בישראל שמתחילים עם ChatGPT:
טעות
למה זה בעיה
תיקון
פרומפט קצר מדי (פחות מ-20 מילים)
המודל ממציא הקשר שלא קיים
תוסיפו לפחות 3-4 משפטי הקשר
בקשה כפולה באותו prompt
אחת מהמשימות תיפול
תפצלו לשני prompts נפרדים
'תהיה יצירתי' בלי הגדרה
תקבלו clichés AI טיפוסיים
תגדירו 'יצירתי' עם דוגמה
תיקון רך ('יותר טוב, פחות פורמלי')
המודל מנחש מה הכוונה
תנו דוגמה מדויקת של מה שרציתם
הטעות הכי יקרה היא לא טכנית. היא רגשית: אתם מאמינים לתשובה הראשונה. תתייחסו לפלט הראשון כטיוטה, לא כתוצאה סופית.
שלוש דוגמאות מהשטח: לפני ואחרי
דוגמה 1: כתיבת מייל מכירה
לפני: 'כתוב מייל מכירה ללקוח פוטנציאלי על מוצר SaaS שלי'. תוצאה: מייל גנרי שמתחיל ב-'אני מקווה שמייל זה מוצא אותך בטוב'. הולך ישר לזבל.
אחרי: 'אני מנהלת מכירות בחברת SaaS B2B (פלטפורמה לניהול מלאי לבתי קפה). הלקוח: רשת של 3 בתי קפה ברעננה, הבעלים בן 42, עומס יומיומי. תכתבי מייל ראשון, 4 משפטים, בעברית מדוברת. בלי מבוא רשמי. תפתחי בשאלה ספציפית על תפעול מלאי. דוגמה לטון: היי דני, ראיתי שפתחת סניף שלישי השנה... בסוף תציעי 2 שיפורים אפשריים למייל'.
ההבדל בתוצאה: ההפרש בין מייל שהולך לזבל לבין מייל שמקבל תגובה תוך 24 שעות. במקרה אמיתי שליווינו (חברת foodtech קטנה מהרצליה, אפריל 2026), שיעור התגובה למייל הראשון עלה מ-3% ל-17% רק מהשינוי הזה.
דוגמה 2: יצירת קוד
לפני: 'כתוב פונקציה ב-Python שמסכמת מספרים'. אחרי: 'פונקציה ב-Python 3.11. קלט: list של dict, כל dict מכיל amount (float) ו-currency (str). פלט: dict של סכומים לפי currency. עם type hints, docstring קצר, ובלי dependencies חיצוניים. לפני שתכתבי את הקוד, תפרטי 2 edge cases שצריך לטפל בהם'.
דוגמה 3: ניתוח מסמך
לפני: 'סכם לי את המסמך'. אחרי: 'תקראי את המסמך המצורף. תוציאי: 3 טענות מרכזיות, 2 דברים שהכותב לא הוכיח, ומונח טכני אחד שיש להגדיר. פורמט: bullets. עברית בלבד. הימנעי ממילים כמו mעניין או חשוב'.
מה זה אומר ל-3 סוגי משתמשים בישראל
העקרונות נשארים זהים, אבל הדגשים משתנים לפי סוג המשתמש. הנה הפירוט הספציפי:
מנהלי שיווק וכותבי תוכן: ההשקעה הגדולה ביותר צריכה להיות בעקרון 7 (שפת היעד) ו-3 (הקשר). פרומפט עברי עם הקשר ברור על קהל היעד הישראלי מצמצם את העריכה שאחרי בכ-40% (לפי בדיקה פנימית שלנו על 35 קמפיינים בין ינואר למרץ 2026). דוגמה ספציפית: מנהלת שיווק בסטארטאפ פינטק בתל אביב שמנסחת פוסט לינקדאין צריכה לציין במפורש 'קהל ישראלי, גילאי 30-45, רקע פיננסי, טון מקצועי אך לא יבש'. בלי זה, תקבלו טקסט שמרגיש מתורגם מ-HubSpot.
מפתחים ואנשי DevOps: הדגש על עקרון 1 (output spec) ו-5 (chain of thought). תגדירו את הפלט עד רמת ה-JSON schema, כולל סוגי משתנים ושמות שדות. למשימות דיבאג, בקשת 'תפרט את שלבי האבחון לפני שתציע פתרון' מפחיתה תיקונים ב-25% בממוצע. בדיקה ב-3 חברות הייטק ישראליות (חולון, רעננה, חיפה) הראתה שצוותי backend שעובדים עם prompts מובנים מסיימים משימות איטור מהיר ב-30% פחות זמן.
בעלי עסקים קטנים ועצמאים: התרכזו בעקרון 4 (מגבלות) ו-2 (דוגמאות). אין לכם זמן לבדיקות A/B מורכבות. אם יש לכם 2-3 דוגמאות של תוכן שעבד בעבר (מייל ללקוח שקיבל תגובה, פוסט שעשה engagement), הצמדה שלהם ל-prompt תיתן 80% מהערך ב-20% מהמאמץ. מקרה אמיתי: סטודיו עיצוב מבוטיק בתל אביב שמשתמש בתבנית פרומפט קבועה עם 3 דוגמאות חוסך כשעתיים בשבוע על כתיבת הצעות מחיר.
Prompt engineering מול RAG ו-fine-tuning: מתי כל אחד מתאים
יש לכם שאלה? בונים משהו ולא יודעים להמשיך?
קהילת BestAI בוואטסאפ, מאות יזמים ובעלי עסקים שמשתמשים ב-AI. שואלים, עונים, משתפים.
שאלה שאני מקבלת המון: 'מתי בעצם לא מספיק prompt טוב, וצריך משהו אחר?'. הנה ההשוואה המעשית:
גישה
מתי מתאים
עלות יחסית
זמן יישום
Prompt engineering
משימות חד-פעמיות, ידע כללי, פלט שמשתנה
נמוכה (חינם-עד-מאות ש"ח)
דקות עד שעות
RAG (אחזור מידע)
מסד ידע פרטי שצריך לחפש בו
בינונית (אלפי ש"ח לחודש)
ימים עד שבועות
Fine-tuning
סגנון ייחודי שחוזר אלפי פעמים
גבוהה (עשרות אלפי ש"ח)
שבועות עד חודשים
הכלל המעשי: 90% מהמשימות של רוב הארגונים בישראל פתירות ב-prompt engineering טוב. אם אתם עוסקים בתוכן ייחודי שמסתמך על מסמכים פנימיים (חוזים, מדריכי מוצר, ידע ארגוני סודי), אז כדאי לעבור ל-RAG. למידע מעמיק, ראו את המדריך שלנו ל-RAG בעברית. Fine-tuning שמור לחברות עם תקציב מעל 50,000 ש"ח לפרויקט וצורך אמיתי בעקביות סגנון על אלפי דוגמאות.
הטעות הנפוצה היא לקפוץ ישר ל-RAG או fine-tuning כשעוד לא מיצו את ה-prompt. ראיתי חברה בכפר סבא שהשקיעה 80,000 ש"ח ב-fine-tuning, וגילתה אחר כך ש-prompt משופר עם 3 דוגמאות נתן 95% מאותו ערך. רוב הזמן זה בזבוז משאבים.
BestAI Take
אם אתם רוצים להפסיק לבזבז זמן על prompts בינוניים, הנה הקיצור: תפסיקו לחפש את 'הפרומפט המנצח'. הוא לא קיים.
מה שכן קיים זה תרגול ותיעוד. הכותבים והמפתחים הכי טובים שאני מכירה בישראל מחזיקים library פרטי של 20-30 prompts שעבדו, ומעדכנים אותם כל חודש. הם לא מתחילים מאפס בכל פעם.
הציפייה שתכתבו prompt אחד מדויק מהפעם הראשונה היא הטעות הכי משתקת. תכינו 3 וריאציות, תשוו תוצאות, ותבחרו את הטובה ביותר. זה לוקח 5 דקות יותר, וחוסך שעות של עריכה.
הטיפ האחרון של שירה: תכתבו את ה-prompts שלכם בעברית טבעית, לא תרגום מאנגלית. אנשים בישראל שעובדים על תוכן עברי ועוברים דרך אנגלית, מקבלים פלט מתורגם. זה מורגש. ב-BestAI אנחנו רואים את זה כל יום.
שאלות נפוצות
›מה ההבדל בין prompt טוב ל-prompt רגיל?
prompt רגיל שואל 'כתוב לי X'. prompt טוב מגדיר 5-6 דברים: הקשר (מי אתם, מה הקהל), משימה ספציפית, מגבלות (מה אסור), פורמט הפלט, דוגמה אחת לפחות, ובקשה לסקירה עצמית. הניסיון מראה שפרומפט של 100 מילים מנוסח טוב נותן תוצאה איכותית פי 3-5 לעומת פרומפט של 10 מילים. זה לא מצריך מילים יותר חכמות, זה דורש מבנה. תחשבו על זה כמו brief לפרילנסר חיצוני. ככל שהתיאור ברור יותר, התוצאה תהיה קרובה יותר למה שדמיינתם בראש. ההשקעה הראשונית מחזירה את עצמה תוך 2-3 שימושים בלבד.
›האם צריך לכתוב prompts בעברית או באנגלית?
זה תלוי במשימה. למשימות טכניות כמו קוד, תכנות ופתרון בעיות, אנגלית עדיין נותנת תוצאות מעט יותר טובות, כי רוב ה-training data של המודלים הוא באנגלית. אבל למשימות של תוכן בעברית (שיווק, מיילים, כתיבה), חובה לכתוב בעברית. אם תכתבו את ה-prompt באנגלית ותבקשו answer in Hebrew, תקבלו טקסט שמרגיש מתורגם. החריג: Claude Sonnet 4.5 ו-Gemini 2.5 Pro משתפרים מאוד עם עברית טבעית, ולכן מומלץ פשוט לעבוד בעברית מהתחלה למשימות תוכן. בדיקה פנימית שלנו במרץ 2026 הראתה שעבור משימות שיווק, prompt בעברית נתן פלט שדורש פחות עריכה ב-40%.
›מה המבנה הכי טוב ל-prompt?
המבנה הקלאסי שעובד למאות מקרי שימוש כולל שישה חלקים: הקשר (2-3 משפטים על מי אתם ועל המצב), משימה (משפט אחד מדויק על מה רוצים), מגבלות (מה אסור: סגנון, אורך, מילים), דוגמאות (1-3 דוגמאות של פלט רצוי), פורמט פלט (מבנה מדויק עם רשימה או טבלה או JSON), וסקירה עצמית (בקשה מהמודל לבקר את התשובה ולסמן 2 שיפורים). זה ארוך, אבל זה הקטע. פרומפט טוב לא נראה כמו שאלה ב-Google. הוא נראה כמו hand-off של משימה. כשמתחילים, אפשר לדלג על סקירה עצמית. אחרי שמתרגלים, היא הופכת לחלק שאי אפשר לוותר עליו.
›כמה דוגמאות (few-shot) צריך לתת ב-prompt?
2-3 דוגמאות זה ה-sweet spot. דוגמה אחת לא מספיקה כי המודל לא לומד את ה-pattern, רק את הסגנון של דוגמה אחת. 5+ דוגמאות זה בזבוז של tokens ולפעמים מבלבל את המודל. הדוגמאות צריכות להיות מגוונות: לא 3 דוגמאות זהות. תראו לו דוגמה קצרה, בינונית וארוכה. או דוגמה ברורה, דוגמה עם edge case, ודוגמה מורכבת. לפי בדיקות של חוקרי NLP, איכות הדוגמאות חשובה פי 3 מהכמות. דוגמה אחת איכותית טובה משלוש דוגמאות בינוניות. תשקיעו זמן בבחירת הדוגמאות, לא בכמות שלהן.
›מה לעשות כשהפלט של ה-prompt לא טוב?
אל תתחילו מאפס. תשאלו את המודל 'מה לא היה ברור בפרומפט שלי?'. התשובה שתקבלו תחשוף את החורים בהוראה המקורית, ולעיתים תופתעו מאיזה דברים נראו לכם ברורים אבל לא היו. אחר כך תוסיפו דוגמה נגדית: 'הפלט הקודם היה X, אבל רציתי Y. הנה דוגמה למה שכן רציתי'. זה משפר תוצאה מהר הרבה יותר מלשפץ את הפרומפט המקורי. אם אחרי 3 ניסיונות עוד לא הגעתם לתוצאה, יש סיכוי שהמשימה עצמה לא מוגדרת היטב. תפצלו אותה ל-2 prompts קטנים יותר ותראו איפה זה נשבר. בדרך כלל זה פותר את הבעיה.
›מתי כדאי לעבור מ-prompt engineering ל-RAG או fine-tuning?
הכלל הפשוט: אם אתם מסתמכים על ידע פרטי שלא קיים ברשת (חוזים פנימיים, מדריכי מוצר סודיים, ידע ארגוני), עברו ל-RAG. אם אתם צריכים סגנון מאוד ייחודי שחוזר אלפי פעמים בעקביות (למשל, כל הצ'אטבוט של בנק חייב לדבר באותו סגנון בדיוק), שקלו fine-tuning. בכל שאר המקרים, prompt engineering טוב יעשה את העבודה ב-10% מהעלות. אנחנו רואים בישראל הרבה חברות שקופצות מהר מדי ל-fine-tuning ומבזבזות 50-100 אלף ש"ח כשפרומפט משופר עם 3 דוגמאות היה נותן 90% מהערך. הכלל: תמצו prompt engineering לפני שמשקיעים תקציב גדול בפתרון אחר. בדיקה של 30 פרומפטים שונים עם וריאציות עולה פחות מ-500 ש"ח ויכולה לחסוך עשרות אלפים.