
برومبتات Veo 3.1: كيف تكتب أوامر فيديو أدق
دليل عملي لكتابة برومبتات Veo 3.1 وصياغة أوامر فيديو أوضح، مع أخطاء شائعة وأمثلة مصححة تساعدك على إخراج لقطات أكثر تماسكاً وصوتاً أنسب للمشهد.
كتبت برومبت Veo 3.1، ثم عاد الفيديو بنتيجة لا تشبه ما أردته.
ربما تغيّر وجه الشخصية بين اللقطات. وربما تجاهلت الكاميرا تعليماتك ومنحتك لقطة واسعة ثابتة بينما كنت تريد لقطة قريبة. وربما بدا كل شيء صحيحاً تقنياً لكنه بلا روح: مسطح، عام، ويمكن تمييزه فوراً كشيء مولد بالذكاء الاصطناعي.
ما يحدث فعلاً هو أنك تكتب برومبتات Veo 3.1 بالطريقة نفسها التي تكتب بها استعلام بحث. وهنا تكمن المشكلة. Veo 3.1 ليس محرك بحث. إنه أقرب إلى فريق تصوير سينمائي، وفرق التصوير لا تستجيب لقوائم كلمات مفتاحية فقط.
يغطي هذا الدليل ثلاثة أشياء: لماذا تفشل الطريقة التي يكتب بها معظم الناس برومبتات Veo 3.1، وكيف تصلح الأخطاء الخمسة الأكثر شيوعاً مع أمثلة واضحة قبل/بعد، وكيف تستخدم قدرات الصوت في Veo 3.1 لإكمال اللقطة. وفي النهاية ستعرف بالضبط ما الذي يجب تغييره لتحصل على نتيجة تبدو فعلاً كما قصدت.
الجزء الأول: لماذا لا تنجح أوامرك في Veo 3.1؟
لنبدأ بمثال واقعي.
تكتب: "امرأة تمشي في مدينة ليلاً."
يولد Veo 3.1 شيئاً ما. امرأة، مدينة، ليل. من الناحية التقنية: صحيح. لكن الكاميرا في موضع غريب. الإضاءة مسطحة. وهي فقط تمشي من دون وزن أو مزاج. يبدو المشهد كلقطة حشو من مكتبة فيديو جاهزة.
الآن تخيّل أنك كتبت المشهد نفسه كما يوجّهه مخرج لفريقه:
"لقطة تتبّع على ارتفاع الكتف بعدسة 35 ملم. امرأة في أواخر العشرينات، شعرها الأسود قصير، وترتدي معطفاً أحمر طويلاً، تمشي في زقاق مبلل بالمطر في طوكيو عند منتصف الليل. تنعكس لافتات النيون في البرك أمامها. إضاءة جانبية ناعمة من الأعلى. اقتراب بطيء بالكاميرا. صوت مطر، وحركة مرور بعيدة، وموسيقى خافتة من حانة خارج الكادر."
المشهد نفسه. والنتيجة مختلفة تماماً.
الفرق ليس في الطول، بل في نوع المعلومات. البرومبت الأول يصف ماذا تريد أن ترى. الثاني يعلّم Veo 3.1 كيف يؤطر المشهد، وكيف يضيئه، وكيف يتحرك داخله، وماذا يجب أن يُسمع. وهذا بالضبط ما يفعله المخرج.
التحول الذي تحتاجه: توقف عن التفكير في البرومبت باعتباره وصفاً لمشهد. وابدأ في التفكير فيه بوصفه موجزاً للإخراج، أي التعليمات التي تعطيها لمصور الكاميرا، ومصمم الإضاءة، ومهندس الصوت قبل اللقطة.
إرشادات Google نفسها حول برومبتات Veo 3.1 تصوغ الأمر بهذا الشكل: النموذج يمثل "انتقالاً من التوليد البسيط إلى التحكم الإبداعي". والصيغة التي يوصون بها هي:
[التصوير السينمائي] + [الشخصية أو العنصر] + [الفعل] + [السياق] + [الأسلوب والجو العام]أي أن التصوير السينمائي يأتي أولاً. لا الشخصية. ولا القصة. بل الكاميرا. وهذا الترتيب مهم لأنه يخبر Veo 3.1 كيف يرى المشهد قبل أن يبنيه.
بمجرد أن تستوعب هذه الفكرة، تصبح معظم أخطاء كتابة برومبتات Veo 3.1 الشائعة واضحة وقابلة للإصلاح.
الجزء الثاني: الأخطاء الخمسة الأكثر شيوعاً عند كتابة برومبتات Veo 3.1 وكيف تصلحها
الخطأ 1: لا توجد تعليمات كاميرا واضحة
ما الذي يحدث؟ تبدو اللقطة ثابتة أو عشوائية. الشخصية بعيدة جداً أو قريبة أكثر من اللازم. وتبقى الكاميرا جامدة بلا قصد بصري واضح.
لماذا يحدث؟ لأن Veo 3.1 يعود إلى الافتراضات حين لا تعطيه تعليمات واضحة عن الكادر والحركة. والافتراضات غالباً مملة.
الحل: كل برومبت Veo 3.1 يحتاج على الأقل إلى عبارتين: واحدة لحجم اللقطة، وواحدة لحركة الكاميرا. ابدأ بهاتين أولاً.
| حجم اللقطة | حركة الكاميرا |
|---|---|
| لقطة شديدة القرب | اقتراب بطيء |
| لقطة قريبة | لقطة تتبّع |
| لقطة متوسطة | ارتفاع تدريجي بالكاميرا |
| لقطة واسعة | متابعة محمولة باليد |
| لقطة من أعلى | التفاف حول العنصر |
❌ قبل: شخص يمشي في حديقة.
✅ بعد: لقطة تتبّع من الخصر إلى أعلى على ارتفاع الصدر بعدسة 35 ملم. اقتراب بطيء بينما يمشي الشخص تحت ضوء الغروب، مع أوراق تمر أمام العدسة. إضاءة خلفية دافئة.
الإصلاح نفسه لا يستغرق سوى ثوانٍ، لكن الفرق في النتيجة واضح فوراً.
الخطأ 2: تعليمات أسلوبية متناقضة
ما الذي يحدث؟ يبدو الفيديو مرتبكاً. المزاج غير متسق، والإضاءة تتعارض مع نفسها، والحركة لا تنسجم مع الإحساس العام.
لماذا يحدث؟ لأنك أعطيت Veo 3.1 تعليمات تلغي بعضها بعضاً. فمثلاً "مزاج نوار مظلم" و"ألوان ساطعة ومشمسة" متضادتان. والنموذج يحاول التوفيق بينهما، فتخرج النتيجة بلا شخصية واضحة.
الحل: نية واحدة واضحة لكل بُعد. اختر مزاجاً واحداً. اختر أسلوب إضاءة واحداً. اختر حركة كاميرا واحدة. وإذا كنت تحتاج شعورين مختلفين، فافصل بينهما في مقطعين.
❌ قبل: ألوان مشمسة ساطعة، ومزاج نوار، ولقطة علوية مع اقتراب إلى لقطة قريبة.
✅ بعد: مزاج نوار. إضاءة منخفضة، وألوان قليلة التشبع، وظلال باردة. اقتراب بطيء إلى لقطة قريبة من الخصر إلى أعلى بعدسة 35 ملم.
كل عنصر هنا يشير إلى الاتجاه نفسه. وهذا هو ما يحتاجه Veo 3.1 لينفّذ بوضوح.
الخطأ 3: انجراف هوية الشخصية
ما الذي يحدث؟ تبدو الشخصية مختلفة بين لقطة وأخرى. وجه مختلف، شعر مختلف، طابع مختلف. لا يمكنك بناء فيديو متسق.
لماذا يحدث؟ لأنك لا تعطي Veo 3.1 نقاط ارتكاز كافية للحفاظ على الهوية. أوصاف مثل "امرأة شابة" تترك مساحة كبيرة جداً لإعادة التفسير.
الحل: اكتب وصفاً ثابتاً للشخصية، ثم كرره كما هو في كل لقطة تظهر فيها. ضمّن العمر، ولون الشعر، وطوله، والبنية، وتفاصيل محددة عن الملابس.
❌ قبل: امرأة شابة ترتدي معطفاً أحمر.
✅ بعد: امرأة في أواخر العشرينات، شعرها أسود مستقيم حتى الكتفين، نحيفة، وترتدي معطفاً أحمر صوفياً محدد الخصر مع حزام أسود، من دون قبعة.
الكتلة نفسها، في كل برومبت، في كل لقطة. حينها يملك Veo 3.1 شيئاً ملموساً يتمسك به.
إذا كنت تبني تسلسلاً من عدة لقطات، فزوّد Veo 3.1 بصور مرجعية للشخصية كلما أمكن. هذا يساعده على الحفاظ على اتساقها عبر التسلسل كله.
الخطأ 4: طلب أشياء كثيرة في لقطة واحدة
ما الذي يحدث؟ يبدو الفيديو متقطعاً أو مرتبكاً. هناك عدة أفعال تتنافس في الوقت نفسه. والكاميرا لا تعرف أين تركز.
لماذا يحدث؟ لأنك تطلب من مقطع واحد مدته 4 إلى 8 ثوان أن يحمل قدراً كبيراً من القصة. قاعدة العمل الأفضل هنا هي: لقطة واحدة، فعل رئيسي واحد، نية كاميرا واحدة.
الحل: اجعل برومبت Veo 3.1 يدور حول فعل رئيسي واحد للشخصية، وحركة كاميرا واحدة. وإذا كنت تريد تسلسلاً أعقد، فاقسمه إلى عدة مقاطع، واستخدم إطارات مرجعية للبداية والنهاية حين تحتاج انتقالات أكثر سلاسة بينها.
❌ قبل: الشخصية تركض في السوق، وتطيح بعربة، ثم تهرب إلى زقاق وتختبئ خلف باب بينما يلاحقها أحدهم.
✅ بعد (المقطع 1): لقطة تتبّع متوسطة. امرأة بمعطف أحمر تركض في سوق مزدحم وتدفع الأكشاك وهي تمر. كاميرا محمولة باليد، إيقاع سريع. 8 ثوانٍ.
✅ بعد (المقطع 2): لقطة من زاوية منخفضة. تنعطف إلى زقاق مظلم، ثم تُسند ظهرها إلى باب معدني وهي تلهث. كاميرا ثابتة وعمق ميدان ضحل. 6 ثوانٍ.
لقطتان نظيفتان أفضل دائماً من لقطة واحدة فوضوية.
الخطأ 5: لا يوجد جوّ حقيقي داخل الكادر
ما الذي يحدث؟ المشهد صحيح تقنياً لكنه فارغ الإحساس. لا يوجد مزاج واضح، ولا ملمس، ولا وزن للمكان. ولهذا يبدو مولداً بالذكاء الاصطناعي أكثر من اللازم.
لماذا يحدث؟ لأنك وصفت الشخصية ونسيت البيئة. يحتاج Veo 3.1 إلى مصادر ضوء ومواد ووقت يوم ومعلومات مكانية كي يبني مشهداً يبدو مأهولاً.
الحل: بعد وصف الشخصية والفعل، أضف أربع تفاصيل بيئية: مصدر الضوء، والخامة، ووقت اليوم، وحجم المكان. هذه هي العناصر التي تجعل المشهد يبدو حقيقياً.
❌ قبل: رجل يجلس إلى مكتب ويعمل حتى وقت متأخر.
✅ بعد: لقطة متوسطة. رجل في الأربعينات يرتدي قميصاً أبيض مجعداً يجلس إلى مكتب خشبي ويكتب. مصباح مكتب واحد يلقي ضوءاً دافئاً على وجهه ويترك الغرفة خلفه في ظل عميق. مكتب واسع وفارغ عند الثانية فجراً. أزيز تكييف خافت ونقرات لوحة مفاتيح متقطعة. 8 ثوانٍ.
البيئة تقوم بعمل لا يقل أهمية عن الشخصية. امنحها القدر نفسه من العناية في برومبتات Veo 3.1.
الجزء الثالث: هنا يظهر تفوق Veo 3.1 في الصوت
بعد أن تصبح قادراً على ضبط الكادر بشكل موثوق، يأتي دور الصوت. وهو ما يفصل فيديو Veo 3.1 عن كثير من أدوات الفيديو الأخرى.
كثير من الناس إما يتجاهلون الصوت تماماً أو يكتبون شيئاً عاماً مثل "أصوات مدينة في الخلفية". وكلاهما خطأ. يستطيع Veo 3.1 إنشاء صوت دقيق ومتزامن: حوار مع تزامن حركة الشفاه، ومؤثرات مرتبطة بالفعل، وأصوات مكان واضحة، وموسيقى تنخفض تحت الحوار. لكن هذا لا يحدث إلا إذا قلت له بدقة ما تريد.
ترتيب طبقات الصوت
فكّر في الصوت على أربع طبقات، بهذا الترتيب من حيث الأولوية:
- الحوار
- المؤثرات الصوتية
- أصوات المكان
- الموسيقى
اكتبها بهذا الترتيب داخل البرومبت. واحتفظ بكل طبقة في حدها الأدنى اللازم، لأن كثرة العناصر المتزامنة تخلق فوضى صوتية.
كيف تكتب الصوت داخل برومبتات Veo 3.1
استخدم وسوماً واضحة لكل طبقة:
حوار: "هل أنت متأكد من هذا؟" (امرأة، بصوت منخفض)
مؤثرات: إغلاق باب معدني، خطوات على أرضية خرسانية
أصوات المكان: حركة مرور خافتة، مطر على النوافذ
موسيقى: توتر وتري منخفض، يهبط تحت الحوارمتى تتجاوز الموسيقى تماماً؟ إذا كانت أصوات المكان نفسها تحمل وزناً عاطفياً كافياً، فالموسيقى قد تزاحمها بدلاً من أن تضيف إليها. زقاق ممطر مع أصوات بعيدة من حانة لا يحتاج دائماً إلى موسيقى تصويرية.
متى تبقي الصوت بسيطاً؟ إذا كان المشهد بصرياً معقداً أصلاً، فخفّض عدد العناصر الصوتية إلى عنصرين كحد أقصى. دع الصورة تتنفس.
قبل/بعد: الصوت عملياً
❌ قبل: مشهد صباحي داخل مخبز.
✅ بعد: ضوء صباحي دافئ يمر عبر نوافذ المخبز. إيقاع موسيقي هادئ وخافت في الخلفية. أصوات شارع تُسمع من الباب المفتوح. رنين لطيف للجرس مع دخول أول زبون. 8 ثوانٍ.
❌ قبل: شخصان يتحدثان.
✅ بعد: لقطة متوسطة لشخصين. الرجل: "يوم مهم؟" المرأة: "سنرى الآن." أصوات مكتب فقط، بلا موسيقى، وبلا نصوص على الشاشة. 6 ثوانٍ، 16:9.
الإصدارات الثانية تخبر Veo 3.1 بالضبط بما يجب أن يولده. أما الإصدارات الأولى فتتركه يخمّن — والنتائج حينها تكون عامة.
الصيغة العملية لكتابة برومبتات Veo 3.1
عندما تجمع كل شيء معاً، تحصل على بنية قابلة للتكرار لكل برومبت Veo 3.1 تكتبه:
[حجم اللقطة + حركة الكاميرا] + [وصف ثابت للشخصية] + [الفعل الرئيسي] + [البيئة: الضوء، والخامة، والوقت، والمكان] + [الأسلوب] + [الصوت: الحوار / المؤثرات / أصوات المكان / الموسيقى] + [المواصفات: الأبعاد، والدقة، والمدة]مثال كامل:
لقطة تتبّع على ارتفاع الخصر بعدسة 35 ملم مع اقتراب بطيء. امرأة في أواخر العشرينات، شعرها أسود مستقيم، وترتدي معطفاً أحمر صوفياً. تمشي في زقاق مبلل بالمطر في طوكيو عند منتصف الليل. تنعكس لافتات النيون في البرك، والأرضية الحجرية مبتلة، والمتاجر الضيقة مضاءة من الداخل. طابع سينمائي، وتباين مرتفع، وعمق ميدان ضحل. أصوات مطر وحركة مرور بعيدة ولمسة جاز خافتة من خارج الكادر. بلا حوار. 16:9، 1080p، 8 ثوانٍ.
هذا البرومبت يمنح Veo 3.1 كل ما يحتاجه: كيف يرى المشهد، ومن فيه، وماذا يحدث، وأين يقع، وما الذي يُسمع، وبأي صيغة يجب أن يخرجه. لا شيء مهم يُترك لافتراضات النموذج.
ابدأ كتابة أوامر Veo 3.1 بشكل أفضل
الفارق بين برومبت يولد "شيئاً ما" وبرومبت يولد ما قصدته فعلاً يعود إلى الدقة. الكاميرا أولاً. الشخصية ثابتة. فعل واحد لكل لقطة. بيئة واضحة. وصوت مبني على طبقات.
هذه هي طريقة المخرج في كتابة برومبتات Veo 3.1، وهي الطريقة الوحيدة التي تتوسع بشكل جيد.
هل تريد تطبيق ذلك عملياً؟ جرّب FlashEdit مع Veo 3.1 وسترى كيف يصنع البرومبت المنظّم فرقاً حقيقياً.
الكاتب
مقالات أخرى

ما هو GPT Image 2؟ ولماذا يلفت الانتباه الآن
دليل يشرح ما نعرفه عن GPT Image 2 حتى الآن، ولماذا يربطه كثيرون بتحسن واضح في كتابة النص داخل الصور والواجهات والواقعية الفوتوغرافية والمشاهد المعقدة.

مقارنة HappyHorse وSeedance 2.0: ماذا تقول الأدلة؟
مقارنة عملية بين HappyHorse وSeedance 2.0 تشرح نتائج لوحات الترتيب، وسهولة الوصول، وملاءمة كل نموذج لسير العمل الفعلي قبل إصدار أحكام مبكرة.

ما هو FlashEdit AI؟ وكيف يفيدك في صناعة المحتوى
تعرّف إلى FlashEdit AI وكيف يساعدك في إنشاء الصور وتحريرها وتوليد الفيديو والموسيقى والصوت ضمن سير عمل واحد، مع استخدامات عملية للمبدعين والمسوقين.