Veo (Google DeepMind)

0
نموذج ذكاء اصطناعي متقدم من Google DeepMind لتوليد فيديوهات عالية الدقة (1080p) تصل إلى دقيقة واحدة، مع تحكم دقيق في المشاهد.
ترخيص البرنامج: مغلق المصدر
المنصات: Web

نبذة عن Veo (Google DeepMind)

Veo هو نموذج AI لتوليد الفيديو من Google DeepMind، تم الكشف عنه في مايو 2024 كمنافس مباشر لـ Sora من OpenAI. يتميز بقدرته على إنشاء فيديوهات تصل مدتها إلى دقيقة واحدة بدقة 1080p، مع فهم عميق للفيزياء والحركة والتفاعلات بين الكائنات. يدخل Veo ضمن الجيل التالي من نماذج الفيديو من Google (بعد نماذج مثل Lumiere). يوفر واجهة تحكم نصية متقدمة تسمح بتعديل التفاصيل (الإضاءة، الزاوية، أسلوب التصوير)، كما يمكنه إنشاء فيديوهات من صورة واحدة أو امتداد فيديو قصير. سيتم دمج Veo مع أدوات Google (مثل YouTube Shorts، Vertex AI) في المستقبل. لم يتم إطلاق النموذج للعامة بعد، لكنه متاح لفريق اختبار محدود عبر Vertex AI.

المنشئ: أمريكا

المميزات و عيوب Veo (Google DeepMind)

المزايا

العيوب

أسئلة شائعة عن Veo (Google DeepMind)

هذه الأسئلة الأكثر طرحا حول Veo (Google DeepMind)

اللغات المدعومة

الإنجليزية

تعلم أكثر عن Veo (Google DeepMind)

[alhisn_related_posts]

موارد خاصة بــ Veo (Google DeepMind)

أخبار و تحديثات عن Veo (Google DeepMind)

[alhisn_related_news]

لا يوجد أي بيانات

بدائل و برامج مشابه لـ Veo (Google DeepMind)

منصة فيديو بالذكاء الاصطناعي مفتوحة المصدر وقابلة للاستضافة الذاتية، تجمع بين ثلاث أدوات قوية لإنشاء المحتوى القصير: مولد المقاطع، منتج فيديوهات UGC، واستوديو يوتيوب، كل ذلك دون علامات مائية أو حدود.
منصة لإنشاء الفيديو بالذكاء الاصطناعي تقدم تحكماً دقيقاً في حركة الكاميرا والسيناريو، وأداة متخصصة لصنع فيديوهات الشخصيات الناطقة "Speak" مع أكثر من 80 قالب حركة.
أداة متقدمة لتوليد الفيديو بالذكاء الاصطناعي من MiniMax، تتميز بقدرتها على تنفيذ تعليمات معقدة وفيزياء متطرفة مثل الجمباز، وتقدم جودة 1080p أصلية بتكلفة اقتصادية قياسية.
منصة ذكاء اصطناعي لتوليد فيديوهات عالية الجودة من النصوص والصور، مع تحكم متقدم في الحركة والأسلوب والاستمرارية عبر المشاهد، وتوليد صوتي متكامل.
PersonaPlex logo
نموذج محادثة صوتي فوري (Full-Duplex) من NVIDIA يتحكم في الشخصية عبر نصوص الأدوار وصوت المتحدث، مبني على بنية Moshi.
نموذج ذكاء اصطناعي متطور من مجموعة علي بابا (Alibaba) لتوليد فيديوهات عالية الجودة من النصوص والصور، مع دعم فيديوهات طويلة ومشاهد معقدة.
نموذج من Stability AI لتوليد فيديوهات قصيرة (2-4 ثوانٍ) من صورة ثابتة واحدة، مع دقة عالية وتنوع في الحركات.
نموذج الذكاء الاصطناعي من OpenAI لتوليد فيديوهات واقعية ومبدعة من النصوص والصور، مع إمكانيات فيديو طويلة ومشاهد معقدة.
أداة تحرير فيديو بالذكاء الاصطناعي تُحوّل أي فيديو إلى مقاطع قصيرة (Shorts) في ثوانٍ، مع إضافة ترجمات جذابة بـ 48 لغة.
أداة تحرير ترجمة فيديو مدعومة بالذكاء الاصطناعي، مع محرر مرئي، التعرف على الكلام (Whisper)، وتصدير بصيغ متعددة. مبنية على React وتعمل محلياً في المتصفح.
إطار عمل متقدم ومفتوح المصدر لرفع دقة الفيديو (Super Resolution) واستيفاء الإطارات (Frame Interpolation) باستخدام تقنيات التعلم الآلي، مع دعم لتحسين جودة مقاطع الفيديو القديمة والصور وملفات GIF.
منصة متطورة لتوليد الفيديو بالذكاء الاصطناعي من ByteDance، تحول النصوص والصور إلى مقاطع فيديو عالية الجودة مع صوت متزامن، وتتميز بحركات سلسة ودقة في تنفيذ التعليمات.
0
0 out of 5 stars (based on 0 reviews)
ممتاز
جيد جدًا
متوسط
ضعيف
فظيع


لا توجد مراجعات حتى الآن. كن أول من يكتب واحدة.


أخر تحديث للصفحة أبريل 26, 2026