PersonaPlex هو نموذج تحويل صوتي فوري (Speech-to-Speech) من NVIDIA، مصمم لتمكين التفاعلات الصوتية الطبيعية ومنخفضة التأخير مع تحكم كامل في شخصية المتحدث (Persona). يعتمد النموذج على بنية Moshi ويدعم وضع الازدواج الكامل (Full-Duplex) مما يعني أنه يمكنه الاستماع والتحدث في نفس الوقت. يتم التحكم في الشخصية عبر وسيلتين: (1) تعليمات دور نصية (Role Prompts) تحدد سلوك وأسلوب الرد، و (2) عينة صوتية (Voice Conditioning) تحدد خصائص الصوت مثل النبرة والجرس. تم تدريب النموذج على مزيج من المحادثات الاصطناعية والحقيقية، مما ينتج تفاعلات طبيعية ومتسقة مع الشخصية المختارة. النموذج متاح كأوزان مفتوحة المصدر على GitHub، مع ورقة بحثية وعرض توضيحي. مناسب لتطبيقات المساعدات الصوتية، الروبوتات الاجتماعية، والألعاب التفاعلية.
منصة فيديو بالذكاء الاصطناعي مفتوحة المصدر وقابلة للاستضافة الذاتية، تجمع بين ثلاث أدوات قوية لإنشاء المحتوى القصير: مولد المقاطع، منتج فيديوهات UGC، واستوديو يوتيوب، كل ذلك دون علامات مائية أو حدود.
منصة لإنشاء الفيديو بالذكاء الاصطناعي تقدم تحكماً دقيقاً في حركة الكاميرا والسيناريو، وأداة متخصصة لصنع فيديوهات الشخصيات الناطقة "Speak" مع أكثر من 80 قالب حركة.
أداة متقدمة لتوليد الفيديو بالذكاء الاصطناعي من MiniMax، تتميز بقدرتها على تنفيذ تعليمات معقدة وفيزياء متطرفة مثل الجمباز، وتقدم جودة 1080p أصلية بتكلفة اقتصادية قياسية.
أداة تحرير ترجمة فيديو مدعومة بالذكاء الاصطناعي، مع محرر مرئي، التعرف على الكلام (Whisper)، وتصدير بصيغ متعددة. مبنية على React وتعمل محلياً في المتصفح.
إطار عمل متقدم ومفتوح المصدر لرفع دقة الفيديو (Super Resolution) واستيفاء الإطارات (Frame Interpolation) باستخدام تقنيات التعلم الآلي، مع دعم لتحسين جودة مقاطع الفيديو القديمة والصور وملفات GIF.
منصة متطورة لتوليد الفيديو بالذكاء الاصطناعي من ByteDance، تحول النصوص والصور إلى مقاطع فيديو عالية الجودة مع صوت متزامن، وتتميز بحركات سلسة ودقة في تنفيذ التعليمات.
0
0 out of 5 stars (based on 0 reviews)
Excellent
Very good
Average
Poor
Terrible
There are no reviews yet. Be the first one to write one.