PersonaPlex logo

PersonaPlex

ملاحظة
0
نموذج محادثة صوتي فوري (Full-Duplex) من NVIDIA يتحكم في الشخصية عبر نصوص الأدوار وصوت المتحدث، مبني على بنية Moshi.

ملاحظة

نموذج بحثي، قد يتطلب موارد حاسوبية عالية (GPU).

نبذة عن PersonaPlex

PersonaPlex هو نموذج تحويل صوتي فوري (Speech-to-Speech) من NVIDIA، مصمم لتمكين التفاعلات الصوتية الطبيعية ومنخفضة التأخير مع تحكم كامل في شخصية المتحدث (Persona). يعتمد النموذج على بنية Moshi ويدعم وضع الازدواج الكامل (Full-Duplex) مما يعني أنه يمكنه الاستماع والتحدث في نفس الوقت. يتم التحكم في الشخصية عبر وسيلتين: (1) تعليمات دور نصية (Role Prompts) تحدد سلوك وأسلوب الرد، و (2) عينة صوتية (Voice Conditioning) تحدد خصائص الصوت مثل النبرة والجرس. تم تدريب النموذج على مزيج من المحادثات الاصطناعية والحقيقية، مما ينتج تفاعلات طبيعية ومتسقة مع الشخصية المختارة. النموذج متاح كأوزان مفتوحة المصدر على GitHub، مع ورقة بحثية وعرض توضيحي. مناسب لتطبيقات المساعدات الصوتية، الروبوتات الاجتماعية، والألعاب التفاعلية.

المنشئ: أمريكا

المميزات و عيوب PersonaPlex

المزايا

العيوب

أسئلة شائعة عن PersonaPlex

هذه الأسئلة الأكثر طرحا حول PersonaPlex

اللغات المدعومة

الإنجليزية

تعلم أكثر عن PersonaPlex

[alhisn_related_posts]

موارد خاصة بــ PersonaPlex

أخبار و تحديثات عن PersonaPlex

[alhisn_related_news]

لا يوجد أي بيانات

بدائل و برامج مشابه لـ PersonaPlex

منصة فيديو بالذكاء الاصطناعي مفتوحة المصدر وقابلة للاستضافة الذاتية، تجمع بين ثلاث أدوات قوية لإنشاء المحتوى القصير: مولد المقاطع، منتج فيديوهات UGC، واستوديو يوتيوب، كل ذلك دون علامات مائية أو حدود.
منصة لإنشاء الفيديو بالذكاء الاصطناعي تقدم تحكماً دقيقاً في حركة الكاميرا والسيناريو، وأداة متخصصة لصنع فيديوهات الشخصيات الناطقة "Speak" مع أكثر من 80 قالب حركة.
أداة متقدمة لتوليد الفيديو بالذكاء الاصطناعي من MiniMax، تتميز بقدرتها على تنفيذ تعليمات معقدة وفيزياء متطرفة مثل الجمباز، وتقدم جودة 1080p أصلية بتكلفة اقتصادية قياسية.
منصة ذكاء اصطناعي لتوليد فيديوهات عالية الجودة من النصوص والصور، مع تحكم متقدم في الحركة والأسلوب والاستمرارية عبر المشاهد، وتوليد صوتي متكامل.
نموذج ذكاء اصطناعي متقدم من Google DeepMind لتوليد فيديوهات عالية الدقة (1080p) تصل إلى دقيقة واحدة، مع تحكم دقيق في المشاهد.
نموذج ذكاء اصطناعي متطور من مجموعة علي بابا (Alibaba) لتوليد فيديوهات عالية الجودة من النصوص والصور، مع دعم فيديوهات طويلة ومشاهد معقدة.
نموذج من Stability AI لتوليد فيديوهات قصيرة (2-4 ثوانٍ) من صورة ثابتة واحدة، مع دقة عالية وتنوع في الحركات.
نموذج الذكاء الاصطناعي من OpenAI لتوليد فيديوهات واقعية ومبدعة من النصوص والصور، مع إمكانيات فيديو طويلة ومشاهد معقدة.
أداة تحرير فيديو بالذكاء الاصطناعي تُحوّل أي فيديو إلى مقاطع قصيرة (Shorts) في ثوانٍ، مع إضافة ترجمات جذابة بـ 48 لغة.
أداة تحرير ترجمة فيديو مدعومة بالذكاء الاصطناعي، مع محرر مرئي، التعرف على الكلام (Whisper)، وتصدير بصيغ متعددة. مبنية على React وتعمل محلياً في المتصفح.
إطار عمل متقدم ومفتوح المصدر لرفع دقة الفيديو (Super Resolution) واستيفاء الإطارات (Frame Interpolation) باستخدام تقنيات التعلم الآلي، مع دعم لتحسين جودة مقاطع الفيديو القديمة والصور وملفات GIF.
منصة متطورة لتوليد الفيديو بالذكاء الاصطناعي من ByteDance، تحول النصوص والصور إلى مقاطع فيديو عالية الجودة مع صوت متزامن، وتتميز بحركات سلسة ودقة في تنفيذ التعليمات.
0
0 out of 5 stars (based on 0 reviews)
ممتاز
جيد جدًا
متوسط
ضعيف
فظيع


لا توجد مراجعات حتى الآن. كن أول من يكتب واحدة.


أخر تحديث للصفحة أبريل 26, 2026