PersonaPlex logo

PersonaPlex

Note
0
نموذج محادثة صوتي فوري (Full-Duplex) من NVIDIA يتحكم في الشخصية عبر نصوص الأدوار وصوت المتحدث، مبني على بنية Moshi.

Note

نموذج بحثي، قد يتطلب موارد حاسوبية عالية (GPU).

About PersonaPlex

PersonaPlex هو نموذج تحويل صوتي فوري (Speech-to-Speech) من NVIDIA، مصمم لتمكين التفاعلات الصوتية الطبيعية ومنخفضة التأخير مع تحكم كامل في شخصية المتحدث (Persona). يعتمد النموذج على بنية Moshi ويدعم وضع الازدواج الكامل (Full-Duplex) مما يعني أنه يمكنه الاستماع والتحدث في نفس الوقت. يتم التحكم في الشخصية عبر وسيلتين: (1) تعليمات دور نصية (Role Prompts) تحدد سلوك وأسلوب الرد، و (2) عينة صوتية (Voice Conditioning) تحدد خصائص الصوت مثل النبرة والجرس. تم تدريب النموذج على مزيج من المحادثات الاصطناعية والحقيقية، مما ينتج تفاعلات طبيعية ومتسقة مع الشخصية المختارة. النموذج متاح كأوزان مفتوحة المصدر على GitHub، مع ورقة بحثية وعرض توضيحي. مناسب لتطبيقات المساعدات الصوتية، الروبوتات الاجتماعية، والألعاب التفاعلية.

Origin: أمريكا

Pro & Cons of PersonaPlex

Pro's

Con's

FAQ About PersonaPlex

These are the most frequently asked questions about PersonaPlex

Supported Languages

English

Learn More About PersonaPlex

[alhisn_related_posts]

Resources About PersonaPlex

News & Updates About PersonaPlex

[alhisn_related_news]

No Data

Alternatives and Similar Tools to PersonaPlex

منصة فيديو بالذكاء الاصطناعي مفتوحة المصدر وقابلة للاستضافة الذاتية، تجمع بين ثلاث أدوات قوية لإنشاء المحتوى القصير: مولد المقاطع، منتج فيديوهات UGC، واستوديو يوتيوب، كل ذلك دون علامات مائية أو حدود.
منصة لإنشاء الفيديو بالذكاء الاصطناعي تقدم تحكماً دقيقاً في حركة الكاميرا والسيناريو، وأداة متخصصة لصنع فيديوهات الشخصيات الناطقة "Speak" مع أكثر من 80 قالب حركة.
أداة متقدمة لتوليد الفيديو بالذكاء الاصطناعي من MiniMax، تتميز بقدرتها على تنفيذ تعليمات معقدة وفيزياء متطرفة مثل الجمباز، وتقدم جودة 1080p أصلية بتكلفة اقتصادية قياسية.
منصة ذكاء اصطناعي لتوليد فيديوهات عالية الجودة من النصوص والصور، مع تحكم متقدم في الحركة والأسلوب والاستمرارية عبر المشاهد، وتوليد صوتي متكامل.
نموذج ذكاء اصطناعي متقدم من Google DeepMind لتوليد فيديوهات عالية الدقة (1080p) تصل إلى دقيقة واحدة، مع تحكم دقيق في المشاهد.
نموذج ذكاء اصطناعي متطور من مجموعة علي بابا (Alibaba) لتوليد فيديوهات عالية الجودة من النصوص والصور، مع دعم فيديوهات طويلة ومشاهد معقدة.
نموذج من Stability AI لتوليد فيديوهات قصيرة (2-4 ثوانٍ) من صورة ثابتة واحدة، مع دقة عالية وتنوع في الحركات.
نموذج الذكاء الاصطناعي من OpenAI لتوليد فيديوهات واقعية ومبدعة من النصوص والصور، مع إمكانيات فيديو طويلة ومشاهد معقدة.
أداة تحرير فيديو بالذكاء الاصطناعي تُحوّل أي فيديو إلى مقاطع قصيرة (Shorts) في ثوانٍ، مع إضافة ترجمات جذابة بـ 48 لغة.
أداة تحرير ترجمة فيديو مدعومة بالذكاء الاصطناعي، مع محرر مرئي، التعرف على الكلام (Whisper)، وتصدير بصيغ متعددة. مبنية على React وتعمل محلياً في المتصفح.
إطار عمل متقدم ومفتوح المصدر لرفع دقة الفيديو (Super Resolution) واستيفاء الإطارات (Frame Interpolation) باستخدام تقنيات التعلم الآلي، مع دعم لتحسين جودة مقاطع الفيديو القديمة والصور وملفات GIF.
منصة متطورة لتوليد الفيديو بالذكاء الاصطناعي من ByteDance، تحول النصوص والصور إلى مقاطع فيديو عالية الجودة مع صوت متزامن، وتتميز بحركات سلسة ودقة في تنفيذ التعليمات.
0
0 out of 5 stars (based on 0 reviews)
Excellent
Very good
Average
Poor
Terrible


There are no reviews yet. Be the first one to write one.


أخر تحديث للصفحة April 26, 2026

Share your love