مكتبة بايثون مفتوحة المصدر لاستخراج البيانات من الويب وجاهزة لنماذج اللغة الكبيرة (LLM)، تعتمد على Playwright لتقديم محتوى ديناميكي وتحويله إلى ماركداون نظيف، مع ميزات متقدمة مثل معالجة الخوادم الوكيلة والتخصيص العميق.
مكتبة لأتمتة المتصفحات مدعومة بالذكاء الاصطناعي، تتيح للوكلاء الرقميين التفاعل مع الويب لأداء مهام معقدة مثل ملء النماذج والتسوق عبر الإنترنت، مع تكامل سهل مع نماذج LLM المتعددة.
نموذج OCR متقدم مفتوح المصدر للتعرف على النصوص في المستندات المعقدة، يتعامل مع الخط اليدوي، الجداول، المعادلات الرياضية، والنماذج مع الحفاظ على التنسيق الكامل.
مشروع مفتوح المصدر رائد لتوليد الكلام بالعربية (Text-to-Speech) يدعم 12 لهجة عربية مختلفة، بما في ذلك الفصحى والمصرية والخليجية والشامية، مع نماذج مدربة مسبقاً.
إطار عمل (Framework) متكيف ومفتوح المصدر لاستخراج بيانات الويب (Web Scraping) بلغة بايثون، يتعامل مع كل شيء من طلب واحد إلى زحف كامل، مع قدرة على تخطي أنظمة الحماية مثل Cloudflare.