مركز المساعدة

الأسئلة الشائعة

كل ما تحتاج إلى معرفته عن Descrideo وخدمة وصف الفيديو بالذكاء الاصطناعي.

Descrideo خدمة لوصف الفيديو بالذكاء الاصطناعي تقوم بتحليل الفيديوهات تلقائيًا باستخدام الإطارات المرئية أو تفريغ الصوت أو الاثنين معًا لإنشاء أوصاف نصية مفصلة ودقيقة. يمكنك الاختيار بين ثلاثة أوضاع: الرؤية فقط، الرؤية مع الصوت، أو الصوت فقط. تقنيتنا مناسبة لإمكانية الوصول وتحسين الظهور وإدارة المحتوى.

تتبع خدمتنا عملية بسيطة: أولًا ترفع الفيديو إلى منصتنا الآمنة. ثم، بحسب وضع الإنشاء الذي تختاره، يستخرج الذكاء الاصطناعي الإطارات الرئيسية أو يفّرغ المقاطع الصوتية أو يقوم بالأمرين معًا. بعد ذلك تحلل نماذج الرؤية الحاسوبية والتعرف على الكلام المحتوى، وأخيرًا تتلقى الأوصاف عبر webhook أو من خلال لوحة التحكم. العملية مؤتمتة بالكامل وتكتمل عادة خلال ثوانٍ إلى دقائق بحسب طول الفيديو ووضع الإنشاء.

يوفر Descrideo ثلاثة أوضاع: الرؤية (الافتراضي) لتحليل الإطارات المستخرجة وفهم المحتوى المرئي. الرؤية + الصوت لدمج تحليل الإطارات مع التفريغ الصوتي من أجل أوصاف أشمل، وهو مثالي للمدونات المرئية والمراجعات والعروض. الصوت فقط لتفريغ الكلام دون استخراج إطارات، وهو مناسب للبودكاست والمقابلات والمحاضرات. وضع الرؤية متاح في جميع الخطط بما فيها المجانية، أما أوضاع الصوت فتتطلب خطة مدفوعة.

عند تفعيل التفريغ الصوتي (vision_audio أو audio)، يستخرج النظام مقاطع صوتية من الفيديو ويفرغها باستخدام نماذج متقدمة للتعرف على الكلام. يمكنك ضبط عدد المقاطع (10 أو 20 أو 30) ومدة كل مقطع (من 5 إلى 60 ثانية). ثم يُدمج النص المفرغ مع التحليل المرئي في وضع vision_audio أو يُستخدم وحده في وضع audio لإنشاء الوصف. ويُحتسب التفريغ الصوتي كإضافة تعتمد على إجمالي مدة الصوت المأخوذ كعينات.

يدعم Descrideo جميع صيغ الفيديو الرئيسية بما في ذلك MP4 وMOV وAVI وMKV وWebM وغيرها. كما يتولى النظام تلقائيًا تحويل الفيديو وتحسينه للتحليل بالذكاء الاصطناعي. ويختلف الحد الأقصى لحجم الملف حسب الخطة.

نعم، الأمان على رأس أولوياتنا. تُخزن جميع الفيديوهات في تخزين متوافق مع S3 ومشفّر مع ضوابط وصول. كما نستخدم webhooks موقعة بـ HMAC للتواصل الآمن، وجميع عمليات نقل البيانات تتم عبر HTTPS. ويمكنك حذف فيديوهاتك وبياناتك المرتبطة بها في أي وقت.

يمكن لـ Descrideo إنشاء أوصاف فيديو بعدة لغات. يستطيع الذكاء الاصطناعي لدينا إنتاج أوصاف بالإنجليزية والإسبانية والفرنسية والألمانية والعديد من اللغات الأخرى. ويمكنك تحديد لغة المخرجات المفضلة عند إنشاء مهمة الوصف.

يوفر Descrideo واجهة API قوية ونظام webhooks للتكامل السلس. يمكنك إرسال طلبات وصف الفيديو عبر REST API واستلام النتائج من خلال webhooks. جميع اتصالات webhooks مؤمنة بتواقيع HMAC للتحقق. راجع التوثيق للحصول على أدلة تكامل مفصلة.

نوفر خطط أسعار مرنة تناسب الاحتياجات المختلفة، من المبدعين الأفراد إلى حلول المؤسسات. أنشئ حسابًا مجانيًا للبدء واستكشاف الميزات. وللحصول على أسعار مخصصة للمؤسسات، تواصل مع فريق المبيعات لدينا على contact@descrideo.com.

يُحتسب التفريغ الصوتي كإضافة إلى التكلفة الأساسية للمهمة. تدفع تكلفة التوكن الأساسية لكل مهمة ناجحة، بالإضافة إلى تكلفة إضافية تعتمد على كمية الصوت التي تم أخذ عينات منها (وتُحسب لكل 10 ثوانٍ). وتُعرض التكلفة الدقيقة قبل إنشاء المهمة وتُؤكد داخل حمولة الفوترة في الـ webhook. أوضاع الصوت متاحة في جميع الخطط المدفوعة، أما الخطة التجريبية المجانية فهي للرؤية فقط.

يحقق الذكاء الاصطناعي لدينا دقة عالية عبر تحليل عدة إطارات وإمكانية تفريغ الصوت من الفيديو. وينتج وضع الرؤية + الصوت أوصافًا أغنى لأنه يلتقط ما يظهر وما يقال معًا. كما يتفوق وضع الصوت فقط في البودكاست والمقابلات والمحاضرات حيث تحمل الكلمات معظم المعنى. وقد تختلف الدقة باختلاف تعقيد المحتوى وجودة الصوت.

صُمم Descrideo مع مراعاة إمكانية الوصول. يمكن استخدام الأوصاف المولدة بالذكاء الاصطناعي كنصوص للوصف الصوتي أو كبدائل نصية/وسائطية أو كسياق داعم إلى جانب التسميات التوضيحية. ويمنح وضع الرؤية + الصوت التغطية الأكثر اكتمالًا لأنه يلتقط المحتوى المرئي والمنطوق معًا. أما الامتثال النهائي لمتطلبات إمكانية الوصول فيعتمد على طريقة تنفيذك ومراجعتك.

راسلنا عبر contact@descrideo.com. نرد عادةً خلال 24-48 ساعة عمل. ويمكنك أيضًا مراجعة الأسئلة الشائعة والتوثيق للحصول على إجابات سريعة للأسئلة الشائعة.

هل لا تزال لديك أسئلة؟

لم تجد الإجابة التي تبحث عنها؟ فريق الدعم لدينا هنا لمساعدتك.

التواصل مع الدعم