Question 1

ما هو Descrideo؟

Accepted Answer

Descrideo خدمة لوصف الفيديو بالذكاء الاصطناعي تقوم بتحليل الفيديوهات تلقائيًا باستخدام الإطارات المرئية أو تفريغ الصوت أو الاثنين معًا لإنشاء أوصاف نصية مفصلة ودقيقة. يمكنك الاختيار بين ثلاثة أوضاع: الرؤية فقط، الرؤية مع الصوت، أو الصوت فقط. تقنيتنا مناسبة لإمكانية الوصول وتحسين الظهور وإدارة المحتوى.

Question 2

كيف يعمل وصف الفيديو بالذكاء الاصطناعي؟

Accepted Answer

تتبع خدمتنا عملية بسيطة: أولًا ترفع الفيديو أو توفر رابطًا مباشرًا مثل بيان HLS VOD. ثم، بحسب وضع الإنشاء الذي تختاره، يستخرج الذكاء الاصطناعي الإطارات الرئيسية أو يفّرغ المقاطع الصوتية أو يقوم بالأمرين معًا. بعد ذلك تحلل نماذج الرؤية الحاسوبية والتعرف على الكلام المحتوى، وأخيرًا تتلقى الأوصاف عبر webhook أو من خلال لوحة التحكم. العملية مؤتمتة بالكامل وتكتمل عادة خلال ثوانٍ إلى دقائق بحسب طول الفيديو ووضع الإنشاء.

Question 3

ما هي أوضاع الإنشاء؟

Accepted Answer

يوفر Descrideo ثلاثة أوضاع: الرؤية (الافتراضي) لتحليل الإطارات المستخرجة وفهم المحتوى المرئي. الرؤية + الصوت لدمج تحليل الإطارات مع التفريغ الصوتي من أجل أوصاف أشمل، وهو مثالي للمدونات المرئية والمراجعات والعروض. الصوت فقط لتفريغ الكلام دون استخراج إطارات، وهو مناسب للبودكاست والمقابلات والمحاضرات. وضع الرؤية متاح في جميع الخطط بما فيها المجانية، أما أوضاع الصوت فتتطلب خطة مدفوعة.

Question 4

كيف يعمل التفريغ الصوتي؟

Accepted Answer

عند تفعيل التفريغ الصوتي (vision_audio أو audio)، يستخرج النظام مقاطع صوتية من الفيديو ويفرغها باستخدام نماذج متقدمة للتعرف على الكلام. يمكنك ضبط عدد المقاطع (10 أو 20 أو 30) ومدة كل مقطع (من 5 إلى 60 ثانية). ثم يُدمج النص المفرغ مع التحليل المرئي في وضع vision_audio أو يُستخدم وحده في وضع audio لإنشاء الوصف. ويُحتسب التفريغ الصوتي كإضافة تعتمد على إجمالي مدة الصوت المأخوذ كعينات.

Question 5

ما صيغ الفيديو المدعومة؟

Accepted Answer

يدعم Descrideo جميع صيغ الفيديو الرئيسية بما في ذلك MP4 وMOV وAVI وMKV وWebM وبيانات M3U8 HLS VOD. كما يتولى النظام تلقائيًا تحويل الفيديو وتحسينه للتحليل بالذكاء الاصطناعي. ويختلف الحد الأقصى لحجم الملف حسب الخطة.

Question 6

هل بيانات الفيديو الخاصة بي آمنة؟

Accepted Answer

نعم، الأمان على رأس أولوياتنا. تُخزن جميع الفيديوهات في تخزين متوافق مع S3 ومشفّر مع ضوابط وصول. كما نستخدم webhooks موقعة بـ HMAC للتواصل الآمن، وجميع عمليات نقل البيانات تتم عبر HTTPS. ويمكنك حذف فيديوهاتك وبياناتك المرتبطة بها في أي وقت.

Question 7

ما اللغات المدعومة؟

Accepted Answer

يمكن لـ Descrideo إنشاء أوصاف فيديو بعدة لغات. يستطيع الذكاء الاصطناعي لدينا إنتاج أوصاف بالإنجليزية والإسبانية والفرنسية والألمانية والعديد من اللغات الأخرى. ويمكنك تحديد لغة المخرجات المفضلة عند إنشاء مهمة الوصف.

Question 8

كيف أدمج Descrideo مع تطبيقي؟

Accepted Answer

يوفر Descrideo واجهة API قوية ونظام webhooks للتكامل السلس. يمكنك إرسال طلبات وصف الفيديو عبر REST API واستلام النتائج من خلال webhooks. جميع اتصالات webhooks مؤمنة بتواقيع HMAC للتحقق. راجع التوثيق للحصول على أدلة تكامل مفصلة.

Question 9

ما هي أسعار Descrideo؟

Accepted Answer

نوفر خطط أسعار مرنة تناسب الاحتياجات المختلفة، من المبدعين الأفراد إلى حلول المؤسسات. أنشئ حسابًا مجانيًا للبدء واستكشاف الميزات. وللحصول على أسعار مخصصة للمؤسسات، تواصل مع فريق المبيعات لدينا على contact@descrideo.com.

Question 10

كيف يُسعّر التفريغ الصوتي؟

Accepted Answer

يُحتسب التفريغ الصوتي كإضافة إلى التكلفة الأساسية للمهمة. تدفع تكلفة التوكن الأساسية لكل مهمة ناجحة، بالإضافة إلى تكلفة إضافية تعتمد على كمية الصوت التي تم أخذ عينات منها (وتُحسب لكل 10 ثوانٍ). وتُعرض التكلفة الدقيقة قبل إنشاء المهمة وتُؤكد داخل حمولة الفوترة في الـ webhook. أوضاع الصوت متاحة في جميع الخطط المدفوعة، أما الخطة التجريبية المجانية فهي للرؤية فقط.

Question 11

ما مدى دقة الأوصاف المولدة بالذكاء الاصطناعي؟

Accepted Answer

يحقق الذكاء الاصطناعي لدينا دقة عالية عبر تحليل عدة إطارات وإمكانية تفريغ الصوت من الفيديو. وينتج وضع الرؤية + الصوت أوصافًا أغنى لأنه يلتقط ما يظهر وما يقال معًا. كما يتفوق وضع الصوت فقط في البودكاست والمقابلات والمحاضرات حيث تحمل الكلمات معظم المعنى. وقد تختلف الدقة باختلاف تعقيد المحتوى وجودة الصوت.

Question 12

هل يمكنني استخدام الأوصاف لأغراض إمكانية الوصول؟

Accepted Answer

صُمم Descrideo مع مراعاة إمكانية الوصول. يمكن استخدام الأوصاف المولدة بالذكاء الاصطناعي كنصوص للوصف الصوتي أو كبدائل نصية/وسائطية أو كسياق داعم إلى جانب التسميات التوضيحية. ويمنح وضع الرؤية + الصوت التغطية الأكثر اكتمالًا لأنه يلتقط المحتوى المرئي والمنطوق معًا. أما الامتثال النهائي لمتطلبات إمكانية الوصول فيعتمد على طريقة تنفيذك ومراجعتك.

Question 13

كيف أحصل على الدعم؟

Accepted Answer

راسلنا عبر contact@descrideo.com. نرد عادةً خلال 24-48 ساعة عمل. ويمكنك أيضًا مراجعة الأسئلة الشائعة والتوثيق للحصول على إجابات سريعة للأسئلة الشائعة.

الأسئلة الشائعة