Centre d'aide

Questions fréquemment posées

Tout ce que vous devez savoir sur Descrideo et notre service de description vidéo IA.

Descrideo est un service de description vidéo alimenté par IA qui analyse automatiquement vos vidéos en utilisant des images visuelles, la transcription audio, ou les deux pour générer des descriptions textuelles détaillées et précises. Choisissez parmi trois modes de génération : vision uniquement, vision + audio combinés, ou audio uniquement. Notre technologie est parfaite pour l'accessibilité, le SEO et la gestion de contenu.

Notre service suit un processus simple : D'abord, vous téléchargez votre vidéo sur notre plateforme sécurisée. Ensuite, selon le mode de génération choisi, notre IA extrait les images clés, transcrit les segments audio, ou les deux. Des modèles avancés de vision par ordinateur et de reconnaissance vocale analysent le contenu. Enfin, vous recevez des descriptions détaillées via webhook ou dans votre tableau de bord. Le processus complet est automatisé et se termine généralement en quelques secondes à minutes selon la longueur de la vidéo et le mode de génération.

Descrideo propose trois modes de génération : Vision (par défaut) analyse les images vidéo extraites pour comprendre le contenu visuel. Vision + Audio combine l'analyse d'images avec la transcription audio pour les descriptions les plus complètes — idéal pour les vlogs, critiques et présentations. Audio uniquement transcrit la parole sans extraction d'images, parfait pour les podcasts, interviews et conférences. Le mode Vision est disponible sur tous les plans y compris gratuit. Les modes audio nécessitent un plan payant.

Lorsque vous activez la transcription audio (mode vision_audio ou audio), notre système extrait des segments audio de votre vidéo et les transcrit en utilisant une reconnaissance vocale avancée. Vous pouvez configurer le nombre de segments (10, 20 ou 30) et la durée des segments (5-60 secondes chacun). Le texte transcrit est ensuite combiné avec l'analyse visuelle (en mode vision_audio) ou utilisé comme seule entrée (en mode audio) pour générer des descriptions. La transcription audio est facturée comme un supplément basé sur la durée audio totale échantillonnée.

Descrideo prend en charge tous les principaux formats vidéo, notamment MP4, MOV, AVI, MKV, WebM et plus encore. Notre système gère automatiquement la conversion vidéo et l'optimisation pour l'analyse IA. La taille maximale des fichiers varie selon le plan.

Oui, la sécurité est notre priorité absolue. Toutes les vidéos sont stockées en utilisant un stockage compatible S3 chiffré avec contrôles d'accès. Nous utilisons des webhooks vérifiés par HMAC pour une communication sécurisée, et toute transmission de données utilise le chiffrement HTTPS. Vous pouvez supprimer vos vidéos et données associées à tout moment.

Descrideo peut générer des descriptions vidéo dans plusieurs langues. Notre IA est capable de produire des descriptions en anglais, espagnol, français, allemand et de nombreuses autres langues. Vous pouvez spécifier votre langue de sortie préférée lors de la création d'une tâche de description.

Descrideo offre une API robuste et un système webhook pour une intégration transparente. Vous pouvez envoyer des demandes de description vidéo via notre API REST et recevoir les résultats via webhooks. Toutes les communications webhook sont sécurisées avec des signatures HMAC pour vérification. Consultez notre documentation pour des guides d'intégration détaillés.

Nous proposons des plans tarifaires flexibles adaptés à différents besoins, des créateurs individuels aux solutions d'entreprise. Créez un compte gratuit pour commencer et explorer nos fonctionnalités. Contactez notre équipe commerciale à contact@descrideo.com pour une tarification entreprise personnalisée.

La transcription audio est un supplément au coût de base de la tâche. Vous payez le coût de jeton de base pour chaque tâche réussie, plus un coût supplémentaire basé sur la quantité d'audio échantillonné (calculé par tranches de 10 secondes). Le coût exact est affiché avant la création de la tâche et confirmé dans le payload de facturation du webhook. Les modes audio (vision_audio et audio) sont disponibles sur tous les plans payants. Le plan Demo gratuit est vision uniquement.

Notre IA atteint une grande précision en analysant plusieurs images et en transcrivant optionnellement l'audio de votre vidéo. Le mode vision + audio combiné produit les descriptions les plus riches en capturant à la fois ce qui est montré et ce qui est dit. Le mode audio uniquement excelle pour les podcasts, interviews et conférences où la parole porte l'information principale. La précision peut varier en fonction de la complexité du contenu et de la qualité audio.

Descrideo est conçu avec l'accessibilité à l'esprit. Nos descriptions générées par IA peuvent être utilisées comme scripts d'audiodescription (pour la narration), comme alternatives textuelles/alternatives médias, et comme contexte de soutien aux côtés des sous-titres. Le mode vision + audio combiné offre la couverture d'accessibilité la plus complète en capturant à la fois le contenu visuel et parlé. La conformité finale en matière d'accessibilité dépend de votre processus d'implémentation et de révision.

Écrivez-nous à contact@descrideo.com. Nous répondons généralement dans les 24-48 heures ouvrables. Vous pouvez également consulter notre FAQ et notre documentation pour des réponses rapides aux questions courantes.

Vous avez encore des questions ?

Vous ne trouvez pas la réponse que vous cherchez ? Notre équipe de support est là pour vous aider.

Contacter le support