Centro de ayuda

Preguntas frecuentes

Todo lo que necesita saber sobre Descrideo y nuestro servicio de descripción de video IA.

Descrideo es un servicio de descripción de video impulsado por IA que analiza automáticamente sus videos usando fotogramas visuales, transcripción de audio o ambos para generar descripciones textuales detalladas y precisas. Elija entre tres modos de generación: solo visión, visión + audio combinados, o solo audio. Nuestra tecnología es perfecta para accesibilidad, SEO y gestión de contenido.

Nuestro servicio sigue un proceso simple: Primero, sube su video a nuestra plataforma segura. Luego, dependiendo del modo de generación elegido, nuestra IA extrae fotogramas clave, transcribe segmentos de audio o ambos. Modelos avanzados de visión por computadora y reconocimiento de voz analizan el contenido. Finalmente, recibe descripciones detalladas vía webhook o en su panel. El proceso completo es automatizado y típicamente se completa en segundos a minutos dependiendo de la longitud del video y el modo de generación.

Descrideo ofrece tres modos de generación: Visión (predeterminado) analiza fotogramas de video extraídos para entender el contenido visual. Visión + Audio combina el análisis de fotogramas con transcripción de audio para las descripciones más completas — ideal para vlogs, reseñas y presentaciones. Solo Audio transcribe el habla sin extracción de fotogramas, perfecto para podcasts, entrevistas y conferencias. El modo Visión está disponible en todos los planes incluyendo gratuito. Los modos de audio requieren un plan de pago.

Cuando habilita la transcripción de audio (modo vision_audio o audio), nuestro sistema extrae segmentos de audio de su video y los transcribe usando reconocimiento de voz avanzado. Puede configurar el número de segmentos (10, 20 o 30) y la duración de los segmentos (5-60 segundos cada uno). El texto transcrito se combina luego con el análisis visual (en modo vision_audio) o se usa como única entrada (en modo audio) para generar descripciones. La transcripción de audio se factura como complemento basado en la duración total de audio muestreado.

Descrideo es compatible con todos los principales formatos de video, incluyendo MP4, MOV, AVI, MKV, WebM y más. Nuestro sistema maneja automáticamente la conversión de video y optimización para análisis IA. El tamaño máximo de archivo varía según el plan.

Sí, la seguridad es nuestra máxima prioridad. Todos los videos se almacenan usando almacenamiento compatible con S3 cifrado con controles de acceso. Usamos webhooks verificados por HMAC para comunicación segura, y toda transmisión de datos usa cifrado HTTPS. Puede eliminar sus videos y datos asociados en cualquier momento.

Descrideo puede generar descripciones de video en múltiples idiomas. Nuestra IA es capaz de producir descripciones en inglés, español, francés, alemán y muchos otros idiomas. Puede especificar su idioma de salida preferido al crear una tarea de descripción.

Descrideo ofrece una API robusta y un sistema webhook para integración perfecta. Puede enviar solicitudes de descripción de video vía nuestra API REST y recibir resultados a través de webhooks. Todas las comunicaciones webhook están aseguradas con firmas HMAC para verificación. Consulte nuestra documentación para guías de integración detalladas.

Ofrecemos planes de precios flexibles para adaptarse a diferentes necesidades, desde creadores individuales hasta soluciones empresariales. Cree una cuenta gratuita para comenzar y explorar nuestras funciones. Contacte a nuestro equipo de ventas en contact@descrideo.com para precios empresariales personalizados.

La transcripción de audio es un complemento al costo base de la tarea. Paga el costo de token base por cada tarea exitosa, más un costo adicional basado en la cantidad de audio muestreado (calculado por incrementos de 10 segundos). El costo exacto se muestra antes de la creación de la tarea y se confirma en el payload de facturación del webhook. Los modos de audio (vision_audio y audio) están disponibles en todos los planes de pago. El plan Demo gratuito es solo visión.

Nuestra IA logra alta precisión analizando múltiples fotogramas y opcionalmente transcribiendo audio de su video. El modo visión + audio combinado produce las descripciones más ricas capturando tanto lo que se muestra como lo que se dice. El modo solo audio sobresale para podcasts, entrevistas y conferencias donde el habla lleva la información principal. La precisión puede variar según la complejidad del contenido y la calidad del audio.

Descrideo está diseñado pensando en la accesibilidad. Nuestras descripciones generadas por IA pueden usarse como guiones de audiodescripción (para narración), como alternativas textuales/alternativas de medios, y como contexto de apoyo junto a subtítulos. El modo visión + audio combinado proporciona la cobertura de accesibilidad más completa capturando tanto el contenido visual como hablado. El cumplimiento final de accesibilidad depende de su proceso de implementación y revisión.

Envíenos un correo a contact@descrideo.com. Normalmente respondemos dentro de 24-48 horas hábiles. También puede consultar nuestra FAQ y documentación para respuestas rápidas a preguntas comunes.

¿Todavía tiene preguntas?

¿No puede encontrar la respuesta que busca? Nuestro equipo de soporte está aquí para ayudar.

Contactar soporte