帮助中心

常见问题

关于 Descrideo 和我们的 AI 视频描述服务,您需要了解的一切。

Descrideo 是一项 AI 驱动的视频描述服务,可使用视觉帧、音频转录或两者结合自动分析您的视频,生成详细准确的文本描述。提供三种生成模式:纯视觉、视觉+音频组合和纯音频。我们的技术非常适合无障碍访问、SEO 和内容管理。

我们的服务流程很简单:首先,您将视频上传到我们的安全平台。然后,根据您选择的生成模式,AI 会提取关键帧、转录音频片段或两者兼有。高级计算机视觉和语音识别模型分析内容。最后,您通过 webhook 或在仪表板中收到详细的描述。整个过程自动化完成,通常在几秒到几分钟内完成。

Descrideo 提供三种模式:视觉模式(默认)分析提取的视频帧以理解视觉内容。视觉+音频模式将帧分析与音频转录结合,提供最全面的描述——适合视频博客、评测和演示。纯音频模式仅转录语音而不提取帧,适合播客、访谈和讲座。视觉模式在所有计划(包括免费)中可用。音频模式需要付费计划。

启用音频转录时(vision_audio 或 audio 模式),我们的系统从视频中提取音频片段并使用先进的语音识别进行转录。您可以配置片段数量(10、20 或 30)和每个片段的时长(5-60 秒)。转录文本与视觉分析结合(vision_audio 模式)或用作唯一输入(audio 模式)来生成描述。音频转录按采样音频总时长计费。

Descrideo 支持所有主流视频格式,包括 MP4、MOV、AVI、MKV、WebM 等。我们的系统自动处理视频转换和优化以供 AI 分析。最大文件大小因计划而异。

是的,安全是我们的首要任务。所有视频使用加密的 S3 兼容存储并配有访问控制。我们使用 HMAC 验证的 webhook 进行安全通信,所有数据传输使用 HTTPS 加密。您可以随时删除视频和关联数据。

Descrideo 可以生成多种语言的视频描述。我们的 AI 能够生成包括中文、英语、西班牙语、法语、德语等多种语言的描述。您可以在创建描述任务时指定所需的输出语言。

Descrideo 提供强大的 API 和 webhook 系统,实现无缝集成。您可以通过 REST API 发送视频描述请求,并通过 webhook 接收结果。所有 webhook 通信使用 HMAC 签名进行验证。请查阅我们的文档获取详细的集成指南。

我们提供灵活的定价计划以满足不同需求,从个人创作者到企业级解决方案。创建免费账户即可开始使用并探索功能。如需企业定制报价,请联系 contact@descrideo.com。

音频转录是基础任务费用的附加项。您需要为每个成功任务支付基础代币费用,加上基于采样音频时长的额外费用(按 10 秒为单位计算)。确切费用在任务创建前显示,并在 webhook 计费负载中确认。音频模式(vision_audio 和 audio)在所有付费计划中可用。免费演示计划仅支持视觉模式。

我们的 AI 通过分析多个帧并可选转录视频中的音频来实现高准确度。视觉+音频组合模式通过捕捉画面内容和语音内容来产生最丰富的描述。纯音频模式特别适合播客、访谈和讲座等以语音为主的内容。准确度可能因内容复杂性和音频质量而异。

Descrideo 在设计时就考虑了无障碍访问需求。AI 生成的描述可用作音频描述脚本(用于旁白)、文本替代方案/媒体替代方案,以及与字幕配合的辅助上下文。视觉+音频模式通过捕捉视觉和语音内容提供最完整的无障碍覆盖。最终的无障碍合规性取决于您的实现和审查流程。

请发送邮件至 contact@descrideo.com。我们通常在 24-48 个工作小时内回复。您也可以查看常见问题和文档快速找到答案。

还有问题?

没找到您要的答案?我们的支持团队随时为您提供帮助。

联系支持