把零散素材汇成一条判断链,快速得到结论、证据和下一步动作。
建议先进入内容分析,完成一次任务后再回到任务记录复核证据。
输入工作区
拖拽到这里,或直接选择文件
支持文档、图片、音频文件上传,未开始分析前支持多次追加文件和删除文件。
任务详情
AI 配置
直接切换提供商、地址和模型。
OCR 参数配置
配置 OCR 服务的请求地址、语言和分割参数。
关闭后不会调用 OCR,文本需要依赖手工补充或其它流程。
服务延迟和可达性会影响识别成功率与总耗时。
传给 OCR 服务的 language 参数。
选择 OCR 引擎;Auto 会根据图片特征做路由。
留空则使用服务默认值(如果服务支持)。
ASR 参数配置
动态调整模型、VAD、解码和分片参数。
关闭后不会调用 ASR,音频仅能依赖手工补充文本。
服务延迟和可达性会直接影响总耗时与成功率。
当前推荐使用 faster-whisper,改错会导致转写失败。
模型越大,准确率通常更高,但 CPU/内存占用和耗时也更高。
固定语言可减少误判并略提速;auto 更灵活但可能更慢。
开启会先做语音活动检测,通常能降耗时和噪声误识别。
越大越可能提升准确率,但解码更慢。
候选越多越稳,但会增加推理时间。
低温更稳定,过高可能更“发散”并影响一致性。
开启有助于上下文连贯,关闭可减少前文误传播。
阈值越高越容易判定“无语音”,可降噪但可能漏识别。
大音频建议开启,能降低超时风险并提升稳定性。
超过该时长才切片,过小会带来额外切片开销。
单片越短越稳但切片更多;越长上下文更完整但耗时更高。
重叠可减少断句丢词,过大则会重复计算。
并行越高吞吐越高,但 CPU/内存占用也会明显上升。
用于拼接回调地址:{callback_base_url}/cl/api/asr-callback/{token}
仅对 ASR 异步回调路径生效(callback_url 非空时)。
回调失败后按尝试次数倍增退避间隔。
包含首次尝试在内的最大尝试次数。
管理员设置
搜索用户并设置/取消管理员权限。