视频 2.6 功能使用手册
📌
欢迎体验可灵视频 2.6:让我们「听见画面,看见声音」
此前,可灵的视频模型只能生成“无声画面”。创作者还要自己去找配音、拼音效、调节节奏——步骤多、来回反复,最后成片也很难做到真正沉浸。
现在,全新的「视频 2.6 模型」 登场:它可以在一次生成中同时产出画面 + 自然语音 + 匹配音效 + 环境氛围,真正打通“音”“画”两个世界。无论是输入一段文字,还是上传一张图片,都能一键得到完整、有声、有节奏的动态视频,不再需要费力拼接。
与以往“只有画面”的模型相比,视频 2.6 带来了全方位升级:
●不再演“哑剧”,做有声故事:画面、语音、音效一步生成,镜头节奏与声音情绪紧密配合,让内容从“能看”升级为“能看、能听、能沉浸”。
●声音由您掌控,细节说了算:谁来说话、说什么、什么情绪,由您决定;环境音、特效声自由生成,节奏快慢与整体氛围都能精准拿捏,适配不同创作场景。
●新手也能一键成片,创作效率翻倍:不用复杂操作,只要输入文字或图片,系统就会自动补全声画细节,自媒体作者、小团队工作室也能快速产出专业感视频。
一、可灵首个「音画同出」模型正式上线!
在「视频 2.6 模型」中,我们首次推出「音画同出」功能:单次生成即可同步产出视频画面与完整音频,涵盖语音、音效及环境音等内容,在节奏、情绪与叙事表达上实现高度协调,真正达成“所见即所闻”的视听体验。
这次升级,我们重点强化了:
●音画协同:语音节奏、环境音与画面动作紧密呼应,避免“画面一套、声音一套”的割裂感。
●音频质量:支持人声、音效、环境声等多类型声音生成,音质更干净、层次更丰富,更接近真实混音效果。
●语义理解:对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力,能更准确地把握创作者意图,输出更贴合需求的音画内容。
在创作流程上,可灵 2.6 围绕“文字 / 图像快速生成音视频内容”的核心需求,提供两条高效创作路径: