“我们的云端服务器,正在根据预设的算法,匹配合适的音乐、特效,完成智能剪辑工作。”
“整个过程,大约需要60秒左右时间。”
“需要特别说明的是,暂时只有水果版,没有安卓版。”
“语音输入识别,暂时只支持中文,不支持英文。”
“相关功能正在紧锣密鼓研发中。几个月后的正式版,我们将提供安卓、水果两个版本,并支持中英文输入。”
话音刚落,剪刀代表的进度条走到尽头,一个mV可播放文件出现在屏幕里。
车雪峰提高音量,高声喊道:
“现在,请大家睁大眼睛,见证剪映即将推出的AI一键成片功能!”
几千双眼睛,很听话的瞪得大如铜铃,看见鼠标点击播放。
轻快的英文流行歌曲《Sunny day》bGm响起。
吉他扫弦开篇,节奏明快且鼓点清晰,整体曲风活泼,完美契合旅游 “轻松愉悦” 的氛围。
老白妞的 50 张旅游照,AI 筛选出 12 张核心画面,含海边日落、雪山远景、教堂打卡、街头咖啡等场景)。
每张照片的入场与出场特效各不相同,且贴合场景风格。
譬如:海边日落照,入场用 “渐显 + 缩放” 特效。
——入场时,画面中心缓慢放大至全屏,同时透明度从 0 增至 100%;出场用 “横向模糊”特效。
同时,屏幕下方,出现中文字幕:
“海边日落,风都是暖的~”——弹出后停留 3 秒,渐隐消失。
车雪峰点击暂停,将中文字幕翻译成英文,说给大家听。
点击继续。
接着来到雪山远景照,字幕:“教堂前的治愈瞬间”。
.......
AI按场景连贯性,自动筛选并排序照片。
每张照片停留时长 2-3 秒, 30 秒内完整呈现 12 个画面,无比丝滑。
并自动卡点 bGm 鼓点 ,让视频整体节奏紧凑且富有韵律感。
30秒后,视频播放结束,屏幕定格在 “剪映 AI 一键成片” 的功能 LoGo 上。
现场先是鸦雀无声,随后爆发热烈掌声,300人拍出1000人的掌声效果。
“oh my god!”
老白妞惊喜大叫,看着logo后面自己的定格照片,完全不敢相信自己的眼睛。
投资者们,惊奇的睁大双眼,喃喃自语:
“天哪,他们怎么做到的?”
“oh shit,无所不能的华国人!”
“so cool!他们重新定义了工具软件!”
线上会议室的弹幕瞬间刷屏:
【这效果比我手动剪的还好!】
【居然能自动识别中文给出中文字幕,中文不是最难被计算机识别的语言吗?】
【多演示几遍,会不会是作假?】
这个疑问,现场也有。
剪映居然闷声不响、悄无声息全球首推“一键成片”功能,还能语音命令,太踏马不可思议了。
虽然是演示版本,语言输入和运营平台还不完善,但——只是需要时间而已。
这个一键成片功能,在2121年2月的时间点,堪称惊艳。
对比硅谷乃至全球的软件市场,展现出诸多领先之处。
硅谷一些知名软件公司,也在探索AI辅助视频编辑领域。
例如InVideo,在上个月月底推出基于语音指令的IVA智能视频助手。
能通过语音进行部分视频编辑操作,如添加音乐、建议模板等 。
但在自动整合素材生成完整视频方面,远不及剪映的一键成片。
此功能,实现从素材筛选、配乐、字幕添加到特效匹配的全流程自动化。
可以依据用户给定的照片,快速筛选核心画面,并按照场景连贯性排序。
且每个画面的入场、出场特效贴合场景,功能的集成度和高效性,无人可比。
在语言识别与字幕处理上,剪映更加突出。
中文被公认为较难被计算机识别的语言之一,然而它能自动识别中文,并给出贴合场景且具有动态效果的中文字幕。
反观其他软件,在多语言尤其是中文的自动字幕生成方面存在较大技术障碍,更难做到根据不同场景适配不同字幕样式。
在特效与场景适配方面,从算法效率和用户体验角度,均是跨时代的创举。
总之,剪映的“一键成片”:
以其功能的全面性、对复杂语言的处理能力、特效与场景的智能适配以及高效的算法,在全球视频编辑软件的竞争中脱颖而出。
遥遥领先其他对手。