可灵AI进入2.0年代,可用“文字+图片+视频”生成视频

liukang20242个月前吃瓜入口484
4月15日,可灵AI举办2.0版别模型发布会,发布可灵2.0视频生成模型及可图2.0图画生成模型。据悉,可灵2.0上线了一种能够将文字、图片、视频等不同格局的文件结合起来一同修改生成视频的新交互形式,此举改变了以往只能用文字生成视频的单一模态修改方法。
记者了解到,当时视频生成首要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就发表,85%的视频创造经过“图生视频”完结。一般情况下,AI视频制作者往往经过文字生成图片,再用图片生成视频。而可灵AI此次上线多模态视频修改功用,使得文字或图片不再成为仅有的AI修改言语,也可让AI生成的视频愈加契合制作者的描绘。
依据发布会上的演示,用户能够结合图画、视频片段等多模态信息,将脑海中的多维度杂乱主意传达给AI。这也意味着,用户在运用AI生成视频时,提示词中能够夹藏图片或视频。业界也将这种全新的交互形式称为MVL(Multi-modal Visual Language,即多模态视觉言语)。
“仅仅用文字描绘自己的幻想是不行的,人和AI的交互需求新的言语。”快手高档副总裁、社区科学线负责人盖坤说道,例如,用户能够将视频中主人公的面庞、服装、布景的参阅图片及人物动作的参阅视频悉数添加到描绘中,视频中的人物便可更靠近用户的幻想来出现。此外,这一功用不只能够灵敏了解用户目的,还能支撑对视频内容进行部分的增、删、改。
此外,主打“文生图”功用的可图2.0的才能也将迎来晋级,其指令遵从才能、电影美学表现力均大幅提高,在多元化的艺术风格方面,可图2.0现在可支撑60多种风格化的作用转绘。
据悉,可灵2.0版别发布即上线。即日起,全球用户即可运用可灵AI 2.0模型。“AI在辅佐构思表达上具有巨大潜力,但当时的职业开展现状还远远无法满意用户需求,在AI生成内容的稳定性、用户杂乱构思的准确传达上仍有许多应战。”盖坤表明。
来历:北京日报客户端
记者:鹿杨
告发/反应

相关文章

「视频」重视帕金森病日|八段锦、跑步机……在家也能学抗“帕”

左手食指不自主活动、无肢体麻痹、抽搐……50岁的陈女士(化姓)在两年前开端呈现上述症状,后来病况逐步加剧,被确诊为帕金森病。吃药就能治好吗?在进行相关医治后,陈女士的左边肢体仍生硬、不自主活动,还呈现...

新款iMac概念宣扬视频流出:三边窄框 类XDR规划

[PConline 资讯]据外媒报导,苹果本年或许将会一起发布新款iMac和iMac Pro,而在现在现Viktor Kadar和Patrik Borgatai现已发布了新款iMac的概念视频,从视频...

监控视频发布!美一男人被指控“优待致6岁儿子逝世”,父子相认不到两年

据英媒2日报导,被指控“优待并致其时年6岁儿子逝世”的美国新泽西州31岁男人克里斯托弗·格雷戈尔,于周二(4月30日)出庭受审。若罪名建立,他将面对终身拘禁。▲克里斯托弗出庭受审据悉,2021年4月2...

视频丨俄莫斯科州一轿车发生爆炸 导致1人逝世

00:09当地时间4月25日,俄罗斯莫斯科州巴拉希哈市一轿车发生爆破,导致一人逝世。塔斯社征引俄紧急情况部分称,爆破由爆破设备引起。查询人员已赶赴现场。(总台记者 郝薇)©2025中心广播电视总台版权...

友情链接: