可灵AI进入2.0年代,可用“文字+图片+视频”生成视频

liukang20243个月前吃瓜入口513
4月15日,可灵AI举办2.0版别模型发布会,发布可灵2.0视频生成模型及可图2.0图画生成模型。据悉,可灵2.0上线了一种能够将文字、图片、视频等不同格局的文件结合起来一同修改生成视频的新交互形式,此举改变了以往只能用文字生成视频的单一模态修改方法。
记者了解到,当时视频生成首要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就发表,85%的视频创造经过“图生视频”完结。一般情况下,AI视频制作者往往经过文字生成图片,再用图片生成视频。而可灵AI此次上线多模态视频修改功用,使得文字或图片不再成为仅有的AI修改言语,也可让AI生成的视频愈加契合制作者的描绘。
依据发布会上的演示,用户能够结合图画、视频片段等多模态信息,将脑海中的多维度杂乱主意传达给AI。这也意味着,用户在运用AI生成视频时,提示词中能够夹藏图片或视频。业界也将这种全新的交互形式称为MVL(Multi-modal Visual Language,即多模态视觉言语)。
“仅仅用文字描绘自己的幻想是不行的,人和AI的交互需求新的言语。”快手高档副总裁、社区科学线负责人盖坤说道,例如,用户能够将视频中主人公的面庞、服装、布景的参阅图片及人物动作的参阅视频悉数添加到描绘中,视频中的人物便可更靠近用户的幻想来出现。此外,这一功用不只能够灵敏了解用户目的,还能支撑对视频内容进行部分的增、删、改。
此外,主打“文生图”功用的可图2.0的才能也将迎来晋级,其指令遵从才能、电影美学表现力均大幅提高,在多元化的艺术风格方面,可图2.0现在可支撑60多种风格化的作用转绘。
据悉,可灵2.0版别发布即上线。即日起,全球用户即可运用可灵AI 2.0模型。“AI在辅佐构思表达上具有巨大潜力,但当时的职业开展现状还远远无法满意用户需求,在AI生成内容的稳定性、用户杂乱构思的准确传达上仍有许多应战。”盖坤表明。
来历:北京日报客户端
记者:鹿杨
告发/反应

相关文章

谷歌“狂飙”在生成式AI赛道 最新模型可凭文字、图片“创造”音乐

谷歌“狂飙”在生成式AI赛道 最新模型可凭文字、图片“创造”音乐

《科创板日报》1月28日讯(修改 宋子乔) 在生成式AI模型的赛道上,谷歌正一路“狂飙”。继文字生成AI模型Wordcraft、视频生成东西Imagen Video之后,谷歌将生成式AI的使用场景扩展...

Suno引爆音乐圈,与音乐人聊聊AI生成音乐与艺术的随机数

文 | 硅谷101AIGC的风终究是吹到了音乐圈——本年3月,“音乐届的ChatGPT” Suno V3粉墨登场,用户只需求在Suno上输入一句话的提示词,即可在数秒内生成两首两分钟的完好歌曲,从作词...

应对关税冲击波 外贸企业借力AI稳订单拓商场

公民财讯4月21日电,“咱们曾经是纯外贸的服装加工企业,客户遍及全球,美国在咱们的客户份额中占到65%,出人意料的关税冲击的确给咱们带来了暂时性困难。”宁波一家外贸服装工厂负责人李先生在承受证券时报记...

英伟达黄仁勋称全球 50% 的 AI 研究人员来自我国

IT之家 3 月 21 日音讯,英伟达创始人兼 CEO 黄仁勋在 GTC 2025 的采访中谈及了英伟达在我国市场开展 AI 的状况。英伟达在我国现已超越 25 年,现在,英伟达在我国已具有近 400...

丰田推出生成式 AI 东西,输入文字指令可主动规划轿车外形

丰田推出生成式 AI 东西,输入文字指令可主动规划轿车外形

IT之家 6 月 21 日音讯,据外媒 carscoops 报导,丰田近来发布了一个依据 AIGC(生成式 AI)的东西,可协助职工更快规划出轿车外形。该东西由丰田研究所(TRI)开发,将被运用于构思...

英伟达将向印度供给最先进的AI芯片 并与信实等科技巨子达到协作

英伟达将向印度供给最先进的AI芯片 并与信实等科技巨子达到协作

财联社10月24日讯(修改 牛占林)当地时间周四,英伟达宣告,现已与印度第二大财团、亚洲首富安巴尼旗下的信实集团达到协作伙伴关系,在印度一起建造人工智能(AI)基础设备,并将推进这项技能在全球人口最多...

友情链接: