可灵AI进入2.0年代，可用“文字+图片+视频”生成视频

liukang20243个月前 (05-25)吃瓜入口513

4月15日，可灵AI举办2.0版别模型发布会，发布可灵2.0视频生成模型及可图2.0图画生成模型。据悉，可灵2.0上线了一种能够将文字、图片、视频等不同格局的文件结合起来一同修改生成视频的新交互形式，此举改变了以往只能用文字生成视频的单一模态修改方法。

记者了解到，当时视频生成首要分“文生视频”和“图生视频”两种。快手副总裁、可灵AI负责人张迪就发表，85%的视频创造经过“图生视频”完结。一般情况下，AI视频制作者往往经过文字生成图片，再用图片生成视频。而可灵AI此次上线多模态视频修改功用，使得文字或图片不再成为仅有的AI修改言语，也可让AI生成的视频愈加契合制作者的描绘。

依据发布会上的演示，用户能够结合图画、视频片段等多模态信息，将脑海中的多维度杂乱主意传达给AI。这也意味着，用户在运用AI生成视频时，提示词中能够夹藏图片或视频。业界也将这种全新的交互形式称为MVL（Multi-modal Visual Language，即多模态视觉言语）。

“仅仅用文字描绘自己的幻想是不行的，人和AI的交互需求新的言语。”快手高档副总裁、社区科学线负责人盖坤说道，例如，用户能够将视频中主人公的面庞、服装、布景的参阅图片及人物动作的参阅视频悉数添加到描绘中，视频中的人物便可更靠近用户的幻想来出现。此外，这一功用不只能够灵敏了解用户目的，还能支撑对视频内容进行部分的增、删、改。

此外，主打“文生图”功用的可图2.0的才能也将迎来晋级，其指令遵从才能、电影美学表现力均大幅提高，在多元化的艺术风格方面，可图2.0现在可支撑60多种风格化的作用转绘。

据悉，可灵2.0版别发布即上线。即日起，全球用户即可运用可灵AI 2.0模型。“AI在辅佐构思表达上具有巨大潜力，但当时的职业开展现状还远远无法满意用户需求，在AI生成内容的稳定性、用户杂乱构思的准确传达上仍有许多应战。”盖坤表明。

来历：北京日报客户端

记者：鹿杨

告发/反应

标签: 视频可灵 AI 2.0 生成

返回列表

上一篇：孩子王(301078.SZ)：自主研制的KidsGPT智能参谋具有AIGC的才能，包括文字生成、图片生成、动态图片、音乐生成等功能

下一篇：山水比德：Aigc项目使用文字生成图片技能，自主研制的元世界渠道在规划职业具有唯一性

相关文章

谷歌“狂飙”在生成式AI赛道最新模型可凭文字、图片“创造”音乐

谷歌“狂飙”在生成式AI赛道最新模型可凭文字、图片“创造”音乐

《科创板日报》1月28日讯（修改宋子乔）在生成式AI模型的赛道上，谷歌正一路“狂飙”。继文字生成AI模型Wordcraft、视频生成东西Imagen Video之后，谷歌将生成式AI的使用场景扩展...

AIGC的风终究是吹到了音乐圈——本年3月，“音乐届的ChatGPT” Suno V3粉墨登场，用户只需求在Suno上输入一句话的提示词，即可在数秒内生成两首两分钟的完好歌曲，从作词、作曲、演奏到人声演唱趁热打铁，大大降低了普通人创造音乐的门槛。

现已习惯了各类“AI歌手翻唱”的听众和用户敏捷拥抱了Suno，从《宫保鸡丁咏叹调》到《让咱们荡起双桨》重金属，从英语、日语、俄语到普通话乃至是粤语，网友们自发上传的著作一应俱全，网易云音乐、QQ音乐等渠道也敏捷上线了SunoAI音乐专区，乃至还推出了定时更新的官方引荐歌单。

本期《硅谷101》约请到了来自音乐和AI音乐生成范畴的两位嘉宾，闻名音乐博主“叨叨冯” 冯建鹏，美国哈特福德大学哈特音乐学院打击乐讲师，百老汇全职演奏家和Roger Chen, Meta Music Tech Lead，共享他们对以Suno为代表的文生音乐模型的观点，以及AI怎样影响音乐工业的未来。

本期亮点：

⭕️为什么咱们感觉是Suno是最火的呢？因为他敢最早把文生音乐模型公之于众

⭕️【测评一】“找不到作业的哀痛摇滚乐”，成果并不哀痛

⭕️能听但没有心情，AI只能写出不愤恨的摇滚乐

⭕️AI写的歌能够到达业界平均水平，但无法出挑成为头部著作

⭕️速度是音乐创造最重要的方针之一，为什么AI写不出80 BPM的音乐？

⭕️AI写歌与人类作曲不是一个逻辑，只能从左到右按次序写，没有大局观

⭕️练习资料满意全面和丰厚，AI或许写出Taylor Swift水平的歌曲?

⭕️相同的音乐，水平不同的演唱者演奏出来也不相同

⭕️【测评二】英豪主题的交响乐，听感能得7分，作为乙方它不及格

⭕️Suno不能按提示词生成指定的乐器，它只寻求听上去大约类似

⭕️AI生成音乐是无法抵抗的激流，但暂时做不到像音乐家相同写歌

⭕️【测评三】应战规矩慎重的赋格，Suno会体现得更好吗？

⭕️赋格研讨在AI音乐有20年前史，不过在巴赫的原曲面前还很幼嫩

⭕️音乐技能与心理学：Mp3技能是怎样被创造出来的？

⭕️音乐的实质是“有安排的声响”，这是文生音乐大模型的底层逻辑

⭕️最怕无聊？艺术需求跳出人类总结

⭕️创造者的脑洞大开：在音乐里参加随机数机制

01 让AI写一首“赋闲的哀痛摇滚”，成果并不哀痛

《硅谷101》：除了 Suno 以外，最近还有其他的几款生成音乐的软件，为什么感觉是 Suno 是最火的呢？

Roger：因为 Suno 是最胆大的，敢最早发布他们的 AI 生成音乐的模型。其他大公司，比方说 Facebook、 Google，其实技能是抢先的，但有许多的考虑，除了把这个技能发布出去，还要考虑它或许会对社会构成的影响。

特别音乐，不像文字或许图画，它的版权问题其实是一个十分灵敏的论题。假如你有海量的数据，假定你把世界上一切的歌都用来练习一个模型，那它肯定是能够做出一个很好的作用。可是它就会或许面临许多的法律问题，乃至说你把这整个音乐工业的格式给改变了，蛋糕就这么大，终究怎样去分？跟唱片公司、出版商去分钱？这些问题假如没有想清楚的话，成果或许无法想象。

《硅谷101》：听起来很风险。其实不是技能问题，而是版权问题。

那让咱们先听一听Suno究竟实力怎样吧。请冯教师给咱们做一个现场测验，应战一些专业、有难度的音乐生成。咱们也能够帮您出一些题，比方写一首哀痛的摇滚乐，主题是“赋闲”或许“面试失利”。

叨叨冯：好的，那咱们就让Suno自己写歌词，咱们在音乐的特点上做一些约束：sad story of not finding a job, Classic Rock, 80 BPM, Guitar, Base, Drum, Keyboard.

Suno引爆音乐圈，与音乐人聊聊AI生成音乐与艺术的随机数

文 | 硅谷101AIGC的风终究是吹到了音乐圈——本年3月，“音乐届的ChatGPT” Suno V3粉墨登场，用户只需求在Suno上输入一句话的提示词，即可在数秒内生成两首两分钟的完好歌曲，从作词...

面临关税冲击，李先生也在活跃想办法。他很快便与百度进行了触摸，并加入了百度优选的出海方案，凭借百度AI慧播星数字人直播技能，从一家传统外贸加工厂向电商出售转型，全力开辟国内商场及日韩、欧洲、澳洲等非美商场。“整个流程跑下来的感触便是一个字，快！”李先生说。

自然的应对关税冲击波外贸企业借力AI稳订单拓市场的图片

在美国所谓“对等关税”冲击之下，像李先生相同的中小外贸企业主们正在寻找“包围”途径，而人工智能则是他们披荆斩棘的一把“白”。最近一段时间以来，包含百度、阿里巴巴等在内的科技公司经过发布外贸企业相关扶持方案，结合本身技能优势推行相应的AI东西，不仅为开辟多元商场供给了支撑，还助力传统外贸企业加快全链条数字化、智能化转型晋级。一场以人工智能为中心的技能革新浪潮，正在外贸职业加快铺开。

明亮的应对关税冲击波外贸企业借力AI稳订单拓市场的照片

应对关税冲击波外贸企业借力AI稳订单拓商场

公民财讯4月21日电，“咱们曾经是纯外贸的服装加工企业，客户遍及全球，美国在咱们的客户份额中占到65%，出人意料的关税冲击的确给咱们带来了暂时性困难。”宁波一家外贸服装工厂负责人李先生在承受证券时报记...

英伟达在我国现已超越 25 年，现在，英伟达在我国已具有近 4000 名职工，在深圳、香港、北京、上海等地都有建立分公司。

据 21 世纪经济报导，黄仁勋在采访中谈到：“全球 50% 的 AI 研讨人员来自我国，这是迄今为止最大的单一集体，没有挨近的第二名。因而，很自然地，我国在 AI 研讨方面将会做出巨大贡献。事实上，美国的每一家 AI 实验室无一例外都有许多优异的我国研讨人员。”

迷人的英伟达黄仁勋称全球 50% 的 AI 研究人员来自中国的照片

此前，黄仁勋曾说到，英伟达在我国的研制作业不停步于根底技能，而是与当地的开发者和草创企业严密协作，推进本地科技产业的立异与开展，“现在，咱们在我国具有超越 150 万名 CUDA 开发者，与 3000 多家草创公司协作，一起促进我国科技职业。”

英伟达黄仁勋称全球 50% 的 AI 研究人员来自我国

IT之家 3 月 21 日音讯，英伟达创始人兼 CEO 黄仁勋在 GTC 2025 的采访中谈及了英伟达在我国市场开展 AI 的状况。英伟达在我国现已超越 25 年，现在，英伟达在我国已具有近 400...

丰田推出生成式 AI 东西，输入文字指令可主动规划轿车外形

丰田推出生成式 AI 东西，输入文字指令可主动规划轿车外形

IT之家 6 月 21 日音讯，据外媒 carscoops 报导，丰田近来发布了一个依据 AIGC（生成式 AI）的东西，可协助职工更快规划出轿车外形。该东西由丰田研究所（TRI）开发，将被运用于构思...

英伟达将向印度供给最先进的AI芯片并与信实等科技巨子达到协作

英伟达将向印度供给最先进的AI芯片并与信实等科技巨子达到协作

财联社10月24日讯（修改牛占林）当地时间周四，英伟达宣告，现已与印度第二大财团、亚洲首富安巴尼旗下的信实集团达到协作伙伴关系，在印度一起建造人工智能(AI)基础设备，并将推进这项技能在全球人口最多...

友情链接：