切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
文本和图片之后,AIGC的下个前沿将是视频生成 ...
菲龙网编辑部7
有 744 人收听 TA
147021
主题
147038
回复
173128
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/86
理财情报局 | 再现0费率!年末银行理财开启“花式”营销,头部理财公司发起自购含权理财
0/84
新希望金融科技曹滔滔:坚守边界,以科技力量助力中小商业银行数字化
0/56
友邦人寿总经理张晓宇升任友邦保险集团区域首席执行官,余宏拟任友邦人寿CEO
0/55
金价连续5日上涨 触及2700美元/盎司
0/59
对话汽车流通协会周伟:银行或将继续在汽车金融市场保持优势
0/63
用户比例达到88%!手机银行已成金融服务主导渠道
0/55
视频 从整个ETF持仓量的变化来看,投资者对黄金的一个热情和策略有哪些调整?
0/59
平安健康险亮相“乌镇峰会” 科技向善助力普惠金融发展
0/52
视频 丨 黄金振荡期,投资者可以采取什么样的交易策略?
查看TA的全部帖子>>
文本和图片之后,AIGC的下个前沿将是视频生成
时间:2023-3-22 12:10
0
333
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
3月21日消息,生成式人工智能(AIGC)在文本和图片生成方面已经取得了显著进展。几个月来,Dall-E、ChatGPT以及Stable Diffusion等服务创作了各种各样的文字和图片内容。现在,初创公司Runway AI正进入AIGC的下一个前沿领域——AI生成视频。
当地时间周一,总部位于纽约的Runway宣布推出名为Gen 2的系统,该系统可以根据少量用户提示生成简短视频。用户可以输入他们想要看到的视频描述,例如“一只猫行走在雨中”,Runway的系统将据此生成大约3秒钟的视频片段。此外,用户也可以上传图片作为系统参考或提示。
Runway是专注于制作AI电影和剪辑工具的公司,该公司宣布,现在并非所有人都能体验Gen 2,但用户可以提交申请。人们可以在Discord频道上注册并等待,该公司计划每周都增加更多测试用户。
不过,这次有限的发布代表了实验室外文本转视频生成的最成功案例。谷歌和Meta去年都展示了他们自己的文本转视频努力,利用AI生成了泰迪熊洗碗和在湖上泛舟等视频,但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。
自2018年以来,Runway始终致力于研发AI工具,并于去年年底筹集了5000万美元资金。这家初创公司帮助创建了原始版本的Stable Diffusion,这是一种文本转图像AI模型,自推出以后大受欢迎,并由Stability AI公司进一步开发。
Runway联合创始人兼首席执行官克里斯·瓦伦苏拉(Cris Valenzuela)上周对Gen 2进行了现场演示,比如生成“无人机拍摄的沙漠景观”。在几分钟内,Gen 2生成了只有几秒钟长的视频,尽管画面显得有点扭曲,但不可否认的是,视频非常像是无人机在沙漠上拍摄的片段。地平线上可以看到蓝天和白云,视频画面右下角的太阳刚刚升起(也可能是落下),其光线突出了下面的棕色沙丘。
Gen 2还根据提示生成了其他几个视频:一段眼球的特写视频看起来很清晰,非常像人类眼睛;但一段徒步旅行者穿过丛林的视频显示,它在生成逼真的腿部和行走动作方面可能仍然存在问题。瓦伦苏拉说,这个模型还没有完全“弄清楚”如何准确地描述物体的运动。
虽然更长的提示可能会帮助生成更详细的图像,比如Dall-E或Stable Diffusion,但瓦伦苏拉说,Gen 2越简单越好。他认为Gen 2为艺术家、设计师和电影制作人提供了新的工具,可以帮助他们完成创作过程,并让这些工具的价格比过去更实惠,也更容易获得。
Gen 2建立在Runway现有的、名为Gen 1的AI模型基础之上,Runway于2月份开始在Discord上测试该模型。瓦伦苏拉表示,Gen 1目前拥有数千名用户。这种AI模型要求用户上传一段视频作为输入源,然后利用这段视频(以及文本提示或图片)来生成新的、无声的3秒视频。例如,你可以上传一张猫追逐玩具的照片,并附上文字“可爱的钩编风格”,Gen 1就会生成一段钩编猫追逐玩具的视频。
用Gen 2 AI模型生成的视频也是无声的,但瓦伦苏拉称,该公司正在研究音频生成技术,希望最终能创造出一种既能产生图像又能产生声音的系统。
Gen 2的首次亮相表明,初创公司在AIGC领域取得的进展非常快。AIGC可以吸收用户输入并生成文本或图像等新内容,其中Stable Diffusion、Open的图像生成模型Dall-E和聊天机器人ChatGPT等系统,近几个月来已经公开发布并受到欢迎。
但与此同时,它们的扩散也引发了法律和伦理方面的担忧。数字取证专家、加州大学伯克利分校教授哈尼·法里德(Hany Farid)看了几段由Gen 2生成的视频,称它们看起来“非常酷”,但他补充说,用这种技术制作的视频迟早将被滥用。他断言:“有些人会试图用这种技术做坏事。”
Runway正在使用AI和人类控制相结合的方式来防止用户使用Gen 2生成包含色情、暴力内容或侵犯版权的视频,但这种方法并非总是有效。
与AI行业的其他领域一样,文本转视频技术正在快速发展。虽然Gen 2目前的图像质量看起来有点模糊、不太稳定,很容易让人发现破绽,但瓦伦苏拉预计它会很快改善。他说:“这套系统还处于早期阶段。随着时间的推移,它会变得越来越好。”(小小)
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部