当前位置: 主页 > 生活杂文 >

⭐封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?

最近网络热点文章💠《封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?》,很多网友都想阅读✨封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?的详细内容,芒果文学(www.mangowenxue.com)编辑精心收集整理了相关内容,希望大家都能开心的阅读。

2月16日凌晨,美国人工智能公司OpenAI在其官网发布了文生视频模型Sora,首次由AI生成了长达1分钟的多镜头长视频,镜头感堪比电影,引发关注。2月17日,据《纽约时报》和彭博社等媒体报道,OpenAI已完成一项允许员工出售公司股份的最新交易,使得这家AI公司的估值达到了860亿美元。何为Sora?Sora为何能引发关注?又将会产生哪些影响?

图源:Sora

能生成60秒视频且对“物理规律”有超强学习能力

从发布的视频来看,Sora 60秒的视频中,视频主体与背景保持了高度流畅性与稳定性;在一个视频里实现多角度镜头,分镜切换符合逻辑且十分流畅;此外,Sora对于光影反射、运动方式、镜头移动等细节处理非常到位。值得一提的是,在OpenAI公布的部分样片中,Sora还展现了对“物理规律”超强的学习能力,无论是飘逸的毛发还是水体波纹,Sora都能“合乎常理”地呈现出来。

图源:Sora

OpenAI究竟是怎么做到的?其官网介绍,通过一次性为模型提供多帧的预测,他们解决了一个具有挑战性的问题。

总体而言,Sora是一个在不同时长、分辨率和宽高比的视频及图像上训练而成的扩散模型,同时采用了Transformer架构。展开讲,在视觉数据上,OpenAI把视频和图像分解为较小的数据单元Patches,每个patches相当于GPT中的一个token;在语言理解能力上,采用了DALL·E 3的重标注技术,通过为视觉训练数据生成详细描述的标题,使模型更加准确地遵循用户的文本指令生成视频。另外,Sora还能将现有的静态图像转化成视频,精准赋予图像中内容以生动的动作;模型还能扩展现有视频或补全缺失的帧。

简单概括下来,Sora功能包括“文生视频、图生视频、扩展原视频”,长度最高可达60秒,视频更高清,细节更逼真,表现力更丰富。

Sora生成的视频截屏

技术报告揭秘Sora 6大优势

在Sora推出后不久,OpenAI发布了这款新工具的技术报告。《每日经济新闻》经过对报告的梳理,总结出了Sora的6大优势。

①准确性和多样性

Sora的显著特征之一是能够准确解释长达135个单词的长提示。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。

②强大的语言理解

OpenAI利用Dall-E模型的re-captioning技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与DALL·E 3类似,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使Sora能够精确地按照用户提示生成高质量的视频。

图源:Sora

③以图/视频生成视频

Sora除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使Sora能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。

④视频扩展功能

由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于Transformer的扩散模型,Sora还能沿时间线向前或向后扩展视频。

⑤优异的设备适配性

Sora具备出色的采样能力,从宽屏的1920×1080p到竖屏的1080×1920,两者之间的任何视频尺寸都能轻松应对。这意味着Sora能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora还能以小尺寸迅速创建内容原型。

⑥场景和物体的一致性和连续性

Sora可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora可确保画面主体即使暂时离开视野也能保持不变。

Sora生成的视频中,主角脸上的雀斑清晰可见。图片来源:OpenAI官网

Sora模型的实际生成效果仍是未知数

OpenAI官网称,Sora模型可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系。

在OpenAI发布的技术报告中有一段Sora模型生成的错误视频,展示了桌上的水杯会先从底部流出果汁,然后沿着错误的方向和角度倒在桌上。

根据OpenAI官网的描述,Sora模型在模拟复杂场景时仍会出错,并不总能准确呈现物体状态的改变。比如,它不能准确地模拟许多日常的基本物理过程,像是玻璃破碎过程、吃食物后表面没有咬痕、凭空生成并不需要的重复或变形画面等。

图源:Sora

此外,Sora模型的安全性、对于有害内容的把控、对于偏见和歧视内容的筛查,目前仍处于摸索当中。Sora模型目前还处于测试阶段,预计再经过一段时间的安全测试和用户反馈后才会正式提供服务,因此还无法了解Sora模型的实际效果。

图源:Sora

或对影视、广告、游戏、新闻、教育、VR\AR等行业产生深远影响

Sora会给人类带来哪些影响?

北京邮电大学人机交互与认知工程实验室主任刘伟表示,Sora在短期内可能会对短视频制作、影视行业以及视觉交互界面应用产生较为显著的影响;从长期来看,这项技术会为自动驾驶、数字仿真、场景模拟等领域带来改变。

中国企业资本联盟副理事长柏文喜表示,Sora作为一种强大的视频生成工具,可以极大地降低视频制作的门槛和成本,使得更多人能够轻松创建高质量的视频内容。这将对影视、广告、游戏、新闻、教育、VR\AR等诸多行业产生深远的影响,具有广泛的应用前景。

例如在影视行业,人人都是导演的时代即将来临,Sora可以快速生成逼真的场景和特效,帮助制作人员更好地实现创意,提高制作效率。在广告行业,Sora可以根据品牌需求和营销目标,快速生成高质量的广告。

内容创作的方式变革后,文学创作领域也将迎来复兴,小说可以直接生成动漫、电视剧。视频内容集中爆发,自媒体行业也将迎来重新洗牌。随着技术的不断深挖,未来Sora会将在更多领域得到推广应用。

技术的变革是把双刃剑。也许有人会问Sora的出现会对哪些岗位产生冲击?

从上述专家的分析来看,目前最容易受到影响的或许是影视行业的从业者。例如视频剪辑师、后期制作这类岗位,Sora能够自动或半自动地生成视频,这可能会导致传统的视频制作和编辑职位的需求下降。后期制作包括剪辑、特效、音效等环节,这些工作也可以通过AI技术进行自动化或半自动化处理。再比如新闻主持人这一岗位,Sora可以根据输入的文本自动生成视频新闻报道,一些简单的新闻报道任务可能会被Sora所取代。此外,游戏动画师、广告创意和设计岗位、内容创作者等岗位都有可能受到冲击。

图源:Sora

大模型的竞争正在加剧

AI的世界,日新月异。

与其他文生视频大模型仅能生成3至4秒的视频相比,Sora模型生成的60秒视频实现了明显提升。

不过,OpenAI虽然遥遥领先,却也不是没有压力。近几个月来,科技巨头们也纷纷宣布将带着自己的模型进入该领域,例如字节跳动的MagicVideo-V2和谷歌的Lumiere。

值得关注的是,就在Sora发布的同日,谷歌也发布其最新力作——Gemini 1.5 Pro,其将稳定处理上下文的上限扩大至100万Tokens,这代表它能一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。

大模型的竞争正在加剧。

发布时间:2024-02-19 16:01

上述文字是💠《封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?》✨的美文内容,大家如想要阅读更多的短文学、文学名著、精品散文、诗歌等作品,请点击本站其他文章进行赏析。

版权声明:本文由互联网用户自发贡献,该文仅代表作者观点。芒果文学仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件进行举报,一经核实本站将立刻删除。

相关文章阅读

如何引导孩子克服自卑心理

导读:孩子今年9岁,上三年级,女孩。每次让孩子去做一件事情,孩子第一反应就是不会,做不好,总是处于一种很自卑的状态。上次学校里面有一个节目,老师找孩子去表演,孩子首...

[生活杂文] - 2023-08-27 01:08:08

试试删他QQ里的女生,看白羊男啥反应?

白羊男:直接翻脸把手机加密不再给你机会甚至不管你删的是谁 白羊座的男生,其实做事直接是个优点,就算是对着自己喜欢的人,也往往不原意留面子,所以遇到有人把自己QQ的女生...

[生活杂文] - 2023-08-31 01:50:28

一种水螅为衰老和再生提供新见解

据发表在最新一期《细胞报告》上的论文,美国国立卫生研究院的科学家通过研究一种微小的海洋生物如何仅从嘴巴再生出完整的新身体,提出了关于愈合和衰老的新见解。 名为Hydra...

[生活杂文] - 2023-07-04 09:01:48

白羊座11月啥事会喜从天降

11月白羊座有啥好事发生 十一月给予具有体育精神的人(那就是你咯)以最佳的祝福。当其他人被漫漫长夜折磨得憔悴不堪的时候,羊羊们却充满活力。你会花很多时间陪伴家人,让他...

[生活杂文] - 2023-07-03 00:05:21

菏泽社保缴费基数,菏泽社保个人查询

一般社保缴纳比例:个人承担部分:养老保险8%、失业保险1%、医疗保险2%; 单位承担部分:养老保险20%、工伤保险0.6%、生育保险0.8%、失业保险2%、医疗保险8%。 菏泽市中华路916号邮编...

[生活杂文] - 2023-11-07 00:12:11

超低噪声系统实现室温量子“光学压缩”,有助理解如何创建大而复杂的量子态

在量子力学领域,科学家一直难以在室温下观测和控制量子现象,尤其是在大尺度上。据瑞士洛桑联邦理工学院官网报道,该校科学家开发出一种超低噪声系统,在室温下实现了量子“...

[生活杂文] - 2024-02-21 10:02:13

西安地图

本文目录一览: 1、西安各个区分布地图 2、西安在中国地图上是什么位置 3、西安的地图 4、西安在地图上的什么位置 5、西安市高新区范围地图 西安各个区分布地图 截至2018年,西安市...

[生活杂文] - 2024-03-13 16:16:46

苹果手机是双卡双待吗

苹果手机有双卡双待。截至2022年9月,苹果公司(Apple Inc. )已发布37款手机产品;iPhone系列产品静音键在设备正面的左侧 ;iPhone 5之前机型使用30Pin(即30针)接口,iPhone 5(包含)之后...

[生活杂文] - 2023-03-05 04:29:17

干红不能和什么一起吃 干红不能和什么食物同吃

导读:干红不能和什么一起吃?下面小编为大家整理介绍。1、干红一般指干红葡萄酒。喝红酒一般忌与海鲜、饮料、苹果等一起吃。2、一般红酒配红肉符合烹调学自身的规则,因为红...

[生活杂文] - 2023-05-01 07:38:58

欧洲最大的国家除了俄罗斯.欧洲国土面积最大的国家

本篇文章给大家谈谈欧洲最大的国家,以及欧洲最大的国家除了俄罗斯对应的知识点,希望对各位有所帮助,不要忘了收藏本站! 内容导航: 欧洲哪个国家面积最大? 欧洲最大的国家是...

[生活杂文] - 2023-08-11 18:14:21

哪些人不宜吃大蒜 什么人不能吃大蒜

导读:哪些人不宜吃大蒜?下面一起来看看吧。1、大蒜虽好五类人不宜吃,包括脾虚腹泻者、虚弱有热者、眼病患者、肝病患者、重病者慎食。2、重病者慎食。蒜属发物,容易 1、大蒜...

[生活杂文] - 2023-11-14 20:43:26

我的常州医保怎么取消默认账户

我的常州医保取消默认账户方法是在微信公众号中找到申报入口,登录账户之后,选择参保信息修改,点击医保账户家庭绑定,选择解绑即可。医疗保险一般指基本医疗保险,是为了补...

[生活杂文] - 2023-02-10 19:09:36

在古代里美指的是什么意思 美在古代是什么意思

导读:在古代里美指的是什么意思?下文是小编给大家带来的介绍。1、美[měi],会意字。金文字形,从羊,从大。 2、美:象形字,象征人佩戴羊角、牛角,古人认为这很美,并非羊大...

[生活杂文] - 2023-01-24 14:21:02

撅菜不能和什么一起吃 蕨菜和哪些东西不能一起吃

导读:撅菜不能和什么一起吃?以下是小编为大家带来的介绍。1、蕨菜一般不能与毛豆、花生等同食。蕨菜性寒,味甘,含有钾、镁、钙和胆碱等营养素,具有降气化痰、促进胃肠蠕动...

[生活杂文] - 2023-05-02 02:19:44

高架桥怎么画简笔画?城市快速高架路的横断面要怎么画?

本篇文章给大家谈谈高架桥怎么画,以及高架桥怎么画简笔画对应的知识点,希望对各位有所帮助,不要忘了收藏本站! 内容导航: 四年级下册美术书第五课壮观的高架桥手工如何做...

[生活杂文] - 2023-08-11 17:26:22

汽车钣金是干嘛的

汽车钣金是一种修复的方法,当车辆发生碰撞存在凹陷的话,就可以使用该方式来修复。钣金修复的价格大约在200至500元,最好去专业的店里,技术不太好的话容易让车身凹凸不平。...

[生活杂文] - 2023-02-17 09:33:00
文章阅读TOP10
猜你喜欢