近日,被誉为“ChatGPT之父”的山姆·奥特曼又整活了。
OpenAI在毫无预告的情况下发布了首个文生视频模型Sora,逼真程度瞬间“引爆”市场。
“Sora意味着AGI(通用人工智能)的实现将从十年缩短到两三年。”2月16日当天,360集团创始人、董事长周鸿祎在微博上如是点评。
反观2024年开年以来的AI大模型发展进程,可以说是“热辣滚烫”。
科大讯飞发布星火语音大模型、云从科技发布DataGPT、清华系大模型公司月之暗面完成新一轮超10亿美金融资、亚马逊开发出有史以来最大的文本转语音模型等。
据报道称,OpenAI首席执行官山姆·奥特曼正寻求数十亿美元的资金来建设人工智能芯片工厂网络。
凡此种种,大模型的出现使得AI技术发展迎来巨大飞跃,各家大厂的积极布局和落地接入等一系列的动作无疑将加速AIGC领域的发展。
倘若,2023年是AI图文生成元年,那么2024年的OpenAI或将推动行业进入AI视频生成元年。
01
谈其可能性
你只要给他一句话,就可以直接生成一段视频。
此前Runway、Pika Labs等多家人工智能公司也推出过的文生视频大模型。
图源:智东西视频号
从对比来看,Sora的“惊艳”之处体现在其对物理世界的理解和模拟能力。
众说纷纭中,一方面人们惊艳于AI大模型的无限可能,进一步拓宽应用场景;
另一方面,热传的Sora模型的“bug案例”以及其在应用中带来的安全性问题,也说明Sora应用还有很多问题要解决。
这也几乎可以看作是各类大模型想要“做大做强”必然需要迈过的一道坎。
目前Sora并未对公众全面开放,仅邀请部分测试者进行体验。
行业热议,Sora 只是小试牛刀,其展现的不仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,将带来新的成果和突破。
02
谈其颠覆性
Sora通过采用游戏引擎的方式,实现了从文字到视频的快速、高效生成。该技术路线的彻底改变,使得视频制作变得更加简单、快速和灵活,极大地降低视频制作的门槛和成本,革新视频生成方式。
由Sora生成的视频来看,质量非常高,在视觉效果上逼真、生动,甚至可以与专业制作的视频相媲美。
如此高质量的视频生成能力,为各种应用场景提供了更多的可能性。
许多业内人士认为,Sora的出现将为内容创作、娱乐和教育等行业带来革命性变化,这也引发“Sora是否会替代影视制作从业人员”的讨论和担忧。
亦有短视频行业的从业者强调,Sora作为一种初步生产力工具,预示着效率革命的到来,但不会是简单地颠覆或取代视频行业现有体系。
简而言之,AI始终是工具,没有创意,守着工具也不会使用。
人工智能没训练好的时候大家都觉得是智障,“能教会ChatGPT理解业务”要先教会甲方、产品、老板清晰地理解自己的需求,培养创造力。
因此Sora大模型的出现,能淘汰相关行业从业人员的,或许不是AI工具本身,而是那些掌握了类似Sora等AI工具运用技巧的同行,相关行业的从业者必须进行转型的思考。
正如业内一直说的,“你越专业,AI工具生成的内容才会越专业。”
03
谈其发展路径
从技术实现的角度来看,AIGC、Sora这类技术逐渐进入公众视野,文生图、图生图、文生视频、图生视频等应用已不再是遥不可及的梦想。
随着算法的不断公开和优化,以及计算资源的日益丰富,美国的技术巨头在此领域已展现出出强大的实力。
从国内视角,自ChatGPT发布之后,各个大厂积极投入研发,推出了无数个行业大模型,在B端虽然已有一些成功的案例,但整体上大模型在垂直领域的定制化和实用性还处于发展阶段。
360周鸿祎认为,当前OpenAI手里除了GPT5以外,可能还有一些秘密武器没有练出来。中国和美国的AI差距可能不但没有缩小,反而在加大。
那么,中国的企业如何实现追赶?
正如我国后发追赶,探索出自己的现代化方案,用短短几十年的时间走完了西方两三百年才走完的工业化道路一般。
技术的实现仅是第一步,真正的挑战在于如何将此类技术应用到实际场景中,并转化为具有市场竞争力的产品。
参与者应更多地思考应用和落地后的软硬件问题,发挥我国大厂在规模效应上的优势。通过精细化的市场分析和用户需求洞察,结合技术创新,打造出真正符合市场需求的产品。
宇视科技张鹏国也亮出观点:现阶段技术迭代太快,我国各厂急也没用。一定会依次依序开源,我国各厂不必着急。
在这个过程中,如果美国的技术巨头迟迟不开源相关技术,我国的大厂也不必过于焦虑,持续专注于应用场景的探索和软硬件的研发,通过不断地迭代和优化,提升产品的竞争力。
一旦美国开源了相关技术,我国的大厂也可以迅速跟进,利用自身的市场优势和技术积累,实现技术的快速落地和应用。
对于安防行业来说,Sora 的出现可能促进安防行业与其他领域的融合,如物联网、大数据等,推动新的创新解决方案的发展。然而,也需要注意到一些潜在的挑战和问题。
例如,技术的可靠性和准确性需要进一步验证,对于复杂场景的理解和判断可能存在一定的局限性。
此外,伦理和法律问题也需要关注,确保人工智能技术的应用符合法律和道德规范。
总的来说,Sora 的出现为安防行业带来了新的机遇和发展潜力,安防从业者需要不断适应技术的变化,加强技术研究和创新,以更好地应对未来的行业发展需求。
写在最后
2024年的AI大门,已然由人工智能大模型“文生视频”敲响。得以感知的是,多模态大模型的进一步交叉融合或将成为2024年未来重要的实践方向。
在落地层面,如何从单纯的炫技走向实用,推动其走向市场,需要每个参与者需要平衡和重视的课题。
纵观每一项技术的成熟和应用需要时间的积累和实践的检验,稳扎稳打地推进技术研发和应用落地,才能在激烈的市场竞争中立于不败之地。
精彩评论