微信
投稿

大华股份先进技术研究院算法专家王亚运:拥抱大模型,创造视觉智能新图景

2023-12-21 18:01 来源:慧聪物联网编辑部作者:松月

12月7日,由慧聪物联网、慧聪安防网、慧聪电子网主办的2023(第20届)中国物联网产业大会暨品牌盛会(简称:慧聪物联网品牌盛会),在杭州盛大召开。大会以“智变重构,创引未来”为主题,以智造力量重塑思维,以创新之举引领发展,汇聚物联网产业上下游600+企业代表,特邀10+权威专家,共同探讨中国物联网产业的蓬勃生机。

大华股份先进技术研究院算法专家王亚运:拥抱大模型,创造视觉智能新图景

图|大会现场


当前,数字经济蓬勃发展,智能物联产业生长强劲,AI大模型日渐落地,物联网行业正迎来跨越式升级。大会聚焦“AI大模型、AloT、智慧办公、智能家居、机器视觉、智慧零售”等热点话题,分享业界前沿生态成果,以榜样力量凝心聚力,共同探寻智能物联发展变革的新范式。

大华股份先进技术研究院算法专家王亚运:拥抱大模型,创造视觉智能新图景

图|浙江大华技术股份有限公司 先进技术研究院算法专家 王亚运


会上,浙江大华技术股份有限公司先进技术研究院算法专家王亚运发表了《拥抱大模型,创造视觉智能新图景》的主题演讲,主要分享大华股份在大模型和人工智能领域的思考和实践应用。


当前,新一轮科技变革深入发展,行业数字化转型迈入深水区,AI技术的加速突破提升了智能业务行业渗透率和覆盖率,为千行百业的发展注入新力量。


自2015年起,随着深度学习技术突破,算法准确率大幅度提高,不断带动着智能业务占比快速提升,行业数字化和智能化升级开始成为产业发展的普遍需求。以车牌识别为例,算法精度不断提升,识别准确率已经达到99.9%甚至是99.99%,高准确率加速了车牌识别智能业务的规模复制。

大华股份先进技术研究院算法专家王亚运:拥抱大模型,创造视觉智能新图景

高精度算法的重大突破,不断丰富着人工智能产业生态,衍生了诸多产业新机。王亚运提到,尽管人工智能在各行各业中拥有巨大的潜力,但仍存在一些挑战:


1、应用场景复杂多样、环境多变,算法精度亟待提升;

2、长尾市场大量碎片化需求,复制性低,开发成本高;

3、从感知、简单认知向复杂认知需求转变;

4、规则配置复杂,智能化水平和可用性有待提升。


不过,随着生成式AI等新兴技术的变革催化,这些挑战开始有望化解。


对此,王亚运肯定的谈到:“随着大模型技术出现,我们将更好的解决行业数智化面临的挑战,带来一些新的机遇。”


尤其在数字中国战略的引领下,数据已经成为生产要素,其中视频数据已经成为最重要的生产要素,人工智能已经成为最重要的生产工具。当前,如何化解人工智能技术面临的瓶颈,深挖数据的潜在价值,助推数字经济发展,这开始成为当代智能物联企业的思考要素。


王亚运表示,在解决行业痛点的探索路径上,大华股份始终走在前列。


据悉,大华通过对人工智能技术研发领域二十余年的探索,构筑了“1+2”的人工智能能力体系,深入超8000个细分场景,为大模型相关算法和工程技术奠定了坚实的基础。


目前,大华星汉大模型是以视觉为核心,融合多模态能力,构建面向行业的大模型,可有效打破行业智能化面临的技术瓶颈,聚焦城市高效治理与企业数智化升级,帮助构建视频数据产业价值,助推数字经济发展。譬如,在工程领域,为了快速满足行业中大量的需求,大华股份通过柔性定制,实现了算法的流水线生产,使得开发效率提升100%。


大模型百花齐放、百家争鸣,但大华星汉大模型在众多大模型中脱颖而出的并不仅仅是落地、交付能力,更多的是从“用户需求”、“行业发展”角度出发的可行性。


王亚运一再强调,我们需要思考,在以视频为核心的智慧物联领域,到底需要一个什么样的大模型?他认为,能用、好用、用得起是首要目标,只有充分结合行业经验的视觉大模型,才是商业落地的成功关键。


为了实现“能用、好用、用得起”,大华不仅持续深耕星汉大模型的视觉解析能力,还在大模型基础上构建行业大脑,不断汇聚行业的新需求,加强大模型的自主学习能力、弹性拓展能力,从产业实践中沉淀行业经验,提炼出通用的计算框架,不断赋能千行百业。

大华股份先进技术研究院算法专家王亚运:拥抱大模型,创造视觉智能新图景

据悉,大华星汉大模型以五大核心优势,全面构建好用、用得起的行业大模型,支撑大模型在城市治理和电力行业落地:


1、准确性和泛化性跃升,加速智能市场规模扩增;


在极小目标、多形态目标、模糊图像等各类复杂场景下,大幅提升准确率和场景适配性,效果更稳定可靠,有助于进一步在存量市场增强竞争力,加速大模型多行业、更广泛落地,快速提升市场容量。


2、拥有图文提示定义新功能,高效满足海量碎片化需求;


支撑大模型在城市治理和电力行业落地,无需定制,开发周期大幅缩短,高效满足长尾市场碎片化需求。比如设备漏油检测,过去不同机器、不同漏油类型都需定制开发,现在基于大模型强大的适配能力,通过图像和文本提示,就可以轻松实现漏油检测功能。


王亚运表示,从市场需求侧来看,面对行业大量的碎片化需求,以前需要考量投入产出比、需求颗粒度等要素,最终的落地产品可能只覆盖了20%的需求,现在有了大模型,能够将碎片化需求的覆盖率提升到70%以上。


3、突破视觉认知能力,开拓了智能市场新空间;


大华星汉大模型具备复杂认知的能力,更容易实现更多复杂行为类的认知业务,从感知领域向认知领域开拓,有望在复杂认知的市场打开一个新的增量空间。


王亚运提到,以往的深度学习技术主要聚焦在感知领域,通过感知数据的结构化来识别人、车、物。现在,大华星汉大模型可以支持多目标、多交互、多步骤的复杂行为识别,比如食品掉落捡回、垃圾扫入下水道等复杂行为,实现从感知解析、简单认知升级到复杂认知业务,拓宽了智能市场新空间。


4、全场景自主解析,提升智能化水平和可用性;


自动理解功能和场景,无需规则配置,解决小模型算法配置规则、核验规则繁琐费力的问题,简化智能应用部署,降低落地部署成本,让用户使用更便捷。


在现场,王亚运通过人员涉水的案例举例说明:对于水域监测,如果不根据场景调整,可能无法实时识别涉水事件的发生。以往的使用者要根据不同的潮涨潮落去配置规则参数,人力成本高、效率低。现在有了大模型,无需规则配置,就可以自动识别水域、建筑、天空等全场景要素,自动理解功能和场景,有效提升应用智能化和可用性。


5、大小模型与算力协同,加速商业落地。


王亚运表示,采用超大规模参数的大模型成本比较高昂,我们必须在实际落地的时候解决大模型的成本问题,才能让用户拥有“用得起”的大模型。对此,大华通过算网融合,大小模型协同部署,构建好用和用得起的大模型系统,实现大模型系统算力成本可控,加速商业落地。


在演讲的末尾,王亚运总结:“目前,大模型将人工智能提升到一个全新的高度,对各行各业都产生了深远的影响。我们认为面向未来,创新多模态的行业视觉大模型,能够提升人工智能的核心能力,构建新的数字产业生态,全面推进城市和企业业务的数字化升级。


AI视觉正迈入“大模型时代”,大华股份结合前期沉淀的实践资源,正以身体力行勾勒出从“观察”到“理解”的视觉智能新图景。

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

精彩评论

暂无评论...
验证码 换一张
取 消

热门作者

东方

简介: 天马行空的文字之旅。

邮箱: liutingting03@hczyw.com

简介: 保持期待,奔赴山海。

邮箱: zhuangjiaxin@hczyw.com

松月

简介: 脚踏实地,仰望星空。

邮箱: wuxiaqing@hczyw.com