大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景_慧聪物联网

12月7日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2023（第20届）中国物联网产业大会暨品牌盛会（简称：慧聪物联网品牌盛会），在杭州盛大召开。大会以“智变重构，创引未来”为主题，以智造力量重塑思维，以创新之举引领发展，汇聚物联网产业上下游600+企业代表，特邀10+权威专家，共同探讨中国物联网产业的蓬勃生机。

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

图|大会现场

当前，数字经济蓬勃发展，智能物联产业生长强劲，AI大模型日渐落地，物联网行业正迎来跨越式升级。大会聚焦“AI大模型、AloT、智慧办公、智能家居、机器视觉、智慧零售”等热点话题，分享业界前沿生态成果，以榜样力量凝心聚力，共同探寻智能物联发展变革的新范式。

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

图|浙江大华技术股份有限公司先进技术研究院算法专家王亚运

会上，浙江大华技术股份有限公司先进技术研究院算法专家王亚运发表了《拥抱大模型，创造视觉智能新图景》的主题演讲，主要分享大华股份在大模型和人工智能领域的思考和实践应用。

当前，新一轮科技变革深入发展，行业数字化转型迈入深水区，AI技术的加速突破提升了智能业务行业渗透率和覆盖率，为千行百业的发展注入新力量。

自2015年起，随着深度学习技术突破，算法准确率大幅度提高，不断带动着智能业务占比快速提升，行业数字化和智能化升级开始成为产业发展的普遍需求。以车牌识别为例，算法精度不断提升，识别准确率已经达到99.9%甚至是99.99%，高准确率加速了车牌识别智能业务的规模复制。

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

高精度算法的重大突破，不断丰富着人工智能产业生态，衍生了诸多产业新机。王亚运提到，尽管人工智能在各行各业中拥有巨大的潜力，但仍存在一些挑战：

1、应用场景复杂多样、环境多变，算法精度亟待提升；

2、长尾市场大量碎片化需求，复制性低，开发成本高；

3、从感知、简单认知向复杂认知需求转变；

4、规则配置复杂，智能化水平和可用性有待提升。

不过，随着生成式AI等新兴技术的变革催化，这些挑战开始有望化解。

对此，王亚运肯定的谈到：“随着大模型技术出现，我们将更好的解决行业数智化面临的挑战，带来一些新的机遇。”

尤其在数字中国战略的引领下，数据已经成为生产要素，其中视频数据已经成为最重要的生产要素，人工智能已经成为最重要的生产工具。当前，如何化解人工智能技术面临的瓶颈，深挖数据的潜在价值，助推数字经济发展，这开始成为当代智能物联企业的思考要素。

王亚运表示，在解决行业痛点的探索路径上，大华股份始终走在前列。

据悉，大华通过对人工智能技术研发领域二十余年的探索，构筑了“1+2”的人工智能能力体系，深入超8000个细分场景，为大模型相关算法和工程技术奠定了坚实的基础。

目前，大华星汉大模型是以视觉为核心，融合多模态能力，构建面向行业的大模型，可有效打破行业智能化面临的技术瓶颈，聚焦城市高效治理与企业数智化升级，帮助构建视频数据产业价值，助推数字经济发展。譬如，在工程领域，为了快速满足行业中大量的需求，大华股份通过柔性定制，实现了算法的流水线生产，使得开发效率提升100%。

大模型百花齐放、百家争鸣，但大华星汉大模型在众多大模型中脱颖而出的并不仅仅是落地、交付能力，更多的是从“用户需求”、“行业发展”角度出发的可行性。

王亚运一再强调，我们需要思考，在以视频为核心的智慧物联领域，到底需要一个什么样的大模型？他认为，能用、好用、用得起是首要目标，只有充分结合行业经验的视觉大模型，才是商业落地的成功关键。

为了实现“能用、好用、用得起”，大华不仅持续深耕星汉大模型的视觉解析能力，还在大模型基础上构建行业大脑，不断汇聚行业的新需求，加强大模型的自主学习能力、弹性拓展能力，从产业实践中沉淀行业经验，提炼出通用的计算框架，不断赋能千行百业。

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

据悉，大华星汉大模型以五大核心优势，全面构建好用、用得起的行业大模型，支撑大模型在城市治理和电力行业落地：

1、准确性和泛化性跃升，加速智能市场规模扩增；

在极小目标、多形态目标、模糊图像等各类复杂场景下，大幅提升准确率和场景适配性，效果更稳定可靠，有助于进一步在存量市场增强竞争力，加速大模型多行业、更广泛落地，快速提升市场容量。

2、拥有图文提示定义新功能，高效满足海量碎片化需求；

支撑大模型在城市治理和电力行业落地，无需定制，开发周期大幅缩短，高效满足长尾市场碎片化需求。比如设备漏油检测，过去不同机器、不同漏油类型都需定制开发，现在基于大模型强大的适配能力，通过图像和文本提示，就可以轻松实现漏油检测功能。

王亚运表示，从市场需求侧来看，面对行业大量的碎片化需求，以前需要考量投入产出比、需求颗粒度等要素，最终的落地产品可能只覆盖了20%的需求，现在有了大模型，能够将碎片化需求的覆盖率提升到70%以上。

3、突破视觉认知能力，开拓了智能市场新空间；

大华星汉大模型具备复杂认知的能力，更容易实现更多复杂行为类的认知业务，从感知领域向认知领域开拓，有望在复杂认知的市场打开一个新的增量空间。

王亚运提到，以往的深度学习技术主要聚焦在感知领域，通过感知数据的结构化来识别人、车、物。现在，大华星汉大模型可以支持多目标、多交互、多步骤的复杂行为识别，比如食品掉落捡回、垃圾扫入下水道等复杂行为，实现从感知解析、简单认知升级到复杂认知业务，拓宽了智能市场新空间。

4、全场景自主解析，提升智能化水平和可用性；

自动理解功能和场景，无需规则配置，解决小模型算法配置规则、核验规则繁琐费力的问题，简化智能应用部署，降低落地部署成本，让用户使用更便捷。

在现场，王亚运通过人员涉水的案例举例说明：对于水域监测，如果不根据场景调整，可能无法实时识别涉水事件的发生。以往的使用者要根据不同的潮涨潮落去配置规则参数，人力成本高、效率低。现在有了大模型，无需规则配置，就可以自动识别水域、建筑、天空等全场景要素，自动理解功能和场景，有效提升应用智能化和可用性。

5、大小模型与算力协同，加速商业落地。

王亚运表示，采用超大规模参数的大模型成本比较高昂，我们必须在实际落地的时候解决大模型的成本问题，才能让用户拥有“用得起”的大模型。对此，大华通过算网融合，大小模型协同部署，构建好用和用得起的大模型系统，实现大模型系统算力成本可控，加速商业落地。

在演讲的末尾，王亚运总结：“目前，大模型将人工智能提升到一个全新的高度，对各行各业都产生了深远的影响。我们认为面向未来，创新多模态的行业视觉大模型，能够提升人工智能的核心能力，构建新的数字产业生态，全面推进城市和企业业务的数字化升级。”

AI视觉正迈入“大模型时代”，大华股份结合前期沉淀的实践资源，正以身体力行勾勒出从“观察”到“理解”的视觉智能新图景。

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

相关文章

精彩评论

热点排行

专家看市

向良璧慧聪物联网专家顾问

热门作者

东方

亓

松月

活动推荐

大咖课堂

热门标签

大华股份先进技术研究院算法专家王亚运：拥抱大模型，创造视觉智能新图景

相关文章

精彩评论

热点排行

专家看市

向良璧 慧聪物联网专家顾问

热门作者

东方

亓

松月

活动推荐

大咖课堂

热门标签

向良璧慧聪物联网专家顾问