视觉大模型在SMB安防市场的应用与实践
近几年,国家把数字经济治理,企业信息化提到了一个非常重要的地位,国务院的《“十四五”数字经济发展规划》明确提出数字经济转向深化应用、规范发展、普惠共享的新阶段。随着企业对数字化转型的迫切需求,安防已经从基础的安全监控升级到数字化的运营和管理。传统的安防就是视频监控,只是单纯的视频记录,主要用于事后查证。随着AI的落地,通过深度学习算法能够对视频进行实时处理分析,就能够实现事中的监测和预警。基于图像处理分析,还能够对生产生活中的相关数据、行为做数字化的分析处理,这些数据就可以和企业的管理、经营信息化系统打通,提升管理效率。不同维度的数据积累拉通后,就可以有更全面、更多维度的数据,进入生产经营系统,辅助进行经营决策。
对于大型企业来说,本身有人、有钱、有时间,往往能够很快进行转型,而中小微企业本身资源有限、人力有限,很多时候优先解决生存问题,无法顺利进行转型。本文通过提出了通过引入视觉大模型+SaaS平台技术,使用视觉大模型的泛化能力,实现对长尾需求的快速满足;通过SaaS平台灵活的扩展性与云服务降低前期投入,提升企业经营效率,助力SMB市场进行数智化转型。
一、SMB安防市场的现状及问题
SMB安防市场,我们一般指的是安防项目发生在规模相对较小的企业,此类企业通常在人员数量、财务规模和业务范围上有上限,安防项目的规模在100万以内。这些企业在经济中扮演着重要角色,通常在各种不同行业和领域中活动,业务多聚焦于零售、餐饮、楼宇、园区、工厂、仓储、农林牧渔等场景。
表1:亿欧智库SMB安防客户分析
场景 | 安防监控渗透率 | 单店/厂平均数量 | AI渗透率 | 换新周期 | 需求 |
---|---|---|---|---|---|
零售 | 77% | 10-30个 | 18% | 3年左右 | 人脸识别、火焰/烟雾识别与报警 |
餐饮 | 78% | 10-15个 | 18% | 3-5年 | 人脸识别、火焰/烟雾识别与报警 |
物业管理 | 80% | 50-100个 | 25% | 2-3年 | 人脸识别、高空抛物、电瓶车识别与报警、火焰/烟雾识别与报警 |
酒店 | 67% | 30-50个 | 27% | 5年 | 人脸识别、高空抛物、火焰/烟雾识别与报警 |
工厂与建筑工地 | 85% | 150-200个 | 20% | 2-3年 | 人脸识别、衣着/行为识别、智能抓拍、火焰/烟雾识别与报警 |
仓储 | 86% | 30-50个 | 24% | 3年 | 人脸识别、衣着/行为识别、智能抓拍、火焰/烟雾识别与报警 |
农林牧渔 | - | 50-100个 | - | 2-3年 | 生物状态监测、陌生人识别报警、衣着行为识别、火焰/烟雾识别与报警 |
根据亿欧智库表格1的安防客户分析调研显示,目前SMB安防市场中大多数安防监控的渗透率已经达到70%以上,但是AI的渗透率不高,究其原因,主要是SMB安防市场存在如下几个特点:
1) SMB企业单个体量小,服务成本高
SMB企业所需要的安防规模相对比较小,由于其单个体量小、项目规模小,导致的安防营收小,碎片化分布,无法进行规模化效应降低边际成本,服务成本居高不下。
2) SMB企业预算有限,难以全面进行AI升级
SMB企业本身预算有限,意味着在整个项目中,企业要考虑到多个需求并且做出权衡。目前的AI产品价格都不算太便宜,安防监控是必要投入,但是AI带来的数字化升级的必要性以及实用性一直在收到挑战。
3) SMB企业场景化AI需求多,长尾需求无法得到满足
目前基于深度学习的AI视觉技术,都需要大量的场景数据进行训练,和场景进行挂钩。而SMB市场由于其碎片化特点,每个行业甚至相同行业不同公司所要求的流程、检测内容都不相同,长尾需求过多而预算有限,导致当前场景化AI无法快速落地。
二、视觉大模型促进SMB安防市场数智化
以深度学习为核心的图像检测等相关算法极大的拓展了安防产品的应用范围,在平安城市、雪亮工程等项目中,有大范围的落地应用,引领安防从视频监控到事中监控到智慧运营管理的升级转变,也成为数字城市、孪生城市的重要组成部分。但是原有基于监督学习的深度学习算法,在面对场景数据少,长尾需求多、预算有限的SMB安防市场,却在特定场景中呈现泛化能力不足,精度低,基本无法使用的状态。
360视觉大模型是基于360搜索超过10亿组互联网图文数据进行清洗训练,融合了千亿参数的360智脑-大语言模型进行训练,在通过360安防百万级安防数据进行微调的360视觉大模型,很好的弥补了传统算法的局限。进一步将原有图像相关算法从感知提升到认知,能够重塑安防的应用生态,进一步拓展落地场景,提升整体的智能化水平。是今年来安防行业技术发展的一次重大技术突破。目前360视觉大模型,通过如下能力促进SMB安防市场数智化转型。
1) 通过图像描述能力,过滤无用信息
当涉及传统深度学习算法生成图像标题时,常常出现一个明显的限制:它们倾向于产生单一而缺乏深度的描述。这种现象导致了标题的信息贫乏,难以真实地反映图像中的多样细节和关键信息。这在安防领域尤为显著,因为传统方法无法有效地捕捉复杂场景中的多重变化。然而借助于视觉大模型,我们得以实现更高层次的图像理解与语言生成的融合,从而生成更为丰富有意义的标题。通过视觉大模型,使得安防监控系统更具智能化,更能够以生动方式传达事件发展情况,从而为安防领域的进步带来了新的可能性。
2) 通过图文跨模态检索,梳理企业SOP流程
借助先进的大模型跨模态检索功能,SMB安防行业在数字化转型中取得了显著的进展。通过明确定义巡检SOP流程模板,系统能够迅速将图像、文本等不同模态的信息进行匹配,从而实现高效的店铺巡检。这一创新不仅在大大降低人工成本的同时,也加速了企业的数字化和信息化转型。通过每天将摄像机的定时事件与预设模板进行对比,识别异常情况并生成报告。跨模态检索技术的引入不仅提高了巡检的准确性和效率,还为企业提供了更好的数据支持,以优化运营和决策。
3)通过开放目标检测,突破传统算法数据局限
借助大模型的开放目标检测功能,我们能够克服传统监督学习算法在AI场景中遇到的挑战。传统方法通常需要庞大的数据集进行训练,但在长尾AI场景中,数据量有限,模型泛化能力不足,精度受到限制。通过大规模预训练,我们能够从大量标记和未标记的数据中获取知识,将其融入大模型的参数中,再通过微调适应特定任务,极大提升了模型的泛化性能。随着数据和模型规模的扩大,模型精度也逐步提升。实验证明,模型和数据规模的增加能够突破现有精度的限制。大模型还具备自监督学习的特性,通过自监督学习和下游微调相结合,降低了训练和研发成本。预训练大模型后,通过下游任务的微调,能够快速将模型应用于垂直领域。
三、通过360视觉云SaaS平台支撑场景化AI落地
360视觉云平台是基于已有的PaaS层和C端平台,面向中小B使用与二次开发集成场景进行场景化定制封装的SaaS与aPaaS平台。采用B端、C端一体化架构设计,底层复用360过去八年来在安防领域的沉淀和技术积累,统一接入360生活物联网平台。通过一键导入设备,即可使用视觉云平台,进行更灵活的进行设备、人员、权限管理,根据场景对AI技能进行订阅。
1)以AI为核心,提供面向SMB安防细分场景的AI服务
我们AI技术与特定场景紧密结合,为中小型企业(SMB)提供了精准的AI解决方案。通过先进的AILAB技术架构,提供AI算法商城,我们实现了云、边缘和端的高效融合,以满足企业在安防领域快速迭代升级的需求。
通过在端侧进行初步检测,然后在云端进行进一步的验证,我们在实时性和精度之间的做到了很好的平衡。比如我们可以在端侧进行最基础的移动侦测检测,降低数据量,再通过云端算法对场景进行识别,进行车辆、火焰、人员、动物的检测。为了进一步提升算法的可用性,可以结合视觉大模型的泛化能力,将未标记的的数据进行识别标记。不同于传统的定制开发,我们为企业提供了一站式的选择,无需从头开始,便可获得适应其需求的AI算法。
2)大小模型协同,数据融合提供最适合的场景算法
在实际的场景中,大型和小型模型并非相互替代,而是相互协同的关系。大型模型具备强大的泛化能力,能够处理多任务和多模态情况,达到高精度的上限。然而,其训练和推理成本较高,实时性较差。相比之下,小型模型虽然精度受限,只能应对特定任务,通用性不强,但实时性却相对较强,且能够节省宽带等成本。
为了充分发挥两种模型的优势,我们采取数据融合策略,以提供最适合特定场景的算法。在这种协同模式下,小模型不仅作为样本价值的判断依据,还能帮助大型模型实现更快的学习。同时,小模型可以充当“教师”,协助大型模型迅速收敛,运用知识蒸馏等技术,将大模型的能力迅速传递给小模型。借此机制,小模型能够迅速生成和标记样本,从而提高效率。通过充分结合大型和小型模型的优势,不仅提升了算法的性能,还实现了模型之间的有效合作。
3) AI增值服务按需订阅,SMB企业订阅更灵活
目前国内主流的互联网服务的免费比例逐步发生调整,以视频网站、音乐软件、工具类服务为代表的一系列产品,均有成熟的增值订阅服务,用户对这种商业模式的认可比例逐年提升,已有一定的用户认知基础。在中小微企业领域,企业更愿意基于自身的明确需求,订阅对应的SaaS服务,这种一次性投入成本低,使用简单、灵活的模式,未来会逐渐成为中小微企业的主流方式,基于SaaS的增值服务订阅模式,在中小微企业客户群体中更加有市场基础。
通过人工智能技术与云端增值服务巧妙结合,结合前沿的AI算法和安防硬件,我们解决了中小微企业的一些数字化需求,为其实现数字化转型提供了有力支持。这一创新性模式旨在满足企业的实际需求,推动中小微企业更加智能地发展,以适应不断变化的商业环境。
四、综述
SMB市场的多样性和碎片化场景使得AI需求变得长尾化,传统模型面临难以迅速解决问题的挑战。为了满足这一需求,360视觉云通过将大小模型的数据结合起来,提高模型的适应性和精度。通过SaaS服务的形式,为企业提供了按需订阅的灵活性,使其能够根据实际需求选择合适的解决方案,避免不必要的资源浪费。这种结合大小模型的策略以及SaaS订阅模式,不仅提供了更好的场景化AI服务,还促进了SMB安防市场的数字化转型,使其更加智能、高效。