机器视觉与工业融合,难在哪了?

在计算机视觉领域中,商汤、旷视、云从、依图可以说是当之无愧的头部企业,更是被业内称为CV(ComputerVision)四小龙。值得关注的是,商汤和云从两家上市公司都经历了上市即巅峰,随即股价下跌的剧情。资本市场表现不佳,深陷裁员等传闻,不禁让人好奇:当风口退去,他们准备好面对资本市场最严格的审视了吗?

研发成本高、盈利难:

目前业内将亏损的主要原因归咎于研发,从招股书显示,商汤科技2018-2021年上半年,累计亏损242.72亿元,调整后累计亏损为28.6亿元。商汤科技在研发上十分大手笔。2018-2021年上半年,商汤科技三年半合计研发支出达69.91亿元。

云从科技的招股书中也可以看到,2019年-2021年,云从科技三年累计亏损高达23.21亿元。造成亏损的一大原因是高额的研发投入占了营收大半,2019年至2021年,云从三年累计研发投入占营收的占比为59.39%。

AI的应用场景中非常分散和碎片化,客户的每一个新场景都需要企业长期堆人头、消耗大量的研发与交付资源。无论是云从还是商汤,持续增加的研发投入,却换来长期亏损,这成为笼罩在AI企业头顶之上的乌云。

商业化落地难:

翻阅商汤科技公布的2022年上半年财报显示,公司新增2136项专利,专利资产总数达12502个,在全球顶级计算机视觉会议上发表了71篇论文。可商业并非学术。如何将技术规模化落地到场景中去,并实现商业化变现,对于不少计算机视觉企业来说也是一个难点。

无论是盈利模式还是应用落地,在CV领域外,四小龙的AI之路仍充满着艰难。

计算机视觉与工业界GAP有多大?

从人脸识别到工业智造,计算机视觉目前已跨越了安防、金融、零售、互联网、半导体、汽车等不同垂直行业。

随着数字化转型需求的提升,越来越多的工业企业开始应用视觉技术替代人工进行工况检测、成品检验、质量控制。“四小龙”在应用场景的落地上虽然都以比较成熟的安防和金融为主,但查看几家企业的网站发现,已有一些企业开始在工业领域涉足。

例如,旷视推出的河图就是面向供应链物联网打造的“机器人物联网操作系统”,重点关注“仓储、物流、制造和供应链”等行业场景。商汤科技在工业质量控制方面更是已有案例,提供了基于SenseCore 商汤AI大装置打造的光机电软算一体化的深泉工业质检推训平台解决方案。

碎片化场景难以深入

新市场、新赛道的拓展并不容易。对于计算机视觉企业来说,想要进入工业市场,质检、巡检是主要应用场景,但对于工业企业来说,计算机视觉只是繁杂工艺中的一环,要嵌入完整的生产线上,必然会遇到与其他环节合作的挑战,甚至与工业本身的相互磨合。

一个个“大而全”的解决方案,看似可以破解一切难题,但往往会被现实场景进一步削弱。因此,机器视觉在工业领域的应用需要找到非常有吸引力的差异化场景。

在我们与工业用户的接触中,很多用于都有意愿尝试通过AI机器视觉来解决工业检测中的问题,但是客户对技术的成熟度并无概念。视觉算法企业在面对千奇百怪的工业应用场景时,也很难保证用户可以在一定成本内达到预期效果。

比如在汽车、3C、制药等行业,他们的共同特点都连续大批量生产、对外观质量的要求非常高,但三个行业的被测物一致性、对视觉系统的分辨率、对检测速度的要求来讲,都是不尽相同的。

细分到不同的工艺环节,都会造成机器视觉系统所需的机理模型不同。以冶金钢卷生产缺陷检测为例,钢卷分为冷轧、热轧,都可以采用机器视觉技术进行质检,但算法要解决的机理问题却又是完全不一样。一个企业、一个场景,尚无法做到模型的通用化,而一对一模型的定制开发,又会导致落地成本和实施周期的增加。

从若干客户的各种具体应用场景中对解决方案进行总结研发,提炼出在一定应用场景下相对普适性的解决方案,并设计有效的机器视觉解决方案,需要大量的行业应用经验积累。

因此,想在工业场景中拓展智能化应用,光有算法实力是不行的,还必须具备相当深刻的行业知识。对于工业领域来说,不一定需要多复杂的算法,而是更多地受到其他现实因素的影响。他们更注重丰富的行业应用经验,算法应力求简单实用,稳定性强。

成熟算法已有

一般来说,掌握底层软件算法的公司更容易形成自身优势。但在工业领域,成熟的视觉算法软件已经有很多,包括vision pro、halcon、opevCV、mil、hexsight、evision、avl等。例如,非常成熟的检测算法Halcon,经过长期的积累和迭代,不仅非常稳定而且计算量小,还不用标注数据和调参。

在算法侧重上,工业视觉的算法往往侧重于精确度的提高;而计算机视觉的算法难度相对较高,侧重于或采用数学逻辑或采用深度学习方法进行物体的标定与识别。

有系统服务商曾表示,在开发解决方案的时候选择了某品牌的相机,相机设备自带一个面向工业视觉的算法库,买回去之后可以直接开发出更具针对性的产品,部署的时候再买一个品牌的加密狗就可以了,完全没有必要再去单独购买一套纯算法。既然已经有了这么多可供选择的算法,工业企业也就完全没有必要再去选择纯算法公司的产品。

缺乏样本数据

软件是机器视觉产业的核心中枢,其背后的本质是数据的积累和算法的迭代。在视觉算法层面,一个最简单的思路是针对特殊场景收集大量数据去训练模型。

在工业场景中,数据的收集存在一定问题,样本数据量往往不足以支持基于深度学习的计算机视觉检测任务。一般来说,不合格缺陷产品的数量远远少于合格品,随机获取的数据将存在样本分布不平衡的问题。而且,工业现场的拍摄环境复杂无法保证,容易造成样本图像的质量不一,从而影响后续检测效果。

机器视觉领域看似繁荣,但是真正落地仍然面临很多问题。除了软件算法层面的问题,光源的稳定性、工件位置的稳定性、工件表面质量的稳定性、工件本身的一致性、工件材质、物体的运动速度、光学系统的精度等都是影响视觉技术在工业领域落地的难点。这需要光学,深度学习、传统图像算法、机械设备、传感器等多方面融合。

对于工业用户来说,合适的硬件及易用的软件算法固然十分重要,但更重要的是提供软硬件方案的机器视觉厂商可以根据他们的应用需要和使用场景进行可行性分析,并给出真正适合的解决方案。