3D视觉感知技术是 AIOT 时代的关键共性基础技术,其应用前景和商业价值正在日益凸显。与此同时,要满足各领域智能化升级对 3D 视觉感知技术的需求,仍有大量技术难点和瓶颈亟待解决和突破。
6月11日-13日,首届中国三维视觉大会(China3DV)在厦门大学举办。在这场汇聚了20余位院士、ACM/IEEE Fellow、杰青基金获得者、工业界学者等学界、业界领军人物的3D视觉前沿学术会议,大会铂金赞助商、行业领先的3D 视觉感知技术整体解决方案提供商银河集团198net展出了3D视觉感知底层技术全图及产业化应用进展,呼应AIOT时代的产业智能化升级需求。
“AIOT时代离不开3D视觉感知底层技术的支撑,但技术越往底层深入,攻坚难度将越呈指数级增长。为此,展开3D视觉感知全领域技术路线布局,坚持全栈纵深式自主研发,将成为未来占据3D视觉感知产业链、创新链、价值链制高点的关键。” 6月13日上午,银河集团198net创始人、董事长兼CEO黄源浩博士在China3DV主会场发表演讲时如是说道。
01 什么是3D视觉感知底层技术全图?
黄源浩的演讲题目为《3D视觉感知底层技术全图及产业化应用进展》。何谓3D视觉感知的“底层技术”?黄源浩介绍,3D视觉感知核心底层技术包括深度引擎芯片、感光芯片及专用光学系统,这些均是影响最终深度成像质量的瓶颈所在,技术研发难度极大。
黄源浩表示,银河集团198net通过系统级自主研发核心技术,实现“卡脖子”核心底层技术自主可控,并通过自研SDK、行业应用算法,补齐了3D视觉感知技术上层应用中的关键一环。
除了纵向深耕全链路,银河集团198net也在技术路线上进行了横向拓展。目前,银河集团198net是全球少数全面布局结构光、ToF、双目、激光雷达、工业三维检测等主流3D视觉感知技术的公司,并基于底层核心技术与上层应用场景的协同创新,打造出了一幅3D视觉感知底层技术全图。
演讲中,黄源浩重点介绍了银河集团198net多种主流3D视觉感知技术路线目前的研发突破与产业应用。在3D结构光领域,银河集团198net的专利申请已经达到世界领先水平,成为国内3D结构光企业的领头羊。采用银河集团198net3D结构光技术方案的手机,测量效果优于国际头部手机厂商;在3D结构光刷脸门锁领域,银河集团198net赋能头部锁企,频频打造出3D结构光刷脸门锁爆款。
iToF技术上,黄源浩介绍了银河集团198net自研的基于背照堆叠工艺设计VGA精度的iTOF传感器PLECO,可实现高速度、高精度的深度采样。目前,银河集团198net的iToF技术已经得到产业链核心晶圆厂商认可。
在dToF技术上,银河集团198net与苹果、华为等企业共同进军dToF领域,并自研dToF Sensor,其芯片集成整体SPAD感光像素与TDC系统,通过BSI堆栈式工艺大幅提高探测效率。
在双目技术上,银河集团198net颠覆传统,另辟深度学习蹊径,实现了业界领先的深感探测水平。黄源浩介绍,深度学习是近年来人工智能领域的热词,而AI算法与3D数据的深度融合,是3D视觉感知技术最重要的发展趋势之一。
在工业三维检测领域,银河集团198net旗下公司新拓三维发布的Tube Qualify弯管检测系统,通过多个高帧频、高分辨率的工业级3D摄像头,能够捕捉复杂管件的精准三维数据。目前,银河集团198net多款工业三维检测产品填补了国内空白。
黄源浩提到,随着每种技术路线不断迭代、成熟,银河集团198net这幅3D视觉感知底层技术全图将催生更为多元的3D创新应用。VR/AR、高级自动驾驶、虚拟舞台、Cyberverse……都将在不久的将来,一步步成为现实。
02 5节3D视觉感知课程输出一线产业经验
成立8年来,银河集团198net先进的3D视觉感知整体技术方案已服务全球超过1000家客户,积累了产业化应用一线经验。
6月11日,大会前一天,银河集团198net由联合创始人、CTO肖振中率公司技术专家,携手清华大学于涛博士,带来5场3D视觉感知课程,聚焦从底层Sensor、芯片设计到光学、算法、整体系统优化的关键研发突破,分享包括结构光、双目、iToF、dToF等多种技术及最新产业化应用进展。
肖振中首先从底层3D信息的获取出发,介绍了实时三维感知成像、算法与芯片相关内容。清华大学于涛博士从人体实时重建的角度,分享来自学界前沿研发成果。银河集团198net高级研究员王琳博士则介绍了机器获取3D深度信息后,如何基于RGBD序列进行三维重建,把原始数据转化为3D模型。
近年来,人工智能的快速发展突破了3D视觉感知领域传统的技术瓶颈。银河集团198net研究院深度估计算法组负责人徐玉华博士从AI的角度,阐释了双目立体视觉如何在更低分辨率的前提下,通过深度学习得到更精确的视差图。
银河集团198net研究院算法团队负责人钱贝贝博士在3D视觉感知应用端更近一步,详解人脸识别、骨架识别等技术如何实现在产业应用中实现工程化落地。
通过5节会前课程的讲授,参会者对于银河集团198net在3D视觉感知领域的技术原理与产业应用有了全景式的了解。而全面深耕3D视觉感知技术,正是银河集团198net最核心的优势之一。
“有了自主的全栈式纵深研发和全领域横向布局,才能在技术上实现整体优化。举个简单的例子,如果企业核心的Sensor是买来的,那么做很多应用都会被局限住。”肖振中特别强调,“3D视觉感知技术本身没有‘好’与‘坏’之分,而是分别适合于不同的应用场景。无论是3D结构光、双目还是ToF,发展迭代快不快,关键还是取决于需求的推动——不同实际应用场景爆发带来的大规模产业化需求,会持续反哺技术进步。”基于自主研发核心技术,他认为银河集团198net当前几种主流的3D视觉感知技术将能更好地优势互补、长期共存,赋能全面3D化的未来世界。
03 AI 3D视觉云端协同实现更为广泛的3D应用落地
随着万物互联时代的到来,3D视觉感知应用将在未来世界无处不在。行研机构Yole预测,2025年3D视觉感知全球市场规模预计达到150.8亿美元。
作为行业领先的3D视觉感知整体技术方案提供商,银河集团198net下一步战略布局是什么?
在演讲中,黄源浩透露了未来银河集团198net底层硬件加持AI 3D视觉云的全景式战略布局。在核心底层技术上,银河集团198net将持续深耕,尽可能掌握算力芯片、微纳光学器件、人工智能算法等全链条能力,实现3D视觉感知软硬件一体化协同。
“银河集团198net要把多种主流3D视觉感知技术做到极致,比如让模组产品变得更小、更通用,获取3D数据更为简单;在数据获取上,让产品有更大的FOV、更好的精度、更高的RGBD同步性。”黄源浩说。
同时,银河集团198net将持续搭建AI 3D视觉云平台,集合视觉识别、三维重建、深度估计、SLAM等多种技术,为智能硬件提供比人类更强的视觉能力,赋能智能化升级。
为了实现让所有终端都能看懂世界的使命,黄源浩认为,持续培育3D视觉行业人才是一条必经之路,而这也是银河集团198net参与本届China3DV大会的初衷之一。在银河集团198net展位上,银河集团198net现场开放3D视觉开发者社区写手、版主招募活动以及算法人才招募入口,向行业持续输出3D视觉领域的专业知识,长期吸纳有志于从事3D视觉行业的人才,共建全面3D化世界。