近日,在第六届世界互联网大会乌镇峰会上,旷视科技联合创始人兼首席执行官印奇在接受新华社记者采访时说,新一轮互联网科技革命和产业变革加速演进,让从业者深切感受到机遇与挑战并存。印奇表示,旷视始终坚持自主创新,已成为全球为数不多的拥有自主研发深度学习框架的公司之一,将努力帮助中国企业在人工智能时代来临时,成为引领世界的力量。
人民日报、人民网等多家央媒第一时间转载了新华社的这篇报道。那么,这项被新华社、人民日报等重磅媒体点名表扬的具有自主创新精神的核心技术到底是什么。它正是旷视在第六届世界互联网大会上荣获“世界互联网领先科技成果”大奖的自研人工智能算法平台Brain++,以及作为Brain++核心组件之一的深度学习框架MegEngine。
人工智能算法从研发到部署是一套庞大的系统工程,目前业界普遍把深度学习框架作为算法开发工具,但是学习和使用成本高,难以规模化。究其原因,在于只有深度学习框架是不够的,需要拉通从数据到算力再到框架的端到端解决方案,人工智能时代亟需一个满足产业需求的操作系统。
旷视科技联合创始人兼首席技术官唐文斌表示,“为了解决这个问题, 2014年我们开始研发Brain++,它是一套端到端的AI算法平台,目标是让研发人员获得从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进AI快速落地。我们的Brain++还引入了AutoML技术,可以让算法来训练算法,让AI来创造AI。”
旷视原创自研的新一代人工智能算法平台Brain++由三大支柱构成,分别是深度学习框架MegEngine、深度学习云平台MegCompute、深度学习数据平台MegData。
针对框架、算力和数据三个核心要素,旷视Brain++在总体架构上分为三部分,包括深度学习框架MegEngine、深度学习云计算平台MegCompute、以及数据管理平台MegData。具体来讲,旷视的Brain++具备以下独特优势:
针对视觉任务定制化优化。Brain++针对视觉任务做出了定制化的优化,使处理图像与影像更高效。经过优化的Brain++特别适合大量图像及视频训练及完成复杂的视觉任务,如图像分类、物体检测、物体场景分割、影像分析等。
配备AutoML技术。Brain++将深度神经网络设计、参数调整及设备适配等过程自动化,可显著降低人力成本并大幅提高开发效率,帮助AI企业构建出一条不断自我改进、不断变得更加高效的半自动的算法研发产线。
强大的多任务及多用户调度能力。Brain++可智能地调度平台硬件基础设施的计算能力,可以支持数百名研究人员同时在数万个GPU芯片上执行从数百到数千个训练任务,从而显著提高算法训练效率。
目前,旷视全员使用Brain++来训练、部署算法,无需依赖第三方开发的深度学习框架。依托Brain++,旷视斩获22项全球AI竞赛冠军。在行业落地方面,旷视已实现对个人物联网、城市物联网、供应链物联网三大场景的赋能。
2019年8月,科技部宣布依托旷视建设“图像感知国家新一代人工智能开放创新平台”。未来,旷视Brain++将通过开源,推动建立完善的AI产业生态,为打造自主可控的人工智能操作系统奠定坚实的基础。
MegEngine 是 Brain++ 的核心组件,是为开发者和研究人员提供开发的深度学习框架。这一框架主要用于旷视内部进行计算机视觉领域的算法开发工作,包括大规模的人脸识别、图像分割、姿态识别等。
MegEngine 的整体架构
从架构来说,MegEngine 分为四个层,包括计算引擎、运行时管理、编译和优化以及编程和表示。计算引擎以 MegDNN 为核心,发挥计算作用。MegDNN 是一个基于异构架构,有着统一的交互方法的内核,可以根据设备本身启发式地选择最优内核,也可以让用户自己选择最适合的内核进行计算。
在运行时管理层中包括两个模块,分别是内核调度和内存管理和优化两大模块。在内存管理和优化模块中,MegEngine 采用了动态、静态内存分配并存的方式。
在编译层和优化层,MegEngine 使用了基于计算图的编译和优化方法。编程和表示层进行用户交互,能够使用高级编程语言(如 Python)执行用户的命令。
MegEngine 还集成了旷视最新的 AutoML 技术,对深度学习算法的各个关键环节进行自动化的设计、搜索和优化。这项技术以 One-Shot 方法为核心,通过一次训练完成自动化过程,将计算代价减小至传统 AutoML 方法的万分之一,在可控的时间内搜索出高性能、易部署的模型结构。
旷视 AutoML 技术图示
相比于市场上的 AutoML 技术,旷视的 AutoML 技术有以下优势:
计算代价小。传统的 AutoML 技术常常需要多次训练模型甚至会遍历部分模型空间,计算代价巨大。旷视的 AutoML 技术只需训练一次即可得到整个模型空间的刻画,大大减小了计算代价,只是平常训练代价的 1-3 倍。
应用范围广。旷视 AutoML 技术提供了一套完整的解决方案,覆盖了大部分业务,包括活体检测、人脸识别、物体检测、语义分割等。
部署方便。旷视 AutoML 技术涵盖了数据处理、模型训练、模型压缩、模型量化等流程,自动处理从数据到落地。
精度高。旷视 AutoML 技术在诸多视觉任务上,超过人类手工设计,达到了业界最优。
除了支持深度学习框架中所有的基本功能,MegEngine 还有很多高级功能,如支持神经架构搜索、网络剪枝和构建低比特的小型神经网络(基于旷视提出的 DoReFaNet)等。
联系人:杨女士
手 机:0825-2226280
邮 箱:381642652@qq.com
公 司:四川中能合创信息技术有限公司
地 址:四川省遂宁市船山区五彩缤纷路五彩新天地2楼1号