【世界快播报】13 层网络拿下 83% 精度,华为诺亚新型神经网络架构 VanillaNet「简约」到极致
2023-05-27 11:21:32来源:ZAKER科技
机器之心专栏
【资料图】
机器之心编辑部
深度学习模型架构越复杂越好吗?
自过去的几十年里,人工神经网络取得了显著的进展,这归功于一种理念:增加网络的复杂度可以提高性能。从 AlexNet 引爆了深度学习在计算机视觉的热潮后,研究者们为了提升深度网络的性能,精心地设计出了各种各样的模块,包括 ResNet 中的残差,ViT 中的注意力机制等。然而,尽管深层的复杂神经网络可以取得很好的性能,但他们在实际应用中的推理速度往往会受到这些复杂操作的影响而变慢。
来自华为诺亚、悉尼大学的研究者们提出了一种极简的神经网络模型 VanillaNet,以极简主义的设计为理念,网络中仅仅包含最简单的卷积计算,去掉了残差和注意力模块,在计算机视觉中的各种任务上都取得了不俗的效果。13 层的 VanillaNet 模型在 ImageNet 上就可以达到 83% 的精度,挑战了深度学习模型中复杂设计的必要性。
论文地址:https://arxiv.org/abs/2305.12972代码地址:https://github.com/huawei-noah/VanillaNet
极简网络的架构设计
图 1. 6 层的 VanillaNet 结构示意图图 1 展示了 6 层的 VanillaNet 的结构,它的结构十分简洁,由 5 个卷积层,5 个池化层,一个全连接层和 5 个激活函数构成,结构的设计遵循 AlexNet 和 VGG 等传统深度网络的常用方案:分辨率逐渐缩小,而通道数逐渐增大,不包含残差,自注意力等计算。
然而,如此简单的神经网络结构真的可以达到 SOTA 的精度吗?从过往的经验来看,AlexNet 和 VGG 等网络由于难以训练,精度低等特性早已被抛弃。而如何提升这类网络的精度,是一个需要解决的难关。
极简网络的训练方案
作者认为,VanillaNet 的瓶颈主要在于由于其层数少带来的非线性差的问题,作者基于此观点,首先提出了深度训练策略来解决这一问题。
针对 VanillaNet 中的一个卷积层,深度训练策略提出将其拆分为两个卷积层,从而增加其非线性,然而,将一层拆分成两层会显著增加网络的计算量和复杂度,因此,作者提出只需在训练时增加网络层数,在推理时将其融合即可。具体来说,被拆分为两层的卷积会使用如下的激活函数:
是由一个传统非线性激活函数(如 ReLU 等)和恒等映射加权得到。在网络训练的初始阶段,非线性激活函数会占主导地位,使得网络在开始训练时具有较高的非线性,在网络训练的过程中,恒等映射的权值会逐渐提升,此时该激活函数会逐渐变为线性的恒等映射,通过以下公式简单推导:
不具有非线性激活的两个卷积层就可以被融合为一层,从而达到了 " 深层训练,浅层推理 " 的效果。
此外,作者还提出了一种基于级数启发的激活函数,来进一步增加网络非线性,具体的,假设为任意现有的非线性激活函数,级数激活函数通过对激活函数进行偏置和加权,得到多个激活函数的叠加,从而使得单个激活函数具有更强的非线性:
作者对这一形式又进行了改进,使得该激活函数可以学习到全局信息而非单个输入点的信息:作者认为,可以通过提出这两个改进方案,增加网络的非线性,从而使得极简网络也具有媲美甚至超越复杂网络的精度。极简网络的威力
为了证明 VanillaNet 的有效性,作者在计算机视觉的三大主流任务:图像分类、检测和分割上进行了实验。
作者首先验证了提出的深度训练方案和级数激活函数的有效性:
表 1 极简网络在图像分类的性能从上表中可以看到,所提出的两个方案可以大幅提升 VanillaNet 的精度,在 ImageNet 上有数十个点的提升,此外,作者还在 AlexNet 这种传统网络上也进行了实验,效果提升依旧十分惊艳,这证明了简单的网络设计只要通过精心的设计和训练,仍然具有强大的威力。而对于 ResNet50 这类复杂网络来说,本文提出的设计方案收效甚微,说明这类方案对于简单的网络更为有效。
表 2 极简网络在图像分类的性能残差模块在 VanillaNet 这种简单的网络中是否还奏效?作者同样针对这一问题进行了实验,实验表明,不管是采用 ResNet 本身的残差方案还是改进后的 PreAct-ResNet 残差方案,对于 VanillaNet 来说都没有提升,这是否说明了残差网络不是深度学习的唯一选择?这值得后续研究者们的思考。作者的解释是由于 VanillaNet 的深度较少,其主要瓶颈在于非线性而非残差,残差反而可能会损害网络的非线性。
接下来,作者对比了 VanillaNet 和各类经过复杂设计的网络在 ImageNet 分类任务上的精度。
表 3 极简网络在图像分类的性能可以看到,所提出的 VanillaNet 具有十分惊艳的速度和精度指标,例如 VanillaNet-9 仅仅使用 9 层,就在 ImageNet 上达到了接近 80% 的精度,和同精度的 ResNet-50 相比,速度提升一倍以上(2.91ms v.s. 7.64ms),而 13 层的 VanillaNet 已经可以达到 83% 的 Top-1 准确率,和相同精度的 Swin-S 网络相比速度快 1 倍以上。尽管 VanillaNet 的参数量和计算量都远高于复杂网络,但由于其极简设计带来的优势,速度反而更快。
图 2 极简网络在图像分类的性能图 2 更直观的展示了 VanillaNet 的威力,通过使用极少的层数,在 batch size 设置为 1 的情况下,VanillaNet 可以达到 SOTA 的精度和速度曲线。
表 4 极简网络在检测和分割任务的性能为了进一步显示 VanillaNet 在不同任务的能力,作者同样在检测和分割模型上进行了实验,实验表明,在下游任务上,VanillaNet 也可以在同精度下具有更好的 FPS,证明了 VanillaNet 在计算机视觉中的潜力。
总结来说,VanillaNet 是一种十分简洁但强大的计算机视觉网络架构,使用简单的卷积架构就可以达到 SOTA 的性能。自从 Transformer 被引入视觉领域后,注意力机制被认为是十分重要且有效的结构设计,然而 ConvNeXt 通过更好的性能重振了卷积网络的信心。那么,VanillaNet 是否可以引发无残差网络、浅层网络等设计 " 文艺复兴 " 的浪潮?让我们拭目以待。
THE END
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
-
【世界快播报】13 层网络拿下 83% 精度,华为诺亚新型神经网络架构 VanillaNet「简约」到极致
机器之心专栏机器之心编辑部深度学习模型架构越复杂越好吗?自过去的几十年里,人工神经网络取得了显著的进
2023-05-27 -
天天消息!Faraday Future 宣布 FF 91 成功通过 FMVSS 碰撞测试 第一阶段交付将于 5 月 31 日开始
品玩5月26日讯,据法拉第未来官方消息,FF91电动汽车成功通过了美国联邦机动车安全标准(FMVSS)的碰撞测试
2023-05-27 -
天天消息!A16z 精心整理的最全 AI 学习资料(全文中译 + 链接)
硅谷以善于研究和喜爱分享著称的投资机构A16z(AndreessenHorowitz)最近发布了一份经过详细筛选并配有简介
2023-05-27
相关阅读
-
【世界快播报】13 层网络拿下 83% 精度,华为诺亚新型神经网络架构 VanillaNet「简约」到极致
机器之心专栏机器之心编辑部深度学习模型架构越复杂越好吗?自过去的几十年里,人工神经网络取得了显著的进
-
苹果 7 月关闭“我的照片流”服务
钛媒体App5月27日消息,苹果宣布将于7月26日关闭我的照片流(MyPhotoStream)服务,建议现有用户尽快迁移到
-
基辛格 100 岁了,但现在的美国似乎不再需要他
5月27日,当今世界最具传奇色彩的外交家基辛格,迎来了自己100岁的生日。撇开政治立场,看他100年的人生经
-
网信办“清朗”专项行动:处置违规账号92.76万余个_当前快报
据“网信中国”消息,按照“清朗·从严整治‘自媒体’乱象”专项行动要求,3月10日以来,各级网信部门积...
-
巨星传奇上市,周杰伦卖咖啡三年赚7个亿
据北京商报报道,周杰伦巡演火热开唱期间,与其深度绑定的巨星传奇集团有限公司通过港交所上市聆讯,在
-
天天消息!Faraday Future 宣布 FF 91 成功通过 FMVSS 碰撞测试 第一阶段交付将于 5 月 31 日开始
品玩5月26日讯,据法拉第未来官方消息,FF91电动汽车成功通过了美国联邦机动车安全标准(FMVSS)的碰撞测试
-
【新要闻】Great Wall Motor Accuses Rival BYD of Failing on Hybrid Emissions
GreatWallMotorAccusesRivalBYDofFailingonHybridEmissions,with,sold,wall,share,sales,motor
-
天天消息!A16z 精心整理的最全 AI 学习资料(全文中译 + 链接)
硅谷以善于研究和喜爱分享著称的投资机构A16z(AndreessenHorowitz)最近发布了一份经过详细筛选并配有简介
-
我过上了“二手人生”,真是一言难尽!一言难尽! 全球讯息
本周六我们的心理学入门小学堂将进入第一章——精神分析流派,这次直播主讲弗洛伊德的人生故事。弗洛伊...
-
环球热推荐:AI+ 广告营销望成流量争夺重要抓手!受益上市公司梳理
财联社5月27日讯(编辑若宇)谷歌于美东时间周二推出了一款人工智能(AI)工具,能够帮助营销人员创建广告,
-
西藏林芝森林消防开展30公里徒步行军训练-全球快播报
为弘扬森林消防救援队伍吃苦耐劳的优良作风,练就高效、专业精准的过硬本领,5月25日,西藏自治区森林消防
-
日喀则博物馆开馆 头条
近日,投资2400万元的日喀则博物馆正式开馆。
-
【世界新视野】西藏今年计划实施乡村振兴项目1139个
近年来,西藏农牧区面貌得到极大改善,人居环境整治工作有序推进,95%的乡镇和78%的建制村通了硬化路,农牧
-
世界微头条丨非标业务估值核算 非标业务
今天来聊聊关于非标业务估值核算,非标业务的文章,现在就为大家来简单介绍下非标业务估值核算,非标业务,
-
142亿全归女方,A股又现天价离婚案!70后女博士牢握控制权,创业踏准光刻胶 观天下
5月25日,光刻胶上市公司彤程新材(603650 SH)紧急连发三条公告,宣告公司实控人夫妇经法院调解后离婚,并
-
*ST庞大被证监会立案调查 全球微动态
5月26日,*ST庞大发布公告称,公司收到证监会下发的《中国证券监督管理委员会立案告知书》。因公司涉嫌
-
百果园被曝不收顾客一元纸币,店家:没说不收,只是兑换麻烦让她换一张
据时间视频,5月25日,网曝百果园上海新村路2店不收1元纸币。网传视频中,女子称店家不收1元纸币,店员
-
2023年全国“奔跑吧·少年”儿童青少年主题健身活动内蒙古主会场活动即将启幕_每日看点
活动彩排。5月26日下午,在包头奥林匹克体育中心的排练场上,伴着稚嫩的童声、矫健的步伐,一群活力四射的
-
热门:我市全力做好青年就业创业工作
拓宽就业渠道提供周到服务精准匹配供需我市全力做好青年就业创业工作今年以来,市人社局以开展春风就业行动
-
爱心送考专项服务启动
图为参加爱心送考专项服务的交警。记者安吉斯摄在2023年高考即将来临之际,5月25日下午,由市总工会、市公
-
全国首个家校社协同育人研究与实践基地在我市建立 全球今热点
5月25日,中国青少年研究会家校社协同育人研究与实践基地揭牌仪式暨培训大会在北重三中举行。中国青少年研
-
包头市全民健身发展研究中心在包头师范学院挂牌成立
5月25日,内蒙古自治区首家地方政府和高校共建的全民健身发展研究中心——包头市全民健身发展研究中心在...
-
全球百事通!我国科研团队揭示人脑杏仁核-海马神经环路工作机制
我国科研团队揭示了人脑杏仁核-海马神经环路在工作记忆编码和维持阶段的功能分工和协同模式,为深入理解工
-
西藏启动电力便民服务体系示范点建设工作-焦点报道
近日,国网类乌齐县供电公司与类乌齐县滨达村正式签订“村网共建”协议,标志着西藏正式启动电力便民服...
-
走向珠峰丨行动——走向那座湖|天天观速讯
近日,2023年珠穆朗玛峰极高海拔地区综合科学考察研究活动在西藏珠峰地区启动。
-
世界动态:2023年珠峰科考登顶队员凯旋
5月25日傍晚,在圆满完成海拔8830米自动气象站维护升级、登顶珠峰采集雪冰样品等科考任务后,9名科考登顶队
-
环球速看:哈铁开行今年首趟“龙藏号”旅游专列
25日22时46分,满载着486名游客的“龙藏号”旅游专列从哈尔滨东站缓缓驶出,这是中国铁路哈尔滨局集团有...
-
全球超高海拔单机容量最大风电机组成功吊装
记者25日从三峡集团获悉,一台单机容量为3 6兆瓦的风机在西藏自治区山南市措美县哲古镇成功吊装。
-
滚动:全球首艘,正式交付!
该船型是世界首个应用最新规范设计的超大型海工项目,可适用于全球多个海域的油气开发作业,实现了我国浮式
-
让梦想触手可及 全新一代中高端北京数智重卡耀世登场
5月16日,让梦想触手可及北京重卡全球上市发布盛典在北汽重型汽车有限公司隆重举行。来自全国各地的客户...
精彩推荐
阅读排行
精彩推送
- 网红何丹彤称在巴黎被抢劫:劫匪...
- 全区推进县域学前教育普及普惠督...
- “高精尖”科技成果扎堆亮相2023...
- 特斯拉:Model Y 成为第一季度...
- FF:首款量产车 FF 91 已通过碰撞测试
- 通信网如何随 AI 之需而变?
- C919 机票开售,上海虹桥飞成都...
- 所有人免费!著名景区官宣 环球讯息
- 法院判了!特斯拉车顶维权女车主...
- 他们公告离婚!140 亿元股票全...
- 提升中小企业科技创新力 十部门...
- 游戏行业2022年年报盘点:用户见...
- 环球短讯!小米一季度造车支出11...
- 定位为紧凑型车 宝骏云朵将于8月上市
- 蔚来150kWh固态电池包将于7月交...
- 世界新消息丨广汽集团:国六A库存...
- 每日观点:华为申请汽车品牌 AI...
- 特斯拉车顶维权女车主败诉,高通...
- 辨认不出亲人的遗书,他们开始在...
- 华硕推出新款 Radeon RX 7600...
- 关注:和数字尾巴一起聊 WWDC23
- 4月经济恢复不及预期:投资增速...
- 恭喜国乒男单包揽四强,梁靖崑跪...
- 度小满开源国内首个千亿参数金融...
- 赛尔号仙境中的顶尖对决_赛尔号...
- 即时看!宝马325 内饰改装,宝...
- 【环球热闻】深圳坪山区龙田街道...
- 【独家】惠州社保卡未领取注销了...
- 遵化市气象台发布雷电黄色预警【...
- 天天快消息!什么信号?这家小公...