科大讯飞分类算法挑战赛2023的一些经验总结

2023-08-08 14:53:51

引言:
ResNet是he kaiming大佬的早年神作,当年直接刷榜各大图像分类任务。ResNet是一种残差网络,咱们可以把它理解为一个子网络,这个子网络经过堆叠可以构成一个很深的网络,而ResNext在其基础上,进行了一定修改完善,通过引入Cardinatity后,模型性能得到了大幅度提升。(下图是经典ResNet残差网络模块结构)
在这里插入图片描述


1. 通用增强网络性能的手段

一般增强一个CNN的表达能力有三种手段:

  • 一是增加网络层次即加深网络(目前CNN已经由最初Alexnet的不到十层增加到了成百上千层,而实际实验结果表明由层次提升而带来的边际准确率增加已是越来越少);

  • 二是增加网络模块宽度(可见我们之前有介绍过的Wide residual network,可宽度的增加必然会带来指数级的参数规模提升,因此它并非为主流CNN设计所认可。);

  • 三是改善CNN网络结构设计(当然在不增加模型复杂度的情况下通过改良模型设计以来提升模型性能是最理想的做法,不过其门槛则实在是太高,不然Google/Facebook/Microsoft的那些埋头设计网络/调参的哥们儿就没办法拿那么高工资了。)

2. ResNet和Resnext比较

ResNeXt的做法可归为上面三种方法的第三种。它引入了新的用于构建CNN网络的模块,而此模块又非像过去看到的Inception module那么复杂,它更是提出了一个cardinatity的概念,用于作为模型复杂度的另外一个度量。Cardinatity指的是一个block中所具有的相同分支的数目。

3. 上述网络在实际比赛的实测

根据科大讯飞几个计算机视觉任务的结果来说,那些EfficientNet、MobileNet这些网络结构对准确率的精度必然是有影响的,根据实测的几个比赛基本精度(准确率)损失在3%-5%左右。ResNext相比于其他ResNet等结构,确实在模型设计上,能够达到更准确的分类精度,至于比ResNext更复杂的经典网络IncepNetv4尚且未能测试,等后续有机会再做测试。每次测试结果为多次超参数测试后的最高值,具体实测的结果如下:

3.1 实测结果

               表1  在科大讯飞AIGC分类挑战赛2023上的实测结果
模型准确率
MobileNetv2_s、MobileNetv2_m95.32%
EfficientNetB1-B595.71%
ResNet3498.15%
ResNext98.53%

3.2 模型集成

在这里,做了一个决策层的融合,找到各个模型差异比较大,存在分歧的结果

import pandas as pd

df1 = pd.read_csv(r"...\kedaxunfei_AI_Fake\ensemble_model\single_results\submit_AI_fake777.csv")
df2 = pd.read_csv(r"...\kedaxunfei_AI_Fake\ensemble_model\single_results\submit_AI_fake888.csv")
df3 = pd.read_csv(r"...\kedaxunfei_AI_Fake\ensemble_model\single_results\submit_AI_fake999_1.csv")

# compare the two DataFrames
df_diff1 = df1.compare(df2)
df_diff2 = df1.compare(df3)
df_diff3 = df2.compare(df3)
# get the indexes of the differences
diff_indexes1 = df_diff1.index
diff_indexes2 = df_diff2.index
diff_indexes3 = df_diff3.index

# obtain 相同部分
equal_parts1 = [x for x, y in zip(list(diff_indexes2), list(diff_indexes1)) if x == y]
equal_parts2 = [x for x, y in zip(list(diff_indexes3), list(diff_indexes1)) if x == y]
equal_parts3 = [x for x, y in zip(list(diff_indexes3), list(diff_indexes2)) if x == y]

print(f"equal_parts1: {equal_parts1};equal_parts2: {equal_parts2};equal_parts3: {equal_parts3}")

结果如下:

equal_parts1: [29, 110, 4009];equal_parts2: [1975];equal_parts3: [1171]
更多推荐

麒麟信安参编的两项云计算团体标准发布!助推云计算产业高质量发展

近日,由中国电子技术标准化研究院主办,全国信标委云计算和分布式平台分委会、全国信标委云计算标准工作组、云计算标准与应用工业和信息化部重点实验室承办的第十二届云计算标准和应用大会在北京举办。本次大会上,麒麟信安起草参编的《信息技术云计算智能云服务用户体验度量模型》《信息技术云计算边缘云协同技术要求》两项团体标准正式发布!

LabVIEW应用开发——前面板和程序框图

上篇我们讲述了LabVIEW的安装并且新建了一个VI程序成功运行,这篇我们详细了解界面上一些工具、属性和层次结构。LabVIEW安装我们双击打开上次创建的.vi文件。这时候我们发现只有前面板,程序框图界面不见了,我们需要使用Ctrl+E或者在Windows-->ShowBlockDiagram选项中把程序框图调出来。而

科技活动类型

声明本文是学习GB-T42776-2023科技评估分类.而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们1范围本文件确立了科技评估的分类原则,描述了分类方法,规定了编码方法、分类与代码。本文件适用于科技评估的规划、设计、委托、组织、实施、管理、研究、培训和信息化等相关活动。2规范性引用文件下列文件中

MYSQL索引——B+树讲解

B-/B+树看MySQL索引结构B-树B-树,这里的B表示balance(平衡的意思),B-树是一种多路自平衡的搜索树.它类似普通的平衡二叉树,不同的一点是B-树允许每个节点有更多的子节点。下图是B-树的简化图.B-树有如下特点:所有键值分布在整颗树中;任何一个关键字出现且只出现在一个结点中;搜索有可能在非叶子结点结束

睿趣科技:抖音开一家网店大概什么时候回本

随着移动互联网的迅猛发展,社交媒体平台如抖音成为了商家推广产品和服务的热门渠道之一。许多人都希望能够通过在抖音上宣传自己的产品,甚至考虑开一家网店,但回本的时间是一个关键问题。本文将探讨抖音开一家网店大概什么时候回本的问题。首先,回本时间的长短与多种因素有关,包括产品的类型、市场竞争、推广策略等。一般来说,如果你的产品

性能测试之压力测试

文章目录一.基本介绍二.性能指标三.下载安装JMeter1.下载安装包2.启动JMeter四.使用JMeter1.模拟用户请求2.填写测试地址3.接收测试结果4.结果解释一.基本介绍压力测试考察当前软硬件条件下系统所能承受的最大负荷并找到系统瓶颈所在。压测是为了系统在线上的处理能力和稳定性维持在一个范围内。压力测试可以

Mysql——压缩包方式安装教程

一.Mysql压缩包下载方式zip版(5.7及8.0)的下载需到官方网站下载,不同版本对应能安装在不同的操作系统下,本次介绍的是mysql-8.0.30-winx64在win10下的安装方式。下载网址:MySQL::DownloadMySQLCommunityServer二.Mysql的安装流程1.下载压缩包至本机目录

DBAPI插件开发指南

DBAPI插件开发指南插件市场您可以去插件市场下载插件插件的作用DBAPI的插件分4类,分别是数据转换插件、缓存插件、告警插件、全局数据转化插件缓存插件对执行器结果进行缓存,比如SQL执行器,对查询类SQL,sql查询结果进行缓存,这样避免频繁的查询数据库,对数据库造成压力。缓存逻辑由用户自己编写,用户可以缓存到red

【linux基础(七)】Linux中的开发工具(下)--make/makefile和git

💓博主CSDN主页:杭电码农-NEO💓⏩专栏分类:Linux从入门到开通⏪🚚代码仓库:NEO的学习日记🚚🌹关注我🫵带你学更多操作系统知识🔝🔝Linux中的开发工具1.前言2.make和makefile介绍3.make和makefile再理解4.伪目标的定义以及性质5.文件的三个属性6.makefile推

Mac 电脑查看本地maven,及私有仓库的搭建与使用【nexus的配置与使用】

查看本地maven查看状态如果要查看本地maven,使用命令行:mvnhelp:effective-settings如下如localRepository标签nexus下载官网地址解压后如下图启动服务器/停止服务器bin目录下执行命令:./nexusstart如下图表面启动成功此时浏览器访问:http://localho

DevExpress WinForms图表组件 - 直观的数据信息呈现新方式!(一)

凭借界面控件DevExpressWinForms全面的2D和3D图表类型的集合,DevExpressWinForms的图表控件设计大大简化了开发者直观地向最终用户呈现信息的方式。DevExpressWinForms有180+组件和UI库,能为WindowsForms平台创建具有影响力的业务解决方案。同时能完美构建流畅、

热文推荐