1.COVID-19 X光医疗数据可视化的冠军冠军笔记
2.李宏毅2023机器学习作业HW04解析和代码分享
COVID-19 X光医疗数据可视化的笔记
在全球COVID-危机中,前线医护人员的源码辛勤付出令人敬佩。非医学背景的代码我,希望能尽一份力,冠军冠军于是源码我在知名数据平台KAGGLE上挖掘了关于COVID- X光医疗的数据,并以此为基础,代码公安内网源码制作了一篇关于X光肺炎识别的冠军冠军可视化笔记。
首先,源码我利用高效的代码算力赞助平台Featurize,该平台提供了经济实惠的冠军冠军GPU资源,并集成了方便的源码vscode编辑器,解决了我在使用jupyter时的代码编辑需求。
进入正题,冠军冠军数据集检查是源码关键。annotations包含了关于X光图像的代码重要信息,通过可视化数据分布,我们可以了解数据的均衡性,可能需要调整进一步处理中的权重分配。
接着,百万赢家源码我们直观地展示了负样本X光,以帮助理解它们的特性,为数据增强提供方向。在构建基础模型时,我参考了arxiv.org/abs/....这篇论文。
训练过程中,我特别关注了损失函数和准确率的变化,尤其是在医疗任务中,召回率往往比精度更为重要,源码安装ruby因为我们不希望漏掉任何潜在的病例。
最后,附上源代码链接:featurize.cn/notebooks/...,包括数据集,考虑到KAGGLE下载速度问题,一并分享。期待各位专业人士的宝贵意见,无论是修改代码、贡献想法还是刻字psd源码提出建议,我都非常欢迎。
让我们共同努力,世界和平,战胜疫情。
李宏毅机器学习作业HW解析和代码分享
MLSpring - HW4 相关信息:课程主页、课程视频、Kaggle链接、Sample代码、GitHub、网页表单 源码Gitee、GitCode。即便Kaggle截止时间已过,你仍可在其上提交并查看分数。但需注意,应于截止前选择两个结果进行最后的Private评分。每年数据集大小与特性虽有细微差别,但基本一致,旧代码适用于新一年的作业。
任务目标:多类分类,性能指标:分类准确度。
数据解析:数据来自VoxCeleb2子集,随机选取了个演讲者。
基线:简单基线(0.),中等基线(0.),在total_steps=时,public_score达到0.。简单参考Optuna进行模型自动调参。
强基线(0.)、Boss基线(0.)。未在PDF中给出Boss基线具体分数,分数来源于Kaggle。模块未显著提升效果,代码中使用全局变量决定是否使用,欢迎大家提出改进意见。
消融研究:Self-Attention Pooling与AMSoftmax在epoch=,下的实验。AMSoftmax接受pred_layer输出,尝试接受encoder输出并重新训练全连接层,但效果不佳,可能为代码问题。
成绩:使用Transformers变体完成Strong基线的提示是转变为Conformer。简单介绍了其模型架构,推荐Pytorch版本源代码。架构包括:SpecAug、Convolution Subsampling、Linear & Dropout、Conformer Block。每个Module使用了残差连接。