admin管理员组文章数量:1564645
研赛题目由当年负责赛区【23年为东南大学,24年为山东大学】的相关老师每年独立命题,因此每年的题目在涉及的模型和知识点上都有很大差异。数模竞赛是百分比获奖,选择人数最多的也就意味着题目简单,会有很多新手、小白选择。我们只需要打败50%的小白即可获奖;选择人数偏少的题目,大多为老手,我们则需要打败50%的老登。
C题作为本次竞赛题,题量较小、难度较为简单,选题人数众多。因此,为了尽量满足大家的需求,本文我们将对C题进行详细的描述。
首先对于数据类型的题目第一步不是直接解题而是数据预处理。2023年研赛数据类型题目数据预处理每个题目都设置了10-15分的分值。因此,对于C题,我们首先需要进行异常值、缺失值、类别型数据处理等数据预处理工作以便方便后续工作处理。
数据预处理可以分为数据清洗、数据处理、数据描述性分析等环节
数据清洗,即需要进行异常值、缺失值的处理。首先判定分布方式,根据非正态分布的结果使用箱线图判定异常值。
类别型数据处理:类别型变量的编码:如励磁波形(正弦波、三角波、梯形波)和磁芯材料(材料1、材料2、材料3、材料4),这些类别特征在建模时不能直接用于数值计算,因此需要进行编码。
名称 | 转码后结果 |
正弦波 | 1 |
三角波 | 2 |
梯形波 | 3 |
描述性分析是对数据集的基本统计特征进行总结和描述,帮助我们更好地了解数据的分布和特性。在描述性分析中,我们通常计算如均值、中位数、标准差、最大值、最小值等基本统计量,并通过可视化手段呈现数据的分布和趋势。
问题一:励磁波形分类
目标:
利用磁通密度的分布特征来对不同的励磁波形(正弦波、三角波和梯形波)进行分类。
1. 数据分析与特征提取:
磁通密度的波形特征:从实验数据中,每个样本包含1024个时间点的磁通密度,这相当于一个周期内的波形数据。我们需要分析这些波形数据以提取能够区分正弦波、三角波和梯形波的特征。
提取关键特征:可以考虑从以下几个方面提取特征:
- 波形的对称性:通过观察波形的对称性,正弦波是平滑对称的,而梯形波和三角波有相对明显的拐点。
- 上升与下降速率:正弦波的上升和下降速率是非线性的,而三角波是线性的,梯形波则具有明显的平坦区。
- 波形的最大最小值:通过计算波形的峰值、平均值、波动幅度等,可以反映波形的基本特征。
- 频域分析:利用傅里叶变换,将时域信号转换为频域信号,不同的波形会在频域中表现出不同的频谱特性(如正弦波主要在基频上,而梯形波可能含有更多的高频成分)。
2. 分类模型选择:
可以使用传统的分类算法,例如:
支持向量机(SVM):对提取的波形特征进行分类,SVM可以很好地处理线性不可分的数据。
K近邻(KNN):基于样本的相似性来进行波形分类。
决策树/随机森林:根据波形特征分层分类,决策树模型易于解释。
3. 模型评价:
通过交叉验证评估分类模型的准确性。
计算分类精度(Precision)、召回率(Recall)以及F1分数等指标,确保模型的分类效BZD数模社 独家制作
盗卖必究4. 输出要求:
对附件二中的样本进行波形分类,统计各波形的数量,并特别对指定的样本序号进行分类并展示结果。
版权声明:本文标题:2024年华为杯研究生数学建模竞赛研赛C题超详细解题思路+数据预处理代码分享 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1727169812a1100114.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论