机器学习20：Transfer learning 迁移学习|电子爱好者

admin管理员组
文章数量:1658609

一、概述

1、从数据角度，分四种情形（如图），每种情形下可以采取的处理方法如下

2、Fine-tuning

Source data数据量大，而Target data数据量小。在Source data上训练模型然后在Target data上对模型进行微调，这种方式叫作Fine-tuning。通常情况下，Fine-tuning需要非常小心，很容易overfitting。因此，需要加入一些技巧：

技巧一：Conservative Training

Conservative Training的思路很简单，在Fine-tuning的过程中加入一些限定条件（正则化），如最小化Source Domain和Target Domain在输出和各层参数之间的差异。

技巧二：Layer Transfer

Layer Transfer选择固定网络结构中的某几层参数，然后只用Target Data（图中标错了）去Fine-tuning剩下的参数。

Layer Transfer在具体操作中case by case，通常情况下，audio识别通常固定后面的几层参数，因为后面几层跟说话人没什么关系；而image识别通常固定前面几层，因为前面几层通常learn到的是图像一些简单的特性，而后面是图像具体的细节。

下图给出了一个Layer Transfer的效果分析，从ImageNet的1000类目标中挑选500类做source，500类做target，共120万张图片。横轴表示copy的layer的数量，0代表没有迁移：

红色线条表示仅训练剩下几层网络结果，可以看出迁移一层时，fine-tuning后面几层结果有提升，迁移多层时，fine-tuning结果下降，表明不同的domain可能仅有前面的几层参数可以共用；

橙色线条表示fine-tune所有层，此时，迁移效果提升很多；

蓝色线条表示直接在target domain上训练一个model，然后固定几层，再训练后面几层，结果可能会变坏，原因是model需要各层参数配合起来调整，淡蓝色表示target domain全部fine-tuning。

对于差别比较大的domain，固定层数越多，效果掉的可能大。

3、Multitask Learning

Multitask Learning同时关注网络在source和target domain上的效果。

图左：相同data，不同任务，共用前几层；

图右：不同data，不同任务，共用中间某几层；

比较成功的例子是多语言语音识别。

4、Domain-adversarial Training

适用于source domain有标签而target domain没有标签的情形。

把网络分成两个部分，一部分是Feature提取，一部分是classifier，对于source domain来说，网络提取的参数由于适用于source分类，可以看到它提取的特征在空间中有好的区分度，而target domain在特征空间的区分度很差。

Domain-adversarial Training的处理就是去消除网络中domain的特性，使得特征提取部分对target domain也适用。Domain-adversarial Training的做法是将source domain和target domain在特征空间中混在一起，而不是明显的分开，因此，接入了一个domain的分类器，使其无法区分数据是属于哪个domain，同时还能正确完成source domain的分类任务。

Domain-adversarial Training训练时，进行梯度的反向传播，domain分类器传给feature extractor一个值，feature extractor乘以负号之后传给输入（实质就是classifier要让梯度上升，它就反而故意下降）。Domain-adversarial Training可能与GAN一样难以训练。

5、Zero-shot learning

建立一个特征的table，对每个样本进行特征有无的标记，进行编码，不仅可以识别看到的类型，还可以辨别没看过的类型。对于一个新的样本，提取特征进行编码，然后查表计算距离进行判别。

Zero-shot Learning通过判断图片与特征的距离进行分类，如图所示，f（*）表示对输入图片进行训练得到的输出，g（*）表示对one-shot向量（特征）进行训练得到一个输出，使得这两个输出相近。

若直接最小化f（*）与g（*）可能存在问题，它将会把同一类都聚集在一起，忽略与其他的距离。因此，这里做出改进，设定比大（或者达到某个阈值K），就认为f与g的距离为0（相近）。它表达的意思是，如果一个图片与一个one-shot编码属于同一类，那么他们的内积要比这张图片与其他one-shot编码的内积最大值更大，实质就是相似度更高，并且高出所有其他编码的相似度。

zero-shot的另一种学习方式是直接利用已有的识别系统得到一张图片的结果，比如图中得到的图片可能是0.5的lion和0.5的tiger，那个就将这两个动物的zero-shot向量进行相同权重的融合，得到一个新的向量，然后根据新的向量得到物种的分类结果。

更多参考

本文标签：机器 Learning Transfer

版权声明：本文标题：机器学习20：Transfer learning 迁移学习内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729814256a1213706.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

机器学习20：Transfer learning 迁移学习

一、概述

更多相关文章

【机器学习(四)】分类和回归任务-梯度提升决策树(Gradient Boosting Decison Tree,GBDT)算法-Sentosa_DSML社区版

2024年 毕业设计 机器学习&amp;深度学习实战案例,含有python代码和教程 (10月16日已更新856篇)

【机器学习】feature_importances_ 参数源码解析

[机器学习速成课程]特征组合 (Feature Crosses)-学习笔记

R语言基于Boruta进行机器学习特征筛选（Feature Selection）

工业机器人与视觉实训平台

机器学习深度学习常用数据集归纳（附百度网盘链接）

【论文阅读】An LSTM-Based Deep Learning Approach for Classifying Malicious Traffic at the Packet Level

自监督学习BYOL《Bootstrap Your Own Latent：A New Approach to Self-Supervised Learning》

Learning to Know Where to See: A Visibility-Aware Approach for Occluded Person Re-identification阅读记录

VizML: A Machine Learning Approach to Visualization Recommendation

从零搭配python机器学习环境

Deep Recurrent Q-Learning for Partially Observable MDPs（DRQN）

【论文翻译】Deep Recurrent Q-Learning for Partially Observable MDPs

关于 i5 与 i7 之间的区别（近期配机器的朋友请看）

显卡机器linux 6卡挖矿,显卡挖矿是什么意思?购买显卡矿机应该注意什么?

因买不到RTX 3090！他花19万搭了一个专业级机器学习工作站

【机器学习】集成模型集成学习：多个模型相结合实现更好的预测

论文速览【Offline RL】—— 【CQL】Conservative Q-Learning for Offline Reinforcement Learning

Double Q-learning

发表评论

推荐文章

工行手机银行android,Android系统-工行手机银行常见问题解决方法-U盾篇

Http2.0那点事

QQ互联对接踩坑

深度ip转换器手机版app_优优手机管家app手机版-优优手机管家免费下载v1.0.0

RabbitMQ ha-promote-on-shutdown 与 ha-promote-on-failure

热门文章

计算机科学与技术要用i7,i7一定比i5强？未必！电脑CPU套路深，你中招了吗？

酷睿i7 12700KF和i5 13600KF怎么选？

mate30pro鸿蒙系统刷机包下载,华为 Mate 30 Pro 的鸿蒙 2.0 Beta 版刷机包流出（附下载地址）...

【前端系列教程之HTML5】01_HTML概述

每周全球科技十大新闻（2020.7.20-7.26）

iOS 学习资料汇总

CleanMyMac X4最新版测评效果及功能下载

Elasticsearch就是这么简单

[设计]2019年全国电子设计竞赛A题-电动小车动态无线充电系统

ubuntu系统安装时的分区方案

最新文章

关于“电脑空闲几分钟出现蓝屏（鼠标能动）、鼠标键盘无响应、硬盘灯长亮”的解决办法

windows蓝屏故障原因（已解答）

Win11 频繁蓝屏重启

win10蓝屏代码_一分钟教你看懂电脑蓝屏，避免故障再次发生！

计算机蓝屏 excel变乱码,使用excel过程中蓝屏为什么?

一次电脑蓝屏NO_MORE_IRP_STACK_LOCATIONS的处理

CrowdStrike更新导致蓝屏事件

VirtualBox7.0.16的蓝屏大坑与ssh登陆ubuntu虚拟机的办法

首次为安装计算机做准备后蓝屏重启,新装电脑蓝屏死机自动重启，问题在哪里？...

计算机错误代码0x 00000006,什么原因造成了蓝屏 电脑蓝屏错误代码介绍

鼠害对计算机硬件的影响,电脑蓝屏对硬件损害大吗？

wegame启动cf蓝屏_Wegame蓝屏怎么解决-解决wegame运行蓝屏、游戏蓝屏的方法 - 河东软件园...

电脑蓝屏0x000024解决记录

服务器显示器蓝屏怎么办

计算机主机启动不了系统怎么办,电脑蓝屏开不了机怎么办

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

2024年毕业设计机器学习&深度学习实战案例,含有python代码和教程 (10月16日已更新856篇)

计算机错误代码0x 00000006,什么原因造成了蓝屏电脑蓝屏错误代码介绍

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载