自己动手做chatGPT：向量的概念和相关操作|电子爱好者

admin管理员组
文章数量:1631701

chatGPT的横空出世给人工智能注入一针强心剂，它是历史上以最短时间达到一亿用户的应用。chatGPT的能力相当惊人，它可以用相当流利的语言和人对话，同时能够对用户提出的问题给出相当顺畅的答案。它的出现已经给各个行业带来不小冲击，据说有很多公司已经使用chatGPT来替代人工，于是引起了不少裁员事件。

chatGPT是人类科技史上一个里程碑。它基于一种叫大语言模型的技术，使得计算机具备了相当于人乃至超越人的能力，chatGPT的发明者openAI据说在推进下一代模型的开发，据说已经能达到通用AI的程度，我对此表示怀疑。无论如何基于大模型技术的AI将人类带入一个新时期，我们必须有所准备，我们既不需要过分狂热，以为它又是一个暴富风口；也不能漠不关心，认为它完全与自己无关，如果你从事信息技术行业，你必须要特意留一手，如果它真的是进入新纪元的钥匙，那么我们不会被落下，如果只是一阵骚动，那么基于技多不压身的原则，咱花点心思多学一门技术也不亏。

我们这个系列着重于探究发明出chatGPT的技术，我们基于可用的算力和数据从零开始做一个“类”chatGPT，也就是我们做出来的模型不可能有chatGPT那么厉害，但是我们掌握和使用的原理跟它一样，只不过我们没有对应的资源训练它而已。同时chatGPT底层还有一种技术叫transformer，基于这个技术我们可以把chatGPT的开源模型拿过来，然后使用小样本数据就能将其训练成某个特定领域的AI专家，于是chatGPT就能为我所用。

这个系列分为两部分，首先是介绍NLP（自然语言处理）的基本原理和技术，然后我们看看如何使用开源的大语言模型进行特定的开发，由此打造出属于我们自己的chatGPT.首先需要声明的是，涉及到人工智能和深度学习，它具有一定的门槛，那就是你至少要比较熟练大学阶段的高数，你要了解微积分相关内容，熟悉向量，矩阵等线性代数概念，要不然很难在这个领域发展。

现在我们回到技术层面。人工智能要解决的主要是传统算法处理不了的问题，传统算法之所以对一些问题束手无措，主要是因为要处理的对象无法使用结构化的数据结构进行表达。例如给定一张人脸图片，我们如何使用传统数据结构来描述呢，是使用链表，二叉树，哈希表吗，显然不行。由于这个原因，传统算法处理不了这些范畴的问题。那么人工智能怎么用数据区描述例如人脸，单词都这些对象呢，方法是用向量，面对的对象性质越复杂，向量的长度就越大，例如人脸通常用长度为256或者更大的实数向量来表示。对NLP而言，它处理的对象是文本，因此它会使用向量来表示文本的基本单位，如果文本是英语，那么就用向量来表示单词，如果是中文，那么就用向量表示一个字。

我们看一个具体例子，假设我们有一段英语文本：

Times flies like an arrow 
Fruit flies like a banana.

显然传统数据结构是无法表达上面的句子和单词，因此我们转向向量来表达。首先我们把所有单词转换为小写，然后将其排列起来，单词排列的先后顺序没有关系，于是有：

time fruit flies like a an arrow banana

接下来我们使用一种叫one-hot-vector的向量来表示单词，可以看到上面有8个不同的单词，因此向量包含8个元素，由于time排在第一个，于是我们把向量第一个元素设置为1，其他元素设置为0，因此time的向量表示就是[1,0,0,0,0,0,0], 同理fruit排在第2位，因此它对应的向量就是第二个元素为1，其他元素为0，于是其对应向量为[0,1,0,0,0,0,0,0]，其他以此类推。这种对单词的向量描述方式在我们后面的深度学习算法中会发挥很大作用。对于一个句子而言，它的向量描述方式就是把单词对应的向量进行“或”操作，例如句子like a banana,组成它三个单词的向量是[0,0,0,1,0,0,0,0], [0,0,0,0,1,0,0,0],[0,0,0,0,0,0,0,1], 进行“或”操作后结果就是[0,0,0,1,1,0,0,1],我们用代码来实践看看：

from sklearn.feature_extraction.text import CountVectorizer
import seaborn as sns 

corpus = ['Time flies flies like an arraw.', 'Friut flies like a banana']
one_hot_vectorizer = CountVectorizer(binary = True)
one_hot = one_hot_vectorizer.fit_transform(corpus).toarray()
vocab = one_hot_vectorizer.get_feature_names_out()
sns.heatmap(one_hot, annot=True, cbar = False, xticklabels = vocab, yticklabels=['Sentence 1','Sentence 2'])

上面代码运行后结果如下：

从上图我们能看到图形化的，两个句子对应的向量表示，如果给的单词在句子中出现了，他们向量对应位置设置为1，要不然就设置为0.one-hot-vector只是对单词或句子最基本的数学描述方式，事实上在不同的文本或应用场景下，单词或句子的向量绝对不会那么简单，他们依然需要以向量来表示，但是向量的长度和每个元素的取值都得靠深度学习算法来分析出来，具体情况在后面章节详细阐明。

下面我们看看深度学习的基本原理。有过微积分基础的同学会了解，对于一个连续函数f(x),如果在某一点求导所得结果为0:f’(x)=0，那么这个点就可能是在局部范围内的最大值或最小值。深度学习本质上就是通过微分求极小值的过程，只不过它对应的函数包含不止一个变量，例如chatGPT对应的模型就是一个包含1750亿个参数的函数，训练的目的就是找出这1750亿参数的合适取值，这样它才能根据输入的句子给出合适的回复，因此用于它训练的算力和数据无疑是及其巨大的，以下我们给出深度学习网络训练的基本流程：

对深度学习基本原理不熟悉的同学可以参考《神经网络与深度学习实战》，或者我在云课堂上的课程：http://m.study.163/provider/7600199/index.htm?share=2&shareId=7600199

下面我们看运算图的概念。在上图中“模型”其实可以使用传统数据结构中的“图论”来表示。“含有很多个参数的函数”其实可以使用链表来表示，当算法对函数的参数进行求导时，这些运算就可以通过链表来完成，我们看一个具体例子，对于函数y = wx+b，我们可以用链表表示如下：

参数x, w, b, y使用矩形节点表示，运算符则使用圆形节点表示。箭头上的值表示对应参数的值，他们经过圆形节点后执行对应运算然后输出结果。前面我们提到过chatGPT的参数有1370亿个，那意味着其对应的运算图将非常庞大和复杂，因此我们通常使用特定框架来完成运算图的构建以及执行基于其的运算，常用的框架有tensorflow, pytorch还有百度的飞桨，目前用的比较多的还是meta的pytorch框架。

在具体的深度学习应用中，参数节点往往不会像上面那么简单，他们通常是高维度向量，我们上面显示的是0维度的向量，也就是他们是单个参数，在实际应用中x，b通常是一维向量，w是二维向量也就是矩阵。如果我们要处理的输入是图片，那么x可能就是二维向量，如果处理的是视频，那么可能就是三维向量，因为视频是具有时间维度的图片，对于NLP而言，也就是自然语言处理而言，输入的x通常是一维或者二维向量.接下来我们看看如何在基于pytorch框架的基础上实现向量的各自运算。

我们所有代码将运行在谷歌的colab开发环境，这个环境好在于集成了pytorch框架，同时还能让我们免费使用gpu加快运算效率。首先我们用一段代码展示如何使用pytorch创建各种维度的向量：

import torch 
def describeTensor(tensor):
  #输出向量的维度，类型，以及元素值
  print(f"Type: {
     tensor.type()}")
  print(f"shape/size: {
     tensor.shape}")
  print(f"values: {
     tensor}")

describeTensor(torch.Tensor(2,3)) #创建二维向量，也就是2*3矩阵

上面代码执行后输出如下：

Type: torch.FloatTensor
shape/size: torch.Size([2, 3])
values: tensor([[-7.9076e-20,  4.5766e-41, -7.7950e-20],
        [ 4.5766e-41, -7.7948e-20,  4.5766e-41]

本文标签：向量概念操作自己动手做 chatGPT

版权声明：本文标题：自己动手做chatGPT：向量的概念和相关操作内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729104475a1186839.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

自己动手做chatGPT：向量的概念和相关操作

更多相关文章

chatgpt的接口调用如何验证key值是否是有效的呢

php对接ChatGPT接口完成示例

AI写算法：调用CHATGPT的代码

怎么对接ChatGpt

两款免费无限制使用 ChatGPT 模型的 API

使用 ONLYOFFICE 宏借助 ChatGPT 生成文章

chatgpt开发，如何实现智能会话

ChatGPT目前在哪些国家和地区可用

如何与chatgpt建立对话

使用 ChatGPT 生成 Flask REST API：分步指南

OpenAI开放ChatGPT API：2分钱700字

五个工作实用的ChatGPT指令（Prompt）分享

chatGPT 配合excel maxscript使用_初试

为什么调用chatgpt的接口显示请求头太长

本地部署GPT MJ: chatgpt-web-midjourney-proxy本地部署指南

用winform开发ChatGPT对话应用

【ChatGPT使用笔记】 ChatGPT回答不完整，如何获取后续的内容

ChatGPT出现429页面：原因、解决方法及FAQ

Chatgpt-3 使用的提取数据集技术、数据集自动化处理和保证数据质量

小白操作Win10扩充C盘（把D盘内存分给C盘）亲测多次有效

发表评论

推荐文章

电脑蓝屏解决方案：[1]错误代码0x0000000A

电脑问题处理篇5：解决电脑突然蓝屏问题

如何利用AI工具如chatgpt，辅助开发？

HarmonyOS鸿蒙操作系统架构

鸿蒙可以和安卓抗衡吗,鸿蒙手机系统正式登场！继承EMUI的衣钵，能抗衡安卓系统吗？...

热门文章

《MySQL 入门教程》第 05 篇 账户和权限

Esp8266学习之旅⑥ 了解SmartConfig与Airkiss一键配网，给8266一键配网上云端。(带Demo)

手动使用GHOST恢复系统的详细图解

【MOT】《Multiple Object Tracking in Recent Times: A Literature Review》

【人工智能】从ChatGPT到AIGC：人工智能重塑千行百业

华为鸿蒙OS系统与安卓、iOS有什么区别，有哪些优缺点 ？_鸿蒙系统缺点

Windows下检测电脑配置以及主板显卡接口的方法（比如是否是PCI-E接口及型号）

windows系统ftp服务器,Windows下使用的FTP服务器软件

一台主机连接两台显示器单独分开工作

ChatGPT 开放接口使用的认证方式 API Key Authentication 详解

最新文章

虚拟机扩展C盘容量方法

啊哈！C盘又满了？快修改IntelliJ IDEA默认系统缓存cache目录路径

Anaconda虚拟环境占用在C盘

WPS挤占C盘——从安装开始入手

c盘中的软件怎么转到D盘,将c盘软件转移到d盘

分区助手怎么用给c盘扩容

戴尔外星人笔记本C盘空间占用疑难问题记录

如何扩容C盘硬盘

Win系统C盘经常被占用满，不太好查出哪里使用了，重启系统就又有空间可用

idea启动过多导致C盘空间不足

C盘左右两边都有恢复分区，如何扩展C盘大小

怎么把已安装的软件从C盘迁移到D盘？轻松迁移软件，释放C盘空间

C盘满了的终极解决方案

C盘过满或者重装系统小技巧(不需要重做系统)

C盘免费扩容【已解决】

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

《MySQL 入门教程》第 05 篇账户和权限

华为鸿蒙OS系统与安卓、iOS有什么区别，有哪些优缺点？_鸿蒙系统缺点

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载