浅析 GitHub Copilot 工作原理帮你更高效使用|电子爱好者

admin管理员组
文章数量:1567642

GitHub Copilot 是一个代码补全工具，它会分析你的代码并在你输入时提供行内建议。

它还提供一个聊天界面，帮助你询问代码库的问题、生成文档、重构代码等。你可以在这里阅读博客。

在这篇博客中，我们将深入探讨在你编写代码时发生了什么，试图了解其工作原理。了解 Copilot 的内部工作机制可以帮助你更高效地使用它。

我们将把系统分为三个组件：代码编辑器、代理服务器（GitHub 服务器）和模型，并逐一了解每个组件。

代码编辑器

在代码补全的情况下，Copilot 不断监控光标位置并分析周围的代码，将所有代码拆分为标记，并对打开的所有其他标签执行 Jacobian 差分算法。

Jacobian 差分算法基本上是比较两段内容的维恩图，这有助于 Copilot 知道哪些代码部分高度重叠或引用相同的变量名和方法名，从而能够组装一个混合了相关内容的提示。编写一个好的提示至关重要，因为它有助于模型获得领域专长。

在聊天界面的情况下，可以在提示中添加其他信息以生成更好的代码建议和聊天回复。一些有用的上下文包括：

目录树：项目中文件和文件夹的层次结构和组织
终端信息：执行的命令、构建日志、系统输出
构建输出：编译结果、错误消息、警告

Copilot 还允许你使用 @Workspace 等标签将这些来源的信息拉入提示中。在即将到来的部分中，我们将看到更多有用的附加上下文。

代理服务

代理服务执行两项操作：

预处理
后处理

预处理

从代码编辑器获取相关数据后，这些数据会发送到 GitHub 的后台服务，输入会经过清理，去除用户的有害内容、阻止与软件工程无关的提示、检查仇恨言论或黑客攻击或提示注入的证据。

完成这些步骤后，代理服务生成相关提示并送入模型。

模型

清理用户提示后，GitHub 的后台服务将其传递给 ChatGPT。对于代码补全任务（Copilot 在你编程时建议代码片段），为了提供最佳用户体验，GitHub 保持非常低的延迟（300-400 毫秒），因此他们使用 GPT-3.5。

对于对话式 AI 机器人，GitHub 可以容忍更高的延迟，并需要更多的智能，因此他们使用 GPT-4。在这一点上，提示也会从 GitHub 服务器中删除，因为他们不希望使用用户的专有数据。

后处理

从模型返回响应后，代理服务在将结果发送回代码编辑器之前执行后处理任务。

在此步骤中，服务再次检查有害数据、安全漏洞的证据等。GitHub 还编写了一个自定义模型，用于检查安全漏洞、个人可识别信息。

GitHub 在返回过程中还进行另一个重要步骤，即如果模型的响应超过 150 个字符，他们会将数据与 GitHub 中的所有数据（数十亿个文件）进行对比，以确保不违反任何代码许可证。GitHub 在 20-30 毫秒内完成这一工程奇迹。

响应生成并返回给用户显示在代码编辑器中后，如果用户选择该响应或不选择，该指标会发送到 GitHub 服务器。

扩展上下文窗口的另一种方式

除了从代码库、终端信息和构建输出中获取上下文之外，Copilot 还使用 检索增强生成 (RAG) 。

通过 RAG，可以从组织的资产中提取任何对提示有用的附加上下文，例如文档、代码和问题。

Copilot 计划的另一项功能是为插件扩展上下文窗口。这允许 Copilot 调用另一个 API 或服务以收集数据和执行操作。

例如，如果你收到有关服务中断的通知，可以请求 Copilot 检查 Datadog 并检索过去一小时的关键错误列表。然后，你可以请求 Copilot 查找导致这些错误的代码路径的拉取请求和作者。

使用微调的自定义模型

GitHub 还为企业提供自定义模型。更具体地说，他们可以微调 ChatGPT 以生成更好的响应。

微调有用的一些场景包括：

风格偏好：团队可能有特定的编码风格、命名约定、格式指南等。使用微调版本的 ChatGPT 将使 Copilot 遵循这些规则。
API/SDK 版本：团队可能正在使用特定版本的 API/SDK。ChatGPT 模型可以在使用目标版本的代码库上进行微调，以提供兼容并优化特定开发环境的建议。
专有代码库：一些公司有使用不公开技术的专有代码库。微调 ChatGPT 可以让它学习这些代码库的模式，从而提供更相关的建议。

参考资料：

YouTube
维基百科
GitHub Copilot 计划

原文链接：https://medium/stackademic/behind-the-scenes-of-github-copilot-e3703971ea73

本文标签：帮你高效工作原理 GitHub Copilot

版权声明：本文标题：浅析 GitHub Copilot 工作原理帮你更高效使用内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1725311790a1018639.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

浅析 GitHub Copilot 工作原理帮你更高效使用

代码编辑器

代理服务

预处理

模型

后处理

扩展上下文窗口的另一种方式

使用微调的自定义模型

更多相关文章

c++后端相关(加深记忆，抄的github和小林coding)

gitHub提交代码报错：响应状态代码不指示成功: 403 (Forbidden)

推荐：开放容器倡议运行时规范——打造高效、标准化的容器平台

cad无法安装_想要重新安装AutoCAD软件，提示无法安装怎么办？两招帮你解决它...

U盘无法访问？揭秘原因与高效恢复策略

迅雷工作原理的推测及慎用它的理由

电脑文件剪切到U盘，为什么不见了？这4个技巧帮你找回丢失文件

电脑里的文件删除了还能恢复吗？这些方法能帮你找回

从github下载开发者版本的源码进行编译安装scikit-image（0.14）

高效解决阿里云远程桌面连接出现credssp加密oracle修正

搜索引擎蜘蛛工作原理，如何引蜘蛛？

如何正确高效准确的使用搜索引擎？

百度搜索引擎工作原理解读

Windows 10下高效工作——快捷键一览

阅读_分享成为高效程序员的7个重要习惯

U盘数据恢复软件，高效恢复数据记好这2款！

U盘、移动硬盘数据误删了怎么恢复？EasyRecovery 轻松帮你恢复

WatchCat：一款高效实用的窗口管理工具，你了解多少？

Ubuntu 18.04LTS Hexo+github搭建个人博客

[转] Win10插入U盘后双击无法打开，无法访问，显示设备未就绪；驱动哥帮你解决...

发表评论

推荐文章

手把手教你在Linux(Deepin)充分发挥Chrome（谷歌浏览器）

计算机启动时报警原因,电脑出现报警声怎么办？电脑出现报警声的原因

java解惑

计算机桌面右下角的图标不见了,win10正式版右下角的操作中心图标不见该怎么办?...

win10安装qt5.12保姆级教程（图文详解，简单快捷）

热门文章

如何使用移动云搭建个人网站（保姆级教程）

如何在计算机中 看到wps云,如何在我的电脑中显示wps网盘入口

谷歌浏览器插件开发--Notes Canvas

win7系统两台计算机共享文件,请问2台电脑,一台是WIN7,另一台是WIN10,如何互相共享文件夹?...

Linux下搭建打印机共享服务器（支持苹果AirPrint）

2022年Java 工程师面试题

测绘——AutoCAD教育版打印戳去除

使用Chrome浏览器自动将文件下载到指定路径（webdriver）

u盘插电脑计算机卡了,U盘连接电脑非常卡的解决方法-电脑自学网

office2020与2016版的不同_Office2016与Office2013有什么区别?Office2016评测

最新文章

电脑重启bootmgr_解决电脑出现bootmgr is missing如何解决

Mac下启动mysql的三种方式

计算机热启动方法,关于电脑热启动的介绍

判断电脑上的Windows启动方式是什么，固态硬盘和机械硬盘启动区别

计算机所有服务都无法启动,依赖服务或组无法启动,详细教您这样解决依赖服务或组无法启动...

因为错误关闭启动服务项目，导致win10开机时出现你的pin无法使用，【Surface pro 系列电脑】

计算机软件自启动设置,设置开机启动项,详细教您电脑如何设置开机启动项

必须重新启动计算机才能更改应用,必须重新启动计算机才能应用这些更改

计算机无法启动打印机,打印机无法启动打印作业是怎么回事

关于联想电脑启动后没有网卡的故障（设备管理器内看不到网卡，网卡消失）

电脑从硬盘启动计算机,电脑怎么设置第一启动项为硬盘

电脑运行计算机命令,常用的Windows运行命令，让你更好的管理电脑

【macOS 系列】如何调整启动台图标大小和行数

睡眠电脑自动启动

计算机主机不能启动,电脑不启动是什么原因_电脑无法启动怎么办-win7之家

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

如何在计算机中看到wps云,如何在我的电脑中显示wps网盘入口

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载