admin管理员组

文章数量:1630203

目录

引言 

复杂系统科学及其发展

作为复杂系统的AI大模型

神经网络与复杂网络

作为复杂动力系统的前馈运算与训练

自注意力是一种自调控机制

大语言模型中的涌现

大语言模型的规模法则

作为复杂适应系统的AI大模型

从生态位到类比思维

从水桶链算法到梯度反传算法

总结

参考资料


引言 

2023年伊始,ChatGPT引爆了社会各界对人工智能发展前沿的关注,尤其是ChatGPT背后的核心技术——大语言模型。大语言模型为什么会涌现出强大的学习能力?从复杂科学视角,AI 大模型可以看作与生态网络类似的复杂适应系统,展现出复杂系统常见的现象规律,例如涌现、规模法则等。因此,复杂系统的研究方法可以为理解和改进 AI 大模型提供深刻的洞察,并有助于构造可解释性的AI模型。

最近,人工智能再一次被人们推上了风口浪尖。究其原因就在于以ChatGPT为代表的AI大模型展示出了令人惊艳的表现,仿佛通用人工智能在一夜之间就已经来到了我们的身边。本质上讲,ChatGPT无论在架构还是在方法上都与以前的模型没有本质区别,然而仅仅就是把数据量和模型参数量提升上去,这些大模型就一下子拥有了很神奇的能力。比如,ChatGPT能通过和用户对话而自动学习知识,还能够在一定的引导下完成较为复杂的推理能力。关键是,所有这些新能力,都并不是该模型训练学习的目标,它是随着参数量规模的增大,而自发产生的——研究者把这样的现象,称之为“涌现”(Emergence)。

对于复杂系统科学&#x

本文标签: 人工智能视角模型语言数据