AI技术干货|从头开始图解大语言模型（下篇）

当前位置：首页 > 资讯 > >正文

AI技术干货|从头开始图解大语言模型（下篇）

来源：金博士时间：2023-07-27 18:59:15

X 关闭

在阅读本文前，有几个热身的问题，您尝试回答一下。

1. 什么是大语言模型（LLM）？

2. 大语言模型开发与传统机器学习开发有什么区别？

(资料图片)

3. 什么是任务特定模型？

4. 什么是大语言模型的微调和参数有效调整？

5. 如何理解大语言模型的一体多用特性？

下面就让我们开启探讨大语言模型奥秘之旅。

前文回顾：

AI技术干货|从头开始图解大语言模型（上篇）

AI技术干货|从头开始图解大语言模型（中篇）

引言

深度学习的子领域中有两个重要的概念：大型语言模型（LLMs）和生成式人工智能（Generative AI）。这两者在许多方面都有交集，并且都属于深度学习的研究范畴。如果您对生成式人工智能感兴趣，建议您阅读金博士的《生成式人工智能简介》一文。

在过去的几年中，生成式人工智能发展迅速，吸引了大量的关注。这种类型的人工智能能够生成全新的内容，包括文本、图像、音频和合成数据。

本文我们探讨一下什么是大型语言模型。这类模型预先通过大量的文本数据进行训练，通常是从互联网或其他公开可获取的书籍中提取的。预训练期间，模型学习并理解文本数据的模式和结构。之后，在微调阶段，模型会根据特定的任务进行优化，这些任务可能包括机器翻译、文本生成、情感分析等。

下面我们通过几个通俗易懂的示例，逐步对大模型的工作机理展开进行讲解，希望能够让更多的读者掌握相关的背景知识。

前文回顾;

AI技术干货|从头开始图解大语言模型（上篇）

AI技术干货|从头开始图解大语言模型（中篇）

大语言模型的定义和特征

大语言模型的特征

大型语言模型的一个显著特性是它们的“多任务”能力，即一个模型能适应并完成各种不同的任务。这种特性使得大型语言模型在诸多领域中具有巨大的应用价值，例如：聊天机器人、内容生成、自然语言理解和生成等，任何涉及理解和生成文本的场景，它们都能大显身手。

那么“预训练”和“微调”到底是什么含义呢？试想一下训练一只狗。通常，你会训练你的狗学习基本的命令，比如“坐下”，“过来”，“趴下”，和“停”。这些命令在日常生活中通常就足够用了，能够帮助你的狗成为一个良好的宠物公民。然而，如果你需要特殊的服务犬，比如警犬、导盲犬或者猎犬，你就需要给它进行额外的特殊训练。

这个思路同样适用于大型语言模型。这些模型进行通用目的的训练，来解决常见的语言问题，如文本分类、问题回答、文档摘要和跨行业的文本生成等。然后，这些模型可以根据不同领域，如零售、金融和娱乐等，利用相对较小规模的领域数据集，进行微调，解决特定的问题。

这个过程中的“预训练”阶段，就相当于教狗狗基本的命令。而“微调”阶段，则对应于对狗狗进行特殊的额外训练。预训练的模型就像一只已经学会基本命令的狗，能够进行基本的任务；而经过微调后的模型，则像是一个专门训练过的服务犬，可以完成更特定、更复杂的任务。

让我们进一步将大型语言模型的概念分解为三个主要特征。

1. “大型”有两个含义。首先，它表示训练数据集的巨大规模，有时达到PB（petabyte，即千兆字节）级别。其次，它指的是参数的数量。在机器学习中，参数通常被称为超参数。参数基本上是机器从模型训练中学到的记忆和知识。参数决定了一个模型在解决问题（如预测文本）时的技能水平。

2. “通用目的”意味着这些模型足以解决常见问题。有两个原因导致了这个观点。首先，无论具体任务是什么，人类语言都有其通用性。其次，资源是有限的。只有某些组织有能力使用巨大的数据集和大量的参数来训练这种大型语言模型。

3. “预训练”和“微调”，即在有能力的组织为他人创建基础语言模型之后，用户使用大规模数据集为通用目的预训练一个大型语言模型，然后使用一个小得多的数据集为特定目标微调它。

在这个框架下，你可以将大型语言模型看作是一个强大的、高度适应性的工具。它们被设计为可以处理各种不同的语言任务，并且可以根据需要进行调整和优化，以满足特定的需求。而这一切，都是基于大规模数据集的预训练和精细的微调实现的，这是大型语言模型的核心思想和主要优势所在。

大语言模型的分类

X 关闭

最近更新

AI技术干货|从头开始图解大语言模型（下篇）

2023-07-27 18:59:15

资讯
SoftWorks Global宣布绿色和红色信号房地产投资平台现已推出

2023-07-27 18:32:20

资讯
广元开展2023年全国节能宣传周系列活动

2023-07-27 18:29:08

资讯
偏食（关于偏食的基本详情介绍）

2023-07-27 18:20:19

资讯
国家统计局：1～6月份全国规模以上工业企业利润下降16.8％

2023-07-27 18:19:42

资讯
甘肃省印发《方案》推进和美乡村建设

2023-07-27 18:08:09

资讯
国学论谭｜胡中行：《长安三万里》也有的几处“硬伤”

2023-07-27 17:58:31

资讯
领略传统之美

2023-07-27 17:53:17

资讯
河南省科技馆游玩路线推荐（中老年）

2023-07-27 17:45:12

资讯
工信部：研究制定新能源汽车动力蓄电池回收利用管理办法

2023-07-27 17:42:25

资讯
深圳市2023年福田区中考最低录取分数线表

2023-07-27 17:24:20

资讯
北京市第11届民族传统体育运动会8月举办新增冰蹴球等项目

2023-07-27 17:17:16

资讯
新时代新征程新伟业丨金银花开幸福来

2023-07-27 17:10:56

资讯
刘瑶水库（刘瑶）

2023-07-27 17:04:45

资讯
意媒：除了佩莱格里尼，米兰还有意引进佩纳罗尔19岁边卫米兰斯

2023-07-27 16:50:42

资讯
两船试航一船开工！大连造船节点连连

2023-07-27 16:31:21

资讯
上海探索新型研发机构体制机制改革

2023-07-12 12:18:22

资讯
我国首个高海拔光氢储项目投产发电

2023-07-12 11:56:25

资讯
库瀚科技参编2023年信通院《数据库发展研究报告》

2023-07-12 11:21:23

资讯
自贡自流井：开展“文明实践携手前行”结对共建活动

2023-07-12 11:00:10

资讯
汽车上ims是什么意思 ims是什么意思

2023-07-12 10:17:56

资讯
宁河区深入实施乡村振兴全面推进行动发展“五大种业” 打造“种业硅谷”

2023-07-12 10:10:31

资讯
温州重推楼市新政背后：去化周期20个月，开发商拿地积极性不高

2023-07-12 09:38:48

资讯
政策加力拉动需求　6月金融数据明显回升

2023-07-12 09:11:56

资讯
【环湖日记】环湖赛的魅力说不尽

2023-07-12 08:25:32

资讯
华友钴业（603799）：7月11日北向资金增持245.42万股

2023-07-12 07:41:35

资讯
7月11日基金净值：银华中证5G通信主题ETF联接A最新净值0.8442，涨2.56%

2023-07-12 06:42:26

资讯
上海百亿抢地大战开锣，保利落子内环，招商蛇口报名11幅地块

2023-07-12 05:17:43

资讯
下电影软件下电影

2023-07-12 01:29:23

资讯
因热射病死亡，保险公司不愿赔偿，法院判决：赔付90万元！

2023-07-11 22:56:46

资讯
星河动力夏东坤：十年之内载人航天旅游就会成为很成熟的行业

2023-07-11 22:03:21

资讯
经济回升将为财政收入增长提供支撑

2023-07-11 21:05:08

资讯
对话德邦证券芦哲：经济是否会很快触底反弹？A股又有哪些投资机会？｜聪明的钱

2023-07-11 20:16:07

资讯
增值税进项税额怎么做账_增值税进项税会计分录

2023-07-11 19:29:54

资讯
未名医药：股东高宝林及其一致行动人王明贤拟继续减持不超过6%

2023-07-11 18:56:13

资讯
《布莱泽奥特曼》豆瓣9.3分网友直呼系列最强开局！

2023-07-11 18:10:25

资讯
中国巨石：上半年预盈18.9亿元同比减少约55% 二季度整体经营情况改善

2023-07-11 17:43:39

资讯
鬼灭之刃：音柱言论活着的人才是赢家引争议炎柱大哥：就你话多

2023-07-11 17:16:06

资讯
雷雨天气将至，周三早高峰受降雨影响交通压力较大

2023-07-11 16:39:16

资讯
湖南长沙发生银行抢劫案？警方：有人报警自称要抢银行已被控制

2023-07-11 16:16:38

资讯
SMM日评：美元四连跌金属普涨双焦涨3%左右

2023-07-11 15:40:55

资讯
“空姐和乘客被甩到天花板!”一飞机遇严重颠簸，国航回应

2023-07-11 15:07:51

资讯
深算院YashanDB亮相可信数据库发展大会

2023-07-11 14:44:47

资讯
申港证券：给予顺鑫农业买入评级，目标价位37.0元

2023-07-11 14:04:24

资讯
安图生物7月11日盘中涨幅达5%

2023-07-11 13:11:58

资讯
南华县首届彝绣文化周开幕

2023-07-11 12:21:20

资讯
“确诊体文学” 自娱自乐式治愈

2023-07-11 11:55:24

资讯
风吹草低见牛羊的见的意思是（风吹草低见牛羊的见的意思）

2023-07-11 11:21:43

资讯
富德生命廊坊中支“乘风·著未来”夏季客服活动火热进行中

2023-07-11 11:01:54

资讯
永和股份：7月10日融资买入1336万元，融资融券余额6932.01万元

2023-07-11 10:30:04

资讯
上海银行业发布《自律公约》利率定价:兼顾社会责任与商业可持续性

2023-07-11 10:19:31

资讯
爷爷竟将刚满月双胞胎孙女扔街头，目击者：路人报警后爷爷被铐走，警方：因家庭琐事赌气，已批评教育

2023-07-11 09:48:34

资讯
浙江温州：省级储能示范项目享受3年补贴，200元、180元、170元/千瓦*年！

2023-07-11 09:22:05

资讯
21个行业获融资净买入汽车行业获净买入最多

2023-07-11 09:01:57

资讯
蒋炜

2023-07-11 08:15:31

资讯
诺思格（301333）：7月10日北向资金增持1.2万股

2023-07-11 07:17:46

资讯
“避暑、研学、康养”领跑暑期文旅市场

2023-07-11 06:16:17

资讯
江苏：产业链党建聚“链”成势

2023-07-11 03:57:00

资讯
厦门多个在建市级保障房项目进入精装修阶段

2023-07-11 00:03:39

资讯
楼市大利好！央行、金融监管总局重磅发文！

2023-07-10 22:27:50

资讯
金昌“吸金”，兰洽会上签约额逾130亿元

2023-07-10 21:23:50

资讯
领湃科技：公司为合并报表范围内的子公司授予的担保额度总金额为4.4亿元

2023-07-10 20:44:42

资讯
2023广州中考录取后什么时候报到？

2023-07-10 20:05:13

资讯
牙髓炎的症状及治疗肺热的症状及治疗

2023-07-10 19:15:20

资讯
2023徒步河南·全民健身旅游大会在南召县五朵山景区鸣枪开走

2023-07-10 18:31:32

资讯
石门银峰特许

2023-07-10 17:59:11

资讯
大宗交易：臻镭科技成交3353万元，折价2.00%（07-10）

2023-07-10 17:32:37

资讯
圣湘生物：与北京大学长沙计算与数字经济研究院签署战略合作协议

2023-07-10 17:06:38

资讯
彝族字体转换器（彝族文字转换器）

2023-07-10 16:14:30

资讯
一路高歌是什么歌（一路高歌是什么意思）

2023-07-10 16:01:27

资讯
蒂亚戈-席尔瓦：普利西奇是个好球员好小伙，若去米兰肯定能成功

2023-07-10 15:03:43

资讯
潍坊市坊子区：办好每一件实事，小食堂托起大民生

2023-07-10 14:24:18

资讯
上海市高级人民法院、上海银保监局共同探索推动司法与监管大数据信息共享互通机制建设

2023-07-10 13:56:47

资讯
孟加拉国登革热病例激增累计超1.2万例

2023-07-10 13:07:07

资讯
定制家居厂商纷纷加码卫浴品类能跨过五金、陶瓷等制造门槛吗？

2023-07-10 12:11:32

资讯
全国机动车保有量达4.26亿辆新能源汽车保有量达1620万辆

2023-07-10 11:50:23

资讯
腾讯《无畏契约》国服抢先下载开启：12日正式开服

2023-07-10 11:11:55

资讯
推进西安—咸阳一体化发展、西安都市圈建设重点任务和重点项目清单出炉 198个项目总投资8840.6亿元

2023-07-10 11:01:28

资讯
浙台经济社会融合发展突出贡献单位！这所学校亮相2023浙江台湾周海峡青年创新创业成果展

2023-07-10 10:12:50

资讯
6月份工业生产者出厂价格同比下降5.4% 环比下降0.8%

2023-07-10 09:53:06

资讯
尼日利亚西南部交通事故致20人死亡

2023-07-10 09:13:18

资讯
中信证券：公募基金费率改革影响相对可控行业仍然有长期增长空间

2023-07-10 08:48:42

资讯
下水管尺寸一般是多少的（下水管尺寸一般是多少）

2023-07-10 08:09:02

资讯
为巴黎战死？卢卡斯：我会为巴黎奉献一切，就像我在别处所做一样

2023-07-10 06:44:01

资讯
小学群殴女生小学生围殴一名小学生

2023-07-10 05:06:14

资讯
「这血，居然是红色的」

2023-07-10 01:05:00

资讯
我国登记在册民营企业突破5000万户

2023-07-09 21:19:33

资讯
何以中国丨这里有最早的“中国”

2023-07-09 20:11:54

资讯
「百闻牌DIY」神器使到访日志——千式

2023-07-09 18:39:01

资讯
nvidiageforcegt630显卡多少钱 nvidiageforcegt630

2023-07-09 17:31:09

资讯
发电、晒盐、养殖三不误！世界单体容量最大“盐光互补”电站并网发电

2023-07-09 16:10:53

资讯
三伏天，少吃瓜子花生多吃它！一健脾，二降血压，三清心宁神

2023-07-09 15:12:03

资讯
美国近半自来水受有毒化学物质污染，数亿人都在饮用，恐致癌和不孕

2023-07-09 14:09:06

资讯
腊肠炒藕片

2023-07-09 12:45:17

资讯
就业服务离校不离线

2023-07-09 11:43:15

资讯
23H1业绩快报点评：符合预期，销售与盈利能力有望持续改善

2023-07-09 10:36:12

资讯
（国际）埃及迎高温天气

2023-07-09 09:56:41

资讯
北京：凤冠回家定陵文物再聚首

2023-07-09 08:54:38

资讯
房屋租赁税率计算方法房屋租赁税率计算器

2023-07-09 07:17:56

资讯
大鹏市场监管局强化民生领域执法放心消费在大鹏

2023-07-09 06:00:49

资讯

AI技术干货|从头开始图解大语言模型（下篇）

推荐内容

最近更新