国家标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
中国人工智能系列白皮书 ——大模型技术 (2023版) 中国人工智能学会 二○二三年九月 2 目录 第1章 大模型技术概述 ................................ ................................ .......... 5 1.1 大模型技术的发展历程 ................................ ............................. 5 1.2 大模型技术的生态发展 ................................ ............................. 9 1.3 大模型技术的风险与挑战 ................................ ....................... 11 第2章 语言大模型技术 ................................ ................................ ........ 13 2.1 Transformer 架构 ................................ ................................ ........ 13 2.2 语言大模型架构 ................................ ................................ ....... 17 2.2.1 掩码语言建模 ................................ ................................ .... 17 2.2.2 自回归语言建模 ................................ ................................ 18 2.2.3 序列到序列建模 ................................ ................................ 18 2.3 语言大模型关键技术 ................................ ............................... 19 2.3.1 语言大模型的预训练 ................................ ........................ 19 2.3.2 语言大模型的适配微调 ................................ .................... 21 2.3.3 语言大模型的提示学习 ................................ .................... 24 2.3.4 语言大模型的知识增强 ................................ .................... 26 2.4.5 语言大模型的工具学习 ................................ .................... 27 第3章 多模态大模型技术 ................................ ................................ .... 29 3.1 多模态大模型的技术体系 ................................ ....................... 29 3.1.1 面向理解任务的多模态大模型 ................................ ........ 29 3.1.2 面向生成任务的多模态大模型 ................................ ........ 31 3.1.3 兼顾理解和生成任务的多模态大模型 ............................ 33 3.1.4 知识增强的多模态大模型 ................................ ................ 35 3.2 多模态大模型的关键技术 ................................ ....................... 36 3.2.1 多模态大模型的网络结构设计 ................................ ........ 36 3 3.2.2 多模态大模型的自监督学习优化 ................................ .... 37 3.2.3 多模态大模型的下游任务微调适配 ................................ 39 第4章 大模型技术生态 ................................ ................................ ........ 41 4.1 典型大模型平台 ................................ ................................ ....... 41 4.2 典型开源大模型 ................................ ................................ ....... 44 4.2.1 典型开源语言大模型 ................................ ........................ 44 4.2.2 典型开源多模态大模型 ................................ .................... 53 4.3 典型开源框架与工具 ................................ ............................... 57 4.4大模型的训练数据 ................................ ................................ .... 60 4.4.1 大模型的训练数据处理流程和特点 ................................ 60 4.4.2 大模型常用的公开数据集 ................................ ................ 63 第5章 大模型的开发训练与推理部署 ................................ ................ 66 5.1 大模型开发与训练 ................................ ................................ ... 66 5.2 大模型推理部署 ................................ ................................ ....... 68 5.2.1 大模型压缩 ................................ ................................ ........ 69 5.2.2 大模型推理与服务部署 ................................ .................... 70 5.3 软硬件适配与协同优化 ................................ ........................... 71 5.3.1 大模型的软硬件适配 ................................ ........................ 72 5.3.2 大模型的软硬件协同优化 ................................ ................ 72 第6章 大模型应用 ................................ ................................ ................ 74 6.1 信息检索 ................................ ................................ ................... 74 6.2 新闻媒体 ................................ ................................ ................... 75 6.3 智慧城市 ................................ ................................ ................... 76 6.4 生
中国人工智能系列白皮书 大模型技术白皮书2023版
文档预览
中文文档
119 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助6.0元下载(无需注册)
温馨提示:本文档共119页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助6.0元下载
本文档由 人生无常 于
2024-05-12 13:16:26
上传分享
举报
下载
原文档
(4.7 MB)
分享
友情链接
GB-T 41856.1-2022 无损检测 工业内窥镜目视检测 第1部分:方法.pdf
GB-T 32065.14-2019 海洋仪器环境试验方法 第14部分振动试验.pdf
HB 8675-2022 系留气球升空试验通用要求.pdf
GA-T 460.2-2020 居民身份证卡体材料及打印薄膜技术规范 第2部分:制卡用印刷层白色PETG薄膜.pdf
GB-T 10001.1-2023 公共信息图形符号 第1部分:通用符号.pdf
GB-T 7729-2021 冶金产品化学分析 分光光度法通则.pdf
GB-T 35190-2017 海水中碘-131的测定 β计数法.pdf
GB/T 25387.2-2021 风力发电机组 全功率变流器 第2部分:试验方法.pdf
Q-GDW 12108-2021 电力物联网全场景安全技术要求.pdf
HJ 1238—2021 汽车排放定期检验信息采集传输技术规范.pdf
GB-T 36629.1-2018 信息安全技术 公民网络电子身份标识安全技术要求 第1部分:读写机具安全技术要求.pdf
GB-T 21709.20-2009 针灸技术操作规范 第20部分:毫针基本刺法.pdf
GB-T 6312-2022 壁厚千分尺.pdf
GB-T 33133.2-2021 信息安全技术 祖冲之序列密码算法 第2部分:保密性算法.pdf
GB-T 25059-2010 信息安全技术 公钥基础设施 简易在线证书状态协议.pdf
GB-T 37400.1-2019 重型机械通用技术条件 第1部分:产品检验.pdf
GB-T 17393-2008 覆盖奥氏体不锈钢用绝热材料规范.pdf
TTAF 044-2019 Android应用质量技术要求及评分细则.pdf
GB-T 10067.31-2013 电热装置基本技术条件 第31部分:中频无心感应炉.pdf
SY-T 0003-2021 石油天然气工程制图规范.pdf
交流群
-->
1
/
3
119
评价文档
赞助6.0元 点击下载(4.7 MB)
回到顶部
×
微信扫码支付
6.0
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。