会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
程戈更新时间:2024-04-25 18:20:57
最新章节:封底开会员,本书免费读 >
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程最新章节
查看全部- 封底
- 作者简介
- 11.5 小结
- 11.4.3 ChatGPT for Robotics
- 11.4.2 PaLM-E
- 11.4.1 具身智能的挑战
- 11.4 具身智能
- 11.3 自回归模型的局限性
- 11.2 数据资源枯竭
- 11.1 强人工智能之路
程戈
主页
同类热门书
最新上架
- 会员
ChatGPT大模型:技术场景与商业应用
ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。计算机13.2万字 - 会员
机器学习中的统计思维(Python实现)
机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。计算机18万字 - 会员
破解深度学习(核心篇):模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的核心知识、原理和内在逻辑。经过基础篇的学习,想必你已经对深度学习的总体框架有了初步的了解和认识,掌握了深度神经网络从核心概念、常见问题到典型网络的基本知识。本书为核心篇,将带领读者实现从入门到进阶、从理论到实战的跨越。全书共7章,前三章包括复杂CNN、RNN和注意力机制网络,深入详解各类主流模型及其变体;第4章介绍这三类基计算机13.4万字 - 会员
GPT图解:大模型是怎样构建的
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字 - 会员
智能计算技术与应用
本书面向初学者介绍智能计算的相关概念、典型应用,采用研究性学习方法和P-MASE模型,按照引入问题、寻找方法、问题分析、问题求解、效果评价的模式,讲授智能计算编程、数据获取和预处理、数据可视化、预测数据的值、分类问题、聚类分析、神经网络、智能图像识别、时间序列数据的处理等知识,并给出了两个综合案例。本书深入浅出、案例丰富、可操作性强,适合作为高校智能计算相关课程的入门教材,也适合相关技术人员学习参计算机10.1万字 - 会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建计算机12.8万字 - 会员
深度学习与计算机视觉:项目式教材
本书基于国产自主可控龙芯处理器,系统地介绍计算机视觉领域的基本理论与实践,并结合当前主流的深度学习框架和龙芯平台以项目式教学的形式讲述任务的实施。本书主要包括OpenCV基础功能实战、深度学习框架的部署、计算机视觉技术基础知识、图像分类网络的部署、目标检测网络的部署、图像分割网络的部署、龙芯智能计算平台模型的训练和龙芯智能计算平台的推理部署等内容。通过阅读本书,读者能够了解和掌握深度学习在计算机视计算机10万字 - 会员
PyTorch深度学习与企业级项目实战
《PyTorch深度学习与企业级项目实战》立足于具体的企业级项目开发实践,以通俗易懂的方式详细介绍PyTorch深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式来引导读者入门人工智能深度学习。《PyTorch深度学习与企业级项目实战》共分18章,内容主要包括人工智能、机器学习和深度学习之间的关系,深度学习框架PyTorch2.0的环境搭建,Python数据科学库,深度学习基本原理,计算机10.8万字 - 会员
Sora革命:重塑人工智能
Sora是一个文本生成视频工具,本书介绍了Sora在视频生成领域的巨大潜力。本书共9章,系统讲解人工智能的演进、Sora的应用实践、Sora深度解析、Sora的挑战与未来等。本书内容全面、图文并茂、经典易懂,适合想要学习Sora的初学者,以及想要学习文本生成文本、文本生成图片、文本生成视频等内容的人工智能爱好者、自媒体从业人员、短视频制作者、设计师、相关专业的企业和高校人员阅读。计算机3.2万字
同类书籍最近更新