ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

程戈
主页
  • 本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南,并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景,从理论到技术实现,全程详尽讲解了如何应对大模型在行业落地中的技术挑战,帮助读者逐步掌握大模型的迁移与微调核心技术。无论你是大模型开发者、人工智能研究人员,还是对垂直领域AI应用感兴趣的行业专家,本书都将带你深入大模型的核心领域,提供从构建、优化到部署的全流程指导,助你
    程戈人工智能13.7万字

同类热门书

最新上架

  • 会员
    随着人工智能(AI)技术的迅猛发展,大模型技术已成为推动各行各业变革的重要力量。为了帮助企业管理者和技术人员更好地理解和应用这一前沿技术,本书精心编排多个篇章,从基础概念到实战应用,全面系统地介绍AI大模型的相关知识。概念普及篇(第1~2章)简要概述人工智能与大模型的基本概念及其对社会经济的广泛影响。企业落地准备篇(第3~4章)介绍企业大模型应用落地的常见形式,评估AI能力边界,解析大模型落地的必
    贾利阳 王奇计算机14万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 会员
    本书是全面介绍DeepSeek人工智能平台及其应用的实用指南,旨在帮助读者从零基础开始,逐步掌握DeepSeek的各项功能,并最终达到精通水平,能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者,还是希望进一步提升技能的专业人士,本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章,涵盖了DeepSeek的各个方面,从基础入门到高级应用,再到私有化部署,
    乔剑 苏小文计算机15.6万字
  • 会员
    本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
    朱建明计算机16万字
  • 会员
    本书由多位AI应用领域的KOL联袂推荐,资深AI专家联合撰写,所有内容经过作者实践验证,是理解和应用DeepSeek技术的绝佳指南。本书共10章,全面介绍了DeepSeek这一AI技术,从初识DeepSeek到快速上手,再到它在不同领域的广泛应用,为读者提供了一条从理论到实践的完整路径。第1章深入解析DeepSeek的核心特点,包括其作为中国AI领跑者的技术优势、透明化的思考能力以及开源免费的前沿
    于君泽 刘家松 廖兵 张栋 周丽霞计算机10.8万字
  • 会员
    本书是系统解读DeepSeek的实用指南,从AI基础知识开始,书中讲解了DeepSeek的底层创新,详细剖析其优缺点,探讨如何通过有效提问激发DeepSeek潜能,如何规避AI幻觉,如何实现本地部署;展示了DeepSeek在创意写作、图片视频创作、职场效率提升、学习辅导、知识库构建等领域的实战应用,并探讨了其在政企智能化转型中的价值。无论你是想提升工作效率的职场人、追求创作突破的内容生产者,还是渴
    程希冀计算机9.4万字
  • 《智能体时代》作为一部融合生物智能演化机制与人工智能技术突破的科普作品,通过对从单一神经元到复杂智能体系统的跨学科分析,不仅揭示了智能涌现的本质规律,还为读者构建了一个从微观到宏观的智能进化全景图。这部横跨生物学、计算机科学和认知科学等多个领域的作品,以其独特的“智能体视角”,系统性地阐释了从Claude和GeminiUltra等大语言模型,到AutoGPT和MicrosoftAutoGen等
    刘志毅计算机21.2万字
  • 会员
    AI时代的高效指南,一本在手,技术全有!从入门到精通,掌握DeepSeek实战应用!AIGC应用博士郭子璇倾力打造,权威解读,系统梳理DeepSeek技术,基础到进阶一网打尽!实战为王,全书包含丰富案例+操作指南,覆盖职场、学习、创意等场景,真正提升效率!内容零基础友好,同时提供高阶技巧,一本书满足不同层次读者的学习需求!本书是国内首本深度解析DeepSeek的实用指南,旨在帮助读者从零基础快速进
    郭子璇计算机6.8万字
  • 会员
    本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把
    朱松纯主编计算机16.4万字