1.2.3 常见的AI大语言模型

AI大语言模型是AI应用领域的一种工具,它主要用于生成智能的交互式文本、图像及(在某些情况下)3D模型。这种模型能够理解输入的文本,并据此生成相应的、具有连贯性的文本输出。这些模型的核心技术是深度学习,特别是变换器(Transformer)架构,该架构在处理和生成文本方面表现出色。

一、ChatGPT

ChatGPT是由美国OpenAI公司开发的AI大语言模型,它基于GPT-3.5和GPT-4架构,被训练用于生成自然语言文本,可以用于多种对话和文本生成任务。ChatGPT可以理解输入的文本并生成连贯的、有意义的回复文本,在对话系统、客服聊天、写作辅助等方面具有广泛的应用。

图1-7所示为ChatGPT的官方平台界面。

图1-7

用户若要在国内使用GPT-3.5,可以下载GPT Chrome浏览器,该浏览器将GPT-3.5作为扩展程序自动嵌入,并在浏览器的右上角显示图标,单击此图标,即可免费使用GPT-3.5聊天机器人,如图1-8所示。

图1-8

使用ChatGPT辅助工作时,需遵守以下几点指导原则。遵守这些指导原则将帮助用户与ChatGPT进行更有效的交互,并获得更有意义和准确的回答。

提出清晰的问题和指令:尽量提出清晰的问题和指令,以便ChatGPT理解需求。避免模糊的描述或含糊不清的问题,这有助于ChatGPT更准确地回答。

提 供必要的上下文信息:如果问题涉及特定情境或背景,应尽量提供上下文信息,这有助于ChatGPT更好地理解问题并提供更准确的回答。

详细的问题描述:尽量提供详细的问题描述,避免过于模糊或简略的问题描述,这有助于ChatGPT提供更有深度的答案。

提出具体的问题:尽量提出具体的问题,而不是泛泛地提问。针对具体的问题,ChatGPT通常更容易产生准确的回答。

使用关键词:在问题中使用关键词有助于ChatGPT更好地理解问题并提供相关的答案。

适度限制回答范围:如果希望ChatGPT给出特定类型或领域的回答,可以通过明确指定限制条件来帮助它更好地理解问题。

利用多轮对话:如果问题复杂或需要进一步追问或澄清,可以尝试进行多轮对话,逐步提供更多信息或进一步提出问题。

提供反馈和修正:如果ChatGPT的回答与期望不符,可以提供明确的反馈来纠正它的回答,并尝试以不同的方式重新表达问题。

检查合格验证:ChatGPT提供的信息不一定总是正确的。在决策或重要问题上,最好自行核实信息,并谨慎考虑ChatGPT的建议。

确保合理的期望:ChatGPT是一种强大的语言模型,但仍有一定的限制。因此应确保期望是合理的,并意识到它可能无法提供完全准确或完美的答案。

文明交流:确保交互是文明和尊重的。ChatGPT被设计成遵守社会准则和法律法规,并不应该用于恶意或不当用途。在使用ChatGPT时,应确保交互遵守社区准则和法律法规。

探索功能:ChatGPT不仅可以回答问题,还可以进行创造性的文本生成、编程辅助、写作建议等。可以尝试不同的用途,发掘其多功能性。

二、文心一言

文心一言是百度发布的知识增强型大语言模型,它能够与人对话互动,如回答问题、协助创作等,帮助人们高效、便捷地获取信息、知识和灵感。文心一言基于飞桨深度学习平台和文心大模型,可以持续从海量数据和大规模知识中融合学习,具备知识增强、检索增强和对话增强的技术特色。

下面介绍使用文心一言时的几个重要提示。

用户需要进入文心一言官方网站使用文心一言大语言模型。

图1-9所示为文心一言大语言模型(简称“文心大模型”)的网页端用户界面。

图1-9

在使用文心一言的过程中,如果用户发现问题,可单击左侧面板中的按钮及时反馈给平台,以便在正式版本中修改和升级。

如果新用户不清楚在文心一言中如何与文心大模型3.5进行对话,可以在首页左侧面板中单击【百宝箱】按钮,进入【一言百宝箱】页面,查看并使用符合用户使用场景的指令,如图1-10所示。

图1-10

假如用户想写作一个科幻小故事,可在【场景】选项卡【创意写作】选项类别中选择【短篇故事创作】指令。文心大模型3.5会自动填写关键词并进行创意写作,如图1-11所示。

图1-11

在与文心大模型3.5进行对话时,用户可使用聊天文本框上方的辅助工具来完成创意写作、文档分析、网页分析、智慧绘图、多语种翻译等工作。还可以选择【我的指令】命令,一键调取自定义的指令(提示词),如图1-12所示。

图1-12

如果用户事先没有创建任何指令,选择【我的指令】命令后,在弹出的【我创建的】面板中选择【创建指令】命令,会弹出【创建指令】对话框。输入指令标题和指令内容后,单击【保存】按钮即可完成指令的创建,如图1-13所示。

图1-13

三、国内其他AI大语言模型

除前面介绍的两款AI大语言模型,国内还有很多互联网企业推出的商业AI大语言模型,例如华为的盘古、阿里云的通义千问、科大讯飞的讯飞星火、360的360智脑、腾讯的腾讯混元、复旦大学的MOSS及百川智能的Baichun等。

在上述大语言模型中,尤其值得推荐的是华为的盘古大语言模型,其应用场景十分强大,主要致力于打造金融、政务、制造、矿山、气象、铁路等行业的大语言模型和能力集合,将行业Know-how与大语言模型能力相结合,重塑千行百业,成为组织、企业、个人的专家级助手。华为盘古大语言模型目前仅邀请企业客户测试,个人客户无法公测,所以本章无法对其详细介绍。

其他厂商的大语言模型与前面介绍的文心一言类似,不赘述。阿里云的通义千问大语言模型的交互界面如图1-14所示。

图1-14