和国内外的很多公司一样,在 Open AI 公司开放了 ChatGPT API 接口之后,我们也在探索如何去结合到业务中。而在探索的过程中,我们发现了一个问题,大部分的业务人员并不了解 AI 的能力,所以我们开源构建了 ClickPrompt,以使 “普通人” 能更方便地了解 ChatGPT。
围绕于我们短暂的开发旅程,我们思考了一些有意思的 ChatGPT 相关的集成模式,这些模式方便我们后续在国内的其它 LLM(大语言模型)中使用。
于是,便邀请了 ChatGPT 和我(Phodal)写了一篇文章 来进行总结。
如果你也对 Prompt 工程感兴趣,欢迎加入 ClickPrompt:https://github.com/prompt-engineering/click-prompt
ClickPrompt 的 ChatGPT 集成
须知:在国内的服务器,似乎无法集成 OpenAI,所以需要一个国外的服务器。
在开发 ClickPrompt 的过程中,我们试着做了一些有意思的事件:
-
提供简单的问题(Prompt)模板,以方便新手学习。
-
提供繁杂问题的模板,可以一步步学习如何提问。
-
集成了 HuggingFace,可以实时在线生成 Stable Diffusion 图片。
-
结合 ChatGPT 来自动生成 Stable Diffusion 的 Prompt。
-
独立的 ChatGPT 聊天页面。
-
探索更多的 Prompt 工程方式。
我们依旧和许多团队一样在探索更多的可能性。
无限的场景,无限的可能
如大家所知,ChatGPT 可用于多种自然语言处理场景,包括:
-
聊天机器人,解决问题,提供建议。
-
自然语言生成,生成高质量文章等。
-
情感分析,分析用户评论和反馈。
-
语言翻译,将一种语言翻译成另一种语言。
-
自然语言理解,帮助机器理解和处理自然语言。
-
……
当然了,ChatGPT 的场景不限于上面这几个,我们也见到了非常有意思的和架构设计、法律法规检查等一系列有意思的场景。
ChatGPT 集成模式
对应的模式列表:
生成器模式
使用 prompt 生成器生成特定输入,提高 ChatGPT 回答准确度和全面性。例如,使用 prompt 生成器生成法律咨询问题,ChatGPT 回答法律问题;在问答领域中,使用预定义的问题模板作为输入,生成相应的回答,能够提高 ChatGPT 的回答准确度和全面性。
生成器模式是我们最早设计的强化 Prompt 场景,它非常容易实现,只需要预设好一些模板,就能很好地工作。
上图便是我们构建生成器的一个场景。
系统集成模式
将 ChatGPT 与其他系统集成,实现数据交换和通信。例如,将 ChatGPT 与电子邮件系统集成,自动回复邮件;在电商平台中,ChatGPT 可以与订单系统穿插,以便处理用户的购物咨询和下单请求。
在 ClickPrompt 中,我们通过集成 HuggingFace 来实现,一个简单的场景,生成图形的功能,如下图所示:
PS:由于,我们是开源项目,穷,所以都是用免费的服务器。
管道模式:
在 ChatGPT 中定义处理流程,对每个输入进行处理并生成输出。例如,将 ChatGPT 用于自动化客服,对用户的问题进行分类和回复;在客服领域中,ChatGPT 可以通过管道模式实现意图识别、实体识别、回答生成等一系列流程。
在 ClickPrompt 中,我们预期通过 ChatGPT 来与人类交互,对每一步的输入和输出校正,进而完善系统的架构设计:
上图是我们正在探索的 DDD 场景,当然写得不行。
目标引导模式
将对话分成场景,并为每个场景设定目标,引导 ChatGPT 生成相关回答。例如,将 ChatGPT 用于旅游规划,引导用户选择目的地并提供相关信息;在旅游领域中,ChatGPT 可以根据场景(如酒店预订、景点推荐)来生成相应的回答。
在 ClickPrompt 中,我们通过 ChatGPT 来生成 Stable Diffusion 的 tag,进而完善文本到图形的转换:
随后,通过 ChatGPT 来生成 tag,再结合其它模式。
协同模式
将 ChatGPT 与其他 AI 技术集成,生成更人性化的回答。例如,将 ChatGPT 与情感分析技术集成,生成更符合用户情感的回答;在语音助手中,ChatGPT 可以与语音识别技术协同,能够更好地理解用户的语义和情感,并生成更加自然的回答。
在 ClickPrompt 中,我们还想做的事情就是通过接入语音功能,来实现语音直转文本,进而输出。
迁移学习模式:
通过将已经学习到的知识应用于新任务中,来改善模型性能和加快学习速度的一种机器学习方法。例如,将预先训练好的 ChatGPT 模型与公司或行业特定的语料库进行微调,以适应特定领域和任务的需求,从而快速构建智能客服机器人。
由于 ChatGPT 训练周期的问题,总存在一些知识老旧的问题。因为在日常的场景中,我们也可以让 ChatGPT 中阅读一些文章,围绕于这些文章,输出新的洞见。
混合模式:
将多个不同类型的模型组合,提高回答准确度和全面性。在问答领域中,将检索模型、知识图谱模型和生成模型混合使用,可以提高回答的准确度和覆盖范围。
我们还在寻找合适的案例,来结合这种模式。
转换器模式:
使用转换器将输入转换为 ChatGPT 可理解的格式,提高ChatGPT对输入的理解和处理能力。例如,使用语音转换器将语音转换为 ChatGPT 可理解的文本格式,从而实现语音交互。
简单来说,就是将步骤转换为格式,通过 ChatGPT 进行格式转换,如在我们的例子中,有一个使用 ChatGPT 实现 i18n 的代码转换。
强化学习模式(ChatGPT 推荐)
我们还没展开研究,不过,理论上是可行的。
基于增量学习的 ChatGPT: 使用增量学习技术对ChatGPT进行训练和调整,提高回答准确度和全面性。例如,将ChatGPT用于股票投资,使用增量学习技术对ChatGPT进行训练和调整,从而实现更精准的股票推荐和投资建议。
基于深度强化学习的 ChatGPT: 使用深度强化学习技术优化ChatGPT的响应速度和回答质量,提高对话质量。例如,将ChatGPT用于智能家居,使用深度强化学习技术优化ChatGPT的响应速度和回答质量,从而实现更快速、准确的家居控制和交互体验。
验证模式(ChatGPT 推荐)
我们还没展开研究,不过,理论上是可行的。
安全模式: 为保护用户隐私和系统安全,对敏感信息进行脱敏、加密等处理,防止恶意攻击和数据泄露。例如,在医疗健康领域中,ChatGPT 用于病例诊断和病情分析时,需要对患者隐私信息进行保护。
自我监督模式: 利用 ChatGPT 自身生成的回答作为监督信号,对模型进行自我监督和调整,提高回答准确度。例如,将 ChatGPT 用于自动化翻译,利用自我监督模式对模型进行调整,从而实现更准确的翻译结果。
其它
硅基生物在这一波中,挺好玩的。
欢迎来加入我们探索无限可能:https://github.com/prompt-engineering