4.3 【prompt教程6】系统地测试更改

系统地测试更改 如果你能测量它,提高性能就更容易了。在某些情况下,对提示的修改将在一些孤立的例子中实现更好的性能,但在一组更具代表性的例子上会导致整体表现更差。因此,为了确保变化对性能是净正的,可能需要定义一个全面的测试套件(也称为“评估”)。 有时很难判断变化——例如,新指令或新设计——是否使您的系统变得更好或更糟。看几个例子可能会暗示哪个更好,但样本量小,很难区分真正的改进或随机运气。也许这种变化有助于一些输入的性能,但损害了其他输入的性能。 参考黄金标准答案评估模型输出 假设知道一个问题的正确答案应该参考一组特定的已知事实。然后,我们可以使用模型查询来计算答案中包含多少必要的事实。 较...

4.3 【prompt教程5】使用外部工具

使用外部工具 通过向GPT提供其他工具的输出来补偿GPT的弱点。例如,文本检索系统可以告诉GPT相关文档。代码执行引擎可以帮助GPT进行数学和运行代码。如果一项任务可以通过工具而不是GPT更可靠或高效地完成,请卸载它以充分利用两者。 使用基于嵌入的搜索来实现高效的知识检索 如果作为其输入的一部分提供,模型可以利用外部信息来源。这可以帮助模型产生更明智和最新的响应。例如,如果用户询问有关特定电影的问题,则在模型的输入中添加有关电影的高质量信息(例如演员、导演等)可能是有用的。嵌入可用于实现高效的知识检索,以便在运行时动态地将相关信息添加到模型输入中。 文本嵌入是一种可以测量文本字符串之间相关性的...

4.3 【prompt教程4】给GPT时间“思考”

给GPT时间“思考” 如果要求将17乘以28,你可能不会立即知道,但仍然可以随着时间的推移而解决。同样,GPT在试图立即回答时会犯更多的推理错误,而不是花时间来找出答案。在答案之前询问一连串的推理可以帮助GPT更可靠地找到正确答案。 1 在匆忙得出结论之前,指示模型制定自己的解决方案 有时,当我们在得出结论之前明确指示模型从第一原则进行推理时,我们会得到更好的结果。例如,假设我们想要一个模型来评估学生对数学问题的解决方案。最明显的方法是简单地询问模型学生的解决方案是否正确。 较糟糕的例子:“一个人从10米高的楼顶掉下来,他会受伤吗?” 较好的例子:“请制定一个模型与解决方案,来确定一个人从...

4.3 【prompt教程3】将复杂的任务拆分为更简单的子任务

将复杂的任务拆分为更简单的子任务 正如软件工程中将复杂系统分解为一组模块化组件的良好做法一样,提交给GPT的任务也是如此。复杂的任务往往比简单的任务具有更高的错误率。此外,复杂的任务通常可以重新定义为更简单任务的工作流程,其中使用早期任务的输出来构建后续任务的输入。 1. 使用意图分类来识别与用户查询最相关的说明 对于需要大量独立指令集来处理不同情况的任务,首先对查询类型进行分类并使用该分类来确定需要哪些指令是有益的。这可以通过定义与处理给定类别中的任务相关的固定类别和硬编码指令来实现。这个过程也可以递归地应用于将任务分解成一系列阶段。这种方法的优点是,与使用单个查询执行整个任务相比,每个查询...

4.3 【prompt教程2】提供参考文本

提供参考文本 GPT可以自信地发明假答案,特别是当被问及深奥的话题或引用和URL时。就像一张笔记可以帮助学生在测试中做得更好一样,为GPT提供参考文本可以帮助以更少的捏造来回答。 1 指导模型使用参考文本回答 如果我们能提供一个具有与当前查询相关的可信信息的模型,那么我们可以指示模型使用提供的信息来编写其答案。 较糟糕的例子:“告诉我关于光纤的事情” 较好的例子:“根据这篇文章[光纤链接],请说明光纤的基本原理和优点。” 2 指导模型用参考文本中的引文来回答 如果输入已经用相关知识补充,那么直接要求模型通过引用所提供文件中的段落在其答案中添加引文。请注意,输出中的引文可以通过在提供的文...

4.3 【prompt教程1】写清楚说明详细

写清楚说明详细(占比80%) GPT无法读懂你的思想。如果输出太长,请要求简短的回复。如果输出太简单,请要求专家级写作。如果您不喜欢这种格式,请演示您想要看到的格式。GPT猜测你想要什么的次数越少,你得到它的可能性就越大。 1.尽可能地提供足够的细节,让它知道你想要什么样的答案。 为了获得高度相关的响应,请确保请求提供任何重要的细节或上下文。否则,你让模型来猜测你的意思。 较糟糕的例子:“写一首歌” 较好的例子:“写一首英文流行歌,长度为三分钟左右,主题是爱情,有四个段落,每个段落有四行歌词,每行歌词有八个音节左右。” 2.要求模型扮演特定角色 系统消息可用于指定模型在其回复中使...

4.2 chatgpt的三步训练

chatgpt的三步训练 1【无监督学习】Pre-trained 预训练 让ChatGPT对「海量互联网文本」做单字接龙,以扩充模型的词汇量、语言知识、世界的信息与知识。使ChatGPT从“哑巴鹦鹉”变成“脑容量超级大的懂王鹦鹉”。 1.1 GPT1 GPT-1 的学习材料约 5GB。 这里 1 MB 能存 30-50 万汉字,而 1 GB 是 1024 MB。 GPT-1 的参数是 1.17 亿。 参数反映着模型大小,参数越多,模型能建构的规律就越复杂,能记忆的信息和学习的知识也就越多,相当于是大脑中神经突触的数量。高中的直线斜截式方程就 2 个参数,而它有 1 亿多个。 1.2 GPT...

4.2 GPT的原理

GPT的原理[一句话:大力出奇迹 ] 1.实质功能:自回归生成 单字生成:根据上文,生成下一个字。 把自己生成的字和原文组合成为上文,再生成下一个字。 输入大量的文本,人类的几千年文化沉淀。 对于同样的上文,生成概率分布。 实际上 ChatGPT 给出的结果长这样,也就是「所有字的概率分布」,「生成的下一个字」就是按照概率分布抽样得到的结果。 由于抽样结果具有随机性,所以 ChatGPT 的回答并不是每次都一样。 把问题和答案组成范例,然后再输入到模型里面。 2.泛化:预训练 自回归生成的过程可以让模型学习通用规律。 这是因为,当大量的各类文本输入后,问题和回答的通用规律的出现次数远高于某...

3.4 【实操3】数据分析

【实操3】数据分析 1.【实操】这是一个淘宝店铺的数据前五行,请帮我解释一下数据: 这是一个淘宝店铺的数据前五行,请帮我解释一下数据:统计日期 访客数 "人均浏览量(访问深度)" 跳失率 "无线端访客数" "无线端浏览量" "无线端人均浏览量" "无线端人均停留时长(秒)" "无线端商品详情页访客数" "无线端跳失率" "无线端商品详情页浏览量" 客单价 "无线端客单价" 下单金额 "无线端下单金额&qu...

OpenAI:将向所有ChatGPT Plus用户开放这一超级功能,人人都能成为数据分析师!-今日头条

OpenAI:将向所有ChatGPT Plus用户开放这一超级功能,人人都能成为数据分析师! 每日经济新闻 7月8日凌晨,OpenAI在社交平台宣布,下周,将向所有ChatGPT Plus用户开放代码解析器功能。这是自OpenAI发布GPT-4以来,最强大的功能! 这将允许ChatGPT 运行代码,并且可以访问用户上传的文件,可实现分析数据、创建图表、编辑文件、执行数学运算等复杂操作。 其中,数据分析功能非常非常强大, 使得很多不会专业代码的业务人员,通过自然语言文本、数据文件等,就能快速创建可视化数据分析图表 ,适用于销售、人力资源、医疗、制造、媒体、金融等业务场景。 图片来源:推特截图 ...

3.3 【实操2】代码生成

【实操2】代码生成 五大AI编程工具(Copilot、Tabnine、Codeium)综合评估分析 https://www.zengqueling.com/wudaaibianchenggongjucopilottabninecodeiumzonghepinggufenxij/ 【案例1】彩票生成prompt: 写一个彩票生成的完整程序代码,可以选择双色球或大乐透(输入1或2选择),然后可以输入注数,用Python。 import random def generate_lottery(choice, num_of_bets): if choice == 1: red_ball...

3.2【实操1】文本生成

1.【案例1】以‘民族企业走向世界:抖音为例’为主题,写一份思政内容大纲。 1.1讯飞星火 以‘民族企业走向世界:抖音为例’为主题,写一份思政内容大纲。 按上面的大纲,填充为一份2000字左右的讲稿。 继续 1.2chatgpt prompt: 以‘民族企业走向世界:抖音为例’为主题,写一份思政内容大纲,输出markdown格式。 按上面的大纲,填充为一份2000字左右的讲稿。 6.5 民族企业走向世界-以抖音为例 P1 (开头)大家好!今天我将跟大家分享一下民族企业走向世界的数字媒体技术,并以抖音为例进行讲述,希望能给大家带来一些启示和思考。 抖音作为一款典型的民族企业产品,自2016年推...

2.4 chatgpt进化之路

chatgpt进化之路 1. GPT3.5和GPT4的区别 GPT3和GPT4的最大不同之处在于规模,GPT3拥有175B参数,而GPT4拥有3.3T参数,可以有效地解决复杂语言任务。 GPT4的模型可以有效地解决自然语言交互(NLU)和自然语言理解(NLU)等复杂NLP任务。 GPT4更创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格 GPT4可以接受图片输入(暂不可用)、并生成字幕等 GPT4可以处理超过25000字长文本 GPT4智能程度大幅提升。以美国BAR律师执照统考为例:GPT3.5可以达到10%水平分,GPT4可以达到90%水平分。生物奥林匹克竞赛从GPT3.5的31%...

2.3 国内平台介绍

一图汇总国内大模型的现状 1.推荐平台 1.1 讯飞星火认知大模型 https://xinghuo.xfyun.cn 科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。 需要申请,但审核很快。 非常接近chatgpt3.5。 【新闻】:8月15日 讯飞星火V2.0重磅发布 https://mp.weixin.qq.com/s/NXUjpq225EaaPeB3iLqUFg 讯飞星火V2.0升级发布的多模态能力,已实现图像描述、图像理解、图像推理、识图创作、文图生...