令爷课程-曾确令(ColinZENG)AIGC玩家 – 第 22 页 – 大数据技术|AIGC|Chatgpt应用|数据分析|人工智能

5.1 【AIGC应用】论文阅读

2026年7月27日2023年7月11日作者曾确令

论文阅读 TXYZ https://txyz.ai 直接搜索文献编号，标题就能开始提问，快速阅读。 Humata https://app.humata.ai 风声雨声 https://fsys.app 让 AI 帮你阅读和解惑，翻译，帮你写。【案例】：“Ranedeer先生”灵感思想之树论文 https://arxiv.org/pdf/2305.10601.pdf prompt示例：论文主要做了什么？为什么会选择这个课题进行研究？本论文的意义和目的是什么？（理论意义+实践意义）论文的框架和逻辑是如何安排的？论文存在哪些不完备或未解决的？论文有什么创新点？论文的主要研究...

4.6 prompt相关资源

2026年7月27日2023年7月11日作者曾确令

1. OpenAI Cookbook https://github.com/openai/openai-cookbook#related-resources-from-around-the-web 1.1 提示库和工具指导：微软的一个看起来很方便的Python库，它使用Handlebars模板来交错生成、提示和逻辑控制。 LangChain：一个流行的Python/JavaScript库，用于链接语言模型提示的序列。 FLAML（自动机器学习和调优的快速库）：用于自动选择模型、超参数和其他可调选项的Python库。 Chainlit：用于制作聊天机器人接口的Python库。 Guardra...

4.7.1 【markdown】为什么要学？

2026年7月27日2023年7月10日作者曾确令

为什么要学markdown？用一个游戏来示例 prompt: 你将要与我进行五子棋对弈。我们将轮流进行运动，并在每次运动后交换写下我们的棋子位置。我将使用黑色棋子（x），你将使用白色棋子（o）。请记住，我们是竞争对手，所以以请不要解释你的举动。在你取举行动之前，请先确保你在脑海中更新了棋盘状态。以markdown形式恢复最新的棋盘。我将首创开始，我的第一步是 5,5。本身就是排版 chatgpt默认就支持markdown 显示图片的prompt：请按以下规则给我发送图片： 1.使用markdown格式； 2.使用unsplash API； 3.使用" ![image](h...

prompt框架和实践案例

2026年7月27日2023年7月10日作者曾确令

从实践来看，GPT-4 是最佳选择， Claude 模型能力次之， GPT-3.5 勉强可用。若有条件，推荐使用 GPT-4 。出于节约成本和服务可访问性的考虑，可能许多朋友需要使用 GPT-3.5 模型。在模型能力允许的情况下，可以先用GPT-4来生成结构化的prompt（ prompt例子1：prompt工程师），然后在GPT-3.5里面使用结构化prompt。同时，依据 prompt 表现，不断修改调优你的提示词。这样的确能提高 Prompt 性能，但是在不符合你的实际需要时，仍然需要使用各种方法调试修改 Prompt。通用prompt框架 CRISPE 框架: 来源：http...

4.3 【prompt教程6】系统地测试更改

2026年7月27日2023年7月10日作者曾确令

系统地测试更改如果你能测量它，提高性能就更容易了。在某些情况下，对提示的修改将在一些孤立的例子中实现更好的性能，但在一组更具代表性的例子上会导致整体表现更差。因此，为了确保变化对性能是净正的，可能需要定义一个全面的测试套件（也称为“评估”）。有时很难判断变化——例如，新指令或新设计——是否使您的系统变得更好或更糟。看几个例子可能会暗示哪个更好，但样本量小，很难区分真正的改进或随机运气。也许这种变化有助于一些输入的性能，但损害了其他输入的性能。参考黄金标准答案评估模型输出假设知道一个问题的正确答案应该参考一组特定的已知事实。然后，我们可以使用模型查询来计算答案中包含多少必要的事实。较...

4.3 【prompt教程5】使用外部工具

2026年7月27日2023年7月10日作者曾确令

使用外部工具通过向GPT提供其他工具的输出来补偿GPT的弱点。例如，文本检索系统可以告诉GPT相关文档。代码执行引擎可以帮助GPT进行数学和运行代码。如果一项任务可以通过工具而不是GPT更可靠或高效地完成，请卸载它以充分利用两者。使用基于嵌入的搜索来实现高效的知识检索如果作为其输入的一部分提供，模型可以利用外部信息来源。这可以帮助模型产生更明智和最新的响应。例如，如果用户询问有关特定电影的问题，则在模型的输入中添加有关电影的高质量信息（例如演员、导演等）可能是有用的。嵌入可用于实现高效的知识检索，以便在运行时动态地将相关信息添加到模型输入中。文本嵌入是一种可以测量文本字符串之间相关性的...

4.3 【prompt教程4】给GPT时间“思考”

2026年7月27日2023年7月10日作者曾确令

给GPT时间“思考” 如果要求将17乘以28，你可能不会立即知道，但仍然可以随着时间的推移而解决。同样，GPT在试图立即回答时会犯更多的推理错误，而不是花时间来找出答案。在答案之前询问一连串的推理可以帮助GPT更可靠地找到正确答案。 1 在匆忙得出结论之前，指示模型制定自己的解决方案有时，当我们在得出结论之前明确指示模型从第一原则进行推理时，我们会得到更好的结果。例如，假设我们想要一个模型来评估学生对数学问题的解决方案。最明显的方法是简单地询问模型学生的解决方案是否正确。较糟糕的例子：“一个人从10米高的楼顶掉下来，他会受伤吗？” 较好的例子：“请制定一个模型与解决方案，来确定一个人从...

4.3 【prompt教程3】将复杂的任务拆分为更简单的子任务

2026年7月27日2023年7月10日作者曾确令

将复杂的任务拆分为更简单的子任务正如软件工程中将复杂系统分解为一组模块化组件的良好做法一样，提交给GPT的任务也是如此。复杂的任务往往比简单的任务具有更高的错误率。此外，复杂的任务通常可以重新定义为更简单任务的工作流程，其中使用早期任务的输出来构建后续任务的输入。 1. 使用意图分类来识别与用户查询最相关的说明对于需要大量独立指令集来处理不同情况的任务，首先对查询类型进行分类并使用该分类来确定需要哪些指令是有益的。这可以通过定义与处理给定类别中的任务相关的固定类别和硬编码指令来实现。这个过程也可以递归地应用于将任务分解成一系列阶段。这种方法的优点是，与使用单个查询执行整个任务相比，每个查询...

4.3 【prompt教程2】提供参考文本

2026年7月27日2023年7月10日作者曾确令

提供参考文本 GPT可以自信地发明假答案，特别是当被问及深奥的话题或引用和URL时。就像一张笔记可以帮助学生在测试中做得更好一样，为GPT提供参考文本可以帮助以更少的捏造来回答。 1 指导模型使用参考文本回答如果我们能提供一个具有与当前查询相关的可信信息的模型，那么我们可以指示模型使用提供的信息来编写其答案。较糟糕的例子：“告诉我关于光纤的事情” 较好的例子：“根据这篇文章[光纤链接]，请说明光纤的基本原理和优点。” 2 指导模型用参考文本中的引文来回答如果输入已经用相关知识补充，那么直接要求模型通过引用所提供文件中的段落在其答案中添加引文。请注意，输出中的引文可以通过在提供的文...

4.3 【prompt教程1】写清楚说明详细

2026年4月27日2023年7月10日作者曾确令

写清楚说明详细（占比80%） GPT无法读懂你的思想。如果输出太长，请要求简短的回复。如果输出太简单，请要求专家级写作。如果您不喜欢这种格式，请演示您想要看到的格式。GPT猜测你想要什么的次数越少，你得到它的可能性就越大。 1.尽可能地提供足够的细节，让它知道你想要什么样的答案。为了获得高度相关的响应，请确保请求提供任何重要的细节或上下文。否则，你让模型来猜测你的意思。较糟糕的例子：“写一首歌” 较好的例子：“写一首英文流行歌，长度为三分钟左右，主题是爱情，有四个段落，每个段落有四行歌词，每行歌词有八个音节左右。” 2.要求模型扮演特定角色系统消息可用于指定模型在其回复中使...

4.2 chatgpt的三步训练

2026年7月27日2023年7月9日作者曾确令

chatgpt的三步训练 1【无监督学习】Pre-trained 预训练让ChatGPT对「海量互联网文本」做单字接龙，以扩充模型的词汇量、语言知识、世界的信息与知识。使ChatGPT从“哑巴鹦鹉”变成“脑容量超级大的懂王鹦鹉”。 1.1 GPT1 GPT-1 的学习材料约 5GB。这里 1 MB 能存 30-50 万汉字，而 1 GB 是 1024 MB。 GPT-1 的参数是 1.17 亿。参数反映着模型大小，参数越多，模型能建构的规律就越复杂，能记忆的信息和学习的知识也就越多，相当于是大脑中神经突触的数量。高中的直线斜截式方程就 2 个参数，而它有 1 亿多个。 1.2 GPT...

4.2 GPT的原理

2026年7月27日2023年7月9日作者曾确令

GPT的原理[一句话：大力出奇迹 ] 1.实质功能：自回归生成单字生成：根据上文，生成下一个字。把自己生成的字和原文组合成为上文，再生成下一个字。输入大量的文本，人类的几千年文化沉淀。对于同样的上文，生成概率分布。实际上 ChatGPT 给出的结果长这样，也就是「所有字的概率分布」，「生成的下一个字」就是按照概率分布抽样得到的结果。由于抽样结果具有随机性，所以 ChatGPT 的回答并不是每次都一样。把问题和答案组成范例，然后再输入到模型里面。 2.泛化：预训练自回归生成的过程可以让模型学习通用规律。这是因为，当大量的各类文本输入后，问题和回答的通用规律的出现次数远高于某...

3.4 【实操3】数据分析

2026年7月27日2023年7月9日作者曾确令

【实操3】数据分析 1.【实操】这是一个淘宝店铺的数据前五行，请帮我解释一下数据：这是一个淘宝店铺的数据前五行，请帮我解释一下数据：统计日期访客数 "人均浏览量（访问深度）" 跳失率 "无线端访客数" "无线端浏览量" "无线端人均浏览量" "无线端人均停留时长(秒)" "无线端商品详情页访客数" "无线端跳失率" "无线端商品详情页浏览量" 客单价 "无线端客单价" 下单金额 "无线端下单金额&qu...

OpenAI：将向所有ChatGPT Plus用户开放这一超级功能，人人都能成为数据分析师！-今日头条

2026年7月27日2023年7月9日作者曾确令

OpenAI：将向所有ChatGPT Plus用户开放这一超级功能，人人都能成为数据分析师！每日经济新闻 7月8日凌晨，OpenAI在社交平台宣布，下周，将向所有ChatGPT Plus用户开放代码解析器功能。这是自OpenAI发布GPT-4以来，最强大的功能！这将允许ChatGPT 运行代码，并且可以访问用户上传的文件，可实现分析数据、创建图表、编辑文件、执行数学运算等复杂操作。其中，数据分析功能非常非常强大，使得很多不会专业代码的业务人员，通过自然语言文本、数据文件等，就能快速创建可视化数据分析图表，适用于销售、人力资源、医疗、制造、媒体、金融等业务场景。图片来源：推特截图 ...

3.3 【实操2】代码生成

2026年7月27日2023年7月9日作者曾确令

【实操2】代码生成五大AI编程工具（Copilot、Tabnine、Codeium）综合评估分析 https://www.zengqueling.com/wudaaibianchenggongjucopilottabninecodeiumzonghepinggufenxij/ 【案例1】彩票生成prompt：写一个彩票生成的完整程序代码，可以选择双色球或大乐透（输入1或2选择），然后可以输入注数，用Python。 import random def generate_lottery(choice, num_of_bets): if choice == 1: red_ball...