应用 – 第 3 页 – 令爷课程-曾确令(ColinZENG)AIGC玩家

字节发布多模态大模型：BuboGPT

2026年4月27日2023年9月3日作者曾确令

字节发布多模态大模型：BuboGPT AI工具箱字节跳动最近也发布了自己的多模态大模型BuboGPT，整合了包括文本、图像和音频在内的多模式输入，能够较好的理解图片片、语言数据。Demo上可以上传图片或者音频，然后询问相关的内容，回答效果不错。可以理解中文，但是回答却是英文。体验地址：https://huggingface.co/spaces/magicr/BuboGPT 开源地址：https://github.com/magic-research/bubogpt 项目主页：https://bubo-gpt.github.io 00:26 / 02:26

千亿级、数学专用，MathGPT大模型开始公测了

2026年4月27日2023年8月29日作者曾确令

机器之心发布机器之心编辑部好未来推出数学领域千亿级大模型 MathGPT ，做好 AI 时代数学基础工作。国内大模型市场又迎来了一个新的「选手」，这次是数学专用大模型。 8 月 24 日，机器之心获悉，在好未来 20 周年直播活动中，CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 开启内测。即日起，用户可通过官网（www.mathgpt.com）申请注册账号免费试用体验。今年 5 月，好未来曾公布正在进行自研数学大模型的研发，命名为 MathGPT。MathGPT 是面向全球数学爱好者和科研机构，以解题和讲题算法为核心的数学垂直领域的大模型，也是国内首个专为数学打...

AI 破解验证码的速度比我还快了？

2026年4月27日2023年8月26日作者曾确令

最近世超看到了个消息：AI 识别验证码，现在比人都快了。不仅快，准确率还吊打人类。这不，前段时间加州大学艾尔文分校就甩出了一份论文，里面的研究数据是啪啪打验证系统的脸。简单来说，他们把市面上所有类型的验证码，点击类的，拖拽旋转类的，图片选择类的等等等等，都搜罗了过来，分别让 AI 和测试者做了个遍。其中，最简单的点击识别， AI 直接 1.4 秒就能过，还百分百准确度，而人类不但要得花 3~4 秒，竟然有一两成的人过不了。到拉大难度的图片验证， AI 虽然在速度上稍有下降，但起码还保持在人类的平均水平里，准确度也和人类相当。让我选红绿灯，这杆子我是真不知道该不该选测试结果...

国内首个AI商拍weshop

2026年4月27日2023年8月20日作者曾确令

https://www.weshop.com 在WeShop，你再也不会受到模特/经纪/摄影/后期/场租/机酒的限制，省时、省力、又省钱。鼠标就是快门，点击就看成片。

DoctorGPT是一个大型语言模型，可以通过美国医生执照考试

2026年4月27日2023年8月20日作者曾确令

DoctorGPT是一个大型语言模型，可以通过美国医生执照考试。这是一个开源项目，其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本，它在医疗对话数据集上进行了微调，然后使用强化学习和宪法人工智能进一步改进。由于该模型的大小只有 3 GB，因此它适合任何本地设备，因此无需支付 API 即可使用它。它是免费的，专为离线使用而设计，可以保护患者的隐私，并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。为了训练模型，可以在本地运行 Training.ipynb ，也可以通过 Google C...

2023AIGC创新案例TOP10

2026年4月27日2023年8月15日作者曾确令

2023AIGC创新案例TOP10 来源： [中商情报网] 中商情报网讯：近日，由DBC联合CIW/CIS推出“2023AIGC创新案例TOP10”，珍岛集团、APUS、百融云创、即时设计等十家企业入选。珍岛集团的大语言模型--教育政策智慧决策大脑拥有自然语言处理和文本分析、数据可视化和报告生成、智能决策支持三大功能，能够提供高效、准确的教育政策文本分析和决策支持，满足政府机构、研究机构和决策者的需求；APUS自研的多模态人工智能大模型“天燕大模型AiLMe”，具备对文本、图像、视频、音频的理解和生成能力。同时，针对具体应用场景，APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀...

摩根大通开始使用AIGC写研报

2026年4月27日2023年8月15日作者曾确令

作为美国最大银行，也是全球金融圈对AI探索“步子迈得最大”的摩根大通，现在开始把创新的目光投向了研究报告领域。据美国财经媒体MarketWatch周五报道，在摩根大通的跨资产报告产品Cross Asset Spotlight中，已经开始使用生成式AI为人类分析师报告撰写总结，同时在这些AI总结后面附带着报告原文的链接。在这份研报的免责声明中，摩根大通的分析师们表示，投资者需要在不断变化的市场中筛选大量内容，这是使用人工智能的部分原因。他们能够使用AI，对近期和最相关的研报撰写总结。对此，Omnia家族办公室的首席运营官Michael Wagner解读称，摩根大通似乎正在使用一...

AIGC高级应用：基于GPT4搭建本地知识库AI机器人

2026年4月27日2023年7月30日作者曾确令

背景在日常生活工作中我们会和很多文档打交道，今天这期我们将一起看下如何使用LlamaIndex和LangChain来构建一个基于GPT-4的本地文档知识库聊天机器人。在我们开始搭建本地自定义知识库之前，让我们先来聊下使用chatGPT网页端的一些限制。由于OpenAI网页端使用的是预训练模型，这意味着它的知识库只能包含在模型训练期间提供的数据。（目前数据还停留在2021年）因此，它无法回答特定的、最新的数据或一些私有未公开数据的问题。另外，网页端的GPT4还有3小时内只能回答25个问题的限制，所以我们这次的目的通过搭建本地知识库来突破这些限制原理首先介绍一些本地AI聊天知识库的原理，...

闪击配搭chatgpt生成PPT教程

2026年4月27日2023年7月26日作者曾确令

SANKKI SANKKI 是闪击矩阵旗下的 AI 辅助智能 PPT 创作的工具，旨在帮助用户制作“内容为王，逻辑清晰”的 PPT 官网地址 SANKKI 是什么？ SANKKI 是闪击矩阵旗下的 AI 辅助智能 PPT 创作的工具，旨在帮助用户制作“内容为王，逻辑清晰”的PPT。有了这个工具，不用再花时间找模板，将 PPT 制作都搬上 SANKKI 的编辑器，同时还能辅助用户进行文字稿创作、演示演讲。 SANKKI 能做什么？搭配ChatGPT使用：将如下提示词发给 ChatGPT，他会生成一份符合语法要求的PPT，然后你再直接使用文本转PPT功能，就能快速得到一份PPT了...

AI数字人

2026年4月27日2023年7月26日作者曾确令

D-ID D-ID 是一个由人工智能驱动的工具，旨在从静态图像中创建专业视频官网地址 D-ID 是什么？ D-ID 是一个由人工智能驱动的工具，旨在从静态图像中创建专业视频。其生成性人工智能使用户能够将任何图片或视频转化为非凡的体验；该项技术被世界各地的创作者、领先的营销机构、制作公司和社交媒体平台使用。 D-ID 的使命是，只用人工智能，就能实现完整的视频制作。 D-ID 能做什么？多功能的视频创作：用文字或音频制作视频，具有广泛的创意可能性；简化过程：以最小的努力快速创建高质量的视频；API访问：允许开发人员在平台上建立自定义应用程序。 HeyGen Movio...

ChatGPT写论文6步法

2026年4月27日2023年7月24日作者曾确令

下面是我们整理的一套提问方法论，专门解决写论文、读文献、润色降重和论文答辩的问题。想让ChatGPT写出一篇高质量的论文，分六步走。 graph LR; A[现象确认] --> B[学术概念化]; B --> C[定位优质学术资源]; C --> D[对比分析]; D --> E[深挖启示]; E --> F[写论文]; 为什么写篇论文要这么复杂，用六个步骤来提问？这里就不得不提ChatGPT的工作原理了。我们都知道ChatGPT是一个大型语言模型，它抓取了互联网上几乎所有的优质数据，然后不断地归纳总结，将信息之间进行连接、建立联系。这...

AGI的发展

2026年4月27日2023年7月22日作者曾确令

AGI的发展人工智能的发展经历了多个阶段，从最初的符号主义到深度学习，每个阶段都有其独特的贡献和限制。AGI（Artificial General Intelligence）是人工智能领域的一个理论概念，它旨在开发能够像人类一样具有智能水平的人工智能系统。以下是AGI的发展历程： flowchart LR subgraph AGI_Evolution A[符号主义] B[连接主义] C[深度学习] D[AGI] end A --> B B --> C C --> D ...

[国培]ChatGPT的技术核心——AIGC应用实践大纲

2026年4月27日2023年7月16日作者曾确令

1. 课程介绍 1.1 课程时间第一期 [2023信息能力提升国培] 时间：2023年07月17日 1.2 讲师：曾确令 www.zengqueling.com 广东机电职业技术学院 1.3 课程内容： ChatGPT的技术核心——AIGC应用实践 ps： AIGC生成的课程大纲 graph TD; Prompt工程 -->|输入| AIGC; AIGC -->|输出| Markdown+; Markdown+ -.->|属于| Prompt工程; 1.4 课程目录 gantt title [令爷]AIGC课程安排 dateFor...

5.2 AI Agents

2023年9月19日2023年7月16日作者曾确令

1. AI Agents 1.1 大部分上面的工具沦为“看不见的过程” 1.1.1 ChatGPT代码解释器（Code interpreter） GPT-4最强功能正式解禁 GPT-4.5来了！使用 OpenAI 的代码解释器在 7 分钟内制作了 Flappy Bird Code Interpreter的自行迭代 chatgpt：如果网络和Code Interpreter能一起用？ Code Interpreter：数据分析师可以摸鱼啦～～ 1.1.2 AI Agents （人工智能代理人）【新闻】AutoGPT太火了，无需人类插手自主完成任务，GitHu...

多模态AI应用

2023年9月28日2023年7月16日作者曾确令

1. 多模态AI应用 1.0 chatgpt的多模态 ChatGPT迎来多模态（看，听，说）重大更新 1.1 AI绘图： 1.1.1 midjourney https://www.midjourney.com Midjourney才发布1年,看一下同样的prompt："a girl"在V1到V5.2的变化 https://www.zengqueling.com/mcfbzncvdvdbh/ 1.1.2 美图秀秀：whee https://www.whee.com/ 1.1.3 Stable Diffusion StabilityAI推出的文本到图像生成AI ht...