字节发布多模态大模型:BuboGPT

字节发布多模态大模型:BuboGPT AI工具箱 字节跳动最近也发布了自己的多模态大模型BuboGPT,整合了包括文本、图像和音频在内的多模式输入,能够较好的理解图片片、语言数据。Demo上可以上传图片或者音频,然后询问相关的内容,回答效果不错。可以理解中文,但是回答却是英文。 体验地址:https://huggingface.co/spaces/magicr/BuboGPT 开源地址:https://github.com/magic-research/bubogpt 项目主页:https://bubo-gpt.github.io 00:26 / 02:26

千亿级、数学专用,MathGPT大模型开始公测了

机器之心发布 机器之心编辑部 好未来推出数学领域千亿级大模型 MathGPT ,做好 AI 时代数学基础工作。 国内大模型市场又迎来了一个新的「选手」,这次是数学专用大模型。 8 月 24 日,机器之心获悉,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 开启内测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验。 今年 5 月,好未来曾公布正在进行自研数学大模型的研发,命名为 MathGPT。MathGPT 是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打...

AI 破解验证码的速度比我还快了?

最近世超看到了个消息:AI 识别验证码,现在比人都快了。不仅快,准确率还吊打人类。 这不,前段时间加州大学艾尔文分校就甩出了一份论文,里面的研究数据是啪啪打验证系统的脸。 简单来说,他们把市面上所有类型的验证码,点击类的,拖拽旋转类的,图片选择类的等等等等,都搜罗了过来,分别让 AI 和测试者做了个遍。 其中,最简单的点击识别, AI 直接 1.4 秒就能过,还百分百准确度,而人类不但要得花 3~4 秒,竟然有一两成的人过不了。 到拉大难度的图片验证, AI 虽然在速度上稍有下降,但起码还保持在人类的平均水平里,准确度也和人类相当。 让我选红绿灯,这杆子我是真不知道该不该选 测试结果...

国内首个AI商拍weshop

https://www.weshop.com 在WeShop,你再也不会受到模特/经纪/摄影/后期/场租/机酒的限制,省时、省力、又省钱。 鼠标就是快门,点击就看成片。

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试。这是一个开源项目,其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本,它在医疗对话数据集上进行了微调,然后使用强化学习和宪法人工智能进一步改进。 由于该模型的大小只有 3 GB,因此它适合任何本地设备,因此无需支付 API 即可使用它。它是免费的,专为离线使用而设计,可以保护患者的隐私,并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。 为了训练模型,可以在本地运行 Training.ipynb ,也可以通过 Google C...

2023AIGC创新案例TOP10

2023AIGC创新案例TOP10 来源: [中商情报网] 中商情报网讯:近日,由DBC联合CIW/CIS推出“2023AIGC创新案例TOP10”,珍岛集团、APUS、百融云创、即时设计等十家企业入选。 珍岛集团的大语言模型--教育政策智慧决策大脑拥有自然语言处理和文本分析、数据可视化和报告生成、智能决策支持三大功能,能够提供高效、准确的教育政策文本分析和决策支持,满足政府机构、研究机构和决策者的需求;APUS自研的多模态人工智能大模型“天燕大模型AiLMe”,具备对文本、图像、视频、音频的理解和生成能力。同时,针对具体应用场景,APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀...

摩根大通开始使用AIGC写研报

作为美国最大银行,也是全球金融圈对AI探索“步子迈得最大”的摩根大通,现在开始把创新的目光投向了研究报告领域。 据美国财经媒体MarketWatch周五报道, 在摩根大通的跨资产报告产品Cross Asset Spotlight中,已经开始使用生成式AI为人类分析师报告撰写总结,同时在这些AI总结后面附带着报告原文的链接 。 在这份研报的免责声明中,摩根大通的分析师们表示, 投资者需要在不断变化的市场中筛选大量内容,这是使用人工智能的部分原因 。他们能够使用AI,对近期和最相关的研报撰写总结。 对此,Omnia家族办公室的首席运营官Michael Wagner解读称,摩根大通似乎正在使用一...

AIGC高级应用:基于GPT4搭建本地知识库AI机器人

背景 在日常生活工作中我们会和很多文档打交道,今天这期我们将一起看下如何使用LlamaIndex和LangChain来构建一个基于GPT-4的本地文档知识库聊天机器人。 在我们开始搭建本地自定义知识库之前,让我们先来聊下使用chatGPT网页端的一些限制。由于OpenAI网页端使用的是预训练模型,这意味着它的知识库只能包含在模型训练期间提供的数据。(目前数据还停留在2021年)因此,它无法回答特定的、最新的数据或一些私有未公开数据的问题。另外,网页端的GPT4还有3小时内只能回答25个问题的限制,所以我们这次的目的通过搭建本地知识库来突破这些限制 原理 首先介绍一些本地AI聊天知识库的原理,...

闪击配搭chatgpt生成PPT教程

SANKKI SANKKI 是闪击矩阵旗下的 AI 辅助智能 PPT 创作的工具,旨在帮助用户制作“内容为王,逻辑清晰”的 PPT 官网地址 SANKKI 是什么? SANKKI 是闪击矩阵旗下的 AI 辅助智能 PPT 创作的工具,旨在帮助用户制作“内容为王,逻辑清晰”的PPT。 有了这个工具,不用再花时间找模板,将 PPT 制作都搬上 SANKKI 的编辑器,同时还能辅助用户进行文字稿创作、演示演讲。 SANKKI 能做什么? 搭配ChatGPT使用:将如下提示词发给 ChatGPT,他会生成一份符合语法要求的PPT,然后你再直接使用文本转PPT功能,就能快速得到一份PPT了...

AI数字人

D-ID D-ID 是一个由人工智能驱动的工具,旨在从静态图像中创建专业视频 官网地址 D-ID 是什么? D-ID 是一个由人工智能驱动的工具,旨在从静态图像中创建专业视频。 其生成性人工智能使用户能够将任何图片或视频转化为非凡的体验;该项技术被世界各地的创作者、领先的营销机构、制作公司和社交媒体平台使用。 D-ID 的使命是,只用人工智能,就能实现完整的视频制作。 D-ID 能做什么? 多功能的视频创作:用文字或音频制作视频,具有广泛的创意可能性;简化过程: 以最小的努力快速创建高质量的视频;API访问: 允许开发人员在平台上建立自定义应用程序。 HeyGen Movio...

ChatGPT写论文6步法

下面是我们整理的一套提问方法论,专门解决写论文、读文献、润色降重和论文答辩的问题。 想让ChatGPT写出一篇高质量的论文,分六步走。 graph LR; A[现象确认] --> B[学术概念化]; B --> C[定位优质学术资源]; C --> D[对比分析]; D --> E[深挖启示]; E --> F[写论文]; 为什么写篇论文要这么复杂,用六个步骤来提问? 这里就不得不提ChatGPT的工作原理了。 我们都知道ChatGPT是一个大型语言模型,它抓取了互联网上几乎所有的优质数据,然后不断地归纳总结,将信息之间进行连接、建立联系。 这...

AGI的发展

AGI的发展 人工智能的发展经历了多个阶段,从最初的符号主义到深度学习,每个阶段都有其独特的贡献和限制。AGI(Artificial General Intelligence)是人工智能领域的一个理论概念,它旨在开发能够像人类一样具有智能水平的人工智能系统。 以下是AGI的发展历程: flowchart LR subgraph AGI_Evolution A[符号主义] B[连接主义] C[深度学习] D[AGI] end A --> B B --> C C --> D ...

[国培]ChatGPT的技术核心——AIGC应用实践大纲

1. 课程介绍 1.1 课程时间 第一期 [2023信息能力提升国培] 时间:2023年07月17日 1.2 讲师:曾确令 www.zengqueling.com 广东机电职业技术学院 1.3 课程内容: ChatGPT的技术核心——AIGC应用实践 ps: AIGC生成的课程大纲 graph TD; Prompt工程 -->|输入| AIGC; AIGC -->|输出| Markdown+; Markdown+ -.->|属于| Prompt工程; 1.4 课程目录 gantt title [令爷]AIGC课程安排 dateFor...

5.2 AI Agents

1. AI Agents 1.1 大部分上面的工具沦为“看不见的过程” 1.1.1 ChatGPT代码解释器(Code interpreter) GPT-4最强功能正式解禁 GPT-4.5来了! 使用 OpenAI 的代码解释器在 7 分钟内制作了 Flappy Bird Code Interpreter的自行迭代 chatgpt:如果网络和Code Interpreter能一起用? Code Interpreter:数据分析师可以摸鱼啦~~ 1.1.2 AI Agents (人工智能代理人) 【新闻】AutoGPT太火了,无需人类插手自主完成任务,GitHu...

多模态AI应用

1. 多模态AI应用 1.0 chatgpt的多模态 ChatGPT迎来多模态(看,听,说)重大更新 1.1 AI绘图: 1.1.1 midjourney https://www.midjourney.com Midjourney才发布1年,看一下同样的prompt:"a girl"在V1到V5.2的变化 https://www.zengqueling.com/mcfbzncvdvdbh/ 1.1.2 美图秀秀:whee https://www.whee.com/ 1.1.3 Stable Diffusion StabilityAI推出的文本到图像生成AI ht...