开源图像模型Stable Diffusion入门手册

来源 腾讯程序员 [腾讯技术工程 ]() 2023-04-11 18:00 发表于广东 作者:hking Stable Diffusion 是 2022 年发布的深度学习文字到图像生成模型。它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品,本文是一篇使用入门教程。 硬件要求 建议使用不少于 16 GB 内存,并有 60GB 以上的硬盘空间。需要用到 CUDA 架构,推荐使用 N 卡。(目前已经有了对 A 卡的相关支持,但运算的速度依旧明显慢于 N 卡,参见: Install and Run on AMD GPUs · AUTOMATIC1111/stable-d...

ChatGPT加入新功能Custom Instructions

过去使用 ChatGPT 一直有个痛点,为了让 ChatGPT 扮演某个角色、给予特定格式的回复,我们每次开新对话都需要复制相同的指令贴上去做设定。 而现在 ChatGPT刚刚推出的新功能“Custom instructions”就能解决这个困扰!在完成设定后,ChatGPT 更像是你的私人助理;开发人员不用再提醒自己使用的代码语言、老师不用再说明自己的学生是小学3年级、营销人员不用再强调客户群体是哪类人。 STEP 1:打开 Custom instructions 设定 点击左下角的“Settings & Beta”,然后在“Beta features”中将“Custom inst...

国内首个AI商拍weshop

https://www.weshop.com 在WeShop,你再也不会受到模特/经纪/摄影/后期/场租/机酒的限制,省时、省力、又省钱。 鼠标就是快门,点击就看成片。

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试。这是一个开源项目,其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本,它在医疗对话数据集上进行了微调,然后使用强化学习和宪法人工智能进一步改进。 由于该模型的大小只有 3 GB,因此它适合任何本地设备,因此无需支付 API 即可使用它。它是免费的,专为离线使用而设计,可以保护患者的隐私,并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。 为了训练模型,可以在本地运行 Training.ipynb ,也可以通过 Google C...

英伟达的人工智能游乐场

在8月9号,英伟达提供了一个AI PlayGround,俗称“人工智能游乐场”。 这次游乐场一共推出了四个项目:NeVA、Stable Diffusion XL、CLIP、LLaMa 2。可以根据兴趣依次体验,一定是用了最好的GPU,速度很快。 NeVA: NeMo Vision and Language Assistant 英伟达Playground的NeVA免费使用地址:https://catalog.ngc.nvidia.com/orgs/nvidia/teams/playground/models/neva NeVA is a multi-modal vision-language ...

2023AIGC创新案例TOP10

2023AIGC创新案例TOP10 来源: [中商情报网] 中商情报网讯:近日,由DBC联合CIW/CIS推出“2023AIGC创新案例TOP10”,珍岛集团、APUS、百融云创、即时设计等十家企业入选。 珍岛集团的大语言模型--教育政策智慧决策大脑拥有自然语言处理和文本分析、数据可视化和报告生成、智能决策支持三大功能,能够提供高效、准确的教育政策文本分析和决策支持,满足政府机构、研究机构和决策者的需求;APUS自研的多模态人工智能大模型“天燕大模型AiLMe”,具备对文本、图像、视频、音频的理解和生成能力。同时,针对具体应用场景,APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀...

ChatGPT 做定性研究的质量怎么样?用定量方法来研究下!附prompt

ChatGPT 做定性研究的质量怎么样?用定量方法来研究下!附prompt 来源:[AIGC研究社] ChatGPT 作为语言模型,最擅长的就是文本的理解和处理。这正好是用户研究工作中定性研究所需要的技能。 相信很多人自己也使用过 ChatGPT 来对访谈材料进行总结,对主观题进行分类,但总结和分类的质量怎么样,跟人类比又如何,目前还很少看到响应的定量结论。 最近发现了一篇研究( https://measuringu.com/classification-agreement-between-ux-researchers-and-chatgpt/),作者对比了3 个人类研究员和 3 次 Chat...

Prompt 编写模式:如何将思维框架赋予机器

Prompt 编写模式:如何将思维框架赋予机器 来源: https://github.com/prompt-engineering/prompt-patterns 欢迎使用集成了这些模式的工具:https://github.com/prompt-engineering/click-prompt 本书旨在介绍一系列的 Prompt 编写模式,以更好地应用 Prompt 对 AI 进行编程。 我们非常感谢您对本书的关注和支持,并欢迎您为该项目做出贡献!您可以通过以下方式参与本书的开发: 发现问题并报告:如果您在使用本书时发现任何问题或错误,请在项目的 Issue 页面中提出问题,我们将尽快修复。...

ChatGPT操作白皮书,AI入门必备

来源:[ChatGPT扫地僧] GPT使用白皮书,这个足够了 01 欢迎来到 Chat GPT 的世界,在这里人工智能与引人入胜的对话的力量相结合。在当今科技驱动的时代,人工智能已经成为一个流行词,激发了科技巨头的想象力,并有望带来一场堪比工业时代的革命。 OpenAI 处于这场人工智能革命的最前沿,它是一家总部位于美国的领先人工智能研究公司。 OpenAI 的创造 Chat GPT 是一种卓越的语言模型,超越了单纯的文本生成。它能够进行自然的对话,让您感觉就像在与真人聊天一样。 通过提供无缝的聊天 GPT 登录体验,OpenAI 打开了通往尖端 AI 驱动聊天领域的大门,您可以在其中提...

摩根大通开始使用AIGC写研报

作为美国最大银行,也是全球金融圈对AI探索“步子迈得最大”的摩根大通,现在开始把创新的目光投向了研究报告领域。 据美国财经媒体MarketWatch周五报道, 在摩根大通的跨资产报告产品Cross Asset Spotlight中,已经开始使用生成式AI为人类分析师报告撰写总结,同时在这些AI总结后面附带着报告原文的链接 。 在这份研报的免责声明中,摩根大通的分析师们表示, 投资者需要在不断变化的市场中筛选大量内容,这是使用人工智能的部分原因 。他们能够使用AI,对近期和最相关的研报撰写总结。 对此,Omnia家族办公室的首席运营官Michael Wagner解读称,摩根大通似乎正在使用一...

一文讲透prompt变现和职业化

来源: ChatGPT扫地僧 (声明:全文仅代表个人观点,大部分来源是本人的观察和体会,不具备权威性。仅供参考,如有谬误,求拍砖求斧正) 这篇文章全文约8300字,包含这几部分内容: 第一部分:分享我的第三个客制化prompt案例 第二部分:提示词(prompt)的含义 第三部分:提示词(prompt)的几个相关概念 第四部分:提示词(prompt)的意义 第五部分:提示词(prompt)学习路径 第六部分:提示词工程师(Prompt Engineer)作为职业 第七部分:提示词工程师(Prompt Engineer)作为副业 第八部分:提示词工程(Prompt Engineering)作为...

超详细!8大实战案例,AIGC在网易落地项目中的运用!

文章转载自:优设网(www.uisdc.com) 全文总字数:5490,阅读大约需要15分钟。文中落地项目中使用到的AI工具有:ChatGPT、Midjourney和Stable Diffusion。 [/caption] AIGC全称AI Generated Content,是利用人工智能技术来生成内容,AIGC绘画属于AIGC的分支。近半年,以Midjourney和Stable Diffusion为代表的AIGC绘画迎来爆发式发展,掀起了一场生产力革命。 Midjourney和Stable Diffusion强大的创造力和无与伦比的高效性,使设计师通过它们提升生产力成为了必然。然而Mid...

ChatGPT 是怎么做的,为什么它有效

、“ 介绍神经网络的基本概念和结构,讨论训练实践、技巧以及网络规模的大小对模型能力的影响。同时介绍嵌入(Embeddings)概念,将高维数据映射到低维空间。通过本文,您将对神经网络有更深入的理解,有助于后面理解 ChatGPT 是怎么做的,为什么它有效。” 01 — 神经网络 那么我们用于图像识别等任务的典型模型实际上是如何工作的呢?当前最流行且最成功的方法是使用神经网络。神经网络发明于 20 世纪 40 年代,其形式与今天的使用非常接近,可以被认为是大脑工作方式的简单理想化。 人脑中约有 1000 亿个神经元(神经细胞),每个神经元每秒能够产生高达一千次的电脉冲。神经元连接在一个复杂的网...