垂直领域的开源模型、数据集及评测基准。

Awesome Domain LLM https://github.com/luban-agi/Awesome-Domain-LLM 自以ChatGPT为代表的大语言模型出现以后,掀起了新一轮研究和应用浪潮,出现了许多包括LLaMA、ChatGLM、Baichuan、Qwen等在内的通用模型。 随后,来自不同领域的从业人员在通用模型的基础上通过持续预训练/指令微调将其应用于垂直领域。 本项目旨在收集和梳理垂直领域的 开源模型 、数据集及 评测基准 。 欢迎大家贡献本项目未收录的开源模型、数据集、评测基准等内容,一起推动大模型赋能各行各业! [2023/11/26] 增强网络安全大模型S...

15小时、几千元训完中文版LLaMA2!低成本方案全面开源,支持商用

训练大模型,几千块就能实现了! 现在, 15小时、几千块钱、85亿 token数据 ,即可训出中文LLaMA2。 综合性能达到开源社区同规模从头预训练SOTA模型水平。 方案 完全开源 ,包括全套训练流程、代码及权重。 而且 无商业限制 ,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。 要知道,从头预训练大模型此前被戏称“要5000万美元才能入局”,让许多开发者和中小企业都望而却步。 这一回 Colossal-LLaMA-2 ,把大模型门槛打下来了。 ChatGPT正式联网,能给出答案出处[/caption] 同时开源团队还提供了一个完整的 评估体系框架ColossalEval ...

Meta AI发布了一款专门用于编程的模型:Code Llama

它能够根据自然语言提示和代码提示生成代码。 Code Llama还可以解释代码的功能或结构。例如,如果你给它一个复杂的代码片段,它可以用普通语言解释这段代码是做什么的。 Code Llama是基于Llama 2构建的,并提供了三个模型版本: Code Llama - 基础代码模型 Code Llama - Python - 专门针对Python进行优化 Code Llama - Instruct - 专门用于理解自然语言指令 它支持许多流行的编程语言,包括Python、C++、Java、PHP、Typescript(Javascript)、C#和Bash。 Code Llama提供了三种不同大...

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试。这是一个开源项目,其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本,它在医疗对话数据集上进行了微调,然后使用强化学习和宪法人工智能进一步改进。 由于该模型的大小只有 3 GB,因此它适合任何本地设备,因此无需支付 API 即可使用它。它是免费的,专为离线使用而设计,可以保护患者的隐私,并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。 为了训练模型,可以在本地运行 Training.ipynb ,也可以通过 Google C...