Llama2 – 令爷课程-曾确令(ColinZENG)AIGC玩家

垂直领域的开源模型、数据集及评测基准。

2026年4月27日2024年7月13日作者曾确令

Awesome Domain LLM https://github.com/luban-agi/Awesome-Domain-LLM 自以ChatGPT为代表的大语言模型出现以后，掀起了新一轮研究和应用浪潮，出现了许多包括LLaMA、ChatGLM、Baichuan、Qwen等在内的通用模型。随后，来自不同领域的从业人员在通用模型的基础上通过持续预训练/指令微调将其应用于垂直领域。本项目旨在收集和梳理垂直领域的开源模型、数据集及评测基准。欢迎大家贡献本项目未收录的开源模型、数据集、评测基准等内容，一起推动大模型赋能各行各业！ [2023/11/26] 增强网络安全大模型S...

15小时、几千元训完中文版LLaMA2！低成本方案全面开源，支持商用

2026年4月27日2023年9月28日作者曾确令

训练大模型，几千块就能实现了！现在， 15小时、几千块钱、85亿 token数据，即可训出中文LLaMA2。综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源，包括全套训练流程、代码及权重。而且无商业限制，还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。要知道，从头预训练大模型此前被戏称“要5000万美元才能入局”，让许多开发者和中小企业都望而却步。这一回 Colossal-LLaMA-2 ，把大模型门槛打下来了。 ChatGPT正式联网，能给出答案出处[/caption] 同时开源团队还提供了一个完整的评估体系框架ColossalEval ...

Meta AI发布了一款专门用于编程的模型：Code Llama

2026年4月27日2023年9月18日作者曾确令

它能够根据自然语言提示和代码提示生成代码。 Code Llama还可以解释代码的功能或结构。例如，如果你给它一个复杂的代码片段，它可以用普通语言解释这段代码是做什么的。 Code Llama是基于Llama 2构建的，并提供了三个模型版本： Code Llama - 基础代码模型 Code Llama - Python - 专门针对Python进行优化 Code Llama - Instruct - 专门用于理解自然语言指令它支持许多流行的编程语言，包括Python、C++、Java、PHP、Typescript（Javascript）、C#和Bash。 Code Llama提供了三种不同大...

DoctorGPT是一个大型语言模型，可以通过美国医生执照考试

2026年4月27日2023年8月20日作者曾确令

DoctorGPT是一个大型语言模型，可以通过美国医生执照考试。这是一个开源项目，其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本，它在医疗对话数据集上进行了微调，然后使用强化学习和宪法人工智能进一步改进。由于该模型的大小只有 3 GB，因此它适合任何本地设备，因此无需支付 API 即可使用它。它是免费的，专为离线使用而设计，可以保护患者的隐私，并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。为了训练模型，可以在本地运行 Training.ipynb ，也可以通过 Google C...