2023年5个自动化EDA库推荐

2023年5个自动化EDA库推荐 来源:deephub EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化的库,但是现在已经过了1年的时间了,我们看看现在有什么新的变化。 为了测试这些库的功能,本文使用了两个不同的数据集,只是为了更好地理解这些库如何处理不同类型的数据。 YData-Profiling 以前被称为Pandas Profiling,在今年改了名字。如果...

千亿级、数学专用,MathGPT大模型开始公测了

机器之心发布 机器之心编辑部 好未来推出数学领域千亿级大模型 MathGPT ,做好 AI 时代数学基础工作。 国内大模型市场又迎来了一个新的「选手」,这次是数学专用大模型。 8 月 24 日,机器之心获悉,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 开启内测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验。 今年 5 月,好未来曾公布正在进行自研数学大模型的研发,命名为 MathGPT。MathGPT 是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打...

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

机器之心报道 编辑:杜伟、陈萍 GPT-4:在代码生成这块,你们依然是「弟弟」。 今日,Meta 的开源 Llama 模型家族迎来了一位新成员 —— 专攻代码生成的基础模型 Code Llama。 作为 Llama 2 的代码专用版本,Code Llama 基于特定的代码数据集在其上进一步微调训练而成。 Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的。 相关论文《Code Llama: Open Foundation Models for Code》已经公布,足足有 47 页,作者有 25 位。 论文地址: https://ai.me...

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试。这是一个开源项目,其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的Llama2 70 亿参数大型语言模型的一个版本,它在医疗对话数据集上进行了微调,然后使用强化学习和宪法人工智能进一步改进。 由于该模型的大小只有 3 GB,因此它适合任何本地设备,因此无需支付 API 即可使用它。它是免费的,专为离线使用而设计,可以保护患者的隐私,并且可以在 iOS、Android 和 Web 上使用。鼓励对功能添加和改进提出请求。 为了训练模型,可以在本地运行 Training.ipynb ,也可以通过 Google C...

2.3 大语言模型(LLM)排名

大语言模型(LLM)排名 https://lmsys.org/blog/ 这是一个大型语言模型 (LLM) 的基准平台,以众包方式进行匿名、随机的战斗。在5月初,研究团队发布了他们的初步结果和基于 Elo 评级系统的排行榜,Elo是国际象棋和其他竞技游戏中广泛使用的评级系统。 排行榜中文说明** https://zhuanlan.zhihu.com/p/639524656 开源大型语言模型的Elo评级。 (时间范围:2023年4月24日至5月1日),清华大学排第五。 对于AIGC,大公司也没有护城河 Claude发布第二代,媲美chatgpt4.0 谷歌泄密文件曝光:AI大战,谷歌...

 开源项目怎样盈利?Generating income from open source

Ink has been getting some good traction lately and it's already being used by some well-known companies for a while. Like most other open so… 来源: Generating income from open source   开源项目怎样盈利? 来自 Ink 的作者,Ink 是一个React CLI 工具,提供在 CLI 中写 React 组件的能力。Stars:23.5K 如果各位有知名的开源项目的可以参看一下,干货非常多,各种例...