Blog

AIGC应用

机器学习之类别特征处理

来源： https://www.biaodianfu.com 类别型特征（categorical feature）主要是指职业，血型等在有限类别内取值的特征。它的原始输入通常是字符串形式，大多数算法模型不接受数值型特征的输入，针对数值型的类别特征会被当成数值型特征，从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式，将…

2024年9月7日 174 0

令爷收藏

机器学习之特征选择方法

来源： https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题，其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正相关的特征简化模型，协助理解数据产生的过程。并且常能听到“ 数据和特…

2024年9月7日 185 0

令爷收藏

Pandas数据处理简明教程

来源： https://www.biaodianfu.com 在使用Python处理分析数据的时候，用的最多的算是Pandas时，由于Pandas是个非常强大的工具，涉及到的功能非常多，所以平常使用的时候经常需要查询文档。这里记载了自己常用的一些功能及知识点。 Pandas简介 Pandas是python的一个数据分析包，最初由AQR Capital Management于2008年4月…

2024年9月7日 155 0

7. 数据分析（市场调研）

数据科学中10个应用广泛的统计方法

以下是数据科学中广泛应用的十个统计方法的详细描述： 1️⃣ 中心极限定理 (Central Limit Theorem, CLT) 描述：中心极限定理告诉我们，无论原始数据的分布是什么样的，只要我们取足够多的样本（通常认为样本量大于30就够了），这些样本的均值分布会趋向于正态分布。这个理论是统计学的基石之一，因为它让…

2024年9月7日 164 0

https://github.com/NeoVertex1/SuperPrompt#superprompt 不过两三天的时间，仅有两个 Markdown 文件的 GitHub 项目为何竟能收获 1.9k star？仔细一看，其中一个 Markdown 文件是一个流程图，另一个 Readme 文件的主要内容则是一大篇大模型提示词（prompt。而如果你细读这个 prompt，却发现里面仅有寥寥数句人类能懂的…

Blog 2024年9月5日 180 0

机器学习入门

拥抱人工智能，从机器学习开始背景：自“阿尔法狗”（AlphaGo）完胜人类围棋顶尖高手后，有关人工智能（AI）的讨论就从未停歇。工业4.0方兴未艾，人工智能引领的工业5.0时代却已悄然苏醒。人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展，而深度学习的进步却是当今人工智能大爆炸的核心驱动。作…

Blog 2024年9月4日 163 0

Cursor + Claude 3.5 Sonnet 案例

Cursor太火了，很多人都放弃 GitHub Copilot ，转投 Cursor了。 Cursor + Claude 3.5 Sonnet 彻底改变了大家编程的体验，网友们几个惊艳的例子↓ 第一个就很震惊！ 8 岁的孩子能在 45 分钟内构建了一个由Cloudflare Workers AI 驱动的聊天机器人 11k 行代码，685 次提交，整整 3 周，一个视频编辑器 Cursor+V0创建一个漂…

AI应用 2024年9月1日 205 0

AGI

从电力革命到AI：组织创新驱动下的生产力飞跃

1.谷歌前CEO说现在像电力革命前夕在2024年8月13日，谷歌前CEO埃里克·施密特在斯坦福大学的演讲中指出，尽管AI技术已经取得了显著的进步，并在许多领域得到了广泛应用，但其真正的潜力尚未完全释放。他强调，当前的AI应用大多集中在替代或辅助人类完成特定任务上，而未能引发深刻的组织变革。这种情况类似于19世纪末期电…

2024年8月17日 232 1

令爷收藏

[转载]使用Cursor，2个晚上做了一个PDF转Markdown的工具

来源：https://blog.vcvit.me/2024/08/11/use-cursor-2-nights-built-pdf-to-markdown-tool/ 今天使用 Cursor，2 个晚上做了一个 PDF 转 Markdown 的工具，真的是一行代码都没有写。我不禁重新思考，这何尝不是一种 0 代码？程序员真的可以被替代么？以前我的个人感受是 GPT 确实能帮助很多会用的人，提高 80%的效率。但…

2024年8月12日 243 1

黄铮：我的中学和大学（转载）

黄铮：我的中学和大学（转载） Colin 黄峥 2016-02-18 我的小学在杭州市郊，应该算是很一般的，但是我非常狗屎运地考进了杭州有点特别的一所中学，杭州外国语学校。据我小学老师说，我是我们小学前后9年里唯一一个考进这所中学的。人生有时候是比较戏剧性的，我当时是因为奥数得了个奖，然后老师让我去考的。去考之前，…

令爷收藏 2024年8月8日 191 0

黄铮：把“资本主义”倒过来

黄峥 2017-09-26 巴菲特是一位让人敬佩的资本家，他是一位纯粹的资本家。他的整个事业可以描述为孜孜不倦地、专注地、理性地挪动钱来享受复利的果实。我喜欢读他写给股东的信，几十年来重复着同样的简单，重复着不容易的纯粹。他的帝国里一手是保险，一手是投资；一手卖的是抗风险能力，收起来的是钱，另一边则是把钱放…

令爷收藏 2024年8月8日 157 0

Mermaid图表示例

关于 Mermaid mindmap root((图表类型)) flow 描述(流程图，用于展示流程或步骤的顺序。) sequence 描述(时序图，展示对象之间的交互和消息传递。) class 描述(类图，用于展示类、对象和它们之间的关系。) state 描述(状态图，用于展示对象或系统的状态变化。) er 描述(实体关系图，用于展示实体及其关系。) gantt 描述(…

Blog 2024年8月2日 180 0

Blog

表情符号（emoji）来表示 token

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗？不知道 9.11 和 9.9 哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人们的无情嘲笑。嘲笑之后，大…

2024年7月28日 211 0

Blog

健身房的正态分布例子

以下是chatgpt 4o的描述重量堆栈正态分布这张图片显示了一个重量堆栈（可能是一个健身器材）的图示，其中每个重量位置上都有明显的磨损痕迹。这些磨损痕迹在图中形成了一个钟形曲线，类似于正态分布（即常态分布）。具体来说，这种磨损痕迹集中在中间的重量区间（大约在40到60之间），而两端的重量位置（10-20和90-11…

2024年7月15日 183 0

垂直领域的开源模型、数据集及评测基准。

Awesome Domain LLM https://github.com/luban-agi/Awesome-Domain-LLM 自以ChatGPT为代表的大语言模型出现以后，掀起了新一轮研究和应用浪潮，出现了许多包括LLaMA、ChatGLM、Baichuan、Qwen等在内的通用模型。随后，来自不同领域的从业人员在通用模型的基础上通过持续预训练/指令微调将其应用于垂直领域。本项目旨在…

AI应用 2024年7月13日 223 0

机器学习之类别特征处理

机器学习之特征选择方法

Pandas数据处理简明教程

数据科学中10个应用广泛的统计方法

几行乱码让大模型获得科学思维:超级提示

机器学习入门

Cursor + Claude 3.5 Sonnet 案例

从电力革命到AI：组织创新驱动下的生产力飞跃

[转载]使用Cursor，2个晚上做了一个PDF转Markdown的工具

黄铮：我的中学和大学（转载）

黄铮：把“资本主义”倒过来

Mermaid图表示例

表情符号（emoji）来表示 token

健身房的正态分布例子

垂直领域的开源模型、数据集及评测基准。

Contact Us

15602395067