Blog

  • 机器学习之类别特征处理

    来源: https://www.biaodianfu.com 类别型特征(categorical feature)主要是指职业,血型等在有限类别内取值的特征。它的原始输入通常是字符串形式,大多数算法模型不接受数值型特征的输入,针对数值型的类别特征会被当成数值型特征,从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式,将…

    2024年9月7日 174
  • 机器学习之特征选择方法

    来源: https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“ 数据和特…

    2024年9月7日 185
  • Pandas数据处理简明教程

    来源: https://www.biaodianfu.com 在使用Python处理分析数据的时候,用的最多的算是Pandas时,由于Pandas是个非常强大的工具,涉及到的功能非常多,所以平常使用的时候经常需要查询文档。这里记载了自己常用的一些功能及知识点。 Pandas简介 Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月…

    2024年9月7日 155
  • 数据科学中10个应用广泛的统计方法

    以下是数据科学中广泛应用的十个统计方法的详细描述: 1️⃣ 中心极限定理 (Central Limit Theorem, CLT) 描述: 中心极限定理告诉我们,无论原始数据的分布是什么样的,只要我们取足够多的样本(通常认为样本量大于30就够了),这些样本的均值分布会趋向于正态分布。这个理论是统计学的基石之一,因为它让…

    2024年9月7日 164
  • 几行乱码让大模型获得科学思维:超级提示

    https://github.com/NeoVertex1/SuperPrompt#superprompt 不过两三天的时间,仅有两个 Markdown 文件的 GitHub 项目为何竟能收获 1.9k star? 仔细一看,其中一个 Markdown 文件是一个流程图,另一个 Readme 文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这个 prompt,却发现里面仅有寥寥数句人类能懂的…

    Blog 2024年9月5日 180
  • 机器学习入门

    拥抱人工智能,从机器学习开始 背景: 自“阿尔法狗”(AlphaGo)完胜人类围棋顶尖高手后,有关人工智能(AI)的讨论就从未停歇。工业4.0方兴未艾,人工智能引领的工业5.0时代却已悄然苏醒。 人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展,而深度学习的进步却是当今人工智能大爆炸的核心驱动。 作…

    Blog 2024年9月4日 163
  • Cursor + Claude 3.5 Sonnet 案例

    Cursor太火了,很多人都放弃 GitHub Copilot ,转投 Cursor了。 Cursor + Claude 3.5 Sonnet 彻底改变了大家编程的体验,网友们几个惊艳的例子↓ 第一个就很震惊! 8 岁的孩子能在 45 分钟内构建了一个由Cloudflare Workers AI 驱动的聊天机器人 11k 行代码,685 次提交,整整 3 周,一个视频编辑器 Cursor+V0创建一个漂…

    AI应用 2024年9月1日 205
  • 从电力革命到AI:组织创新驱动下的生产力飞跃

    1.谷歌前CEO说现在像电力革命前夕 在2024年8月13日,谷歌前CEO埃里克·施密特在斯坦福大学的演讲中指出,尽管AI技术已经取得了显著的进步,并在许多领域得到了广泛应用,但其真正的潜力尚未完全释放。他强调,当前的AI应用大多集中在替代或辅助人类完成特定任务上,而未能引发深刻的组织变革。这种情况类似于19世纪末期电…

    2024年8月17日 232
  • [转载]使用Cursor,2个晚上做了一个PDF转Markdown的工具

    来源:https://blog.vcvit.me/2024/08/11/use-cursor-2-nights-built-pdf-to-markdown-tool/ 今天使用 Cursor,2 个晚上做了一个 PDF 转 Markdown 的工具,真的是一行代码都没有写。我不禁重新思考,这何尝不是一种 0 代码?程序员真的可以被替代么?以前我的个人感受是 GPT 确实能帮助很多会用的人,提高 80%的效率。但…

    2024年8月12日 243
  • 黄铮:我的中学和大学(转载)

    黄铮:我的中学和大学(转载) Colin 黄峥 2016-02-18 我的小学在杭州市郊,应该算是很一般的,但是我非常狗屎运地考进了杭州有点特别的一所中学,杭州外国语学校。据我小学老师说,我是我们小学前后9年里唯一一个考进这所中学的。人生有时候是比较戏剧性的,我当时是因为奥数得了个奖,然后老师让我去考的。去考之前,…

    令爷收藏 2024年8月8日 191
  • 黄铮:把“资本主义”倒过来

    黄峥 2017-09-26 巴菲特是一位让人敬佩的资本家,他是一位纯粹的资本家。他的整个事业可以描述为孜孜不倦地、专注地、理性地挪动钱来享受复利的果实。我喜欢读他写给股东的信,几十年来重复着同样的简单,重复着不容易的纯粹。他的帝国里一手是保险,一手是投资;一手卖的是抗风险能力,收起来的是钱,另一边则是把钱放…

    令爷收藏 2024年8月8日 157
  • Mermaid图表示例

    关于 Mermaid mindmap root((图表类型)) flow 描述(流程图,用于展示流程或步骤的顺序。) sequence 描述(时序图,展示对象之间的交互和消息传递。) class 描述(类图,用于展示类、对象和它们之间的关系。) state 描述(状态图,用于展示对象或系统的状态变化。) er 描述(实体关系图,用于展示实体及其关系。) gantt 描述(…

    Blog 2024年8月2日 180
  • 表情符号(emoji)来表示 token

    为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下 让模型知道自己擅长什么、不擅长什么是一个很重要的问题。 还记得这些天大模型被揪出来的低级错误吗? 不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。 嘲笑之后,大…

    2024年7月28日 211
  • 健身房的正态分布例子

    以下是chatgpt 4o的描述 重量堆栈正态分布 这张图片显示了一个重量堆栈(可能是一个健身器材)的图示,其中每个重量位置上都有明显的磨损痕迹。这些磨损痕迹在图中形成了一个钟形曲线,类似于正态分布(即常态分布)。 具体来说,这种磨损痕迹集中在中间的重量区间(大约在40到60之间),而两端的重量位置(10-20和90-11…

    2024年7月15日 183
  • 垂直领域的开源模型、数据集及评测基准。

    Awesome Domain LLM https://github.com/luban-agi/Awesome-Domain-LLM 自以ChatGPT为代表的大语言模型出现以后,掀起了新一轮研究和应用浪潮,出现了许多包括LLaMA、ChatGLM、Baichuan、Qwen等在内的通用模型。 随后,来自不同领域的从业人员在通用模型的基础上通过持续预训练/指令微调将其应用于垂直领域。 本项目旨在…

    AI应用 2024年7月13日 223

Contact Us

15602395067

在线咨询:点击这里给我发消息

邮件:eden7@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code