-
AI驱动的数据抓取新时代:从BeautifulSoup到智能爬虫工具
在数据驱动的AI时代,获取高质量的网络数据变得越来越重要。传统的网页抓取方法正在被新一代智能工具所取代,这些工具不仅简化了数据获取过程,还提高了数据质量。本文将带你了解从传统方法到最新AI驱动工具的演变,帮助你选择最适合自己项目的数据抓取解决方案。 传统爬虫的局限性 网络数据抓取一直是AI和数据分析项目…
-
令爷开发: WordPress 插件Memos Widget
网上找了好久关于如何在WordPress里面调用Memos的动态信息,很麻烦还不成功。折腾了好半天。 然后自己用Trae发开了一个WordPress小插件,前后调试也就一个小时。 主要是告诉Trae 官网最新的api调用规则,和 api输出的JSON是什么内容。 插件放到GitHub里面了。 https://github.com/zengqueling/memos-widget 简介 Memos W…
-
Trae已上线 Windows 版本
🚀2月17日,字节的AI IDE工具-Trae的 Windows 版本终于上线啦🎉!🎉不再是 Mac 独占,现在大家都可以用起来啦💻。 🔍什么是 Trae? Trae(/treɪ/)与 AI 深度集成,是开发者的超级助手🤖。它提供智能问答、代码自动补全以及基于 Agent 的 AI 自动编程能力。使用 Trae 开发项…
-
DeepSeek-R1横空出世,Prompt真的要被时代抛弃了吗?
DeepSeek-R1横空出世,Prompt真的要被时代抛弃了吗? 最近科技圈被DeepSeek-R1的突破性进展刷屏,许多自媒体开始鼓吹"Prompt工程已死"的论调。这种非黑即白的论断背后,实则暴露了对大模型技术演进规律的误读。当我们深入剖析DeepSeek-R1的技术内核,会发现这恰恰是Prompt工程发展的新里程碑,而非终章。 一、…
-
RAG基础:Markdown指南 – 专业文档结构化的破局之道
RAG基础:Markdown指南 – 专业文档结构化的破局之道 当非结构化文档成为RAG的阿喀琉斯之踵 在金融、法律、医疗等专业领域,每天产生的PDF技术白皮书、Word版行业报告、PPT培训文档堆积如山。这些看似规范的专业文档,在RAG系统中却如同布满荆棘的迷宫——当我们尝试用LlamaIndex构建证券行业知识库时,发现PDF中的三线表格…
-
何同学的“流量密码”:从219个封面测试看视频点击率的优化之道
何同学的“流量密码”:从219个封面测试看视频点击率的优化之道 在短视频与自媒体高度竞争的时代,如何让作品在海量内容中脱颖而出?知名数码博主何同学通过一项针对219个视频封面的系统性测试,揭示了封面设计对点击率的深层影响,并结合自身创作经验总结出一套“流量密码”。本文将从测试方法、核心结论、数据分析原理、封…
-
正则表达式入门教程
5分钟搞懂 —— 正则表达式 (by 令爷) 引言 正则表达式是一种强大的文本匹配和处理工具。它就像是一个神奇的模式识别系统,能帮助我们在文本中查找、匹配和替换特定的字符串。无论是验证用户输入、处理文本文件,还是进行数据分析,正则表达式都能大显身手。 让我们通过一个简单的例子开始。假设你需要在一篇文章中找出所有…
-
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式 综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图片(EXIF元数据和OCR)、音频(EXIF元数据和语音转录)、HTML(特别处理Wikipedia等)以…
-
Cursor 、v0 和 Bolt.new:当今 AI 编程工具的全面解析与对比
Cursor 、v0 和 Bolt.new:当今 AI 编程工具的全面解析与对比 AI 驱动的编码工具正在迅速发展,每次新版本的发布都承诺将改变我们的开发流程。这些工具旨在通过智能代码建议、重复任务的自动化,甚至从自然语言提示生成整个代码片段来提升生产力。10月4日,StackBlitz 推出了 Bolt.new,进一步丰富了AI 编码助手的生态系…
-
提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是一个物种了
提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是一个物种了 谁能最先用 AI 颠覆搜索,至今还悬而未决。 年初,在体验当下几款热门的 AI 搜索引擎后,我和同事都一致认为,即便百度、Google 等搜索引擎巨头被群狼环视,但还是难以被撼动。 最近发布的 Kimi 探索版带来了很大的惊喜。相比于 AI 搜索更懂…
-
机器学习之类别特征处理
来源: https://www.biaodianfu.com 类别型特征(categorical feature)主要是指职业,血型等在有限类别内取值的特征。它的原始输入通常是字符串形式,大多数算法模型不接受数值型特征的输入,针对数值型的类别特征会被当成数值型特征,从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式,将…
-
机器学习之特征选择方法
来源: https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“ 数据和特…
-
几行乱码让大模型获得科学思维:超级提示
https://github.com/NeoVertex1/SuperPrompt#superprompt 不过两三天的时间,仅有两个 Markdown 文件的 GitHub 项目为何竟能收获 1.9k star? 仔细一看,其中一个 Markdown 文件是一个流程图,另一个 Readme 文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这个 prompt,却发现里面仅有寥寥数句人类能懂的…
-
机器学习入门
拥抱人工智能,从机器学习开始 背景: 自“阿尔法狗”(AlphaGo)完胜人类围棋顶尖高手后,有关人工智能(AI)的讨论就从未停歇。工业4.0方兴未艾,人工智能引领的工业5.0时代却已悄然苏醒。 人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展,而深度学习的进步却是当今人工智能大爆炸的核心驱动。 作…
-
Cursor + Claude 3.5 Sonnet 案例
Cursor太火了,很多人都放弃 GitHub Copilot ,转投 Cursor了。 Cursor + Claude 3.5 Sonnet 彻底改变了大家编程的体验,网友们几个惊艳的例子↓ 第一个就很震惊! 8 岁的孩子能在 45 分钟内构建了一个由Cloudflare Workers AI 驱动的聊天机器人 11k 行代码,685 次提交,整整 3 周,一个视频编辑器 Cursor+V0创建一个漂…