实战复盘:Qwen3 x ms-swift,在居住服务行业的微调实践 一、业务背景:复杂场景下的“时延争夺” 在我们的业务场景中,用户通过语音与平台交互,咨询租房、预约看房或了解详情。 我们要做的不仅仅是一个简单的分类任务,而是一个对时延和准确率都有着苛刻要求的实时系统。 1.1、苛刻的时延账本 领导层给出的死线是:端到端延迟控制在 2 秒以内。 这听起来似乎很宽裕,但我们必须为这 2 秒钟的“花销”精打细算。因为是语音交互,链路异常复杂: ASR(语音转文字)和 2025-05-01 AI #LLM #SFT #Qwen3
Spring AI - MCP 小试牛刀 Spring AI 是 Spring 生态中专门为人工智能应用开发的框架,其核心目标是将 Spring 的设计理念应用于 AI 领域。 目前Spring AI 已经支持了 MCP。 这里我就用它实现一个简单的 MCP,功能就是获取当前的日期。 使用 Spring AI 的 MCP Server 和 MCP Client。 Spring AI 版本:1.0.0-M7 MCP Server 端 p 2025-04-22 AI #LLM #MCP #Spring AI
MCP 实战 2024 年 11 月 25 日,Anthropic,就是 Claude 背后的那家公司,推出了一个名为 MCP 的开放协议,它的全称为 Model Context Protocol(模型上下文协议),用于标准化大模型与各类外部工具和数据源之间的交互。 这个协议自推出以来,在 AI 圈一直不温不火,很多人认为 MCP 只是套壳的 API,并没有什么特别之处。但是近期随着 Manus 的爆火,MCP 2025-04-11 AI #LLM #MCP
大模型后训练:SFT 之 Full Fine-Tuning、LoRA、QLoRA 1. 全量微调 (Full Fine-Tuning) 假设要微调一个 8B 模型, 权重矩阵:比如是一个 4096 × 4096 的矩阵。 全量微调:意味着你要更新这 4096 × 4096 个参数里的每一个数字。 显存爆炸:你需要存储 权重(Weight) + 梯度(Gradients) + 优化器状态(Optimizer States, AdamW需要存两份) + 激活值(Activatio 2025-02-27 AI #LLM #Post-Training
ESP32-CAM + Arduino 上手 最近开始单片机来实现一些家庭智能,来弥补现在市面上成品无法实现的一些功能或价格。 我现在用的单片机主要都是乐鑫 ESP 系列的,目前已经做了几个设备。 本篇先记录一下 ESP32-CAM 的快速上手和过程中遇到的问题,以及解决办法。 ESP32-CAM 简介 ESP32-CAM 是一个小尺寸的摄像头模组,该模块可以作为最小系统独立工作,尺寸仅为 27*40.5*4.5mm。 价格也很便宜,带 2024-05-18 Smart Home #IoT #ESP
Slef-Hosted:Nextcloud 部署 Nextcloud 的部署方式有很多种,经过研究,发现了一种比较好的部署方式,我称之为混合部署。 2023-10-27 Self-Hosted #Self-Hosted
北京联通白嫖 IPTV 北京联通是没开通 IPTV 也能收到电视组播数据的。 本文就介绍如何白嫖北京联通 IPTV,并使任意设备可在家庭网络上流畅观看 IPTV 的直播流。 2023-05-22 Smart Home #Note
dnsmasq 按需分配分配网关与 DNS(旁路由) 一个主路由下有多个旁路由,如何在主路由上针对不同的连接设备,指定其使用的旁路由是哪一个? 2023-01-08 Smart Home #Router #Note
OpenWRT 旁路由二次端口转发 一般来说,部署了 HomeAssistant 后,想在外网访问的话,只需在路由上做一次端口转发就行了。 但是既然都用 HA 了,那肯定免不了要用 HACS,这时候就涉及到科学冲浪的问题了。 我的选择是用旁路由来解决科学冲浪的问题。(至于为什么用旁路由而不直接给“主路由”插上翅膀,主要还是家里网络不止我一人用,得考虑主路由的稳定性) 那这个时候,仅仅在主路由上做端口转发是无法正常访问家里的 HA 的 2022-10-25 Smart Home #Note #OpenWRT
macOS 使用 remote-viewer 连接 SPICE 服务 MacOS 平台下没有很好的支持 SPICE 协议的图形化客户端,但是可以使用 `remote-viewer` 这个工具。本文就安装过程中踩的坑做个记录。 2022-10-18 Software #macOS #NOTE
一个 Java 程序员跨界:如何用近红外光谱 (NIR) 搞定“智能洗衣” 作为一个写了多年 Java 的程序员,我的日常工作通常聚焦在架构设计与代码实现上。 但在一次出差深入洗衣工厂的业务实地考察中,一个非典型的技术问题摆在了我面前。 这不是关于高并发或微服务,而是关于物理世界的“物质识别”。 一、 业务痛点:当经验主义失效 在实地考察中,我了解到洗衣业务面临的一个核心痛点是“洗损”(洗坏衣服)。 洗衣工厂往往都得有一个至少 10 年经验的老师“镇场”,否则可能都不够赔 2022-01-21
log4j RCE 漏洞的缓解&验证方式 log4j 使用范围之广,Javaer 应该都接触过。今天应该有不少人被 log4j2 的这个核弹级的 RCE 漏洞折磨了,看到有人半夜 1 点被叫起来进行修复。。。 2021-12-10 Technology #Log4j2 #Vulnerability #RCE
博客崩了的那些事儿 好久没写文章了,来水一篇博文。 前几天,突然有人在我公众号私信提醒我:“博主,你的网站崩了” 当时我还是挺懵 B 的。 因为这个博客是纯静态页面部署的,服务器也在国内,还做了备案。 崩了实属不该。 按着几条路子去检查了一下,都没发现问题: 服务器续费正常,运行状态正常 服务器的 443 端口正常(因为我做了强制 HTTPS,这里先埋一个伏笔) DNS 解析看似正常 静态文件正常 Nginx 运行 2021-08-07 #Blog
从 Apollo 客户端源码学 SPI SPI 机制为很多框架扩展提供了可能,不需要改动源码就可以实现扩展、解耦,实现扩展对原来的代码几乎没有侵入性,只需要添加配置就可以实现扩展,符合开闭原则。 2021-03-02 Technology #Apollo #SPI
分布式配置中心调研——携程 Apollo 分布式配置中心哪家强?Apollo vs Nacos vs SpringCloudConfig 2021-02-08 Technology #Apollo #config #technology research
PPT:Git 的那些事儿——如何优雅的合并与回滚 合并的时候只会 git merge?回滚只会 git reset? 本来清晰的历史记录,被搞得如电路板一般,看不出来龙去脉,如何办? 一起来看看如何优雅的进行合并与回滚吧。 目录: 本篇内容较长,需要有些耐心哦~ 2021-01-11 Technology #Git #PPT
记一次线上问题排查与解决:从 Redis 超时到 Apache Common-pool2 源码剖析 线上一直“偶现”的 Redis 超时问题,不查不知道,一查吓一跳 —— 竟然是一个隐藏了 N 年之久的性能问题。 2020-12-14 Technology #Redis #Apache Common-pool2
PPT:浮点数为什么运算不精确? 思考 🤔 以下两端代码的输出结果分别是什么? 123float a = 0.125f; double b = 0.125d;System.out.println((a - b) == 0.0); 1234double c = 0.8;double d = 0.7;double e = 0.6;System.out.println((c - d) == (d-e)); 带着问题一起来看看浮点数的底 2020-12-08 Technology #PPT
基于 Redis ( Tair ) 的 Hash 实现滑动窗口 前段时间要做一个风控系统,实现过程中有一个比较关键的部分 —— 滑动窗口。单机版的滑动窗口实现起来比较容易,但是分布式的,就略麻烦了。 2020-11-20 Technology #Redis
博客评论系统迁至 Remark42 静态博客本身是无法支持评论的,因为没有服务端程序接收请求,只能求助于系统外的服务。 目前虽然评论系统很多,但综合考虑能够真正用起来并且很稳定的很少。 2020-08-18 #Blog