Vector/ 精诚新创ISSUE 001 · APR 2026

ADVISORY — INFRASTRUCTURE SELECTION

智能体
基础设施
选型方案

精诚新创知识产权专案。

八档候选 · ¥3 万 → ¥125 万

Editor's Note · 评估范围P. 02

一台本地服务器，
能否同时承载所内多个 AI 工作负载？

精诚新创知识产权当前的工作流，提出了三个待解的工程约束：客户技术交底书属敏感数据，外发存在合规风险；商业查新工具（如 PatSnap）按账号年订阅（约 ¥8-15 万 / 账号），1 账号成共享瓶颈、3+ 账号超出试点预算，采购模型与所内并行使用规模不匹配；所内未来的 AI 需求会按垂直技能逐步上线（专利查新先行，再到文书总结、商标查重、OA 答复等），底层组件（模型 / 向量 / 解析）高度复用——本期一次性建好底层，后续每个新技能 ≈ 一份 Prompt + 接入既有索引，避免重复建设。

本次评估的目标，是判断一台本地服务器能否在 3-10 名种子员工的试点规模下，承载patent-prior-art-search技能的全流水线，连同 Gemma 4 / Qwen 3.5 等本地模型、文档解析、本地向量检索四类基础组件。

评估范围涵盖硬件选型（整机与 DIY 的权衡）、软件栈分工（本地与云端协同）、月度运营成本测算、与现有商业方案的横向对比。所有候选机型、价格区间与采购入口附于后文。

Pilot Bay 01

03-10

首期试点员工

敏感数据不外发

本地

模型 / 解析 / 向量检索

USPTO · EPO · GP · CNIPA

查新检索轮次

10 特征 × 20 候选

200

特征对比矩阵格

评估方法 · METHODOLOGY

硬件选型

8 档候选 · 整机 / DIY 权衡

软件栈分工

本地 vs 云端 · 80 / 20

成本测算

月度运营 + 硬件折旧

对比验证

对照 PatSnap（智慧芽）订阅

MAIN SPEC · 整机配置与外设清单P. 03

首选机型 · T1

整机起价 ¥34,000
推荐配置 ≈ ¥38,200（含 6 TB×2 NAS + UPS）

DGX Spark 系 NVIDIA 桌面级 AI 工作站。OEM 联名款（联想 PGX、HP ZGX Nano、戴尔、华硕、宏碁等）硬件规格一致，差异在保修、容量与渠道；本地总代为神州数码、英迈中国、紫光晓通。

采购备注

DGX Spark 内置 1 TB NVMe，建议加配外置 NAS（4-10 TB 三档可选，下表）扩容并归档。RAID-1 配置避免单盘故障导致数据丢失。

T1 候选机型规格与外设清单

类型

主机集成规格

价格

入口

主机型号

NVIDIA DGX Spark 1TB

NVIDIA 行货 · OEM 备选 PGX 1TB ¥35,999 / HP ZGX Nano 4TB ¥52,800

¥34,000

→ JD.COM

SoC

NVIDIA GB10 Grace-Blackwell Superchip

20 核 ARM (10× X925 + 10× A725)

集成

—

GPU

Blackwell 架构 · 5th Gen Tensor Core

AI 算力 1 PetaFLOP FP4（含稀疏）

集成

—

统一内存

128 GB LPDDR5x

CPU/GPU 一致性共享 · 273 GB/s

集成

—

系统存储

1 TB NVMe M.2

TCG Opal 自加密 · 外接 NAS 扩容（下表三档）

集成

—

网络

ConnectX-7 200 Gbps + 10 GbE + Wi-Fi 7

双机互联可组 256 GB 内存池

集成

—

形态 / 功耗

150 × 150 × 51 mm · 1.2 kg · 240 W

桌面级 · Ubuntu DGX OS 预装

集成

—

类型

外置归档存储（RAID-1 双盘 · 三档可选）

价格

入口

4 TB × 2

WD Red Plus WD40EFPX / Seagate IronWolf ST4000VN006

NAS 级 · 7×24 · 3 年保修

≈ ¥1,300

→ JD.COM

6 TB × 2

WD Red Plus WD60EFPX / Seagate IronWolf ST6000VN006

NAS 级 · 7×24 · 3 年保修

≈ ¥1,800

→ JD.COM

10 TB × 2

WD Red Pro WD102KFBX / Seagate IronWolf Pro ST10000NE000

Pro 级 · 7×24 · 5 年保修

≈ ¥4,000

→ JD.COM

类型

配件

价格

入口

UPS

APC SUA1500ICH

1500 VA · 在线互动式 · 断电缓冲 ~15 分钟

¥2,400

→ JD.COM

外置硬盘盒 / NAS

OWC ThunderBay / 群晖 DS224+

RAID-1 双盘位 · USB 3.2 / 千兆网络

¥1,500 — ¥3,000

→ JD.COM

起步配置

¥37,700

主机 ¥3.4 万 + 4TB NAS + UPS

推荐配置 ★

¥38,200

主机 ¥3.4 万 + 6TB NAS + UPS

满配

¥40,400

主机 ¥3.4 万 + 10TB Pro + UPS

DUAL-NODE CLUSTER · 双机集群分工P. 04

一机承载推理，
一机承载常驻服务。

两台 DGX Spark 通过 ConnectX-7 双口 200 Gbps RDMA 互联，常态下分工运行：主机 α 承载本地大模型推理与上下文 KV 缓存；主机 β 常驻三类轻量服务——本地向量检索、PDF 文本抽取、文档结构化。

当遇到单机 128 GB UMA 容不下的更大模型时，两机池化为 256 GB 统一内存，张量并行跑 100B+ 量级模型；当任一节点宕机，另一节点经心跳切换接管，构成业务连续性的最小可行单元。

主机 α / PRIMARY

DGX Spark

128 GB UMA · GB10

本地 LLM 推理~80 GB

KV Cache · 多轮~30 GB

余量~18 GB

承载

Gemma 4 / Qwen 3.5 · 70B 量级 FP8

主机 β / AUX

DGX Spark

128 GB UMA · GB10

本地向量检索~10 GB

PDF 文本抽取~6 GB

扫描件兜底解析~8 GB

余量 / 池化备用~104 GB

备线

α 节点热备份 · 心跳秒级切换

两机互联 ¥6.8 万，构成可推理、可池化、可容灾的最小生产单元——比单台 DGX Station GB300 (¥80-125 万) 低一个量级。

双机总价

¥6.8万

T1 × 2 + 互联线缆

池化 UMA

256 GB

128G × 2 跨机统一

互联带宽

200 Gbps

ConnectX-7 RDMA 双口

三种运行模式

① 错峰

α · LLM 推理常驻

β · 向量 / 解析 / 文本三类服务

② 池化

α + β 跨机张量并行 · 256 GB UMA · 跑 100B+ 大模型

③ 高可用

α · 主业务节点

β · 热备份

模式

触发条件

默认 ① · 大模型时切 ② · 检测异常切 ③

三种模式由 OpenClaw 网关层根据请求类型与节点健康度自动调度——日常查新走错峰，深度评述与扩展模型走池化，节点心跳异常时自动切高可用。

STACK · 软件栈协奏P. 05

五层堆栈

本地承担 80% 的推理；只把"创造性评述"等法律含金量高的请求外发到云端。

本地为骨，
云端为筋。

接入

Claude Code ／微信 ClawBot ／ Telegram Bot

编排

类 OpenClaw / Hermes-like 智能体网关／技能路由 · 配额 · 审计 · 多账户隔离

本地模型

Gemma 4 / Qwen 3.5（本地总结 · 客户备注）／本地向量检索（语义召回）／ PDF 解析（文本层抽取 · 扫描件兜底）

云端模型

Claude Opus 4.7 — 创造性评述／ DeepSeek-V4 — 特征抽取兜底

存储

MinIO · NAS · RAG（知识库）／ PostgreSQL · Redis（编排状态）

本地

80%

敏感数据 · 高频任务
客户文书总结

云端

20%

创造性评述
复杂法律理由

每月 API 预算

¥1,000

Claude + DeepSeek
混合调用

PRICE LADDER · 2026-04 全市场扫描P. 06

八档候选机型

基于《AI 开发主机调研报告 2026-04》全市场扫描，列出对当前评估有意义的八档候选。 T1（DGX Spark，¥3.4 万）为本期建议；T2（双机集群，¥6.8 万）作生产级备选； T3-T8 列出向上扩展路径，软件栈跨档平滑迁移。

八档价格阶梯。

¥3.4 — 5.3 万

DGX Spark / 联想 PGX / HP ZGX Nano

GB10 + 128GB UMA · 建议 DGX Spark ¥3.4 万

¥6.8 — 8 万

DGX Spark / PGX 双机集群

T1 ×2 + ConnectX-7 200 Gbps · 256 GB UMA 池化

¥7.5 万

Mac Studio M3 Ultra 512GB

512GB UMA · 推理友好 · 训练弱

¥10–13 万

RTX PRO 6000 Blackwell 单卡整机

96GB VRAM · 单卡承载更大模型

¥14.9 万

行云褐蚁 HY90

EPYC 9355×2 + 5090D · 大模型满血推理

¥18–22 万

PRO 6000 Blackwell ×2

192GB VRAM · 双卡叠加

¥45–55 万

H20×4 塔式整机

合规渠道 · 思腾合力 / 宁畅

¥80–125 万

DGX Station GB300 / HP Z8 Fury G6i

30+ 人扩展期 · 训练级算力

T1 · 建议改投

NVIDIA DGX Spark

¥3.4 万即可买到 NVIDIA 行货：128GB UMA、1TB NVMe、DGX OS 预装、原厂保修。同平台 OEM 备选 PGX 1TB ¥35,999（三年上门）/ HP ZGX Nano ¥52,800（Care Pack 可选）。

T2 · 备选

DGX Spark 双机集群

¥6.8 万 · 两台 T1 经 ConnectX-7 200 Gbps 互联，错峰 / 池化 / 高可用三模式可切。保留为生产级（业务连续性 + 大模型扩展）备选。

Four-way Showdown · 四方案横评P. 07

四种买法

四档主机覆盖从 3-10 人试点到 30+ 人训练扩展的全部规模区间。同一套软件栈跨档迁移，差异在算力上限、并发承载、保修与运维成本——按所规模选档。

从试点到训练，
四档算力分层。

T1 · 建议

NVIDIA DGX Spark 1TB

NVIDIA GB10 + 128GB UMA

¥3.4 万→ 本地 LLM + 文档解析 + 向量检索

优势

+NVIDIA 行货 + 原厂保修
+DGX OS 预装 · 200 Gbps 互联
+桌面级 1.2 kg · 1 TB 自加密

劣势

−1 年原厂保修（可加购延保）
−建议外接 NAS 归档

★★★★★

推荐度 5/5

T1 ×2 · 集群

DGX Spark 双机

GB10 ×2 + ConnectX-7 200G

¥6.8 万→ 推理 + 常驻 + 容灾

优势

+256 GB UMA 池化
+三模式可切（错峰 / 池化 / 高可用）
+原厂保修 ×2

劣势

−对比单机 +¥3.4 万
−需配置 RDMA 网络

★★★★★

推荐度 4/5

T3 · 备选

Mac Studio M3 Ultra

M3 Ultra · 512 GB UMA

¥7.5 万→ 推理为主 · 大上下文

优势

+512 GB 统一内存
+静音稳定
+整机可靠

劣势

−训练能力弱
−macOS 软件栈适配

★★★★★

推荐度 3/5

T8 · 扩展

DGX Station GB300

GB300 + 784 GB UMA

¥80–125 万→ 30+ 人 · 训练级算力

优势

+训练 / 微调一体
+数百 GB 大模型常驻
+整机三年保修

劣势

−试点期算力过剩
−采购周期 8-12 周

★★★★★

推荐度 2/5

本期建议

NVIDIA DGX Spark
¥3.4 万

对 3-10 人试点规模，NVIDIA DGX Spark 1TB（¥3.4 万）为建议方案：NVIDIA 行货、128GB 统一内存可同时承载本地 LLM、文档解析与本地向量检索；存储 1TB 通过外接 NAS 扩容归档。同平台 OEM 备选：联想 ThinkStation PGX 1TB（¥35,999，三年原厂上门 + 一次数据恢复）、HP ZGX Nano 4TB（¥52,800，HP Care Pack 可加购）；硬件规格三家一致，差异在容量、保修与渠道。双机集群（¥6.8 万）为生产级备选——错峰 / 池化 / 高可用三模式可切；DGX Station GB300 列为 30+ 人扩展期或训练级负载的升级路径。

ECONOMICS · 投入产出测算P. 08

KNOWLEDGE BASE · RAG 知识库的角色

数字员工平台的共享检索中枢

— 它不只是为"查新"建的。

知识库本期定制的 RAG，由本地向量服务 + RAG 网关 + 客户分库隔离构成，承载查新流水线的候选文献池、历史报告、引证图谱三类语义资产。

它的真正价值不止于查新——后续的商标查重、OA 答复、贯标审计、商务邮件等技能可直接复用同一索引，省掉每个新技能各自重建数据通道的冷启动成本，构成事务所 AI 平台的"语义底层"。

※ 向量服务与 RAG 网关一次部署、所有未来技能共享。新增一个技能 ≈ 一份 Prompt 模板 + 接入既有索引。

▍后续技能 × 知识库复用矩阵

技能

知识库角色

性能收益

状态

专利查新（当前）

候选文献池 + 历史报告复用

重复检索命中率 ↑ 60%

当前

商标查重

商标公告 + 同类商品类目库

启动期省 80% 数据采集

待开发

OA 答复

历史 OA + 答辩成功案例

模板复用率 ↑ · 答辩缩短

待开发

贯标 / 审计

GB/T 29490 条文 + 历史报告

条款定位即时检索

待开发

商务邮件 / 简报

客户偏好 + 往来邮件向量化

上下文连续 · 个性化生成

待开发

“

知识库（RAG）一次性专属授权价 ¥45,000，
（同类产品企业版市场价 ¥20–30 万 / 年）

投入测算 · 10 人试点 · 三项分解

① 一次性硬件投入

¥3.7 万

首次部署 · 不计折旧

NVIDIA DGX Spark 1TB¥3.4 万
全局网络稳定$400 / 台含物流关税

② 运营年费（不含 RAG 授权）

¥15,600 / 年

≈ ¥1,300 / 月 · 持续支出

Claude API$125 / 月
DeepSeek V4 按量¥100 / 月
全自动 AI 运维¥300 / 月
微信 / TG Bot 接入¥500 / 年 / 席
（前 3 席赠）

③ 知识库（RAG）一次性专属授权价

¥45,000

一次性 · 永久使用 · 企业版 4-7 倍折扣

同类产品企业版¥20-30 万 / 年
首年节省¥15.5 - 25.5 万

※ 第 2 年起若需知识库升级新功能 / 性能，按 ¥5 万 / 年起计；不升级则无后续费用。

首年总投入 · ① + ② + ③

¥9.8 万

硬件 ¥3.7 万 + 运营 ¥1.56 万 + 知识库 ¥4.5 万（一次性）

↻

次年起每年 · 仅 ②（不升级）

¥15,600 / 年

仅运营年费；知识库如需升级新功能 / 性能 +¥5 万 / 年起 → 至多 ¥6.6 万 / 年

首年总投入 约 ¥9.8 万，与一份 PatSnap（智慧芽）单账号年订阅相当（约 ¥8-15 万）；但本方案产出的是可长期复用的本地基础设施——次年起若不升级，仅需 ¥1.56 万 / 年运营成本；知识库若需升级新功能 / 性能，按 ¥5 万 / 年起追加。其中"知识库一次性专属授权"以 ¥45,000 置换企业版 ¥20-30 万/年的市场价，单此一项首年即可省下 ¥15.5-25.5 万，覆盖所有运营成本的 8 倍以上。

SKILL COVERAGE · 技能覆盖度剖面P. 09

性能 / Performance

五个环节自动化，
三个环节人工守界。

对标专利代理实务的 8 步流程，本技能覆盖 ② → ⑥ 五个环节，把代理师在 PatSnap 上"开 28 个搜索窗口、翻 100 篇文献、填对比矩阵、写评述初稿"的 6-8 小时劳力压缩到 15-30 分钟，并在 ⑥ 强制律师签字闭环。

阶段

主导方 / 产出

技能覆盖度

①

客户初步咨询

业务沟通，人工

代理师 + 客户

口头/文字技术构想

②

技术交底沟通

解析既有 docx/md/txt；引导仍需代理师

代理师问询 + 客户

结构化交底书

30%

③

关键词 / 特征提炼

代理师复审同类词与 IPC 归属

代理师 → 技能

检索要素表 (a–j + IPC + 同类词)

80%

④

多通道查新检索CORE

28 轮 × 3 通道全自动 · 核心价值环节

技能（4 通道并行）

候选文献池 ~100 篇

95%

⑤

对比文献筛选 + 矩阵

矩阵自动填充；归类边界值需复核

技能 → 代理师

Top-3 文献 · X/Y/A · 200 格矩阵

85%

⑥

创造性评述与结论

结论句必须由代理师签字背书

技能起草 → 律师签字

评述正文 ≥ 1,500 字

60%

⑦

权利要求撰写

不在本技能范围

代理师

权利要求书 + 说明书

⑧

递交 / OA 答复

不在本技能范围

代理师

申请文件 · 审查意见答复

核心价值命题

1-2 天→15-30 分

替代代理师"开 28 个 PatSnap 窗口、翻 100 篇文献、填对比矩阵、起草评述"的 6-8 小时劳力。

检索调用

28 × 3

轮 × 通道

特征矩阵

200 格

10 × 20

三条边界警告

1.不能替代交底书撰写 · 客户描述残缺时仍需代理师面谈补全，技能只能解析既有文档。
2.不能替代代理师签字 · X/Y/A 判定与创造性结论属执业责任，LLM 建议不等于法律意见。
3.IPC 分类依赖 LLM · 偏门或交叉技术领域可能误分；review_checklist.md 强制人工复核。

DATA CHANNELS · 公网专利库通道验证（2026-04 实测）

通道

区域

认证

配额

实测时延

状态

USPTO PatentsView / ODP

美专利首选 · JSON + PDF 链接

API Key（免费注册）

无速率限制

< 0.8 s

已验证

EPO Espacenet OPS

欧专 + WIPO 同族 · 官方 ToS 允许

EP / WO

OAuth client_credentials

4 GB / 周

< 1.2 s

已验证

Google Patents

覆盖 CN 1985 至今 · 走 WebFetch

Global

无（前端）

1 req / 2 s 自限

2 – 5 s

已验证

CNIPA epub.cnipa.gov.cn

中国专利 PDF 首选源

无（官方公告）

PDF 直链

2 – 4 s

已验证

WIPO PATENTSCOPE

备线 · 与 EPO 同族字段重叠

无（REST）

官方过渡中

—

备线

四主线 (USPTO + EPO + Google Patents + CNIPA) 已通过 scripts/check_endpoints.py 每日联通性测试；禁用 PatSnap / SooPAT 等付费库爬虫与反爬绕过——技能默认走合规通道。

人机协同工作流

①② 人工

代理师面谈 → 客户写交底书

→

③④⑤⑥ 技能 · 15-30 分

extract → elements → 28 轮检索 → 200 格矩阵 → 评述初稿

→

⑥ 律师签字

审阅 report.docx · 修改 X/Y/A 与结论 · 签字

⑦⑧
代理师

CLOSING · 结尾总结P. 10

结论 / 三句话

i.NVIDIA DGX Spark（¥3.4 万）为本期建议方案：NVIDIA 行货、128 GB 统一内存、原厂保修，足以同时承载本地 LLM、文档解析、本地向量检索与查新流水线。同平台 OEM 备选 PGX 1TB（¥35,999，三年上门）/ HP ZGX Nano 4TB（¥52,800，Care Pack 可选）。
ii.双机集群（¥6.8 万）为生产级备选：两机经 ConnectX-7 200 Gbps 互联，错峰 / 池化 / 高可用三模式可切，跑 100B+ 大模型与节点容灾一并解决。
iii.向上扩展路径清晰：30+ 人或需训练级算力时，直接跨向 DGX Station GB300（¥80-125 万）。RAG 知识库与软件栈跨档可平滑迁移，无需重建数据通道。

下期预告 →ISSUE 002 将聚焦"知识库共用资产"的下一步落地：把第二个技能（商标查重 / OA 答复）接入既有 RAG 索引，量化复用收益；同时讨论福州、北京、漳州、泉州四地分支的远程接入方案，让本地推理在跨地工位仍保持低延迟体验。

QUOTE / 整机报价

NVIDIA DGX Spark 1TBT1

NVIDIA GB10 · 128GB UMA · 1TB · 行货保修

¥3.4 万

联想 PGX 1TB · HP ZGX Nano 4TBT1 OEM

同平台 OEM · 保修与渠道差异

¥3.6 / 5.3 万

DGX Spark 双机集群T1 ×2

ConnectX-7 200G 互联 · 256 GB UMA 池化

¥6.8 万

Mac Studio M3 Ultra 512G

大上下文推理友好

¥7.5 万

DGX Station GB300

784 GB UMA · 训练级算力 · 30+ 人扩展

¥80-125 万

本期建议

NVIDIA DGX Spark

双机集群（¥6.8 万）作为生产级备选保留

所有报价为 ± 15% 估值。采购前请向京东企业购、中商科技（厦门本地代理）、富士康金牌渠道索取 3 家正式报价单。

智能体基础设施选型方案

一台本地服务器，能否同时承载所内多个 AI 工作负载？

T1 候选机型规格与外设清单

一机承载推理，一机承载常驻服务。

本地为骨，云端为筋。

八档价格阶梯。

从试点到训练，四档算力分层。

数字员工平台的共享检索中枢

五个环节自动化，三个环节人工守界。

结论 / 三句话

智能体
基础设施
选型方案

一台本地服务器，
能否同时承载所内多个 AI 工作负载？

一机承载推理，
一机承载常驻服务。

本地为骨，
云端为筋。

从试点到训练，
四档算力分层。

五个环节自动化，
三个环节人工守界。