Vector/ 精诚新创ISSUE 001 · APR 2026

ADVISORY — INFRASTRUCTURE SELECTION

智能体
基础设施
选型方案

精诚新创知识产权专案。

八档候选 · ¥3 万 → ¥125 万
PRODUCT IN FOCUSDGX SPARK/ 联想 ThinkStation PGXNVIDIAGB10 GRACE BLACKWELLUNIFIED MEMORY128 GB · 273 GB/sAI PERFORMANCE1 PetaFLOP FP4¥34,000 起 · NVIDIA 行货保修
A Quarterly Survey
on Compute, Privacy, and the Practical Limits of On-prem AI.
特约
patent-prior-art-search · v0.1
本期推荐
DGX Spark · GB10 Superchip
评估对象
3-10 人试点 · 厦门精诚新创
Editor's Note · 评估范围P. 02

一台本地服务器,
能否同时承载所内多个 AI 工作负载?

§
精诚新创知识产权当前的工作流,提出了三个待解的工程约束:客户技术交底书属敏感数据,外发存在合规风险;商业查新工具(如 PatSnap)按账号年订阅(约 ¥8-15 万 / 账号),1 账号成共享瓶颈、3+ 账号超出试点预算,采购模型与所内并行使用规模不匹配;所内未来的 AI 需求会按垂直技能逐步上线(专利查新先行,再到文书总结、商标查重、OA 答复等),底层组件(模型 / 向量 / 解析)高度复用——本期一次性建好底层,后续每个新技能 ≈ 一份 Prompt + 接入既有索引,避免重复建设。

本次评估的目标,是判断一台本地服务器能否在 3-10 名种子员工的试点规模下,承载patent-prior-art-search技能的全流水线,连同 Gemma 4 / Qwen 3.5 等本地模型、文档解析、本地向量检索四类基础组件。

评估范围涵盖硬件选型(整机与 DIY 的权衡)、软件栈分工(本地与云端协同)、月度运营成本测算、与现有商业方案的横向对比。所有候选机型、价格区间与采购入口附于后文。

Pilot Bay 01
03-10
首期试点员工
敏感数据不外发
本地
模型 / 解析 / 向量检索
USPTO · EPO · GP · CNIPA
28
查新检索轮次
10 特征 × 20 候选
200
特征对比矩阵格
评估方法 · METHODOLOGY
01
硬件选型
8 档候选 · 整机 / DIY 权衡
02
软件栈分工
本地 vs 云端 · 80 / 20
03
成本测算
月度运营 + 硬件折旧
04
对比验证
对照 PatSnap(智慧芽)订阅
MAIN SPEC · 整机配置与外设清单P. 03
01

首选机型 · T1

整机起价 ¥34,000
推荐配置 ≈ ¥38,200(含 6 TB×2 NAS + UPS)

DGX Spark 系 NVIDIA 桌面级 AI 工作站。OEM 联名款(联想 PGX、HP ZGX Nano、戴尔、华硕、宏碁等)硬件规格一致,差异在保修、容量与渠道;本地总代为神州数码、英迈中国、紫光晓通。

采购备注
DGX Spark 内置 1 TB NVMe,建议加配外置 NAS(4-10 TB 三档可选,下表)扩容并归档。RAID-1 配置避免单盘故障导致数据丢失。

T1 候选机型规格与外设清单

类型
主机集成规格
价格
入口
主机型号
NVIDIA DGX Spark 1TB
NVIDIA 行货 · OEM 备选 PGX 1TB ¥35,999 / HP ZGX Nano 4TB ¥52,800
¥34,000
→ JD.COM
SoC
NVIDIA GB10 Grace-Blackwell Superchip
20 核 ARM (10× X925 + 10× A725)
集成
GPU
Blackwell 架构 · 5th Gen Tensor Core
AI 算力 1 PetaFLOP FP4(含稀疏)
集成
统一内存
128 GB LPDDR5x
CPU/GPU 一致性共享 · 273 GB/s
集成
系统存储
1 TB NVMe M.2
TCG Opal 自加密 · 外接 NAS 扩容(下表三档)
集成
网络
ConnectX-7 200 Gbps + 10 GbE + Wi-Fi 7
双机互联可组 256 GB 内存池
集成
形态 / 功耗
150 × 150 × 51 mm · 1.2 kg · 240 W
桌面级 · Ubuntu DGX OS 预装
集成
类型
外置归档存储(RAID-1 双盘 · 三档可选)
价格
入口
4 TB × 2
≈ ¥1,300
→ JD.COM
6 TB × 2
≈ ¥1,800
→ JD.COM
10 TB × 2
≈ ¥4,000
→ JD.COM
类型
配件
价格
入口
UPS
APC SUA1500ICH
1500 VA · 在线互动式 · 断电缓冲 ~15 分钟
¥2,400
→ JD.COM
外置硬盘盒 / NAS
OWC ThunderBay / 群晖 DS224+
RAID-1 双盘位 · USB 3.2 / 千兆网络
¥1,500 — ¥3,000
→ JD.COM
起步配置
¥37,700
主机 ¥3.4 万 + 4TB NAS + UPS
推荐配置 ★
¥38,200
主机 ¥3.4 万 + 6TB NAS + UPS
满配
¥40,400
主机 ¥3.4 万 + 10TB Pro + UPS
DUAL-NODE CLUSTER · 双机集群分工P. 04
02

一机承载推理,
一机承载常驻服务。

两台 DGX Spark 通过 ConnectX-7 双口 200 Gbps RDMA 互联,常态下分工运行:主机 α 承载本地大模型推理与上下文 KV 缓存;主机 β 常驻三类轻量服务——本地向量检索、PDF 文本抽取、文档结构化。

当遇到单机 128 GB UMA 容不下的更大模型时,两机池化为 256 GB 统一内存,张量并行跑 100B+ 量级模型;当任一节点宕机,另一节点经心跳切换接管,构成业务连续性的最小可行单元。

α
主机 α / PRIMARY
DGX Spark
128 GB UMA · GB10
本地 LLM 推理~80 GB
KV Cache · 多轮~30 GB
余量~18 GB
承载
Gemma 4 / Qwen 3.5 · 70B 量级 FP8
β
主机 β / AUX
DGX Spark
128 GB UMA · GB10
本地向量检索~10 GB
PDF 文本抽取~6 GB
扫描件兜底解析~8 GB
余量 / 池化备用~104 GB
备线
α 节点热备份 · 心跳秒级切换
两机互联 ¥6.8 万,构成可推理、可池化、可容灾的最小生产单元——比单台 DGX Station GB300 (¥80-125 万) 低一个量级。
双机总价
¥6.8万
T1 × 2 + 互联线缆
池化 UMA
256 GB
128G × 2 跨机统一
互联带宽
200 Gbps
ConnectX-7 RDMA 双口
三种运行模式
① 错峰
α · LLM 推理常驻
β · 向量 / 解析 / 文本三类服务
② 池化
α + β 跨机张量并行 · 256 GB UMA · 跑 100B+ 大模型
③ 高可用
α · 主业务节点
β · 热备份
模式
触发条件
默认 ① · 大模型时切 ② · 检测异常切 ③

三种模式由 OpenClaw 网关层根据请求类型与节点健康度自动调度——日常查新走错峰, 深度评述与扩展模型走池化,节点心跳异常时自动切高可用。

STACK · 软件栈协奏P. 05
03

五层堆栈

本地承担 80% 的推理;只把"创造性评述"等法律含金量高的请求外发到云端。

本地为骨,
云端为筋

01
接入
Claude Code / 微信 ClawBot / Telegram Bot
02
编排
类 OpenClaw / Hermes-like 智能体网关 / 技能路由 · 配额 · 审计 · 多账户隔离
03
本地模型
Gemma 4 / Qwen 3.5(本地总结 · 客户备注) / 本地向量检索(语义召回) / PDF 解析(文本层抽取 · 扫描件兜底)
04
云端模型
Claude Opus 4.7 — 创造性评述 / DeepSeek-V4 — 特征抽取兜底
05
存储
MinIO · NAS · RAG(知识库) / PostgreSQL · Redis(编排状态)
本地
80%
敏感数据 · 高频任务
客户文书总结
云端
20%
创造性评述
复杂法律理由
每月 API 预算
¥1,000
Claude + DeepSeek
混合调用
PRICE LADDER · 2026-04 全市场扫描P. 06
04

八档候选机型

基于《AI 开发主机调研报告 2026-04》全市场扫描,列出对当前评估有意义的八档候选。 T1(DGX Spark,¥3.4 万)为本期建议;T2(双机集群,¥6.8 万)作生产级备选; T3-T8 列出向上扩展路径,软件栈跨档平滑迁移。

八档价格阶梯

T1
¥3.4 — 5.3 万
DGX Spark / 联想 PGX / HP ZGX Nano
GB10 + 128GB UMA · 建议 DGX Spark ¥3.4 万
T2
¥6.8 — 8 万
DGX Spark / PGX 双机集群
T1 ×2 + ConnectX-7 200 Gbps · 256 GB UMA 池化
T3
¥7.5 万
Mac Studio M3 Ultra 512GB
512GB UMA · 推理友好 · 训练弱
T4
¥10–13 万
RTX PRO 6000 Blackwell 单卡整机
96GB VRAM · 单卡承载更大模型
T5
¥14.9 万
行云褐蚁 HY90
EPYC 9355×2 + 5090D · 大模型满血推理
T6
¥18–22 万
PRO 6000 Blackwell ×2
192GB VRAM · 双卡叠加
T7
¥45–55 万
H20×4 塔式整机
合规渠道 · 思腾合力 / 宁畅
T8
¥80–125 万
DGX Station GB300 / HP Z8 Fury G6i
30+ 人扩展期 · 训练级算力
T1 · 建议改投
NVIDIA DGX Spark
¥3.4 万即可买到 NVIDIA 行货:128GB UMA、1TB NVMe、DGX OS 预装、原厂保修。 同平台 OEM 备选 PGX 1TB ¥35,999(三年上门)/ HP ZGX Nano ¥52,800(Care Pack 可选)。
T2 · 备选
DGX Spark 双机集群
¥6.8 万 · 两台 T1 经 ConnectX-7 200 Gbps 互联,错峰 / 池化 / 高可用三模式可切。 保留为生产级(业务连续性 + 大模型扩展)备选。
Four-way Showdown · 四方案横评P. 07
05

四种买法

四档主机覆盖从 3-10 人试点到 30+ 人训练扩展的全部规模区间。同一套软件栈跨档迁移,差异在算力上限、并发承载、保修与运维成本——按所规模选档。

从试点到训练,
四档算力分层。

01
T1 · 建议
NVIDIA DGX Spark 1TB
NVIDIA GB10 + 128GB UMA
¥3.4 万本地 LLM + 文档解析 + 向量检索
优势
  • +NVIDIA 行货 + 原厂保修
  • +DGX OS 预装 · 200 Gbps 互联
  • +桌面级 1.2 kg · 1 TB 自加密
劣势
  • 1 年原厂保修(可加购延保)
  • 建议外接 NAS 归档
★★★★★
推荐度 5/5
02
T1 ×2 · 集群
DGX Spark 双机
GB10 ×2 + ConnectX-7 200G
¥6.8 万推理 + 常驻 + 容灾
优势
  • +256 GB UMA 池化
  • +三模式可切(错峰 / 池化 / 高可用)
  • +原厂保修 ×2
劣势
  • 对比单机 +¥3.4 万
  • 需配置 RDMA 网络
★★★★
推荐度 4/5
03
T3 · 备选
Mac Studio M3 Ultra
M3 Ultra · 512 GB UMA
¥7.5 万推理为主 · 大上下文
优势
  • +512 GB 统一内存
  • +静音稳定
  • +整机可靠
劣势
  • 训练能力弱
  • macOS 软件栈适配
★★★★★
推荐度 3/5
04
T8 · 扩展
DGX Station GB300
GB300 + 784 GB UMA
¥80–125 万30+ 人 · 训练级算力
优势
  • +训练 / 微调一体
  • +数百 GB 大模型常驻
  • +整机三年保修
劣势
  • 试点期算力过剩
  • 采购周期 8-12 周
★★★★★
推荐度 2/5
本期建议
NVIDIA DGX Spark
¥3.4 万
对 3-10 人试点规模,NVIDIA DGX Spark 1TB(¥3.4 万)为建议方案:NVIDIA 行货、128GB 统一内存可同时承载本地 LLM、文档解析与本地向量检索;存储 1TB 通过外接 NAS 扩容归档。 同平台 OEM 备选:联想 ThinkStation PGX 1TB(¥35,999,三年原厂上门 + 一次数据恢复)、HP ZGX Nano 4TB(¥52,800,HP Care Pack 可加购);硬件规格三家一致,差异在容量、保修与渠道。双机集群(¥6.8 万)为生产级备选——错峰 / 池化 / 高可用三模式可切;DGX Station GB300 列为 30+ 人扩展期或训练级负载的升级路径。
ECONOMICS · 投入产出测算P. 08
KNOWLEDGE BASE · RAG 知识库的角色

数字员工平台共享检索中枢

— 它不只是为"查新"建的。

知识库本期定制的 RAG,由本地向量服务 + RAG 网关 + 客户分库隔离构成,承载查新流水线的候选文献池、历史报告、引证图谱三类语义资产。

它的真正价值不止于查新——后续的商标查重、OA 答复、贯标审计、商务邮件等技能可直接复用同一索引,省掉每个新技能各自重建数据通道的冷启动成本,构成事务所 AI 平台的"语义底层"。

※ 向量服务与 RAG 网关一次部署、所有未来技能共享。新增一个技能 ≈ 一份 Prompt 模板 + 接入既有索引。

后续技能 × 知识库复用矩阵
技能
知识库角色
性能收益
状态
专利查新(当前)
候选文献池 + 历史报告复用
重复检索命中率 ↑ 60%
当前
商标查重
商标公告 + 同类商品类目库
启动期省 80% 数据采集
待开发
OA 答复
历史 OA + 答辩成功案例
模板复用率 ↑ · 答辩缩短
待开发
贯标 / 审计
GB/T 29490 条文 + 历史报告
条款定位即时检索
待开发
商务邮件 / 简报
客户偏好 + 往来邮件向量化
上下文连续 · 个性化生成
待开发
知识库(RAG)一次性专属授权价 ¥45,000,
(同类产品企业版市场价 ¥20–30 万 / 年)
投入测算 · 10 人试点 · 三项分解
① 一次性硬件投入
¥3.7 万
首次部署 · 不计折旧
  • NVIDIA DGX Spark 1TB¥3.4 万
  • 全局网络稳定$400 / 台 含物流关税
② 运营年费(不含 RAG 授权)
¥15,600 / 年
≈ ¥1,300 / 月 · 持续支出
  • Claude API$125 / 月
  • DeepSeek V4 按量¥100 / 月
  • 全自动 AI 运维¥300 / 月
  • 微信 / TG Bot 接入¥500 / 年 / 席
    (前 3 席赠)
③ 知识库(RAG)一次性专属授权价
¥45,000
一次性 · 永久使用 · 企业版 4-7 倍折扣
  • 同类产品企业版¥20-30 万 / 年
  • 首年节省¥15.5 - 25.5 万
※ 第 2 年起若需知识库升级新功能 / 性能,按 ¥5 万 / 年起计;不升级则无后续费用。
Σ
首年总投入 · ① + ② + ③
¥9.8 万
硬件 ¥3.7 万 + 运营 ¥1.56 万 + 知识库 ¥4.5 万(一次性)
次年起每年 · 仅 ②(不升级)
¥15,600 / 年
仅运营年费;知识库如需升级新功能 / 性能 +¥5 万 / 年起 → 至多 ¥6.6 万 / 年
首年总投入 约 ¥9.8 万,与一份 PatSnap(智慧芽)单账号年订阅相当(约 ¥8-15 万); 但本方案产出的是可长期复用的本地基础设施——次年起若不升级,仅需 ¥1.56 万 / 年运营成本;知识库若需升级新功能 / 性能,按 ¥5 万 / 年起追加。其中"知识库一次性专属授权"以 ¥45,000 置换企业版 ¥20-30 万/年的市场价, 单此一项首年即可省下 ¥15.5-25.5 万,覆盖所有运营成本的 8 倍以上。
SKILL COVERAGE · 技能覆盖度剖面P. 09
06

性能 / Performance

五个环节自动化,
三个环节人工守界

对标专利代理实务的 8 步流程,本技能覆盖 ② → ⑥ 五个环节,把代理师在 PatSnap 上"开 28 个搜索窗口、翻 100 篇文献、填对比矩阵、写评述初稿"的 6-8 小时劳力压缩到 15-30 分钟,并在 ⑥ 强制律师签字闭环。

#
阶段
主导方 / 产出
技能覆盖度
客户初步咨询
业务沟通,人工
代理师 + 客户
口头/文字技术构想
0%
技术交底沟通
解析既有 docx/md/txt;引导仍需代理师
代理师问询 + 客户
结构化交底书
30%
关键词 / 特征提炼
代理师复审同类词与 IPC 归属
代理师 → 技能
检索要素表 (a–j + IPC + 同类词)
80%
多通道查新检索CORE
28 轮 × 3 通道全自动 · 核心价值环节
技能(4 通道并行)
候选文献池 ~100 篇
95%
对比文献筛选 + 矩阵
矩阵自动填充;归类边界值需复核
技能 → 代理师
Top-3 文献 · X/Y/A · 200 格矩阵
85%
创造性评述与结论
结论句必须由代理师签字背书
技能起草 → 律师签字
评述正文 ≥ 1,500 字
60%
权利要求撰写
不在本技能范围
代理师
权利要求书 + 说明书
0%
递交 / OA 答复
不在本技能范围
代理师
申请文件 · 审查意见答复
0%
核心价值命题
1-2 天15-30 分
替代代理师"开 28 个 PatSnap 窗口、翻 100 篇文献、填对比矩阵、起草评述"的 6-8 小时劳力。
检索调用
28 × 3
轮 × 通道
特征矩阵
200 格
10 × 20
三条边界警告
  1. 1.不能替代交底书撰写 · 客户描述残缺时仍需代理师面谈补全,技能只能解析既有文档。
  2. 2.不能替代代理师签字 · X/Y/A 判定与创造性结论属执业责任,LLM 建议不等于法律意见。
  3. 3.IPC 分类依赖 LLM · 偏门或交叉技术领域可能误分;review_checklist.md 强制人工复核。
DATA CHANNELS · 公网专利库通道验证(2026-04 实测)
通道
区域
认证
配额
实测时延
状态
USPTO PatentsView / ODP
美专利首选 · JSON + PDF 链接
US
API Key(免费注册)
无速率限制
< 0.8 s
已验证
EPO Espacenet OPS
欧专 + WIPO 同族 · 官方 ToS 允许
EP / WO
OAuth client_credentials
4 GB / 周
< 1.2 s
已验证
Google Patents
覆盖 CN 1985 至今 · 走 WebFetch
Global
无(前端)
1 req / 2 s 自限
2 – 5 s
已验证
CNIPA epub.cnipa.gov.cn
中国专利 PDF 首选源
CN
无(官方公告)
PDF 直链
2 – 4 s
已验证
WIPO PATENTSCOPE
备线 · 与 EPO 同族字段重叠
WO
无(REST)
官方过渡中
备线

四主线 (USPTO + EPO + Google Patents + CNIPA) 已通过 scripts/check_endpoints.py 每日联通性测试;禁用 PatSnap / SooPAT 等付费库爬虫与反爬绕过——技能默认走合规通道。

人机协同工作流
①② 人工
代理师面谈 → 客户写交底书
③④⑤⑥ 技能 · 15-30 分
extract → elements → 28 轮检索 → 200 格矩阵 → 评述初稿
⑥ 律师签字
审阅 report.docx · 修改 X/Y/A 与结论 · 签字
⑦⑧
代理师
CLOSING · 结尾总结P. 10

结论 / 三句话

  1. i.NVIDIA DGX Spark(¥3.4 万)为本期建议方案:NVIDIA 行货、128 GB 统一内存、原厂保修,足以同时承载本地 LLM、文档解析、本地向量检索与查新流水线。同平台 OEM 备选 PGX 1TB(¥35,999,三年上门)/ HP ZGX Nano 4TB(¥52,800,Care Pack 可选)。
  2. ii.双机集群(¥6.8 万)为生产级备选:两机经 ConnectX-7 200 Gbps 互联,错峰 / 池化 / 高可用三模式可切,跑 100B+ 大模型与节点容灾一并解决。
  3. iii.向上扩展路径清晰:30+ 人或需训练级算力时,直接跨向 DGX Station GB300(¥80-125 万)。RAG 知识库与软件栈跨档可平滑迁移,无需重建数据通道。
下期预告 →ISSUE 002 将聚焦"知识库共用资产"的下一步落地:把第二个技能(商标查重 / OA 答复)接入既有 RAG 索引,量化复用收益;同时讨论福州、北京、漳州、泉州四地分支的远程接入方案,让本地推理在跨地工位仍保持低延迟体验。
QUOTE / 整机报价
NVIDIA DGX Spark 1TBT1
NVIDIA GB10 · 128GB UMA · 1TB · 行货保修
¥3.4 万
联想 PGX 1TB · HP ZGX Nano 4TBT1 OEM
同平台 OEM · 保修与渠道差异
¥3.6 / 5.3 万
DGX Spark 双机集群T1 ×2
ConnectX-7 200G 互联 · 256 GB UMA 池化
¥6.8 万
Mac Studio M3 Ultra 512G
大上下文推理友好
¥7.5 万
DGX Station GB300
784 GB UMA · 训练级算力 · 30+ 人扩展
¥80-125 万
本期建议
NVIDIA DGX Spark
双机集群(¥6.8 万)作为生产级备选保留
所有报价为 ± 15% 估值。采购前请向京东企业购、中商科技(厦门本地代理)、富士康金牌渠道索取 3 家正式报价单。