ADVISORY — INFRASTRUCTURE SELECTION
智能体
基础设施
选型方案
精诚新创知识产权专案。
一台本地服务器,
能否同时承载所内多个 AI 工作负载?
本次评估的目标,是判断一台本地服务器能否在 3-10 名种子员工的试点规模下,承载patent-prior-art-search技能的全流水线,连同 Gemma 4 / Qwen 3.5 等本地模型、文档解析、本地向量检索四类基础组件。
评估范围涵盖硬件选型(整机与 DIY 的权衡)、软件栈分工(本地与云端协同)、月度运营成本测算、与现有商业方案的横向对比。所有候选机型、价格区间与采购入口附于后文。
首选机型 · T1
整机起价 ¥34,000
推荐配置 ≈ ¥38,200(含 6 TB×2 NAS + UPS)
DGX Spark 系 NVIDIA 桌面级 AI 工作站。OEM 联名款(联想 PGX、HP ZGX Nano、戴尔、华硕、宏碁等)硬件规格一致,差异在保修、容量与渠道;本地总代为神州数码、英迈中国、紫光晓通。
T1 候选机型规格与外设清单
一机承载推理,
一机承载常驻服务。
两台 DGX Spark 通过 ConnectX-7 双口 200 Gbps RDMA 互联,常态下分工运行:主机 α 承载本地大模型推理与上下文 KV 缓存;主机 β 常驻三类轻量服务——本地向量检索、PDF 文本抽取、文档结构化。
当遇到单机 128 GB UMA 容不下的更大模型时,两机池化为 256 GB 统一内存,张量并行跑 100B+ 量级模型;当任一节点宕机,另一节点经心跳切换接管,构成业务连续性的最小可行单元。
三种模式由 OpenClaw 网关层根据请求类型与节点健康度自动调度——日常查新走错峰, 深度评述与扩展模型走池化,节点心跳异常时自动切高可用。
五层堆栈
本地承担 80% 的推理;只把"创造性评述"等法律含金量高的请求外发到云端。
本地为骨,
云端为筋。
客户文书总结
复杂法律理由
混合调用
八档候选机型
基于《AI 开发主机调研报告 2026-04》全市场扫描,列出对当前评估有意义的八档候选。 T1(DGX Spark,¥3.4 万)为本期建议;T2(双机集群,¥6.8 万)作生产级备选; T3-T8 列出向上扩展路径,软件栈跨档平滑迁移。
八档价格阶梯。
四种买法
四档主机覆盖从 3-10 人试点到 30+ 人训练扩展的全部规模区间。同一套软件栈跨档迁移,差异在算力上限、并发承载、保修与运维成本——按所规模选档。
从试点到训练,
四档算力分层。
- +NVIDIA 行货 + 原厂保修
- +DGX OS 预装 · 200 Gbps 互联
- +桌面级 1.2 kg · 1 TB 自加密
- −1 年原厂保修(可加购延保)
- −建议外接 NAS 归档
- +256 GB UMA 池化
- +三模式可切(错峰 / 池化 / 高可用)
- +原厂保修 ×2
- −对比单机 +¥3.4 万
- −需配置 RDMA 网络
- +512 GB 统一内存
- +静音稳定
- +整机可靠
- −训练能力弱
- −macOS 软件栈适配
- +训练 / 微调一体
- +数百 GB 大模型常驻
- +整机三年保修
- −试点期算力过剩
- −采购周期 8-12 周
¥3.4 万
数字员工平台的共享检索中枢
— 它不只是为"查新"建的。
知识库本期定制的 RAG,由本地向量服务 + RAG 网关 + 客户分库隔离构成,承载查新流水线的候选文献池、历史报告、引证图谱三类语义资产。
它的真正价值不止于查新——后续的商标查重、OA 答复、贯标审计、商务邮件等技能可直接复用同一索引,省掉每个新技能各自重建数据通道的冷启动成本,构成事务所 AI 平台的"语义底层"。
※ 向量服务与 RAG 网关一次部署、所有未来技能共享。新增一个技能 ≈ 一份 Prompt 模板 + 接入既有索引。
知识库(RAG)一次性专属授权价 ¥45,000,(同类产品企业版市场价 ¥20–30 万 / 年)
- NVIDIA DGX Spark 1TB¥3.4 万
- 全局网络稳定$400 / 台 含物流关税
- Claude API$125 / 月
- DeepSeek V4 按量¥100 / 月
- 全自动 AI 运维¥300 / 月
- 微信 / TG Bot 接入¥500 / 年 / 席(前 3 席赠)
- 同类产品企业版¥20-30 万 / 年
- 首年节省¥15.5 - 25.5 万
性能 / Performance
五个环节自动化,
三个环节人工守界。
对标专利代理实务的 8 步流程,本技能覆盖 ② → ⑥ 五个环节,把代理师在 PatSnap 上"开 28 个搜索窗口、翻 100 篇文献、填对比矩阵、写评述初稿"的 6-8 小时劳力压缩到 15-30 分钟,并在 ⑥ 强制律师签字闭环。
- 1.不能替代交底书撰写 · 客户描述残缺时仍需代理师面谈补全,技能只能解析既有文档。
- 2.不能替代代理师签字 · X/Y/A 判定与创造性结论属执业责任,LLM 建议不等于法律意见。
- 3.IPC 分类依赖 LLM · 偏门或交叉技术领域可能误分;review_checklist.md 强制人工复核。
四主线 (USPTO + EPO + Google Patents + CNIPA) 已通过 scripts/check_endpoints.py 每日联通性测试;禁用 PatSnap / SooPAT 等付费库爬虫与反爬绕过——技能默认走合规通道。
代理师
结论 / 三句话
- i.NVIDIA DGX Spark(¥3.4 万)为本期建议方案:NVIDIA 行货、128 GB 统一内存、原厂保修,足以同时承载本地 LLM、文档解析、本地向量检索与查新流水线。同平台 OEM 备选 PGX 1TB(¥35,999,三年上门)/ HP ZGX Nano 4TB(¥52,800,Care Pack 可选)。
- ii.双机集群(¥6.8 万)为生产级备选:两机经 ConnectX-7 200 Gbps 互联,错峰 / 池化 / 高可用三模式可切,跑 100B+ 大模型与节点容灾一并解决。
- iii.向上扩展路径清晰:30+ 人或需训练级算力时,直接跨向 DGX Station GB300(¥80-125 万)。RAG 知识库与软件栈跨档可平滑迁移,无需重建数据通道。