<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-CN"><generator uri="https://jekyllrb.com/" version="3.10.0">Jekyll</generator><link href="https://frankenchine.github.io/feed.xml" rel="self" type="application/atom+xml" /><link href="https://frankenchine.github.io/" rel="alternate" type="text/html" hreflang="zh-CN" /><updated>2026-03-18T16:34:26+08:00</updated><id>https://frankenchine.github.io/feed.xml</id><title type="html">Frank in Shanghai</title><subtitle>Full-stack Engineer (Fintech) · Java &amp; Vue · Creator of agent4j</subtitle><entry><title type="html">AI Weekly — 2026-03-18</title><link href="https://frankenchine.github.io/weekly/2026-03-18/ai-weekly/" rel="alternate" type="text/html" title="AI Weekly — 2026-03-18" /><published>2026-03-18T00:00:00+08:00</published><updated>2026-03-18T00:00:00+08:00</updated><id>https://frankenchine.github.io/weekly/2026-03-18/ai-weekly</id><content type="html" xml:base="https://frankenchine.github.io/weekly/2026-03-18/ai-weekly/"><![CDATA[<p>本周关注：<strong>Agent 工程化</strong>、<strong>可靠性与评测</strong>、以及<strong>企业落地的“最后一公里”</strong>。</p>

<!--more-->

<h2 id="1-agent-工程化从-demo-到-production">1) Agent 工程化：从 Demo 到 Production</h2>
<ul>
  <li><strong>工具协议与可观测性</strong>：把工具调用当作一等公民（结构化输入/输出、失败重试、审计日志）。</li>
  <li><strong>工作流编排</strong>：把“自由对话”与“可重复流程”分开设计，流程可测试、可回放。</li>
  <li><strong>安全边界</strong>：权限最小化、对外部系统写操作必须显式批准或通过策略门控。</li>
</ul>

<h2 id="2-评测与可靠性">2) 评测与可靠性</h2>
<ul>
  <li><strong>离线评测优先</strong>：在同一套用例上比较提示词/模型/工具版本，避免主观波动。</li>
  <li><strong>线上观测闭环</strong>：把失败样本沉淀为回归集，持续迭代。</li>
  <li><strong>成本控制</strong>：缓存、分层模型、按场景路由（大模型只做“需要”的部分）。</li>
</ul>

<h2 id="3-我在做什么">3) 我在做什么</h2>
<ul>
  <li>继续推进 <a href="https://github.com/agent4java/agent4j">agent4j</a>：让 Java 团队在现有 Spring/微服务体系里更顺滑地接入 Agent 能力。</li>
</ul>

<h2 id="links">Links</h2>
<ul>
  <li>这周我会把更多“工程化 checklist”整理成可复用模板，方便团队直接上手。</li>
</ul>]]></content><author><name></name></author><category term="weekly" /><category term="ai" /><category term="llm" /><category term="agents" /><category term="engineering" /><summary type="html"><![CDATA[本周关注：Agent 工程化、可靠性与评测、以及企业落地的“最后一公里”。]]></summary></entry></feed>