2521690 ce299cbb18 feat: 增加 Agent 演示入口与 app_metadata 驱动验证链路

- 新增 app_metadata 模型、仓储与服务
- 将默认 edge 验证步骤改为由 app_metadata 驱动生成
- 新增 chat_session / chat_message 会话层模型与 chat service
- 新增 demo chat API，支持会话创建、消息发送、任务确认
- 新增最小 Web Demo 页面，形成聊天式演示入口
- 增强任务报告，补充 audit_summary 与更细粒度 task_metrics
- 增强 edge-agent 执行器：tcp_probe、日志时间范围过滤、进程指标与更灵活健康检查
- 更新 README 与当前进度总结，MVP 进度推进到约 94%

2026-04-09 14:10:13 +08:00

20 KiB

Raw Blame History

智能化部署 Agent 当前进度总结

更新时间:2026-04-09

1. 当前总体状态

当前阶段已完成从"需求方案"到"技术架构"再到"接口定义"和"demo 后端骨架"的文档化收敛,整体处于:

方案已成型、文档体系已建立、技术路线已基本明确、demo 后端主链路已可运行

当前产出重点已经从纯文档设计切换为:

文档收口 + demo 代码骨架落地 + 主链路验证

1.1 MVP 进度统计(每轮更新)

以下进度为当前 MVP 目标的估算进度,用于每轮结束后滚动更新:

需求方案与技术架构: 已完成
demo 后端主链路: 已完成
identity / approval / software-a demo 接口: 已完成
edge 接入与调度链路: 已完成
基础验证执行器: 已完成
service control 执行器: 已完成
审计 / 报告 / 聚合指标: 已完成第二轮
失败路径与幂等性测试: 已完成第一轮
便携打包与私有运行时: Windows 已完成验证, Linux 产物契约已验证
真实场景联调: 进行中

当前 MVP 进度估算:

约 94%

2. 已完成的文档产出

当前目录已形成以下核心文档:

智能化部署agent.md 用于描述项目目标、场景、总体方案、风险、安全和实施路线。
智能化部署agent-技术架构设计说明书.md 用于描述系统架构、模块分层、数据模型、接口建议、安全设计和实施约束。
智能化部署agent-demo接口定义说明.md 用于描述 demo 阶段的接口协议、统一响应格式、状态枚举、Agent 接口、软件 A 最小能力实现接口、身份 demo 接口、审批 demo 接口。
智能化部署agent-demo后端项目骨架设计.md 用于描述 demo 后端的推荐技术栈、项目结构、模块职责、数据库表建议、代码落点和开发顺序。
docs/智能化部署agent-demo最小DDL设计.md 用于沉淀 demo 阶段最小可运行的数据表结构。
docs/智能化部署agent-demo首批OpenAPI.yaml 用于沉淀第一批已收口接口的 OpenAPI 草案。
智能化部署agent-技术架构设计说明书.backup-20260408-141109.md 为技术架构说明书备份文件。
edge-agent/README.md 及 edge-agent/app/* 用于沉淀本地 edge-agent 初始化代码骨架与运行说明。

3. 已完成的主要工作

3.1 方案文档已重写

已解决原始文档存在的编码和可读性问题,并重写为结构化方案文档,覆盖:

项目目标。
产品定位。
核心需求拆解。
风险分析。
开源对标。
MVP 范围。
实施路线。

3.2 技术架构说明书已形成

已形成较完整的技术架构设计说明书,覆盖:

总体架构分层。
核心模块职责。
云端与本地部署架构。
软件 A 集成设计。
数据模型。
接口设计建议。
关键流程设计。
安全设计。
非功能设计。

3.3 已确认前提已写入架构文档

以下前提已被整理并写入技术架构设计说明书:

MVP 阶段先开发 demo 版软件 A,不直接对接真实软件 A。
软件 A 的操作者透传和权限能力在 demo 阶段由 demo 实现承接。
本地 Agent 部署环境为 Windows 和 Linux 混合环境。
试点应用部署方式统一。
审批系统和身份系统在现网可能已有接口,但当前阶段无法直接接入,需开发 demo 版闭环。
模型接入方式支持自定义 base_url 和 api_key。

3.4 接口文档已形成

demo 接口定义文档已覆盖:

Agent 对外任务接口。
云端与本地 Agent 交互接口。
软件 A 最小能力实现接口。
身份 demo 接口。
审批 demo 接口。
内部对象结构。
典型时序。

3.5 文档规范已统一

已统一以下文档规范:

时间字段格式统一为 yyyy-MM-dd HH:mm:ss.SSS
默认时区统一为 Asia/Shanghai
JSON 字段统一采用 snake_case
字段命名规则统一为: *_id、*_status、*_type、*_at、*_ms、*_count

3.6 demo 后端骨架设计已完成

已完成 demo 后端项目骨架设计,明确:

推荐采用单体后端服务 + 模块化分层。
推荐技术栈为 Python + FastAPI + LangGraph。
后端目录结构和模块边界。
核心 service 划分。
数据库表建议。
本地 Agent 骨架建议。
开发顺序建议。

3.7 demo 后端初始化代码已开始落地

当前已完成以下代码层工作:

已生成 FastAPI demo 后端项目基础目录。
已补充 pyproject.toml、基础 README 和 .gitignore。
已实现 task、approval_request、tool_call、audit_log 对应的最小模型和数据库初始化逻辑。
已打通三条主接口: POST /api/agent/tasks、POST /api/agent/tasks/{task_id}/confirm、GET /api/agent/tasks/{task_id}
已实现最小 identity demo、approval demo、software-a 最小能力实现接口。
已将高风险任务确认后的审批创建流程接入后端主链路。
已实现最小 edge 心跳、拉取任务、回传结果接口。
已将默认验证任务接入 edge 调度主链路。
已将 software-a 最小能力部署任务创建接入主执行链。
已将 tool_call 和 audit_log 接入主链路关键动作。
已实现任务报告接口,可返回审批、工具、验证、审计轨迹。
已实现任务取消接口,并将 request_id、operator 维度写入关键审计和工具调用记录。
已补充自动化测试,并基于内存 SQLite 完成首轮通过验证。
已完成任务状态机第一轮收紧,补上重复确认、审批后任务状态漂移、edge 重复回传等冲突校验。
已补上首轮失败分支细化,包括 software-a 最小能力实现执行失败、审批驳回、edge 验证失败三条主失败路径。
已完成 duration_ms 第一轮落地,tool_call 和 edge 验证轨迹可基于 started_at / finished_at 自动计算并返回时长。
已完成结果摘要第一轮结构化改造,任务详情和任务报告可返回 result_summary_detail,包含最终状态、失败原因、software-a 摘要、审批摘要和验证摘要。
已补充任务报告级聚合指标 task_metrics,可返回总耗时、确认等待耗时、审批耗时、执行耗时、工具耗时汇总、验证耗时汇总及相关计数。
已补充失败路径与幂等性测试,覆盖创建任务幂等、重复审批决策冲突、错误 edge 回传冲突、重复取消冲突等场景。
已创建本地 edge-agent 初始化骨架,包含配置加载、后端客户端、工具注册、http_health_check 执行器、轮询调度器与启动入口。
已补充 edge-agent 启动脚本与便携打包脚本,覆盖 Windows zip 与 Linux tar.gz 两类交付方向。
已补充 edge-agent 基础测试,覆盖 http_health_check 执行器和轮询调度器主路径。
已补充 edge-agent 基础执行器实现,新增 check_port、check_process、grep_log 三类能力并接入工具注册表。
已将 Windows / Linux 的 service control 执行器从占位实现推进为可用版本,支持 status、start、stop、restart。
已将便携打包脚本增强为携带私有 Python 运行时,并完成 Windows 便携包实际打包验证。
已增强健康检查与验证能力,新增 tcp_probe,并扩展 http_health_check 的期望状态码与响应体匹配能力。
已增强 grep_log 的日志时间范围过滤能力,支持按 start_at / end_at 过滤。
已增强 check_process 的进程指标输出,支持 CPU 与内存聚合信息。
已增强任务报告中的审计与指标输出,新增 audit_summary 以及更细的 task_metrics 字段。
已生成并验证 Linux 便携包产物契约,确认 tar.gz 中包含 start.sh、app/main.py 与 runtime/python/bin/python3。

3.8 当前代码可运行范围

截至当前回合,后端代码已具备以下最小可运行范围:

任务创建、确认、查询、取消。
高风险任务确认后自动创建审批单。
审批通过后进入执行链,审批驳回后进入取消态。
执行链包含: software-a 权限校验 -> software-a 最小能力部署任务创建 -> edge 默认验证任务创建 -> edge 拉取 -> edge 回传。
任务详情接口可返回: 当前状态、software-a 状态、工具调用摘要、验证结果摘要。
任务报告接口可返回: task_basic、intent_snapshot、approval_trace、tool_trace、verification_trace、result_summary、audit_trace
edge 侧已支持: 心跳、拉取任务、回传结果、上报异常事件。
执行指标当前已支持: tool_trace.duration_ms、verification_trace.duration_ms 与 task_metrics
结果摘要当前已支持: result_summary_detail.final_status、final_reason、software_a、approval、verification
本地 edge-agent 当前已具备最小启动骨架: 心跳、拉取任务、执行 http_health_check、回传结果、上报异常。
本地 edge-agent 当前已具备: 启动脚本、打包脚本、基础执行器测试和轮询调度测试。
本地 edge-agent 当前已具备已注册工具: http_health_check、tcp_probe、check_port、check_process、grep_log、windows_service_control、linux_service_control
任务报告当前已新增: audit_summary 更细粒度 task_metrics

当前测试基线:

共 20 条测试通过。
使用 sqlite:///:memory: 做回归验证。
当前主链路已不是“只有接口壳”,而是具备最小闭环行为。
edge-agent 侧基础测试共 19 条通过。

4. 当前已明确的核心技术结论

4.1 架构方向

当前建议的总体方向是:

软件 A 做执行底座,Agent 做智能编排层,本地 Agent 做受控执行器

4.2 MVP 路线

当前 MVP 路线已经收敛为:

自然语言发起任务。
Agent 解析意图并做结构化任务生成。
策略层做风险判断。
调用软件 A 最小能力实现执行部署或控制动作。
调用本地 Agent 做验证。
汇总结果,生成报告和审计。

4.3 技术选型方向

当前建议方向:

编排框架优先 LangGraph。
demo 后端优先 Python + FastAPI。
用户端本地 Agent 采用受控执行模式。
所有外部系统统一通过 adapter 接入。

4.4 用户端 Python 运行方式建议

当前讨论结论是:

用户端不应依赖客户现场预装 Python。
本地 Agent 应做成"自带运行时"的便携包。
Windows 可采用 embeddable Python 或等价便携运行方式。
Linux 可采用自包含运行目录或可执行打包方式。

该结论已明确,但尚未系统性回写到所有设计文档。

4.5 数据库选择建议

当前讨论结论是:

正式路线可以采用 PostgreSQL。
如果以 demo 快速落地和减少安装成本为优先,可以先用 SQLite。
后续试点或正式化阶段再切换 PostgreSQL。

该结论已在本轮决策、最小 DDL 和当前后端实现中落地。

4.6 开源和商用许可判断

当前讨论结论是:

Python、FastAPI、LangGraph、Pydantic、SQLAlchemy、PostgreSQL 等组件,整体上适合免费使用和商用。
Redis 的许可证情况相对复杂,不建议在文档中简单视为"低风险宽松开源"。
如果确实需要 Redis 类组件,后续应评估 Valkey 或在 demo 阶段先不强依赖缓存中间件。

该结论已收口为当前 demo 阶段“不引入 Redis 强依赖”的正式实现策略。

4.7 本轮正式落地决策

本轮已正式确认以下落地决策,后续实现与文档以此为准:

demo 数据库默认采用 SQLite,后续试点和正式化阶段再切换 PostgreSQL。
demo 阶段不引入 Redis 强依赖,缓存能力默认弱化,任务队列先采用数据库表 + 后台轮询方式承接。
用户端 edge-agent 交付格式正式确认为: Windows 使用 zip 便携包,Linux 使用 tar.gz 自包含运行目录。
文档补充策略正式确认为: 只补最小 DDL 和首批 OpenAPI 草案,不一次性扩展到全部表和全部接口。
开发顺序正式确认为: 先补最小 DDL 和首批 OpenAPI,再直接进入 FastAPI demo 后端骨架开发。

4.8 当前代码层关键实现约定

以下约定虽然部分未完整回写到全部设计文档,但当前代码实现已经以此为准:

任务主状态机当前主要覆盖: CREATED -> PENDING_CONFIRM -> RUNNING -> VERIFYING -> SUCCEEDED / FAILED / CANCELLED
高风险任务路径为: PENDING_CONFIRM -> PENDING_APPROVAL -> RUNNING
software-a 最小能力实现当前在任务详情查询时会同步刷新状态,因此: 确认接口返回的 software_a_task_status 可能是 RUNNING,而后续查询任务详情时可能已变为 SUCCEEDED
当前 demo 中的 operator 默认使用: alice(u1001) 作为任务发起和执行方,bob(u2001) 作为审批人
当前 edge 默认验证工具为: http_health_check
当前默认 edge 节点 ID 为: edge-shanghai-001
当前任务报告中的 tool_trace 和 audit_trace 已包含 request_id 和 operator 信息,后续扩展应保持兼容。
当前已补上的状态约束包括: 重复确认拦截、重复执行拦截、审批决策前必须仍处于 PENDING_APPROVAL、edge 重复回传拦截、非 RUNNING 任务不再下发 edge 执行。
当前 demo 已支持可控失败模拟: 若 app_code 或 version 包含 fail,则 software-a 最小能力实现会返回失败任务,用于联调失败分支。

5. 当前待补强的部分

当前还未收口,或仅实现了最小版本的工作包括:

本地 edge-agent 初始化代码与打包脚本已完成第一轮,Windows 私有运行时便携包已验证,Linux 便携包产物契约已验证,但原生 Linux/bash 环境下的实机打包仍待验证。
文件型 SQLite / PostgreSQL 实库运行验证。
身份 demo / 审批 demo 与任务主链路的权限、审批决策联动细化。
任务级聚合指标已完成第一轮,但更细的任务级指标拆分仍可继续增强,如等待时长细分、失败步骤占比、阶段级统计。
更真实的验证插件实现,尤其是更细的日志解析、进程/JVM 指标扩展和更多健康检查方式。
部署脚本和运行脚本进一步完善,包括原生 Linux/bash 环境下的私有运行时打包验证和安装/升级流程。
OpenAPI 扩展到第二批接口。
更多测试用例与联调脚本。

5.1 当前已知环境限制

以下问题不是当前代码逻辑错误,而是当前运行环境限制:

当前对话环境下,文件型 SQLite 落盘会出现 disk I/O error。
因此当前自动化验证统一采用: DATABASE_URL=sqlite:///:memory:
当前测试命令需禁用 pytest cache provider,否则可能因写缓存目录失败出现噪音告警。
PowerShell 内联脚本在中文字符串场景下可能有编码干扰,因此测试样例优先使用 ASCII 文本。

6. 当前待落地重点

当前不是继续补基础文档,而是继续补强现有可运行链路。优先级建议收敛为:

增补失败路径与幂等性测试: 已完成一轮,后续可继续补回滚和更细冲突场景。
继续丰富审计细节与任务级指标拆分: 让任务级总耗时、审批耗时、等待耗时、阶段时长边界更直观。
再补更多执行指标: 如失败步骤占比、阶段级耗时拆分、任务级成功率统计。
然后再继续: 本地 edge-agent 执行器增强、第二批 OpenAPI、更多联调能力。

当前状态:

SQLite / 去 Redis / 最小 DDL / 首批 OpenAPI / FastAPI 骨架 / 主接口 / demo adapter / edge 接口 / 第二轮任务级聚合指标与审计摘要 / 第一轮失败与幂等性测试 / edge-agent 初始化骨架 / edge-agent 启动与打包脚本 / edge-agent 基础测试 / service control 执行器 / Windows 私有运行时便携打包 / Linux 便携包产物契约验证,均已完成当前阶段落地。

7. 建议的下一步

按当前进度,建议后续直接按以下顺序推进:

增补状态冲突、失败回滚、重复上报等测试。
再补更多任务级执行指标。
继续增强审计细节。
再进入本地 edge-agent 初始化代码和第二批 OpenAPI。

当前更推荐:

继续迭代代码主链路,不再回到“大段补文档”的节奏。

7.1 如果下一轮需要快速续接,优先做什么

如果后续上下文被裁剪,建议下一轮直接先读取本文件,然后按以下顺序继续:

优先读取: backend/README.md
再读取关键代码入口: backend/app/main.py backend/app/api/agent/tasks.py backend/app/services/task_service.py backend/app/services/approval_service.py backend/app/services/edge_service.py
再读取测试: backend/tests/test_task_api.py

下一步推荐顺序:

再补更细的任务级指标拆分。
再补审计细节和聚合摘要。
继续补本地 Agent 更真实的日志/进程/健康检查执行能力,并在原生 Linux/bash 环境验证私有运行时打包。
再补第二批 OpenAPI。

7.2 如果上下文快满,有什么影响

主要影响是:

对话里的临时上下文可能被裁剪。
已写入仓库的代码和文档不会受影响。
因此续接时优先读本文件和 backend/README.md,成本可控。

结论:

上下文快满不会影响现有代码成果,只会增加下一轮续接时重新装载上下文的成本。

当前推荐命令:

set PYTHONPATH=backend
set DATABASE_URL=sqlite:///:memory:
.venv\Scripts\python -m pytest backend/tests -q -p no:cacheprovider

8. 当前一句话结论

目前不是"还在想法阶段",而是已经完成了:

方案文档 -> 技术架构 -> 接口定义 -> 后端骨架

当前已经完成从"写文档"切换到"写 demo 代码"的第一步,下一步进入:

更多执行指标 -> 审计细节增强 -> 本地 Agent 与联调能力继续补齐

9. 本轮更新(2026-04-09)

本轮新增完成内容:

已将多类 edge 执行器真正接入后端下发链路，默认验证计划已由单步扩展为多步组合: check_process、check_port、tcp_probe、http_health_check、grep_log
已将 edge 结果聚合逻辑从“单步回传即结束”调整为: 全部成功才 SUCCEEDED 任一步失败则 FAILED 并取消剩余待执行步骤
已增强 http_health_check，支持 method、expected_status、body_contains
已增强 grep_log，支持 start_at / end_at 时间范围过滤
已增强 check_process，支持 command_contains，并返回 CPU / 内存聚合指标
已新增 tcp_probe 执行器并接入工具注册表
已增强任务报告，补充更细的 task_metrics 和 audit_summary
已新增 Linux 原生打包后续测试步骤说明，供后续在真实 Linux/bash 环境验证
已完成 Windows 便携包验证与 Linux 产物契约验证，当前临时验证目录已清理

本轮测试结果:

backend 测试 20 passed
edge-agent 测试 20 passed

本轮 MVP 进度更新:

约 91%

距离当前 MVP 收口，主要剩余:

更真实的日志/JVM/健康检查插件扩展
更细的任务级阶段指标与审计摘要打磨
原生 Linux/bash 环境下的私有运行时打包实机验证
第二批 OpenAPI 与更多联调场景

10. 本轮更新(2026-04-09, Agent 演示入口层)

本轮新增完成内容:

已新增 app_metadata 模型、仓储与服务,并在后端启动时自动注入 demo 元数据。
已将默认验证步骤改为由 app_metadata 驱动生成,不再全部依赖写死参数。
已新增最小会话层: chat_session chat_message 以及对应 chat service
已新增 demo chat API: POST /api/demo/chat/sessions GET /api/demo/chat/sessions/{session_id} POST /api/demo/chat/sessions/{session_id}/messages POST /api/demo/chat/sessions/{session_id}/tasks/{task_id}/confirm
已新增最小 Web Demo 页面: GET / GET /demo/chat
已形成“一句话部署 -> 结构化解析 -> 确认 -> 执行 -> 验证 -> 报告”的可视化演示流。
已补充聊天入口和页面可用性测试,并完成后端全量回归。

本轮测试结果:

backend 测试 23 passed
edge-agent 测试 20 passed

本轮 MVP 进度更新:

约 94%

当前 MVP 主线剩余重点:

接入一个真实 Java 样板应用做端到端演示
继续增强 app_metadata 驱动的验证模板与真实插件能力
原生 Linux/bash 环境下验证私有运行时打包
对演示 UI 做产品化打磨

20 KiB Raw Blame History

智能化部署 Agent 当前进度总结

1. 当前总体状态

1.1 MVP 进度统计(每轮更新)

2. 已完成的文档产出

3. 已完成的主要工作

3.1 方案文档已重写

3.2 技术架构说明书已形成

3.3 已确认前提已写入架构文档

3.4 接口文档已形成

3.5 文档规范已统一

3.6 demo 后端骨架设计已完成

3.7 demo 后端初始化代码已开始落地

3.8 当前代码可运行范围

4. 当前已明确的核心技术结论

4.1 架构方向

4.2 MVP 路线

4.3 技术选型方向

4.4 用户端 Python 运行方式建议

4.5 数据库选择建议

4.6 开源和商用许可判断

4.7 本轮正式落地决策

4.8 当前代码层关键实现约定

5. 当前待补强的部分

5.1 当前已知环境限制

6. 当前待落地重点

7. 建议的下一步

7.1 如果下一轮需要快速续接,优先做什么

7.2 如果上下文快满,有什么影响

8. 当前一句话结论

9. 本轮更新(2026-04-09)

10. 本轮更新(2026-04-09, Agent 演示入口层)

20 KiB

Raw Blame History