如何利用 Hermes Agent生成PPT并沉淀为Skill技能

发布于 2026-05-05 07:41

利用 Hermes Agent 从提示词生成 PowerPoint 演示文稿并沉淀为Skill技能

背景

在传统的工作流中,从文本提示词生成专业的 PowerPoint 演示文稿通常需要手动操作多个工具:先设计内容结构,再使用 PowerPoint 或在线工具创建幻灯片。本文介绍如何利用 Hermes Agent 实现从自然语言提示词到可编辑 PPTX 文件的端到端自动化,并将这一工作流沉淀为可复用的 Hermes Skill。

整体工作流

整个过程分为两个主要阶段:

  1. 提示词到演示文稿:从用户提示词出发,生成 HTML 格式的 PPT(使用 reveal.js),再转换为原生 PowerPoint 文件(使用 pptxgenjs)
  2. 工作流沉淀为技能:将完整的操作步骤、最佳实践、常见陷阱记录为 Hermes Skill,使未来类似任务可以自动加载并遵循既定流程

第一阶段:从提示词到 PPTX 文件

1.1 需求分析

用户需求:生成一个关于 AI 技术介绍的 HTML PPT,包含 3 页内容,随后转换为视觉效果一致的 PowerPoint 文件。

关键要求:

  • 3 页幻灯片(概述、核心技术、应用与趋势)
  • 保持视觉一致性(黑色背景、蓝色标题、金色高亮)
  • 输出格式:HTML(可网页查看)和 PPTX(可编辑)

1.2 生成 HTML PPT

使用 reveal.js 框架创建网页版演示文稿。reveal.js 是一个专业的 HTML 演示框架,支持平滑过渡、响应式布局和多种主题。

关键实现要点:

<!-- 引入 reveal.js 样式和主题 -->
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/reveal.js@4.3.1/dist/reveal.css">
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/reveal.js@4.3.1/dist/theme/black.css">

<!-- 自定义样式匹配视觉要求 -->
<style>
    .reveal h1, .reveal h2, .reveal h3 { color: #00d4ff; }
    .reveal .slides section { text-align: left; }
    .highlight { color: #ffd700; font-weight: bold; }
</style>

幻灯片结构使用 <section> 元素定义,每页一个 section:

  • 第 1 页:AI 技术概述(定义、分类卡片)
  • 第 2 页:核心技术(机器学习、深度学习、LLM、CV)
  • 第 3 页:应用场景与未来趋势(双栏布局)

1.3 转换为 PowerPoint 文件

使用 pptxgenjs 库将 HTML 结构转换为原生的 .pptx 文件。这是一个 Node.js 库,可以通过编程方式创建 PowerPoint 文件。

安装依赖

npm install pptxgenjs

关键映射关系

HTML 元素 pptxgenjs 实现
<section> pres.addSlide()
<h1>/<h2> slide.addText() 设置 fontSize, color
<ul><li> 文本数组 + bullet: true
CSS 颜色 十六进制字符串(不带 # 前缀)
Flexbox 布局 手动计算 x/y 坐标和宽度

颜色方案定义

const colors = {
  background: "000000",      // 黑色背景
  title: "00D4FF",           // 蓝色标题
  highlight: "FFD700",       // 金色高亮
  text: "FFFFFF",            // 白色文本
  subtext: "AAAAAA"          // 灰色副文本
};

重要注意事项

  1. 颜色格式:pptxgenjs 中颜色必须使用 6 位十六进制字符串,不能带 # 前缀,否则会导致文件损坏
  2. 项目符号:使用 bullet: true 选项,不要使用 Unicode 符号(如 •)
  3. 换行处理:文本数组中使用 breakLine: true 实现换行
  4. 对象复用:不要复用选项对象,pptxgenjs 会就地修改对象

1.4 验证与输出

生成文件后,进行内容验证:

# 检查文件是否存在
ls -lh ai_tech_intro.pptx

# 提取文本内容验证(需要 markitdown)
python3 -m markitdown ai_tech_intro.pptx

最终输出:

  • /mnt/d/AIProject/SQLiteManager/AIBatch/ai_tech_intro.html (4.9KB)
  • /mnt/d/AIProject/SQLiteManager/AIBatch/ai_tech_intro.pptx (81KB)

第二阶段:沉淀为 Hermes Skill

2.1 为什么需要 Skill

Hermes Agent 的 Skill 系统用于保存可复用的工作流程、最佳实践和领域知识。将本次工作流保存为 Skill 的好处:

  • 未来遇到类似任务时自动加载相关上下文
  • 标准化输出质量和视觉风格
  • 记录常见陷阱和解决方案
  • 减少重复决策和试错成本

2.2 Skill 结构

使用 skill_manage 工具创建名为 html-to-pptx 的技能,存放在 productivity 类别下。

必需的前置元数据

---
name: html-to-pptx
description: "Use when converting HTML presentations (reveal.js) to editable PowerPoint files with consistent visual styling. Handles the full workflow from prompt to HTML PPT to PPTX."
version: 1.0.0
author: Hermes Agent
license: MIT
metadata:
  hermes:
    tags: [powerpoint, html, reveal.js, pptxgenjs, presentation]
    related_skills: [powerpoint]
---

技能文档结构

  1. Overview:简述技能用途和价值
  2. When to Use:触发条件和反触发条件(何时不使用)
  3. Prerequisites:依赖安装(pptxgenjs, markitdown)
  4. Workflow Steps:三步工作流详细说明
    • Step 1: 生成 HTML PPT
    • Step 2: 创建 pptxgenjs 转换脚本
    • Step 3: 执行与验证
  5. Common Pitfalls:常见错误和解决方案
  6. Verification Checklist:验证清单
  7. Quick Reference:HTML 与 pptxgenjs 元素对照表
  8. One-Shot Recipe:完整场景示例

2.3 添加参考文件

使用 skill_manage(action='write_file') 添加两个参考文件:

  1. references/html-template.html:完整的 HTML PPT 模板
  2. references/convert-script.js:完整的 Node.js 转换脚本

这些文件使技能内容更具体,用户可以直接参考或修改。

2.4 技能验证

技能创建完成后,验证要点:

  • 文件位于 ~/.hermes/skills/productivity/html-to-pptx/SKILL.md
  • 前置元数据完整且符合规范(name, description 不超过 1024 字符)
  • 正文内容不超过 100,000 字符
  • 结构和风格与同类技能一致

关键技术要点总结

pptxgenjs 使用技巧

  1. 布局尺寸:使用 LAYOUT_16x9(10" × 5.625")适配现代屏幕
  2. 文本框边距:设置 margin: 0 实现精确对齐
  3. 阴影效果:使用 opacity 属性控制透明度,不要将透明度编码到颜色字符串中
  4. 图片处理:支持文件路径、URL 和 base64 数据

reveal.js 使用技巧

  1. 主题选择:black.css 适合技术主题演示
  2. 过渡效果:使用 transition: 'slide' 获得平滑切换
  3. 导航功能:启用 hash: trueslideNumber: true

完整流程回顾

用户提示词
    ↓
[Step 1] 生成 HTML PPT (reveal.js)
    ↓
[Step 2] 编写 pptxgenjs 转换脚本
    ↓
[Step 3] 执行脚本生成 .pptx 文件
    ↓
[Step 4] 验证内容完整性和视觉一致性
    ↓
[Step 5] 沉淀为 Hermes Skill (html-to-pptx)
    ↓
未来任务:自动加载 Skill → 遵循标准流程 → 一致的输出质量

结论

通过 Hermes Agent,我们实现了从自然语言提示词到专业 PowerPoint 文件的自动化生成。整个流程不仅解决了单次任务需求,更重要的是通过 Skill 系统将工作流沉淀为可复用知识。

这种方式的优势在于:

  • 效率提升:未来类似任务无需重新探索工具链和参数
  • 质量保证:标准化输出,避免常见错误
  • 知识积累:工作流、最佳实践、陷阱经验全部结构化保存
  • 团队协作:Skill 可以分享,使整个团队受益

Hermes Agent 的 Skill 系统不仅仅是存储命令或代码片段,而是保存"如何做好一件事"的完整上下文,这是 AI 助手持续进步和知识积累的关键机制。

最后,如果您对沉淀好的 Hermes Skill (html-to-pptx)也感兴趣,欢迎加我们的微信公众号,回复关键词:html-to-pptx


← 返回博客列表