如何利用 Hermes Agent生成PPT并沉淀为Skill技能
发布于 2026-05-05 07:41
利用 Hermes Agent 从提示词生成 PowerPoint 演示文稿并沉淀为Skill技能
背景
在传统的工作流中,从文本提示词生成专业的 PowerPoint 演示文稿通常需要手动操作多个工具:先设计内容结构,再使用 PowerPoint 或在线工具创建幻灯片。本文介绍如何利用 Hermes Agent 实现从自然语言提示词到可编辑 PPTX 文件的端到端自动化,并将这一工作流沉淀为可复用的 Hermes Skill。
整体工作流
整个过程分为两个主要阶段:
- 提示词到演示文稿:从用户提示词出发,生成 HTML 格式的 PPT(使用 reveal.js),再转换为原生 PowerPoint 文件(使用 pptxgenjs)
- 工作流沉淀为技能:将完整的操作步骤、最佳实践、常见陷阱记录为 Hermes Skill,使未来类似任务可以自动加载并遵循既定流程
第一阶段:从提示词到 PPTX 文件
1.1 需求分析
用户需求:生成一个关于 AI 技术介绍的 HTML PPT,包含 3 页内容,随后转换为视觉效果一致的 PowerPoint 文件。
关键要求:
- 3 页幻灯片(概述、核心技术、应用与趋势)
- 保持视觉一致性(黑色背景、蓝色标题、金色高亮)
- 输出格式:HTML(可网页查看)和 PPTX(可编辑)
1.2 生成 HTML PPT
使用 reveal.js 框架创建网页版演示文稿。reveal.js 是一个专业的 HTML 演示框架,支持平滑过渡、响应式布局和多种主题。
关键实现要点:
<!-- 引入 reveal.js 样式和主题 -->
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/reveal.js@4.3.1/dist/reveal.css">
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/reveal.js@4.3.1/dist/theme/black.css">
<!-- 自定义样式匹配视觉要求 -->
<style>
.reveal h1, .reveal h2, .reveal h3 { color: #00d4ff; }
.reveal .slides section { text-align: left; }
.highlight { color: #ffd700; font-weight: bold; }
</style>
幻灯片结构使用 <section> 元素定义,每页一个 section:
- 第 1 页:AI 技术概述(定义、分类卡片)
- 第 2 页:核心技术(机器学习、深度学习、LLM、CV)
- 第 3 页:应用场景与未来趋势(双栏布局)
1.3 转换为 PowerPoint 文件
使用 pptxgenjs 库将 HTML 结构转换为原生的 .pptx 文件。这是一个 Node.js 库,可以通过编程方式创建 PowerPoint 文件。
安装依赖
npm install pptxgenjs
关键映射关系
| HTML 元素 | pptxgenjs 实现 |
|---|---|
<section> |
pres.addSlide() |
<h1>/<h2> |
slide.addText() 设置 fontSize, color |
<ul><li> |
文本数组 + bullet: true |
| CSS 颜色 | 十六进制字符串(不带 # 前缀) |
| Flexbox 布局 | 手动计算 x/y 坐标和宽度 |
颜色方案定义
const colors = {
background: "000000", // 黑色背景
title: "00D4FF", // 蓝色标题
highlight: "FFD700", // 金色高亮
text: "FFFFFF", // 白色文本
subtext: "AAAAAA" // 灰色副文本
};
重要注意事项
- 颜色格式:pptxgenjs 中颜色必须使用 6 位十六进制字符串,不能带
#前缀,否则会导致文件损坏 - 项目符号:使用
bullet: true选项,不要使用 Unicode 符号(如 •) - 换行处理:文本数组中使用
breakLine: true实现换行 - 对象复用:不要复用选项对象,pptxgenjs 会就地修改对象
1.4 验证与输出
生成文件后,进行内容验证:
# 检查文件是否存在
ls -lh ai_tech_intro.pptx
# 提取文本内容验证(需要 markitdown)
python3 -m markitdown ai_tech_intro.pptx
最终输出:
/mnt/d/AIProject/SQLiteManager/AIBatch/ai_tech_intro.html(4.9KB)/mnt/d/AIProject/SQLiteManager/AIBatch/ai_tech_intro.pptx(81KB)
第二阶段:沉淀为 Hermes Skill
2.1 为什么需要 Skill
Hermes Agent 的 Skill 系统用于保存可复用的工作流程、最佳实践和领域知识。将本次工作流保存为 Skill 的好处:
- 未来遇到类似任务时自动加载相关上下文
- 标准化输出质量和视觉风格
- 记录常见陷阱和解决方案
- 减少重复决策和试错成本
2.2 Skill 结构
使用 skill_manage 工具创建名为 html-to-pptx 的技能,存放在 productivity 类别下。
必需的前置元数据
---
name: html-to-pptx
description: "Use when converting HTML presentations (reveal.js) to editable PowerPoint files with consistent visual styling. Handles the full workflow from prompt to HTML PPT to PPTX."
version: 1.0.0
author: Hermes Agent
license: MIT
metadata:
hermes:
tags: [powerpoint, html, reveal.js, pptxgenjs, presentation]
related_skills: [powerpoint]
---
技能文档结构
- Overview:简述技能用途和价值
- When to Use:触发条件和反触发条件(何时不使用)
- Prerequisites:依赖安装(pptxgenjs, markitdown)
- Workflow Steps:三步工作流详细说明
- Step 1: 生成 HTML PPT
- Step 2: 创建 pptxgenjs 转换脚本
- Step 3: 执行与验证
- Common Pitfalls:常见错误和解决方案
- Verification Checklist:验证清单
- Quick Reference:HTML 与 pptxgenjs 元素对照表
- One-Shot Recipe:完整场景示例
2.3 添加参考文件
使用 skill_manage(action='write_file') 添加两个参考文件:
- references/html-template.html:完整的 HTML PPT 模板
- references/convert-script.js:完整的 Node.js 转换脚本
这些文件使技能内容更具体,用户可以直接参考或修改。
2.4 技能验证
技能创建完成后,验证要点:
- 文件位于
~/.hermes/skills/productivity/html-to-pptx/SKILL.md - 前置元数据完整且符合规范(name, description 不超过 1024 字符)
- 正文内容不超过 100,000 字符
- 结构和风格与同类技能一致
关键技术要点总结
pptxgenjs 使用技巧
- 布局尺寸:使用
LAYOUT_16x9(10" × 5.625")适配现代屏幕 - 文本框边距:设置
margin: 0实现精确对齐 - 阴影效果:使用
opacity属性控制透明度,不要将透明度编码到颜色字符串中 - 图片处理:支持文件路径、URL 和 base64 数据
reveal.js 使用技巧
- 主题选择:black.css 适合技术主题演示
- 过渡效果:使用
transition: 'slide'获得平滑切换 - 导航功能:启用
hash: true和slideNumber: true
完整流程回顾
用户提示词
↓
[Step 1] 生成 HTML PPT (reveal.js)
↓
[Step 2] 编写 pptxgenjs 转换脚本
↓
[Step 3] 执行脚本生成 .pptx 文件
↓
[Step 4] 验证内容完整性和视觉一致性
↓
[Step 5] 沉淀为 Hermes Skill (html-to-pptx)
↓
未来任务:自动加载 Skill → 遵循标准流程 → 一致的输出质量
结论
通过 Hermes Agent,我们实现了从自然语言提示词到专业 PowerPoint 文件的自动化生成。整个流程不仅解决了单次任务需求,更重要的是通过 Skill 系统将工作流沉淀为可复用知识。
这种方式的优势在于:
- 效率提升:未来类似任务无需重新探索工具链和参数
- 质量保证:标准化输出,避免常见错误
- 知识积累:工作流、最佳实践、陷阱经验全部结构化保存
- 团队协作:Skill 可以分享,使整个团队受益
Hermes Agent 的 Skill 系统不仅仅是存储命令或代码片段,而是保存"如何做好一件事"的完整上下文,这是 AI 助手持续进步和知识积累的关键机制。
最后,如果您对沉淀好的 Hermes Skill (html-to-pptx)也感兴趣,欢迎加我们的微信公众号,回复关键词:html-to-pptx
← 返回博客列表