AI探索计划skill分享-AI 生成原生可编辑 PPTX
emer
2026-07-05
2
0
PPT Master —— AI 生成原生可编辑 PPTX,支持任意文档输入
丢进原材料,拿回的这份 PPT 不只是能改:它有 PPT 原生的转场与入场动画,演讲者备注能直接合成音频旁白,图表和表格还能以带数据的 PowerPoint 原生对象形式导出,也能参考你自己的 PPT 模板来设计——一份能直接拿去讲、回头还能改的成品。

【产品定位】
一个文件如果在 PowerPoint 里打不开、改不动,就不该被叫做 PPT。市面上的 AI PPT 工具大致分四类,PPT Master 只做最后一类:
- 模板填空 —— 套模板的 PPTX —— 部分可以改,受模板限制
- 图片式 —— 一页一张大图拼成 PPTX —— 整页是图片,改不了
- HTML 演示 —— 网页演示 —— 根本不是 PPTX
- 原生可编辑(PPT Master)—— 真 DrawingML 形状、文本框、图表 —— 每个元素都能点开改
形态上,它不是网站也不是 App,而是一套在 AI IDE(Claude Code / Cursor / VS Code + Copilot 等)里运行的工作流(一个 "skill"):你在 IDE 的对话框里说"用这份 PDF 做一份 PPT",AI 按这套工作流在你本机生成真正可编辑的 .pptx。你不写任何代码,要做的只有三件事——装 Python、装一个 AI IDE、把资料放进来。

这个形态换来三个别的工具很难同时给出的承诺:- 成本透明可控 —— 工具免费开源,唯一成本是你自己的 AI 模型用量,你用多少付多少,不在此之外增加任何订阅费用
- 数据不出本地 —— 你的文件不应该为了做一份 PPT 就被上传到别人的服务器。除与 AI 模型的对话外,全流程在你的电脑上完成
- 不锁定平台 —— 你的工作流不应该被任何一家公司绑架。Claude Code、Cursor、VS Code Copilot 等均可驱动;Claude、GPT、Gemini、Kimi 等模型均可使用
重要提示:这是一个工具,不是一个许愿池。harness + model = agent——PPT Master 只负责工作流,产出上限由模型决定。推荐 Claude 大上下文窗口(约 100 万 token)+ AI 生图(gpt-image-2);其他模型能跑通流程,但有质量差距。也别指望一把就拿到完美成品。它的价值是帮你把大部分枯燥的活儿干掉,剩下的打磨交给你——做原生可编辑的 PPT,本就是为了让你接着改,而不是甩给你一张改不动的图。

【安装方式】推荐方式:Skill Marketplace 一键安装(无需 Git)
在任何支持 skill marketplace 的 AI agent 中执行:
npx skills add hugohe3/ppt-master
或在 Claude Code 内:
/plugin marketplace add hugohe3/ppt-master
/plugin install ppt-master@ppt-master
安装后进入 skill 目录,安装 Python 依赖:
pip install -r requirements.txt
前置条件: - Python 3.10+- 一个支持 agent 能力的 AI 编程工具(Claude Code / Cursor / VS Code + Copilot / Codebuddy 等)
可选配置(图片获取): - AI 生图:设置 IMAGE_BACKEND 和对应 *_API_KEY(OPENAI_API_KEY、GEMINI_API_KEY 等)
- 网络图片搜索:建议配置 PEXELS_API_KEY / PIXABAY_API_KEY(都免费申请)
- API Key 统一通过 .env 文件配置,复制 .env.example 为 .env 后填写即可
推荐模型:追求最佳效果选 Claude Opus,搭配 gpt-image-2 生图;Gemini 3.5 Flash 目前综合性价比很高,尤其速度很快。
【快速上手】
- 在 AI IDE 中打开 ppt-master 项目文件夹
- 把 PDF、DOCX、图片等原始材料放入 projects/ 目录
- 在聊天框中说:请用 projects/xxx/xxx.pdf 这份文件生成一份 PPT
- 也可以直接把文字内容粘贴进聊天窗口:请根据以下内容制作成 PPT:[粘贴内容]
- AI 会先跟你确认设计规范(画布格式、页数、配色方案、字体、图片风格等)
- 确认后 AI 全自动处理——内容分析、视觉设计、SVG 生成、PPTX 导出
- 最终 .pptx 保存在 exports/ 目录下,所有元素都可以在 PowerPoint 里逐一点开编辑已有 .pptx 模板想复用?把那份 deck 连同素材给 AI,说「套模板」即可——它会把新内容填进你现有的设计,保持原生可编辑。

【核心能力一览】- 原生可编辑 PPTX:文本、形状、图表都能逐元素修改,不是图片
- 多种输入格式:PDF / DOCX / EPUB / HTML / Markdown / 网页 / 纯文本- 转场与入场动画:PPT 原生动画效果,支持逐元素出场
- 演讲者备注转音频旁白:Edge TTS / AI 语音合成,可直接嵌入 PPT
- 原生图表与表格导出:带数据的 PowerPoint 原生对象,可直接编辑数据- 模板系统:品牌模板 / 布局模板 / 整份 Deck 模板,支持多模板融合- AI 图片生成与网络搜图:Gemini / GPT-image 等后端,Pexels / Unsplash 等图源- 实时预览:浏览器中边生成边预览,支持标注和直接编辑
- 多种画布格式:PPT 16:9、4:3、小红书、朋友圈、Story 竖屏等 10+ 种格式
- 不锁定模型和平台:Claude / GPT / Gemini / Kimi 均可,Claude Code / Cursor / VS Code 均可
【常见问题提示】Q: 生成效果不理想?
A: 先升级模型(Claude Opus > Sonnet > Gemini),再检查用法是否符合 SKILL.md 规范。
Q: AI 迷失上下文?
A: 让它先读 skills/ppt-master/SKILL.md 重新锚定工作流。
Q: 导出的 PPTX 图片糊?
A: 检查原图分辨率,导出时加 --image-scale 2 提高内嵌图片质量。
Q: Office 版本要求?
A: 需要 Office 2016+。更早版本兼容性不保证。
Q: 需要付费吗?
A: 工具本身免费开源。你只需支付 AI 模型 API 的调用费用(按量计费,无订阅)。
【相关链接】
GitHub:
立即下载
常见问题: 立即下载