docs

约 1110 个字预计阅读时间 4 分钟

AI擅长生成什么文档？¶

md html

格式	AI生成友好度	最适合做什么	优点	局限 / 注意点	是否推荐 AI 直接生成
txt	⭐⭐⭐⭐⭐	原始内容、草稿、日志、Prompt	极简、无干扰、可读性强	无结构、不可视化	✅ 强烈推荐
md (Markdown)	⭐⭐⭐⭐⭐	技术文档、README、博客、知识库	结构清晰、版本友好	样式有限	✅ 强烈推荐
html	⭐⭐⭐⭐⭐	在线文档、产品说明	表达能力强	需要渲染环境	✅ 非常推荐
json / yaml	⭐⭐⭐⭐⭐	配置、结构化文档	机器友好	人类阅读差	✅ 推荐
tex / LaTeX	⭐⭐⭐⭐	论文、数学文档	排版极强	上手成本高	⚠️ 理工科推荐
docx	⭐⭐⭐⭐	正式文档、报告、方案	通用性强	样式容易乱	⚠️ 推荐生成内容
rst	⭐⭐⭐⭐	Sphinx 文档	适合工程文档	语法小众	⚠️ 有明确需求再用
csv	⭐⭐⭐⭐	表格数据、清单	简单直观	无类型/注释	⚠️ 适合轻量
pdf	⭐⭐	最终交付、不可修改文档	版式稳定	不适合编辑	❌ 不建议直出
xlsx	⭐⭐	复杂表格、财务	功能强	AI难控样式	❌ 不推荐直出
pptx	⭐⭐	演示文稿	表现力强	设计不可控	❌ 不推荐直出

随后用pandoc转化

扣子 PPT¶

扣子 PPT 本质是 AI 驱动的自动化内容生成与版式编排系统，

核心是 “自然语言理解→内容结构化→模板匹配 / 版式生成→PPT 文件渲染” 的全流程自动化，结合了 NLP、模板引擎、办公文档格式处理等技术。

核心分为 6 个关键环节：

需求解析：自然语言理解（NLP 核心）这是第一步，也是 AI 的核心能力体现：用户输入自然语言需求（比如 “生成一份电商 618 活动复盘 PPT，包含销量数据、用户画像、问题总结”），扣子的大语言模型（LLM）会先做语义解析：提取核心主题（618 活动复盘）、拆分 PPT 结构（确定页数、每页核心主题）；识别内容类型（是否需要图表、图片、特定风格 / 配色）；最终将非结构化的文字需求，转化为结构化的 PPT 大纲（比如 JSON 格式，包含每页的标题、内容类型、核心要点）。关键技术：意图识别、文本分类、信息抽取（NLP 基础能力）。
内容生成：AI 创作适配 PPT 的文案基于解析后的结构化大纲，LLM 会为每一页生成适配 PPT 场景的内容：标题：简洁、符合 PPT 阅读习惯（避免长标题）；正文：精简凝练（PPT 核心是 “少文字、多视觉”），比如把大段文字拆分为要点列表；辅助内容：如果需要图表，会生成图表的 “数据描述”（比如 “近 3 天销量分别为 1000/1500/2000 单”），为后续图表生成做准备。
版式规划：模板匹配 + 智能排版这一步是让 PPT “好看” 的核心，核心是 “内容 - 版式” 的智能匹配：模板库：扣子内置海量分类模板（按行业、风格、内容类型，比如标题页、数据页、图文页模板）；规则引擎：根据每页的内容类型（标题页 / 文本页 / 图表页）自动匹配最优模板；智能排版：遵循 PPT 设计规则（比如文字行数≤6 行、字体大小适配、元素对齐、留白），确保所有页面风格统一（配色、字体、间距一致）。
多媒体匹配（可选）如果需求包含图片 / 图表，会触发这一步：图片：根据页面关键词（比如 “618 销量增长”）调用自有 / 第三方图片 API，筛选匹配图片并智能裁剪适配 PPT 尺寸；图表：解析数据需求，自动生成柱状图 / 折线图等，填充模拟数据或用户提供的数据。
文件渲染：生成标准 PPT 格式 PPT 的本质是Office Open XML 格式（pptx 文件实际是 ZIP 压缩包，包含 XML 文件和媒体资源），扣子会：按照该规范，将 “结构化内容 + 版式信息” 转化为对应的 XML 文件；打包 XML 文件、图片 / 图表等媒体资源，生成标准的 pptx 文件；也支持导出 PDF / 图片等格式（核心是格式转换引擎）。
交互优化（可选）生成后支持在线编辑（修改内容、调整版式），本质是 “前端修改数据→后端重新渲染 PPT 文件” 的循环。