文档中心

动态读取 docs/Guidance-for-Users 下的 Markdown 文档

来源文件:功能详情/问答汇总 - DOCX 转 XLSX(增量).md

问答汇总 - DOCX 转 XLSX(增量)

用于将多个 DOCX 问答表格中的“问题/回答/相关规定”抽取出来,并增量追加写入既有的知识库 Excel(按“母表/分类子表”写入),最终下载更新后的 .xlsx 文件。

页面使用方式

入口:登录后首页 → 问答汇总(DOCX→XLSX)

  1. 上传知识库 XLSX(已有总表)
  2. 上传一个或多个 DOCX 问答文件(可多选)
  3. (可选)填写“项目来源”
  4. (可选)开启“不调用模型(更快)”
  5. 点击“开始处理并下载”

DOCX 要求

  • DOCX 内需包含表格
  • 默认读取 第一个表格
  • 常见列顺序:序号 / 问题 / 回答 / 相关规定

XLSX 写入规则(增量)

  • 母表:写入 提出时间问题内容
  • 子表:按类别写入 提出时间问题内容解答情况 等字段
  • 如果工作表已存在且表头与预期不一致,会跳过写入该表(避免破坏原表结构)

本地脚本(批量/自动化)

脚本入口:scripts/kptg-update-xlsx.js

示例(不调用模型):

node scripts/kptg-update-xlsx.js \
  --xlsx "path/to/知识库.xlsx" \
  --docx-dir "path/to/docx目录" \
  --out "path/to/updated.xlsx" \
  --no-llm

常用参数:

  • --xlsx:必填,已有知识库总表(.xlsx)
  • --docx-dir:选填,包含多个问答 DOCX 的目录(自动读取其中所有 .docx)
  • --docx:选填,可重复指定多个 .docx
  • --out:选填,输出文件路径
  • --project-source:选填,写入“项目来源”
  • --no-llm:选填,不调用模型;分类统一为“其他”,文件名元信息仅使用正则解析