用python转markdown文件为word

1、前言

很多人都会用deepseek查询一些答案,但是如果想复制deepseek回答的答案文本到word中,它的文件格式是Markdown,不像在网页中看着格式很清晰。比如我问deepseek关于python的问题,它的回答看起来很清晰:

但是把答案粘贴到word中是这样的:

这里面的很多符号和空格是我们不想看到的,手动删除又很繁琐。我的解决方案是用Python 的pypandoc库将 Markdown 文件转换为 Word 文档。可能前期需要花时间编写代码,但是后期使用就比较方便了。

2、环境准备

首先要配置环境,也就是安装pypandoc、pandoc,当然前提是已经有python环境。

安装pypandoc库

pypandoc是对pandoc工具的 Python 封装,借助它可以轻松实现不同格式文档间的转换。通过以下命令安装pypandoc:

pip install pypandoc

安装pandoc工具

可以从 pandoc 官网 下载并安装pandoc工具。

我下载的是pandoc-3.6.4-windows-x86_64,直接双击安装。

双击应用程序安装后的界面是这样的:

下一步要添加pandoc到环境变量,不然系统识别不到pandoc,也就不能使用。

在终端指令界面输入pandoc --version检查是否安装正确,下面这样的显示表示安装正确。

3、markdown文件转为word文件

在AI飞速发展的今天,写代码已经不是什么难事,特别是python这种应用很广的高级语言,只要问一下AI就能得到代码。我用豆包生成转markdown文件为word文件的python代码如下所示。

这段代码直接复制就能使用。下面演示一下。

首先在visual studio code里新建markdown文件,将需要转换的原始markdown文件拷贝进去保存。

将上面的python代码在visual studio code里修改编辑,把input_md_file的值替换成markdown文件的路径,输出文件output_docx_file也可以根据实际情况改一下。

运行程序,即可得到转换后的word文档。

下面是我得到的word文档。除了字体和deepseek网页上显示的不完全一致,整体格式是一致的,方便自己后续编辑和使用。当然如果懒得做这些转换,干脆直接在deepseek网页或者APP上阅读也是可以的。

作者:科技圈小透明原文地址:https://www.cnblogs.com/y0011/p/18811508

%s 个评论

要回复文章请先登录注册