大家好,欢迎来到本篇文章,今天我们将通过一个实际案例,介绍如何使用AI和Python来实现Word转Excel。我们将使用New Bing 的AI功能,配合Python代码来完成这个任务。
案例分析
一个公务员小伙伴委托我们将一份Word文件转换为Excel表格。Word文件中包含5000多条记录,每条记录包括以下信息:日期、发文单位、文号、标题和签收人。我们需要将其中的日期、文号和标题提取出来,并存储到Excel表格中。
Word文件如下:
Excel表格样式如下:
根据手动复制和修改一个条目需要10秒的时间计算,一分钟可以完成6条,需要耗费的时间超过8小时。我们可以使用AI和Python来自动处理这个任务,节省大量时间和精力。
AI验证
首先,我们在New Bing网站上验证了这个任务是否可以使用AI自动完成。我们向AI发出以下问题:
我有一个word,需要提取其中数据输出到Excel文件中。 word中的数据也是以表格形式存在,该表格的规范如下 1.每三行为一组 2.每组中第一行第二列为日期 3.每组中第一行第四列为文号 4.每组中第二行第二列为标题 数据输出到Excel后的格式如下,第一列为序号,第二列为日期,第三列为文号,第四列为标题 请帮我写一个实现以上需求的python程序,并且预留word文件位置和Excel输出目录两个自定义变量,并同时提供依赖导入的requirment.txtAI生成的Python代码如下:
import pandas as pd from docx import Document # 读取Word文件中的表格数据 def read_table_from_word(word_file_path): document = Document(word_file_path) tables = document.tables data = [] for table in tables: for i, row in enumerate(table.rows): text = [cell.text for cell in row.cells] if i % 3 == 0: date = text[1] doc_num = text[3] elif i % 3 == 1: title = text[1] data.append([date, doc_num, title]) return pd.DataFrame(data, columns=[日期, 文号, 标题]) # 将DataFrame写入Excel文件中 def write_dataframe_to_excel(dataframe, excel_file_path): dataframe.to_excel(excel_file_path, index=False) # 自定义变量 word_file_path = path/to/word/file.docx excel_file_path = path/to/excel/file.xlsx # 读取Word文件中的表格数据 dataframe = read_table_from_word(word_file_path) # 将DataFrame写入Excel文件中 write_dataframe_to_excel(dataframe, excel_file_path)可以看到,AI生成的代码无需任何调整就可以直接使用。
如何提问
为了能够让AI理解我们的问题,并生成正确的代码,我们需要遵循一定的提问方式。以下是一个可供参考的提问模板:
Copy Code我有一个需要处理的任务,描述如下: (在这里描述你的任务) 请帮我用Python实现以上需求的程序,并且预留必要的自定义变量,例如输入文件路径和输出文件路径,并提供依赖导入的requirment.txt文件。以下是详细信息: 1. 输入文件格式:(例如Word、Excel等) 2. 数据存储格式:(例如表格形式,每行包含哪些列等) 3. 处理逻辑:(例如需要进行什么样的数据清洗、加工、计算等) 4. 输出文件格式:(例如Excel表格形式,每行包含哪些列等) 5. 预期输出效果:(例如样例数据或者示意图) 谢谢!具体怎么提问的逻辑,我也整理了一张思维导图
通过使用这种提问方式,可以让AI更好地理解我们的需求,并生成正确的代码。
如果想要进一步学习如何使用AI和Python来实现办公自动化,可以关注我的公众号,我将定期更新案例分析和视频讲解,同时也欢迎大家留言提问,我将选取经典问题进行分析。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。