excel表格从文字中提取数字

导读:Excel表格是办公人员经常使用的工具,然而当我们需要从文字中提取数字时,手动录入非常耗时耗力。本文将介绍如何使用Python实现文字中数字的提取,并生成简洁明了的Excel表格。

1. 安装所需模块

在命令行中输入以下命令安装所需的模块:

pip install pandas openpyxl xlwt xlrd

excel表格从文字中提取数字

其中,pandas模块是数据处理的核心模块,openpyxl模块用于读写Excel文件,xlwt和xlrd模块用于处理旧版Excel文件(.xls格式),如果我们只需要处理.xlsx文件,可以不用安装xlwt和xlrd模块。

2. 实现提取数字代码

2.1 导入模块

在Python代码中,我们需要导入pandas模块和re模块,pandas模块用于读取txt或docx文件生成DataFrame对象,re模块用于正则表达式处理。

import pandas as pd

import re

2.2 读取文件

首先,我们需要指定文本文件的路径并通过pandas读取文件:

path = "example.txt"

df = pd.read_csv(path, sep="\n", header=None)

其中,read_csv()方法用于从文件中读取数据,sep="\n"指定行分隔符为换行符,header=None表示文件中没有标题。

2.3 正则表达式提取数字

接下来,我们需要使用正则表达式从DataFrame中提取数字。我们可以使用re模块的findall()方法,使用正则表达式提取DataFrame中的数字,代码如下:

num_list = []

for row in df[0]:

row_num = re.findall(r'\d+\.?\d*', str(row))

num_list.append(row_num)

这里,我们使用了正则表达式\d+\.?\d*,其中\d+匹配一连串数字,\.?表示匹配0个或1个点号,\d*表示可能包含小数部分。

3. 生成Excel表格

3.1 导入模块并创建DataFrame对象

接下来,我们需要将提取的数字存储在Excel表格中。可以使用pandas模块生成DataFrame对象。

df_num = pd.DataFrame(num_list)

3.2 写入Excel文件

使用openpyxl模块将DataFrame写入Excel文件中。

from openpyxl import Workbook

wb = Workbook()

ws = wb.active

for r in df_num.iterrows():

ws.append(list(r[1]))

wb.save("example.xlsx")

4. 总结归纳

本文介绍了如何使用Python从文字中提取数字并生成Excel表格的方法。通过以上步骤,我们可以更加便捷地处理需要提取数字的文本。

首先,我们需要安装所需的Python模块,包括pandas、openpyxl、xlwt、xlrd模块。其次,我们需要导入相关模块并读取文本文件,使用正则表达式提取数字。最后,我们使用openpyxl模块将数字存储在Excel表格中。希望本文能够帮助您更好地处理数字提取的问题。

免责声明:本文来自互联网,本站所有信息(包括但不限于文字、视频、音频、数据及图表),不保证该信息的准确性、真实性、完整性、有效性、及时性、原创性等,版权归属于原作者,如无意侵犯媒体或个人知识产权,请来电或致函告之,本站将在第一时间处理。站悠网站发布此文目的在于促进信息交流,此文观点与本站立场无关,不承担任何责任。

相关内容

  • wps2019把word和excel分开的操作教程
  • 简介在使用WPS2019办公软件时,许多用户会发现Word和Excel文档默认是以标签页的形式呈现在同一个窗口中的。这种方式虽然便于切换,但对于需要多任务处理的...
  • 2024-09-12 11:18:37

    1

  • wps excel里怎样按照类别拆分数据
  • 使用WPS Excel按照类别拆分数据的方法在数据分析过程中,将数据按照不同类别进行拆分是一项非常常见且重要的任务。WPS Excel提供了多种工具和方法,帮助...
  • 2024-09-10 15:06:50

    1

  • word表格转Excel表格排版不变的操作方法
  • 将Word表格转换为Excel表格的必要性在日常工作中,许多人需要在Word和Excel之间进行数据转换。Word表格虽然方便编辑和排版,但在处理大量数据或进行...
  • 2024-09-10 11:08:07

    1

  • word表格转成excel的操作步骤
  • 对Word表格进行初步准备要将Word表格转换成Excel文件,首先需要对Word文档进行初步准备。在这一阶段,我们需要确保表格内容整齐,避免随意的排版造成转换...
  • 2024-09-10 10:17:59

    1

  • windows10 EXCEL提示运行时错误1004如何解决
  • 1. 什么是运行时错误1004运行时错误1004是指在使用Excel时出现的一种常见错误。它通常是由于代码中的某个操作无法正常执行而导致的。具体来说,这个错误通...
  • 2024-09-09 18:15:45

    1