千家信息网

python编码格式导致csv读取错误怎么解决

发表于:2025-11-08 作者:千家信息网编辑
千家信息网最后更新 2025年11月08日,这篇文章主要讲解了"python编码格式导致csv读取错误怎么解决",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python编码格式导致csv读取错误
千家信息网最后更新 2025年11月08日python编码格式导致csv读取错误怎么解决

这篇文章主要讲解了"python编码格式导致csv读取错误怎么解决",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"python编码格式导致csv读取错误怎么解决"吧!

python编码格式导致csv读取错误

本文记录python小白我今天遇到的这两个问题(csv.reader和pandas.csv_read):

pandas模块"CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2"错误

csv模块"line contains NULL byte"错误

今天处理数据时疏忽了,而且还偷懒把数据复制到xlsx保存后,直接修改文件后缀成.csv准备用来读取。之后运行算法要读数据的时候果然问题来了。

import pandas as pdpath = 'water30.csv'df=pd.read_csv(path)

注:后两行可写作df=pd.read_csv('water30.csv')。

但由于read_csv本身有好多参数(虽然这里不用), 故写成path习惯好些。

这样会报错CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2

我在网上查了好多种解决办法,由于read_csv的参数很多,所以各有其词,我这里遇到的应该也只是其中一种,久寻无果。直到我看到这里说看了模块_csv.c的代码后,发现文件里不能有 "\0", 所以csv文件不可以是unicode编码的,可以是ANSI。

针对我直接改后缀名的结果是,点击那个.csv打开时就已经提示我:


也就是这里改后缀并没有把文件格式弄好。所以我选择"另存为"改选了文件格式为

之后,读取就不会报错了。

注:有个疑问没有解决,就是那个我"直接改后缀得到的那个.csv"我用记事本打开查看了一下,编码就是ANSI啊。那我就不知道为什么报错了……不过问题倒是暂时解决了。

现在读取到的格式为

是个结构体。

另外,对于:csv模块"line contains NULL byte"错误。和上面出现问题原因和解决方案是一样的,比如

import csvcsvfile=file('water30.csv','rb')reader = csv.reader(csvfile)for line in reader:     print linecsvfile.close()

报错:Error: line contains NULL byte

修正后,读入的数据格式为list,如下

[‘1’, ‘2’, ‘2’, ‘1’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘1’, ‘2’, ‘1’, ‘1’, ‘1’]
[‘1’, ‘1’, ‘1’, ‘1’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘0.697’, ‘0.744’, ‘0.634’, ‘0.403’, ‘0.481’]
[‘0.46’, ‘0.376’, ‘0.264’, ‘0.237’, ‘0.149’]
[‘1’, ‘1’, ‘1’, ‘1’, ‘1’]

pandas读取csv常见错误及解决

1)第一种错误

错误提示:

pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2

解决方法:

import pandas as pddata = pd.read_csv(inputfile, encoding='utf-8',header=None,sep = '\t')

2)第二种错误

错误提示:

pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15945

解决方法:

import pandas as pdimport csvdf = pd.read_csv(csvfile, quoting=csv.QUOTE_NONE, encoding='utf-8')

感谢各位的阅读,以上就是"python编码格式导致csv读取错误怎么解决"的内容了,经过本文的学习后,相信大家对python编码格式导致csv读取错误怎么解决这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

错误 格式 编码 文件 问题 后缀 数据 模块 就是 学习 提示 内容 参数 方法 不用 两个 也就是 代码 倒是 办法 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 阿里巴巴北京网络技术公司 网络安全防范措施范文 北京电子软件开发条件 多个纬度讲解数据库 山东单招报软件开发学校 数据库升级的影响 ps数据库怎么进入 网络安全准入系统升级服务方案 手抄报网络安全健康上网内容 丰台电脑服务器回收公司 计算机网络技术提取公积金 德国网络安全专业哪些大学好 数据库中库起到了什么作用 软件开发终止 账务处理 软件开发公司是免税企业吗 网络技术人员英语怎么说 数据库还原提示什么 视图 远程sql数据库 计算机网络技术专业演讲稿 云服务器更改dns无效 服务器程序的监听端口号 数据库升级的影响 政府机关网络安全实施方案 人力资源软件开发者信任度高吗 银川办公软件开发花多少钱 阿里云服务器发布项目 好奇心科技互联网 黄河国产服务器厂商 什么发挥网络安全基础性作用 主机数据库ip地址怎么看
0