JupyterNotebook读⼊csv⽂件时出错的解决⽅案
问题
jupyter notebook读⼊csv数据时出现错误
“SyntaxError: (unicode error) ‘unicodeescape' codec can't decode bytes in position 2-3: truncated \UX”
解决⽅法
将⽂件路径中'C:\Users\huangyanli\Desktop\churn.csv'的“\”改为“\\”就可以了。
syntaxerror是什么错误
完美解决问题。
补充:Jupyter notebook 导出的csv ⽂件是乱码的解决⽅案
本⼈使⽤的是Jupyter notebook 编辑器做数据分析的,API 是pyspark,有时候需要把 pyspark DataFrame 转成 pandas Dataframe,然后转成CSV ⽂件去汇报⼯作,发现有中⽂导出的时候是乱码,问了运维的同事的他们已经设置成了UTF-8 的模式,我在代码⾥也设置了UTF-8 .后来发现是CSV的问题,先将CSV⽤txt记事本打开,然后选择ANSI编码⽅式。
另存为,点编码这⾥,这⾥的编码有这么⼏种选择,最后⽤excel去打开就可以了。
pyspark 导出代码:
aa1 = aa.toPandas()
<_csv('output_file.csv')
以上为个⼈经验,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅,望不吝赐教。