正确书写编码格局是十分关键的,特意是面对大数据时,SQL Server 数据库是基于 mssql 格局,假设排编码不规范,会带来诸多费事,那末怎样在 mssql 数据汇总后处置不规范的排编码呢?
首先,要装置并正确性能SQL Server,而后装置NumPy包,经常使用NumPy可以读取不规定的排编码类型,上方是装置NumPy包的代码:
pip install numpy
该代码可以装置NumPy包,用户可以在装置完该包后,经常使用以下代码将mssql数据库数据导入NumPy包:
import pandas as pd
from sqlalchemy import create_Engine
engine = create_engine(“mssql+pymssql://username:password@host/dbname”)
df = pd.read_sql(‘SELECT * FROM YourTableName’,engine)
接上去,经常使用Series对象将导入的排编码不规定的字段启动处置,上方是数据排编码格局不规定的处置代码:
from pandas import Series
series = Series.from_array(df[“YourColumnName”])
series.str.strip()
str.strip()方法的作用是移除指定字符串的某些字符,包含前后及两边的字符,从而抵达正确的排编码格局,最后经常使用以下代码把整顿的排编码数据存入mssql数据库中:
series.to_sql(‘NewTableName’,engine,if_exists=’Append’,index=False)
以上代码可以成功mssql数据汇总后排编码不规范处置,只需把NumPy包性能好、装置好,在汇总后经常使用Series对象处置,上述步骤就能够成功。
本文地址: https://yihaiquanyi.com/article/bce323e34cde2c0c96bb.html
上一篇:电脑怎样修正文档内容电脑怎样修正hosts文...