安装pandas组件
import pandas as pd
先了解一下numpy 和pandas的区别
numpy 由数组结构组成。
pandas 由数据表结构组成。
pandas 中的 DataFrame 指数据情结构 df1 = pd.DataFrame([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]], columns=['name','gender','age'])
data = { 'A': [1, 0, 1, 1], 'B': [0, 2, 5, 0], 'C': [4, 0, 4, 4], 'D': [1, 0, 1, 1] } df = pd.DataFrame(data=data) df1=df.drop_duplicates(keep=False) # keep=False 删除所有重复项 print(df1) df2=df.drop_duplicates(subset=['B'],keep=False) #去除所有重复项,对于B列来说两个0是重复项 d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(d) #使用df['列']=值,插入新的数据列 df['three']=pd.Series([10,20,30],index=['a','b','c']) #print(df) #将已经存在的数据列做相加运算 df['four']=df['one']+df['three'] #删除 DataFrame 中的数据列 #del df['four'] #添加数据行 df2 = pd.DataFrame([[5, 6], [7, 8]], columns = ['one','two']) #df = df.append(df2) #删除数据行 df = df.drop('a') #创建一组数据 label = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'] labe2 = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10'] df = pd.DataFrame(labe2, index=label) #print(df) #对行操作 #print(df.loc['a':'d',:]) #等同于df.loc['a':'d'] print(df.loc['a'])
path ='F:/000001.xls' #把文件路径记录下来
datas=pd.read_excel(path)#读xls的数据
loc=datas.iloc[1:2,1:3] #取1横的1-2和列的1-3数据
2.导出xls数据表分析
data1=pd.read_csv(r"C:\Users\Administrator\Desktop\201909.csv") #读取csv文件
data1.head() #读取csv文件
data1.to_csv(r"C:\Users\Administrator\Desktop\201909_bat.csv") #把文件另存为csv文件
版权声明
本文仅代表作者观点,不代表牛人量化交易网立场。
本文系作者授权牛人量化交易网发表,未经许可,不得转载。
评论列表
发表评论