pandas应用股票数据分析量化

adminadmin 技术推文 2021-12-22 594 0

安装pandas组件

import pandas as pd


先了解一下numpy 和pandas的区别

numpy 由数组结构组成。

pandas 由数据表结构组成。

pandas 中的 DataFrame 指数据情结构 

df1 = pd.DataFrame([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]], columns=['name','gender','age'])


data = {

    'A': [1, 0, 1, 1],
    'B': [0, 2, 5, 0],
    'C': [4, 0, 4, 4],
    'D': [1, 0, 1, 1]
}
df = pd.DataFrame(data=data)
df1=df.drop_duplicates(keep=False)  # keep=False 删除所有重复项
print(df1)
df2=df.drop_duplicates(subset=['B'],keep=False)   #去除所有重复项,对于B列来说两个0是重复项


d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
   'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
#使用df['列']=值,插入新的数据列
df['three']=pd.Series([10,20,30],index=['a','b','c'])
#print(df)
#将已经存在的数据列做相加运算
df['four']=df['one']+df['three']
#删除 DataFrame 中的数据列
#del df['four']
#添加数据行
df2 = pd.DataFrame([[5, 6], [7, 8]], columns = ['one','two'])
#df = df.append(df2)
#删除数据行
df = df.drop('a')

#创建一组数据
label = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
labe2 = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10']


df = pd.DataFrame(labe2, index=label)
#print(df)
#对行操作
#print(df.loc['a':'d',:]) #等同于df.loc['a':'d']

print(df.loc['a'])
path ='F:/000001.xls' #把文件路径记录下来
datas=pd.read_excel(path)#读xls的数据
loc=datas.iloc[1:2,1:3]  #取1横的1-2和列的1-3数据


2.导出xls数据表分析

data1=pd.read_csv(r"C:\Users\Administrator\Desktop\201909.csv")  #读取csv文件
data1.head() #读取csv文件
data1.to_csv(r"C:\Users\Administrator\Desktop\201909_bat.csv") #把文件另存为csv文件


版权声明

本文仅代表作者观点,不代表牛人量化交易网立场。
本文系作者授权牛人量化交易网发表,未经许可,不得转载。

喜欢0发布评论

评论列表

发表评论

  • 昵称(必填)
  • 邮箱
  • 网址