1. 首页 > 科技

Python, pandas 取一列的前两位数字? python pandas读取excel

Python, pandas 取一列的前两位数字?python pandas读取excel

python pandas怎么提取一列数据

1.queryset是查询集,就是传到服务器上的url里面的查询内容。Django会对查询返回的结果集QuerySet进行缓存,这是为了提高查询效率。也就是说,在你创建一个QuerySet对象的时候,Django并不会立即向数据库发出查询命令,只有在你需要用到这个QuerySet的时候才会这样做。

2.Objects是django实现的mvc中的m,Django中的模型类都有一个objects对象,它是一个Django中定义的QuerySet类型的对象,它包含了模型对象的实例。

3.不能,因为get可能会有异常,可以用filter函数,如下

>>> Entry.objects.filter(blog__id__exact=1)# 显示的使用__exact

>>> Entry.objects.filter(blog__id=1)# 隐含的使用__exact>>> Entry.objects.filter(blog__pk=1)# __pk 相当于 __id__exact

python panda怎么提取列数据

创建数据

通过python的zip构造出一元组组成的列表作为dataframe的输入数据rec。

in [3]: import pandas as pd

in [4]: import random

in [5]: num = random.sample(xrange(10000, 1000000), 5)

in [6]: num

out[6]: [244937, 132008, 278446, 613409, 799201]

in [8]: names = "hello the cruel world en".split()

in [9]: names

out[9]: ['hello', 'the', 'cruel', 'world', 'en']

in [10]: rec = zip(names, num)

in [15]: data = pd.dataframe(rec, columns = [u"姓名",u"业绩" ])

in [16]: data

out[16]:

姓名 业绩

0 hello 244937

1 the 132008

2 cruel 278446

3 world 613409

4 en 799201

dataframe方法函数的第一个参数是数据源,第二个参数columns是输出数据表的表头,或者说是表格的字段名。

导出数据csv

windows平台上的编码问题,我们可以先做个简单处理,是ipython-notebook支持utf8.

import sys

reload(sys)

sys.setdefaultencoding("utf8")

接下来可以数据导出了。

in [31]: data

out[31]:

姓名 业绩

0 hello 244937

1 the 132008

2 cruel 278446

3 world 613409

4 en 799201

#在ipython-note里后加问号可查帮助,q退出帮助

in [32]: data.to_csv?

in [33]: data.to_csv("c:\\out.csv", index = true, header = [u"雇员", u"销售业绩"])

将data导出到out.csv文件里,index参数是指是否有主索引,header如果不指定则是以data里columns为头,如果指定则是以后边列表里的字符串为表头,但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。

可到c盘用notepad++打开out.csv看看。

简单的数据分析

in [43]: data

out[43]:

姓名 业绩

0 hello 244937

1 the 132008

2 cruel 278446

3 world 613409

4 en 799201

关于pandas处理数据,怎么提取某一列的部分数字

请注意是部分数据

python中如何提取一组数据中的第一列数据

概述

直接提取会报错,把array数组转换成list,即可提取,使用numpy转换

步骤详解

1、直接提取尝试:

group=[[1,2],[2,3],[3,4]]

#提取第一列元素

print(group[:,1])

#Out:TypeError: list indices must be integers or slices, not tuple

2、使用numpy转换:

import numpy as np 

group=[[1,2],[2,3],[3,4]]

#numpy转化

ar=np.array(group) 

print(ar[:,1])

#Out:[2 3 4]

拓展内容

numpy详解

Numpy对象是数组,称为ndarray 

维度(dimensions)称作轴(axes),轴的个数叫做秩(rank)。注:有几级中括号就有几个维度

一、ndarray.attrs:

ndarray.ndim 秩

ndarray.shape 例如一个2排3列的矩阵,它的shape属性是(2,3)

ndarray.size 数组元素的总个数

ndarray.dtype 元素类型,NumPy提供自己的数据类型

ndarray.itemsize 数组中每个元素的字节大小

二、数组创建函数:

array

asarray将输入转换成ndarray

arange

ones

zeros

empty 只分配内存空间不填充任何值

eye 创建N*N单位矩阵(对角线为1)

三、数组和标量之间的运算

numpy数组的一个特点,不用编写循环就可对数据执行批量运算,这通常称作矢量化(vectorization)。

四、基本的索引和切片

numpy数组的索引是一个内容丰富的主题,因为选取数据子集或单个元素的方式有很多。这里我仅详细介绍常用的方法,对于高级功能的方式我列举名称,读者可以等到要用的时候自行查阅资料。