04-python-numpy-datatype-obj
4. NumPy之:数据类型对象dtype
简介
之前讲到了NumPy中有多种数据类型,每种数据类型都是一个dtype(numpy.dtype )对象。今天我们来详细讲解一下dtype对象。
dtype的定义
先看下dtype方法的定义:
其作用就是将对象obj转成dtype类型的对象。
它带了两个可选的参数:
align - 是否按照C编译器的结构体输出格式对齐对象。
Copy - 是拷贝对象,还是对对象的引用。
dtype可以用来描述数据的类型(int,float,Python对象等),描述数据的大小,数据的字节顺序(小端或大端)等。
可转换为dtype的对象
可转换的obj对象可以有很多种类型,我们一一来进行讲解
dtype对象
如果obj对象本身就是一个dtype对象,那么可以进行无缝转换。
None
不传的话,默认就是float_
,这也是为什么我们创建数组默认都是float类型的原因。
数组标量类型
内置的数组标量可以被转换成为相关的data-type对象。
前面一篇文章我们讲到了什么是数组标量类型。数组标量类型是可以通过np.type来访问的数据类型。 比如:
np.int32
,np.complex128
等。
我们看下数组标量的转换:
这些以np开头的内置数组标量类型可以参考我之前写的文章 “NumPy之:数据类型” 。
注意,数组标量并不是dtype对象,虽然很多情况下,可以在需要使用dtype对象的时候都可以使用数组标量。
通用类型
一些通用类型对象,可以被转换成为相应的dtype类型:
number
, inexact
, floating
float
complexfloating
cfloat
integer
, signedinteger
int_
unsignedinteger
uint
character
string
generic
, flexible
void
内置Python类型
一些Python内置的类型和数组标量类型是等价的,也可以被转换成为dtype:
int
int_
bool
bool_
float
float_
complex
cfloat
bytes
bytes_
str
str_
buffer
void
(all others)
object_
看下内置Python类型转换的例子:
带有.dtype属性的对象
任何type对象只要包含dtype
属性,并且这个属性属于可以转换的范围的话,都可以被转换成为dtype。
一个字符的string对象
对于每个内置的数据类型来说都有一个和它对应的字符编码,我们也可以使用这些字符编码来进行转换:
数组类型的String
Numpy中数组类型的对象有一个属性叫做typestr。
typestr描述了这个数组中存放的数据类型和长度。
typestr由三部分组成,第一部分是描述数据字节顺序: <
小端 >
大端。
第二部分是数组里面元素的基本类型:
t
Bit field (following integer gives the number of bits in the bit field).
b
Boolean (integer type where all values are only True or False)
i
Integer
u
Unsigned integer
f
Floating point
c
Complex floating point
m
Timedelta
M
Datetime
O
Object (i.e. the memory contains a pointer to PyObject)
S
String (fixed-length sequence of char)
U
Unicode (fixed-length sequence of Py_UNICODE)
V
Other (void * – each item is a fixed-size chunk of memory)
最后一部分就是数据的长度。
dtype支持下面几种类型的转换:
'?'
boolean
'b'
(signed) byte
'B'
unsigned byte
'i'
(signed) integer
'u'
unsigned integer
'f'
floating-point
'c'
complex-floating point
'm'
timedelta
'M'
datetime
'O'
(Python) objects
'S'
, 'a'
zero-terminated bytes (not recommended)
'U'
Unicode string
'V'
raw data (void
)
我们看几个例子:
逗号分割的字符串
逗号分割的字符串可以用来表示结构化的数据类型。
对于这种结构化的数据类型也可以转换成为dtpye格式,转换后的dtype,将会以f1,f2, … fn-1作为名字来保存对应的格式数据。我们举个例子:
上面的例子中,f0保存的是32位的整数,f1保存的是 2 x 3 数组的64-bit 浮点数。f2是一个32-bit 的浮点数。
再看另外一个例子:
类型字符串
所有在numpy.sctypeDict
.keys()中的字符,都可以被转换为dtype:
使用的例子:
元组
通过使用dtype构成的元组,我们可以生成新的dtype。
元组也有很多种方式。
(flexible_dtype, itemsize)
对于不固定长度的dtype,可以指定size:
(fixed_dtype, shape)
对于固定长度的dtype,可以指定shape:
[(field_name, field_dtype, field_shape), ...]
list中的元素是一个个的field,每个field都是由2-3个部分组成的,分别是field名字,field类型,field的shape。
field_name如果是 ’ ‘的话,就会使用默认的f1,f2 ….作为名字。field_name 也可以是一个2元组,由title 和 name 组成。
field_dtype 就是field的dtype类型。
shape是一个可选字段,如果field_dtype是一个数组的话,就需要指定shape。
上面是两个字段,一个是大端的32位的int,一个是小端的32位的int。
四个字段,每个都是无符号整形。
{'names': ..., 'formats': ..., 'offsets': ..., 'titles': ..., 'itemsize': ...}
这种写法可以指定name列表和formats列表:
offsets 指的是每个字段的byte offsets。titles 是字段的title,itemsize 是整个dtype的size。
(base_dtype, new_dtype)
可以将基本的dtype类型转换为结构化的dtype类型:
32位的int转换成两个16位的int。
32位的int,转换成4个unsigned integers。
本文已收录于 www.flydean.com
最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!
欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!
最后更新于