In [67]: _ = s.seek(0)
In [68]: data = np.genfromtxt(s,delimiter=",")
In [69]: data
Out[69]: array([1. , 1.3, nan])
这次有输出了,但是最后一个字符串因为不能被转换成为float,所以得到了nan。
注意,我们第一行需要重置StringIO的指针到文件的开头。这里我们使用 s.seek(0)。
那么怎么把最后一个str也进行转换呢?我们需要手动指定dtype:
In [74]: _ = s.seek(0)
In [75]: data = np.genfromtxt(s,dtype=float,delimiter=",")
In [76]: data
Out[76]: array([1. , 1.3, nan])
上面我们指定了所有的数组类型都是float,我们还可以分别为数组的每个元素指定类型:
In [77]: _ = s.seek(0)
In [78]: data = np.genfromtxt(s,dtype=[int,float,'S5'],delimiter=",")
In [79]: data
Out[79]: array((1, 1.3, b'abcde'), dtype=[('f0', '<i8'), ('f1', '<f8'), ('f2', '<U')])
In [214]: data = np.genfromtxt(s, dtype="i8,f8,S5",names=['myint','myfloat','mystring'], delimiter=",")
In [215]: data
Out[215]:
array((1, 1.3, b'abcde'),
dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', 'S5')])
分隔符除了使用字符之外,还可以使用index:
In [216]: s = StringIO(u"11.3abcde")
In [217]: data = np.genfromtxt(s, dtype=None, names=['intvar','fltvar','strvar'],
...: delimiter=[1,3,5])
In [218]: data
Out[218]:
array((1, 1.3, b'abcde'),
dtype=[('intvar', '<i8'), ('fltvar', '<f8'), ('strvar', 'S5')])
>>> data = u"""#
... # Skip me !
... # Skip me too !
... 1, 2
... 3, 4
... 5, 6 #This is the third line of the data
... 7, 8
... # And here comes the last line
... 9, 0
... """
>>> np.genfromtxt(StringIO(data), comments="#", delimiter=",")
array([[1., 2.],
[3., 4.],
[5., 6.],
[7., 8.],
[9., 0.]])
跳过行和选择列
可以使用skip_header 和 skip_footer 来跳过返回的数组特定的行:
>>> data = u"\n".join(str(i) for i in range(10))
>>> np.genfromtxt(StringIO(data),)
array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])
>>> np.genfromtxt(StringIO(data),
... skip_header=3, skip_footer=5)
array([ 3., 4.])