PythonNumpy数组的初始化和基本操作⼀.基础:
Numpy的主要数据类型是ndarray,即多维数组。它有以下⼏个属性:
ndarray.ndim:数组的维数
ndarray.shape:数组每⼀维的⼤⼩
ndarray.size:数组中全部元素的数量
ndarray.dtype:数组中元素的类型(numpy.int32, numpy.int16, and numpy.float64等)
ndarray.itemsize:每个元素占⼏个字节
例⼦:
>>> import numpy as np
>>> a = np.arange(15).reshape(3, 5)
>>> a
array([[ 0,  1,  2,  3,  4],
[ 5,  6,  7,  8,  9],
[10, 11, 12, 13, 14]])
>>> a.shape
(3, 5)
>>> a.ndim
2
>>> a.dtype.name
'int64'
>>> a.itemsize
8
>>> a.size
15
>>> type(a)
<type 'numpy.ndarray'>
>>> b = np.array([6, 7, 8])
>>> b
array([6, 7, 8])
>>> type(b)
<type 'numpy.ndarray'>
⼆.创建数组:
使⽤array函数讲tuple和list转为array:
>>> import numpy as np
>>> a = np.array([2,3,4])
>>> a
array([2, 3, 4])
>>> a.dtype
dtype('int64')
>>> b = np.array([1.2, 3.5, 5.1])
>>> b.dtype
dtype('float64')
多维数组:
>>> b = np.array([(1.5,2,3), (4,5,6)])
>>> b
array([[ 1.5,  2. ,  3. ],
[ 4. ,  5. ,  6. ]])
⽣成数组的同时指定类型:
>>> c = np.array( [ [1,2], [3,4] ], dtype=complex )
>>> c
array([[ 1.+0.j,  2.+0.j],
[ 3.+0.j,  4.+0.j]])
⽣成数组并赋为特殊值:
ones:全1
zeros:全0
empty:随机数,取决于内存情况
>>> np.zeros( (3,4) )
array([[ 0.,  0.,  0.,  0.],
[ 0.,  0.,  0.,  0.],
[ 0.,  0.,  0.,  0.]])
>>> np.ones( (2,3,4), dtype=np.int16 )                # dtype can also be specified
array([[[ 1, 1, 1, 1],
[ 1, 1, 1, 1],
[ 1, 1, 1, 1]],
[[ 1, 1, 1, 1],
[ 1, 1, 1, 1],
[ 1, 1, 1, 1]]], dtype=int16)
>>> np.empty( (2,3) )                                # uninitialized, output may vary
array([[  3.73603959e-262,  6.02658058e-154,  6.55490914e-260],
[  5.30498948e-313,  3.14673309e-307,  1.00000000e+000]])
⽣成均匀分布的array:
arange(最⼩值,最⼤值,步长)(左闭右开)
linspace(最⼩值,最⼤值,元素数量)
>>> np.arange( 10, 30, 5 )python3 numpy教程
array([10, 15, 20, 25])
>>> np.arange( 0, 2, 0.3 )                # it accepts float arguments
array([ 0. ,  0.3,  0.6,  0.9,  1.2,  1.5,  1.8])
>>> np.linspace( 0, 2, 9 )                # 9 numbers from 0 to 2
array([ 0.  ,  0.25,  0.5 ,  0.75,  1.  ,  1.25,  1.5 ,  1.75,  2.  ])
>>> x = np.linspace( 0, 2*pi, 100 )        # useful to evaluate function at lots of points
三.基本运算:
整个array按顺序参与运算:
>>> a = np.array( [20,30,40,50] )
>>> b = np.arange( 4 )
>>> b
array([0, 1, 2, 3])
>>> c = a-b
>>> c
array([20, 29, 38, 47])
>>> b**2
array([0, 1, 4, 9])
>>> 10*np.sin(a)
array([ 9.12945251, -9.88031624,  7.4511316 , -2.62374854])
>>> a<35
array([ True, True, False, False], dtype=bool)
两个⼆维使⽤*符号仍然是按位置⼀对⼀相乘,如果想表⽰矩阵乘法,使⽤dot:>>> A = np.array( [[1,1],
...            [0,1]] )
>>> B = np.array( [[2,0],
...            [3,4]] )
>>> A*B                        # elementwise product
array([[2, 0],
[0, 4]])
>>> A.dot(B)                    # matrix product
array([[5, 4],
[3, 4]])
>>> np.dot(A, B)                # another matrix product
array([[5, 4],
[3, 4]])
内置函数(min,max,sum),同时可以使⽤axis指定对哪⼀维进⾏操作:
>>> b = np.arange(12).reshape(3,4)
>>> b
array([[ 0,  1,  2,  3],
[ 4,  5,  6,  7],
[ 8,  9, 10, 11]])
>>>
>>> b.sum(axis=0)                            # sum of each column
array([12, 15, 18, 21])
>>>
>>> b.min(axis=1)                            # min of each row
array([0, 4, 8])
>>>
>>> b.cumsum(axis=1)                        # cumulative sum along each row
array([[ 0,  1,  3,  6],
[ 4,  9, 15, 22],
[ 8, 17, 27, 38]])
Numpy同时提供很多全局函数
>>> B = np.arange(3)
>>> B
array([0, 1, 2])
>>> np.exp(B)
array([ 1.        ,  2.71828183,  7.3890561 ])
>>> np.sqrt(B)
array([ 0.        ,  1.        ,  1.41421356])
>>> C = np.array([2., -1., 4.])
>>> np.add(B, C)
array([ 2.,  0.,  6.])
四.寻址,索引和遍历:
⼀维数组的遍历语法和python list类似:
>>> a = np.arange(10)**3
>>> a
array([  0,  1,  8,  27,  64, 125, 216, 343, 512, 729])
>>> a[2]
8
>>> a[2:5]
array([ 8, 27, 64])
>>> a[:6:2] = -1000    # equivalent to a[0:6:2] = -1000; from start to position 6, exclusive, set every 2nd element to -1000 >>> a
array([-1000,    1, -1000,    27, -1000,  125,  216,  343,  512,  729])
>>> a[ : :-1]                                # reversed a
array([  729,  512,  343,  216,  125, -1000,    27, -1000,    1, -1000])
>>> for i in a:
...    print(i**(1/3.))
...
nan
1.0
nan
3.0
nan
5.0
6.0
7.0
8.0
9.0
多维数组的访问通过给每⼀维指定⼀个索引,顺序是先⾼维再低维:
>>> def f(x,y):
...    return 10*x+y
.
..
>>> b = np.fromfunction(f,(5,4),dtype=int)
>>> b
array([[ 0,  1,  2,  3],
[10, 11, 12, 13],
[20, 21, 22, 23],
[30, 31, 32, 33],
[40, 41, 42, 43]])
>>> b[2,3]
23
>>> b[0:5, 1]                      # each row in the second column of b
array([ 1, 11, 21, 31, 41])
>>> b[ : ,1]                        # equivalent to the previous example
array([ 1, 11, 21, 31, 41])
>>> b[1:3, : ]                      # each column in the second and third row of b
array([[10, 11, 12, 13],
[20, 21, 22, 23]])
When fewer indices are provided than the number of axes, the missing indices are considered complete slices: >>>
>>> b[-1]                                  # the last row. Equivalent to b[-1,:]
array([40, 41, 42, 43])
…符号表⽰将所有未指定索引的维度均赋为:,:在python中表⽰该维所有元素:>>> c = np.array( [[[  0,  1,  2],              # a 3D array (two stacked 2D arrays)
...                [ 10, 12, 13]],
...                [[100,101,102],
...                [110,112,113]]])
>>> c.shape
(2, 2, 3)
>>> c[1,...]                                  # same as c[1,:,:] or c[1]
array([[100, 101, 102],
[110, 112, 113]])
>>> c[...,2]                                  # same as c[:,:,2]
array([[  2,  13],
[102, 113]])
遍历:
如果只想遍历整个array可以直接使⽤:
>>> for row in b:
...    print(row)
...
[0 1 2 3]
[10 11 12 13]
[20 21 22 23]
[30 31 32 33]
[40 41 42 43]
但是如果要对每个元素进⾏操作,就要使⽤flat属性,这是⼀个遍历整个数组的迭代器>>> for element in b.flat:
...    print(element)
...
1
2
3
10
11
12
13
20
21
22
23
30
31
32
33
40
41
42
43