将Numpy中的大量矩阵运算矢量化的最快方法是什么?

更新时间:2023-04-02 13:09:48

问题阐述

假设我要在Numpy中做大量的矩阵乘法;最快的方法是什么?

具体来说,假设问题是这样的:我有两个很长的矩阵列表,我想要将它们逐个相乘。也就是说,我有

[a_1, a_2, a_3, ..., a_N]

[b_1, b_2, b_3, ..., b_N],
其中每个a_ib_i是一个nxn矩阵(n是小的,比如n=2),而N是大的(比如N = 100000),我想找出矩阵乘积a_1 * b_1, a_2 * b_2, ...

使用Python和Numpy/Scipy执行此操作的最快方法是什么?

部分选项包括:

  1. 使用for循环--这很慢,因为Python循环很慢。
  2. 将较小的矩阵放入两个NxN块对角线矩阵AB--这将导致必须将一个比所需大得多的矩阵相乘。
  3. 使用vectorize--这是最容易编码的,但并不比for循环快。

精准答案

您已经可以将3D数组相乘,只需将数组列表放入NumPy数组即可,例如

A = np.array([a_1, a_2, ..., a_N])
B = np.array([b_1, b_2, ..., b_N])

然后乘以A @ B(@是矩阵乘法运算符)。以下是使用两个3x3数组列表的示例:

In [1]: import numpy as np

In [2]: x = np.random.randint(0, 9, (2, 3, 3))

In [3]: y = np.random.randint(0, 9, (2, 3, 3))

In [4]: x
Out[4]:
array([[[0, 4, 8],
        [2, 5, 5],
        [3, 0, 5]],

       [[7, 6, 1],
        [7, 0, 7],
        [5, 2, 8]]])

In [5]: y
Out[5]:
array([[[7, 2, 6],
        [6, 1, 4],
        [6, 8, 5]],

       [[8, 5, 4],
        [8, 2, 7],
        [3, 7, 0]]])

In [7]: x @ y
Out[7]:
array([[[ 72,  68,  56],
        [ 74,  49,  57],
        [ 51,  46,  43]],

       [[107,  54,  70],
        [ 77,  84,  28],
        [ 80,  85,  34]]])

要证明所有这些都是每个矩阵在相应索引处的乘积:

In [8]: x[0]
Out[8]:
array([[0, 4, 8],
       [2, 5, 5],
       [3, 0, 5]])

In [9]: y[0]
Out[9]:
array([[7, 2, 6],
       [6, 1, 4],
       [6, 8, 5]])

In [10]: x[0] @ y[0]
Out[10]:
array([[72, 68, 56],
       [74, 49, 57],
       [51, 46, 43]])

In [11]: (x @ y)[0]
Out[11]:
array([[72, 68, 56],
       [74, 49, 57],
       [51, 46, 43]])