谢邀,前几天就看到邀请了,一直没空写。今天先来挖个坑。 大家可以去参观一下numpy.dot 的内核函数: * This module provides a BLAS optimized matrix multiply, * inner product and dot for numpy arrays:cblas内核函数 你会发现np.dot就是分类讨论式的使用blas函数,先判断好你输入的数据类型,是标量,一维向量,还是矩阵,然后再调用相应的blas函数。 所以问题python的numpy向量化语句为什么会比for快?就可以转化为为什么blas库比for快? 为什么呢?先挖坑,慢慢来答 |