// Compile with // g++ -O3 -ffast-math -march=pentium4 lr.cpp libacml.a -o lr -lgfortran struct Matrix { double* data; int n; int m; int lda; Matrix(double* data_, int n_, int m_, int lda_) : data(data_), n(n_), m(m_), lda(lda_) {} double& operator()(int i, int j) { return data[j*lda+i]; } }; #include #include #include #include #include // C = beta*C + alpha*A*B void dgemm(double alpha, Matrix& A, Matrix& B, double beta, Matrix& C) { assert(C.n==A.n); assert(C.m==B.m); assert(A.m==B.n); for (int j=0; j tmpDataA(N*N), tmpDataB(N*N), tmpDataC(N*N); for (int j=0; j=0; --i) for (int k=0; k #include #include double check(int n) { std::vector data(n*n); Matrix A(&data[0],n,n,n); for (int j=0; j save(data); boost::timer timer; int run = 0; for (; timer.elapsed()<20; ++run) { std::copy(save.begin(),save.end(),data.begin()); lr(A); /* std::vector rhs(n); std::fill(rhs.begin(),rhs.end(),1.0); Matrix b; b.data = &rhs[0]; b.n = n; b.m = 1; b.lda = n; trisolve(A,b); std::cout << "b = ["; for (int i=0; i data(n*n); Matrix A(&data[0],n,n,n); for (int j=0; j save(data); boost::timer timer; int run = 0; for (; timer.elapsed()<20; ++run) { std::copy(save.begin(),save.end(),data.begin()); blockLR(A); } return timer.elapsed()/run; } double checkDGEMM(int n) { std::vector dataA(n*n), dataB(n*n), dataC(n*n); Matrix A(&dataA[0],n,n,n), B(&dataB[0],n,n,n), C(&dataC[0],n,n,n); for (int j=0; j dataA(n*n), dataB(n*n), dataC(n*n); Matrix A(&dataA[0],n,n,n), B(&dataB[0],n,n,n), C(&dataC[0],n,n,n); for (int j=0; j dataA(n*n), dataB(n*n), dataC(n*n); Matrix A(&dataA[0],n,n,n), B(&dataB[0],n,n,n), C(&dataC[0],n,n,n); for (int j=0; j