Numerik / sources / Diff of /LibDBlasM2.mod

Diff of /LibDBlasM2.mod [93da36] .. [139f46]

Switch to unified view

-a/LibDBlasM2.mod
+b/LibDBlasM2.mod
 ...
   (* Letzte Bearbeitung                                                     *)
   (*                                                                        *)
   (* 23.11.93, MRi: Erstellen der 1. Version                                *)
   (* Aug.  95, MRi: Erweiterung                                             *)
   (* 03.11.95, MRi: Durchsicht                                              *)
-  (* 13.10.15, MRi: Ersetzen von LFLOAT(#) durch VAL(LONGREAL,#)            *)
+  (* 13.10.15, MRi: Ersetzen von FLOAT(#) durch VAL(FLOAT,#)          *)
   (* 30.11.15, MRi: Erstelle der Routinen dscal,daxpy,idmax aus Linpack     *)
   (*                Benchmark aus Beispielen von Stony Brook M2             *)
   (* 01.12.15, MRi: Umbenennen von BlasLib auf LibDBlas, einfuegen von      *)
   (*                dnrm2 (aus dnrm2.f)                                     *)
   (* 28.01.16, MRi: Umstellen von dgemv und dgemm auf "Open Array".         *)
 ...
   (* 31.03.16, MRi: drot und drotg eingefuegt                               *)
   (* 13.04.16, MRi: dcopy eingefuegt                                        *)
   (* 21.10.16, MRi: idamin eingefuegt                                       *)
   (* 28.10.17, MRi: zgemm eingefuegt                                        *)
   (* 29.10.17, MRi: Rolle von M,N in dgemm und dgemv an zgemm angepasst     *)
+  (* 11.09.18, MRi: zgemv eingefuegt                                        *)
+  (* 12.09.18, MRi: zswap,zcopy,zdotc,dznrm2,zscal,zaxpy,zdrot eingefuegt   *)
   (*------------------------------------------------------------------------*)
   (* Testroutinen                                                           *)
   (*                                                                        *)
+  (* - dgemv in TstDGEMV                                                    *)
+  (* - zgemv in TstZGEMV                                                    *)
   (* - zgemm in TstCmplxMaMul                                               *)
   (*------------------------------------------------------------------------*)
   (* Offene Punkte:                                                         *)
   (*                                                                        *)
   (* - Weiteres austesten von dgemm und besonders dgemv                     *)
 ...
   (*------------------------------------------------------------------------*)
   (* Implementation : Michael Riedl                                         *)
   (* Licence        : GNU Lesser General Public License (LGPL)              *)
   (*------------------------------------------------------------------------*)
-  (* $Id: LibDBlasM2.mod,v 1.9 2017/10/29 09:55:11 mriedl Exp mriedl $ *)
+  (* $Id: LibDBlasM2.mod,v 1.11 2018/09/12 13:20:49 mriedl Exp mriedl $ *)
                      IMPORT SYSTEM;
-FROM Deklera         IMPORT FLOAT; (* REAL type *)
+FROM Deklera         IMPORT FLOAT,CFLOAT; (* REAL/COMPLEX Type *)
 FROM LongMath        IMPORT sqrt;
-FROM LongComplexMath IMPORT conj;
+FROM LongComplexMath IMPORT zero,one,conj,scalarMult;
                      IMPORT Errors;
+FROM F77func         IMPORT MAX0;
-                     IMPORT TIO;
-TYPE  PVEKTOR = POINTER TO ARRAY [0..MAX(INTEGER)-1] OF FLOAT;
 PROCEDURE IMax(a,b : INTEGER) : INTEGER;
 BEGIN
       IF (a > b) THEN RETURN a; ELSE RETURN b; END;
 ...
       ELSE
         scale := 0.0;
         ssq   := 1.0;
         ix    := 0;
         FOR i:=0 TO n-1 DO
-TIO.WrStr("ix = "); TIO.WrInt(ix,1); TIO.WrLn;
           IF (X[ix] # 0.0) THEN
             absxi := ABS(X[ix]);
             IF (scale < absxi) THEN
               zw    := scale / absxi;
               ssq   := 1.0 + ssq*zw*zw;
 ...
           (* Finds the index of element having min. absolute value.         *)
           (*----------------------------------------------------------------*)
           VAR dmin       : FLOAT;
               i,ix,itemp : INTEGER;
-              XX         : PVEKTOR;
 BEGIN
       IF (n < 1) THEN RETURN -1; END;
       IF (n = 1) THEN RETURN  0; END;
-      XX:=SYSTEM.CAST(PVEKTOR,SYSTEM.ADR(X));
       itemp:=0;
       IF (IncX <> 1) THEN (* code for Increment not equal to 1 *)
-        dmin := ABS(XX^[0]);
+        dmin := ABS(X[0]);
         ix := 1 + IncX;
         FOR i:=1 TO n-1 DO
-          IF (ABS(XX^[ix]) < dmin) THEN
+          IF (ABS(X[ix]) < dmin) THEN
             itemp := i;
-            dmin := ABS(XX^[ix]);
+            dmin := ABS(X[ix]);
           END;
           INC(ix,IncX);
         END;
       ELSE (* code for increment equal to 1 *)
-        dmin := ABS(XX^[0]);
+        dmin := ABS(X[0]);
         FOR i:=1 TO n-1 DO
-          IF (ABS(XX^[i]) < dmin) THEN
+          IF (ABS(X[i]) < dmin) THEN
             itemp := i;
-            dmin := ABS(XX^[i]);
+            dmin := ABS(X[i]);
           END;
         END;
       END;
       RETURN itemp + 1;
 END idamin;
 ...
           VAR Temp                              : FLOAT;
               i,j,iy,jx,jy,kx,ky,Info,LenX,LenY : INTEGER;
 BEGIN (* Testen *)
       (* Test the input parameters. *)
-      IF (CAP(Trans) = 'C') THEN
+      IF (NOT (CAP(Trans) = 'N')) AND (NOT (CAP(Trans) = 'T')) THEN
         Info :=  1;
       ELSIF (M < 0) THEN
         Info :=  2;
       ELSIF (N < 0) THEN
         Info :=  3;
 ...
         ky := 1 - (LenY - 1)*IncY;
       END;
       (* Start the operations. In this version the elements of A are *)
       (* accessed sequentially with one pass through A.              *)
       IF (Beta # 1.0) THEN (* First form  y := beta*y. *)
         IF (IncY = 1) THEN
           IF (Beta = 0.0) THEN
             FOR i:=0 TO LenY-1 DO Y[i]:=0.0; END;
 ...
           INC(ix,IncX);
         END;
       END;
 END dger;
+(*=========================== Complex valued routines =====================*)
+PROCEDURE zswap(    N    : CARDINAL;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER;
+                VAR Y    : ARRAY OF CFLOAT;
+                    IncY : INTEGER);
+          CONST veclen = 4;
+          VAR   Xi    : CFLOAT;
+                Xtmp  : ARRAY [0..veclen-1] OF CFLOAT;
+                ix,iy : INTEGER;
+                i,m   : CARDINAL;
+BEGIN
+      IF (N = 0) THEN RETURN; END;
+      IF (IncX = 1) AND (IncY = 1) THEN
+        m := N MOD veclen;
+        IF (m # 0) THEN
+          FOR i:=0 TO m-1 DO (* Clean up loop *)
+            Xi := X[i]; X[i] := Y[i]; Y[i] := Xi;
+          END;
+        END;
+        IF (N < veclen) THEN RETURN; END;
+        FOR i:=m TO N-1 BY veclen DO
+          Xtmp[0] := X[i+0];  Xtmp[1] := X[i+1];
+          Xtmp[2] := X[i+2];  Xtmp[3] := X[i+3];
+          X[i+0]  := Y[i+0];  X[i+1]  := Y[i+1];
+          X[i+2]  := Y[i+2];  X[i+3]  := Y[i+3];
+          Y[i+1]  := Xtmp[1]; Y[i+0]  := Xtmp[0];
+          Y[i+2]  := Xtmp[2]; Y[i+3]  := Xtmp[3];
+        END;
+      ELSE (* code for unequal increments or equal increments # 1 *)
+        IF (IncX > 0) THEN ix:=0; ELSE ix:=(1 - VAL(INTEGER,N))*IncX; END;
+        IF (IncY > 0) THEN iy:=0; ELSE iy:=(1 - VAL(INTEGER,N))*IncY; END;
+        FOR i:=0 TO N-1 DO
+          Xi := X[ix]; X[ix] := Y[iy]; Y[iy] := Xi;
+          INC(ix,IncX); INC(iy,IncY);
+        END;
+      END;
+END zswap;
+PROCEDURE zcopy(    N    : INTEGER;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER;
+                VAR Y    : ARRAY OF CFLOAT;
+                    IncY : INTEGER);
+          (*----------------------------------------------------------------*)
+          (* Adopted to Modula-2, MRi, 04.04.2016, complex version 09.08.18 *)
+          (*----------------------------------------------------------------*)
+          VAR   i,ix,iy,m  : INTEGER;
+BEGIN
+      IF (N <= 0) THEN RETURN; END;
+      IF (IncX = 1) AND (IncY = 1) THEN
+        (* code for both increments equal to 1 *)
+        m := (N MOD 8);
+        IF (m # 0) THEN (* Clean-up loop *)
+          FOR i:=0 TO m-1 DO Y[i] := X[i]; END;
+          IF (N < 8) THEN RETURN; END
+        END;
+        FOR i:=m TO N-1 BY 8 DO
+          Y[i+0] := X[i+0]; Y[i+1] := X[i+1];
+          Y[i+2] := X[i+2]; Y[i+3] := X[i+3];
+          Y[i+4] := X[i+4]; Y[i+5] := X[i+5];
+          Y[i+6] := X[i+6]; Y[i+7] := X[i+7];
+        END;
+      ELSE
+        (* code for unequal increments or equal increments not equal to 1 *)
+        IF (IncX > 0) THEN ix:=0; ELSE ix:=(1 - VAL(INTEGER,N))*IncX; END;
+        IF (IncY > 0) THEN iy:=0; ELSE iy:=(1 - VAL(INTEGER,N))*IncY; END;
+        FOR i:=0 TO N-1 DO
+          Y[iy] := X[ix];
+          INC(ix,IncX); INC(iy,IncY);
+        END;
+      END;
+END zcopy;
+PROCEDURE zdotc(    N    : INTEGER;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER;
+                VAR Y    : ARRAY OF CFLOAT;
+                    IncY : INTEGER) : CFLOAT;
+          CONST veclen = 4;
+          VAR   dtemp     : CFLOAT;
+                i,ix,iy,m : INTEGER;
+BEGIN
+      IF (N <= 0) THEN RETURN zero; END;
+      dtemp := zero;
+      IF (IncX = 1) AND (IncY = 1) THEN
+        (* code for both increments equal to 1 *)
+        m := N MOD veclen;
+        IF (m # 0) THEN
+          FOR i:=0 TO m-1 DO (* clean-up loop *)
+            dtemp:=dtemp + conj(X[i])*Y[i];
+          END;
+          IF (N < veclen) THEN RETURN dtemp; END;
+        END;
+        (* i := m - veclen; *)
+        FOR i:=m TO N-1 BY veclen DO
+          dtemp:=dtemp + conj(X[i+0])*Y[i+0] + conj(X[i+1])*Y[i+1] +
+                         conj(X[i+2])*Y[i+2] + conj(X[i+3])*Y[i+3];
+        END;
+      ELSE
+        (* code for unequal increments or equal increments not equal to 1 *)
+        ix := 0; IF (IncX < 0) THEN ix := (1-N)*IncX; END;
+        iy := 0; IF (IncY < 0) THEN iy := (1-N)*IncY; END;
+        FOR i:=1 TO N DO
+          dtemp:=dtemp + conj(X[ix])*Y[iy];
+          INC(ix,IncX); INC(iy,IncY);
+        END;
+      END;
+      RETURN dtemp;
+END zdotc;
+PROCEDURE dznrm2(    N    : INTEGER;
+                 VAR X    : ARRAY OF CFLOAT;
+                     IncX : INTEGER) : FLOAT;
+          VAR norm,scale,ssq,tmp : FLOAT;
+              i,ix               : INTEGER;
+              zw                 : FLOAT;
+BEGIN
+      IF (N < 1) OR (IncX < 1) THEN
+        norm := 0.0;
+      ELSE
+        scale := 0.0;
+        ssq   := 1.0;
+        ix := 0;
+        FOR i:=0 TO N-1 DO (* DO ix=1,1+(N-1)*IncX,IncX *)
+          IF (RE(X[ix]) # 0.0) THEN
+            tmp := ABS(RE(X[ix]));
+            IF (scale < tmp) THEN
+              zw    := scale / tmp;
+              ssq   := 1.0 + ssq*(zw*zw);
+              scale := tmp;
+            ELSE
+              zw := tmp / scale;
+              ssq:=ssq + (zw*zw);
+            END;
+          END;
+          IF (IM(X[ix]) # 0.0) THEN
+            tmp := ABS(IM(X[ix]));
+            IF (scale < tmp) THEN
+              zw    := scale / tmp;
+              ssq   := 1.0 + ssq*(zw*zw);
+              scale := tmp;
+            ELSE
+              zw := tmp / scale;
+              ssq:=ssq + (zw*zw);
+            END;
+          END;
+          INC(ix,IncX);
+        END; (* FOR *)
+        norm := scale*sqrt(ssq);
+      END; (* IF *)
+      RETURN norm;
+END dznrm2;
+PROCEDURE zscal(    n    : INTEGER;
+                    da   : CFLOAT;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER);
+          CONST veclen = 4;
+          VAR   i,m    : INTEGER;
+BEGIN
+      IF (n <= 0) THEN RETURN; END;
+      IF (IncX <> 1) THEN (* code for increment not equal to 1 *)
+        FOR i:=0 TO n-1 DO
+          X[i*IncX] := da*X[i*IncX];
+        END;
+      ELSE (* code for increment equal to 1 *)
+        m := n REM veclen;
+        IF (m <> 0) THEN
+          FOR i:=0 TO m-1 DO X[i] := da*X[i]; END;
+          IF (n < veclen) THEN
+            RETURN;
+          END;
+        END;
+        FOR i:=m TO n-1 BY veclen DO
+          X[i+0] := da*X[i+0];
+          X[i+1] := da*X[i+1];
+          X[i+2] := da*X[i+2];
+          X[i+3] := da*X[i+3];
+        END;
+      END;
+END zscal;
+PROCEDURE zaxpy(    n    : INTEGER;
+                    da   : CFLOAT;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER;
+                VAR Y    : ARRAY OF CFLOAT;
+                    IncY : INTEGER);
+          CONST veclen    = 4;
+          VAR   i,ix,iy,m : INTEGER;
+BEGIN
+      IF (n <= 0 ) THEN RETURN; END;
+      IF (da = 0.0) THEN RETURN; END;
+      IF ((IncX <> 1) OR (IncY <> 1)) THEN
+        (* code for unequal increments or equal increments <> 1 *)
+        ix := 1;
+        iy := 1;
+        IF (IncX < 0) THEN ix := (-n+1)*IncX + 1; END;
+        IF (IncY < 0) THEN iy := (-n+1)*IncY + 1; END;
+        FOR i:=0 TO n-1 DO
+          Y[iy] := Y[iy] + da*X[ix];
+          INC(ix, IncX);
+          INC(iy, IncY);
+        END;
+      ELSE (* code for both increments equal to 1 *)
+        m := n REM veclen;
+        IF (m <> 0) THEN
+          FOR i:=0 TO m-1 DO
+            Y[i] := Y[i] + da*X[i];
+          END;
+          IF (n < veclen) THEN RETURN; END;
+        END;
+        FOR i:=m TO n-1 BY veclen DO
+          Y[i] := Y[i] + da*X[i];
+          Y[i+1] := Y[i+1] + da*X[i+1];
+          Y[i+2] := Y[i+2] + da*X[i+2];
+          Y[i+3] := Y[i+3] + da*X[i+3];
+        END;
+      END;
+END zaxpy;
+PROCEDURE zdrot(    N    : INTEGER;
+                VAR X    : ARRAY OF CFLOAT;
+                    IncX : INTEGER;
+                VAR Y    : ARRAY OF CFLOAT;
+                    IncY : INTEGER;
+                    c,s  : FLOAT);
+          VAR i,ix,iy : INTEGER;
+              tmp     : CFLOAT;
+BEGIN
+      IF (IncX = 1) AND (IncY = 1) THEN
+        FOR i:=0 TO N-1 DO
+          tmp    := scalarMult( c,X[i]) + scalarMult(s,Y[i]);
+          Y[i] := scalarMult(-s,X[i]) + scalarMult(c,Y[i]);
+          X[i] := tmp;
+        END;
+      ELSE
+        IF (IncX > 0) THEN ix:=0; ELSE ix:=(1 - VAL(INTEGER,N))*IncX; END;
+        IF (IncY > 0) THEN iy:=0; ELSE iy:=(1 - VAL(INTEGER,N))*IncY; END;
+        FOR i:=0 TO N-1 DO
+          tmp   := scalarMult( c,X[ix]) + scalarMult(s,Y[iy]);
+          Y[iy] := scalarMult(-s,X[ix]) + scalarMult(c,Y[iy]);
+          X[iy] := tmp;
+          ix := ix + IncX;
+          iy := iy + IncY;
+        END;
+      END;
+END zdrot;
+PROCEDURE zgemv(    Trans : CHAR;
+                    M,N   : INTEGER;
+                    Alpha : CFLOAT;
+                VAR A     : ARRAY OF ARRAY OF CFLOAT;
+                    lda   : INTEGER;
+                VAR X     : ARRAY OF CFLOAT;
+                    IncX  : INTEGER;
+                    Beta  : CFLOAT;
+                VAR Y     : ARRAY OF CFLOAT;
+                    IncY  : INTEGER);
+          VAR i,j,iy,jx,kx,ky : INTEGER;
+              lenx,leny,info  : INTEGER;
+              s               : CFLOAT;
+              noconj          : BOOLEAN;
+BEGIN
+      (* test the input parameters *)
+      info := 0;
+      IF (NOT (CAP(Trans) = 'N')) AND (NOT (CAP(Trans) = 'T')) AND
+         (NOT (CAP(Trans) = 'C'))
+      THEN
+        info := 1;
+      ELSIF (M < 0) THEN
+        info := 2;
+      ELSIF (N < 0) THEN
+        info := 3;
+      ELSIF (lda < MAX0(1,M)) THEN
+        info := 6;
+      ELSIF (IncX = 0) THEN
+        info := 8;
+      ELSIF (IncY = 0) THEN
+        info := 11;
+      END;
+      IF (info # 0) THEN (* Fehlerbehandlung ! *)
+        Errors.WriteLn; Errors.WriteLn;
+        Errors.WriteString("Fehler in LibDBlas.zgemv, info = ");
+        Errors.WriteInt(info);
+        Errors.WriteLn; Errors.WriteLn;
+        RETURN;
+      END;
+      (* quick return if possible *)
+      IF ((M = 0) OR (N = 0) OR ((Alpha = zero) AND (Beta = one))) THEN
+        RETURN
+      END;
+      noconj := (CAP(Trans) = 'T');
+      (* set lenx  and  leny, the lengths of the vectors X and Y, *)
+      (* and set up the start points in X and Y.                  *)
+      IF (CAP(Trans) = 'N') THEN
+        lenx := N;
+        leny := M;
+      ELSE
+        lenx := M;
+        leny := N;
+      END;
+      IF (IncX > 0) THEN
+        kx := 1;
+      ELSE
+        kx := 1 - (lenx-1)*IncX;
+      END;
+      IF (IncY > 0) THEN
+        ky := 1;
+      ELSE
+        ky := 1 - (leny-1)*IncY;
+      END;
+      (* start the operations. In this version the elements of A are *)
+      (* accessed sequentially with one pass through A               *)
+      (* first form Y = Beta*Y *)
+      IF (Beta # one) THEN
+        IF (IncY # 1) THEN
+          iy := ky - 1;
+          IF (Beta = zero) THEN
+            FOR i:=0 TO leny-1 DO
+              Y[iy] := zero;
+              INC(iy,IncY);
+            END; (* FOR *)
+          ELSE
+            FOR i:=0 TO leny-1 DO
+              Y[iy] := Beta*Y[iy];
+              INC(iy,IncY);
+            END; (* FOR *)
+          END; (* IF *)
+        ELSE
+          IF (Beta = zero) THEN
+            FOR i:=0 TO leny-1 DO
+              Y[i] := zero;
+            END;
+          ELSE
+            FOR i:=0 TO leny-1 DO
+              Y[i] := Beta*Y[i];
+            END;
+          END; (* IF *)
+        END; (* IF *)
+      END; (* IF *)
+      IF (Alpha = zero) THEN RETURN END;
+      IF (CAP(Trans) = 'N') THEN (* Form  y := alpha*A*x + y. *)
+        IF (IncX = 1) AND (IncY = 1) THEN
+          FOR i:=0 TO M-1 DO
+            s:=zero;
+            FOR j:=0 TO N-1 DO
+              s:=s + Alpha*A[i,j]*X[j];
+            END;
+            Y[i]:=Y[i] + s;
+          END;
+        ELSE
+          iy:=ky-1;
+          FOR i:=0 TO M-1 DO
+            s:=zero;
+            jx:=kx-1;
+            FOR j:=0 TO N-1 DO
+              s:=s + Alpha*A[i,j]*X[jx]; INC(jx,IncX);
+            END;
+            Y[iy]:=Y[iy] + s; INC(iy,IncY);
+          END;
+        END;
+      ELSE
+        (* Form  Y = Alpha*A'*X + Y or Y = Alpha*conj(A')*x + y. *)
+        IF (IncX = 1) AND (IncY = 1) THEN
+          FOR j:=0 TO M-1 DO
+            IF noconj THEN
+              FOR i:=0 TO N-1 DO
+                Y[i]:=Y[i] + Alpha*A[j,i]*X[j];
+              END;
+            ELSE (* (CAP(Trans) = "C") *)
+              FOR i:=0 TO N-1 DO
+                Y[i]:=Y[i] + Alpha*conj(A[j,i])*X[j];
+              END;
+            END;
+          END;
+        ELSE
+          jx:=kx-1;
+          FOR j:=0 TO M-1 DO
+            IF noconj THEN
+              iy:=ky-1;
+              FOR i:=0 TO N-1 DO
+                Y[iy]:=Y[iy] + Alpha*A[j,i]*X[jx]; INC(iy,IncY);
+              END;
+            ELSE (* (CAP(Trans) = "C") *)
+              iy:=ky-1;
+              FOR i:=0 TO N-1 DO
+                Y[iy]:=Y[iy] + Alpha*conj(A[j,i])*X[jx]; INC(iy,IncY);
+              END;
+            END;
+            INC(jx,IncX);
+          END; (* FOR j *)
+        END;
+      END; (* IF Trans *)
+END zgemv;
 PROCEDURE zgemm(    TransA,TransB : CHAR;
                     M,N,K         : INTEGER;
-                    Alpha         : LONGCOMPLEX;
+                    Alpha         : CFLOAT;
-                VAR A             : ARRAY OF ARRAY OF LONGCOMPLEX;
+                VAR A             : ARRAY OF ARRAY OF CFLOAT;
                     LDA           : INTEGER;
-                VAR B             : ARRAY OF ARRAY OF LONGCOMPLEX;
+                VAR B             : ARRAY OF ARRAY OF CFLOAT;
                     LDB           : INTEGER;
-                    Beta          : LONGCOMPLEX;
+                    Beta          : CFLOAT;
-                VAR C             : ARRAY OF ARRAY OF LONGCOMPLEX;
+                VAR C             : ARRAY OF ARRAY OF CFLOAT;
                     LDC           : INTEGER);
           CONST zero                   = CMPLX(0.0,0.0);
                 one                    = CMPLX(1.0,0.0);
           VAR   NotA,NotB,ConjA,ConjB  : BOOLEAN;
                 i,j,k,Info,NRowA,NRowB : INTEGER;
-                Temp,Aki,Aik           : LONGCOMPLEX;
+                Temp,Aki,Aik           : CFLOAT;
                 Nm1,Mm1,Km1            : INTEGER;
 BEGIN
       (* Set NotA and NotB as true if A and B respectively are not *)
       (* transposed and set NRowA, NColA and NRowB as the number of rows *)
       (* and columns of A and the number of rows of B respectively. *)