[ tor-browser ].git.dasho

vorbis_mdct.c (15493B)
      1 /********************************************************************
      2 *                                                                  *
      3 * THIS FILE IS PART OF THE OggVorbis SOFTWARE CODEC SOURCE CODE.   *
      4 * USE, DISTRIBUTION AND REPRODUCTION OF THIS LIBRARY SOURCE IS     *
      5 * GOVERNED BY A BSD-STYLE SOURCE LICENSE INCLUDED WITH THIS SOURCE *
      6 * IN 'COPYING'. PLEASE READ THESE TERMS BEFORE DISTRIBUTING.       *
      7 *                                                                  *
      8 * THE OggVorbis SOURCE CODE IS (C) COPYRIGHT 1994-2009             *
      9 * by the Xiph.Org Foundation https://xiph.org/                     *
     10 *                                                                  *
     11 ********************************************************************
     12 
     13 function: normalized modified discrete cosine transform
     14           power of two length transform only [64 <= n ]
     15 
     16 Original algorithm adapted long ago from _The use of multirate filter
     17 banks for coding of high quality digital audio_, by T. Sporer,
     18 K. Brandenburg and B. Edler, collection of the European Signal
     19 Processing Conference (EUSIPCO), Amsterdam, June 1992, Vol.1, pp
     20 211-214
     21 
     22 The below code implements an algorithm that no longer looks much like
     23 that presented in the paper, but the basic structure remains if you
     24 dig deep enough to see it.
     25 
     26 This module DOES NOT INCLUDE code to generate/apply the window
     27 function.  Everybody has their own weird favorite including me... I
     28 happen to like the properties of y=sin(.5PI*sin^2(x)), but others may
     29 vehemently disagree.
     30 
     31 ********************************************************************/
     32 
     33 /* this can also be run as an integer transform by uncommenting a
     34   define in mdct.h; the integerization is a first pass and although
     35   it's likely stable for Vorbis, the dynamic range is constrained and
     36   roundoff isn't done (so it's noisy).  Consider it functional, but
     37   only a starting point.  There's no point on a machine with an FPU */
     38 
     39 #include <stdio.h>
     40 #include <stdlib.h>
     41 #include <string.h>
     42 #include <math.h>
     43 #include "vorbis/codec.h"
     44 #include "mdct.h"
     45 #include "os.h"
     46 #include "misc.h"
     47 
     48 /* build lookups for trig functions; also pre-figure scaling and
     49   some window function algebra. */
     50 
     51 void mdct_init(mdct_lookup *lookup,int n){
     52  int   *bitrev=_ogg_malloc(sizeof(*bitrev)*(n/4));
     53  DATA_TYPE *T=_ogg_malloc(sizeof(*T)*(n+n/4));
     54 
     55  int i;
     56  int n2=n>>1;
     57  int log2n=lookup->log2n=rint(log((float)n)/log(2.f));
     58  lookup->n=n;
     59  lookup->trig=T;
     60  lookup->bitrev=bitrev;
     61 
     62 /* trig lookups... */
     63 
     64  for(i=0;i<n/4;i++){
     65    T[i*2]=FLOAT_CONV(cos((M_PI/n)*(4*i)));
     66    T[i*2+1]=FLOAT_CONV(-sin((M_PI/n)*(4*i)));
     67    T[n2+i*2]=FLOAT_CONV(cos((M_PI/(2*n))*(2*i+1)));
     68    T[n2+i*2+1]=FLOAT_CONV(sin((M_PI/(2*n))*(2*i+1)));
     69  }
     70  for(i=0;i<n/8;i++){
     71    T[n+i*2]=FLOAT_CONV(cos((M_PI/n)*(4*i+2))*.5);
     72    T[n+i*2+1]=FLOAT_CONV(-sin((M_PI/n)*(4*i+2))*.5);
     73  }
     74 
     75  /* bitreverse lookup... */
     76 
     77  {
     78    int mask=(1<<(log2n-1))-1,i,j;
     79    int msb=1<<(log2n-2);
     80    for(i=0;i<n/8;i++){
     81      int acc=0;
     82      for(j=0;msb>>j;j++)
     83        if((msb>>j)&i)acc|=1<<j;
     84      bitrev[i*2]=((~acc)&mask)-1;
     85      bitrev[i*2+1]=acc;
     86 
     87    }
     88  }
     89  lookup->scale=FLOAT_CONV(4.f/n);
     90 }
     91 
     92 /* 8 point butterfly (in place, 4 register) */
     93 STIN void mdct_butterfly_8(DATA_TYPE *x){
     94  REG_TYPE r0   = x[6] + x[2];
     95  REG_TYPE r1   = x[6] - x[2];
     96  REG_TYPE r2   = x[4] + x[0];
     97  REG_TYPE r3   = x[4] - x[0];
     98 
     99           x[6] = r0   + r2;
    100           x[4] = r0   - r2;
    101 
    102           r0   = x[5] - x[1];
    103           r2   = x[7] - x[3];
    104           x[0] = r1   + r0;
    105           x[2] = r1   - r0;
    106 
    107           r0   = x[5] + x[1];
    108           r1   = x[7] + x[3];
    109           x[3] = r2   + r3;
    110           x[1] = r2   - r3;
    111           x[7] = r1   + r0;
    112           x[5] = r1   - r0;
    113 
    114 }
    115 
    116 /* 16 point butterfly (in place, 4 register) */
    117 STIN void mdct_butterfly_16(DATA_TYPE *x){
    118  REG_TYPE r0     = x[1]  - x[9];
    119  REG_TYPE r1     = x[0]  - x[8];
    120 
    121           x[8]  += x[0];
    122           x[9]  += x[1];
    123           x[0]   = MULT_NORM((r0   + r1) * cPI2_8);
    124           x[1]   = MULT_NORM((r0   - r1) * cPI2_8);
    125 
    126           r0     = x[3]  - x[11];
    127           r1     = x[10] - x[2];
    128           x[10] += x[2];
    129           x[11] += x[3];
    130           x[2]   = r0;
    131           x[3]   = r1;
    132 
    133           r0     = x[12] - x[4];
    134           r1     = x[13] - x[5];
    135           x[12] += x[4];
    136           x[13] += x[5];
    137           x[4]   = MULT_NORM((r0   - r1) * cPI2_8);
    138           x[5]   = MULT_NORM((r0   + r1) * cPI2_8);
    139 
    140           r0     = x[14] - x[6];
    141           r1     = x[15] - x[7];
    142           x[14] += x[6];
    143           x[15] += x[7];
    144           x[6]  = r0;
    145           x[7]  = r1;
    146 
    147           mdct_butterfly_8(x);
    148           mdct_butterfly_8(x+8);
    149 }
    150 
    151 /* 32 point butterfly (in place, 4 register) */
    152 STIN void mdct_butterfly_32(DATA_TYPE *x){
    153  REG_TYPE r0     = x[30] - x[14];
    154  REG_TYPE r1     = x[31] - x[15];
    155 
    156           x[30] +=         x[14];
    157           x[31] +=         x[15];
    158           x[14]  =         r0;
    159           x[15]  =         r1;
    160 
    161           r0     = x[28] - x[12];
    162           r1     = x[29] - x[13];
    163           x[28] +=         x[12];
    164           x[29] +=         x[13];
    165           x[12]  = MULT_NORM( r0 * cPI1_8  -  r1 * cPI3_8 );
    166           x[13]  = MULT_NORM( r0 * cPI3_8  +  r1 * cPI1_8 );
    167 
    168           r0     = x[26] - x[10];
    169           r1     = x[27] - x[11];
    170           x[26] +=         x[10];
    171           x[27] +=         x[11];
    172           x[10]  = MULT_NORM(( r0  - r1 ) * cPI2_8);
    173           x[11]  = MULT_NORM(( r0  + r1 ) * cPI2_8);
    174 
    175           r0     = x[24] - x[8];
    176           r1     = x[25] - x[9];
    177           x[24] += x[8];
    178           x[25] += x[9];
    179           x[8]   = MULT_NORM( r0 * cPI3_8  -  r1 * cPI1_8 );
    180           x[9]   = MULT_NORM( r1 * cPI3_8  +  r0 * cPI1_8 );
    181 
    182           r0     = x[22] - x[6];
    183           r1     = x[7]  - x[23];
    184           x[22] += x[6];
    185           x[23] += x[7];
    186           x[6]   = r1;
    187           x[7]   = r0;
    188 
    189           r0     = x[4]  - x[20];
    190           r1     = x[5]  - x[21];
    191           x[20] += x[4];
    192           x[21] += x[5];
    193           x[4]   = MULT_NORM( r1 * cPI1_8  +  r0 * cPI3_8 );
    194           x[5]   = MULT_NORM( r1 * cPI3_8  -  r0 * cPI1_8 );
    195 
    196           r0     = x[2]  - x[18];
    197           r1     = x[3]  - x[19];
    198           x[18] += x[2];
    199           x[19] += x[3];
    200           x[2]   = MULT_NORM(( r1  + r0 ) * cPI2_8);
    201           x[3]   = MULT_NORM(( r1  - r0 ) * cPI2_8);
    202 
    203           r0     = x[0]  - x[16];
    204           r1     = x[1]  - x[17];
    205           x[16] += x[0];
    206           x[17] += x[1];
    207           x[0]   = MULT_NORM( r1 * cPI3_8  +  r0 * cPI1_8 );
    208           x[1]   = MULT_NORM( r1 * cPI1_8  -  r0 * cPI3_8 );
    209 
    210           mdct_butterfly_16(x);
    211           mdct_butterfly_16(x+16);
    212 
    213 }
    214 
    215 /* N point first stage butterfly (in place, 2 register) */
    216 STIN void mdct_butterfly_first(DATA_TYPE *T,
    217                                        DATA_TYPE *x,
    218                                        int points){
    219 
    220  DATA_TYPE *x1        = x          + points      - 8;
    221  DATA_TYPE *x2        = x          + (points>>1) - 8;
    222  REG_TYPE   r0;
    223  REG_TYPE   r1;
    224 
    225  do{
    226 
    227               r0      = x1[6]      -  x2[6];
    228               r1      = x1[7]      -  x2[7];
    229               x1[6]  += x2[6];
    230               x1[7]  += x2[7];
    231               x2[6]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
    232               x2[7]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
    233 
    234               r0      = x1[4]      -  x2[4];
    235               r1      = x1[5]      -  x2[5];
    236               x1[4]  += x2[4];
    237               x1[5]  += x2[5];
    238               x2[4]   = MULT_NORM(r1 * T[5]  +  r0 * T[4]);
    239               x2[5]   = MULT_NORM(r1 * T[4]  -  r0 * T[5]);
    240 
    241               r0      = x1[2]      -  x2[2];
    242               r1      = x1[3]      -  x2[3];
    243               x1[2]  += x2[2];
    244               x1[3]  += x2[3];
    245               x2[2]   = MULT_NORM(r1 * T[9]  +  r0 * T[8]);
    246               x2[3]   = MULT_NORM(r1 * T[8]  -  r0 * T[9]);
    247 
    248               r0      = x1[0]      -  x2[0];
    249               r1      = x1[1]      -  x2[1];
    250               x1[0]  += x2[0];
    251               x1[1]  += x2[1];
    252               x2[0]   = MULT_NORM(r1 * T[13] +  r0 * T[12]);
    253               x2[1]   = MULT_NORM(r1 * T[12] -  r0 * T[13]);
    254 
    255    x1-=8;
    256    x2-=8;
    257    T+=16;
    258 
    259  }while(x2>=x);
    260 }
    261 
    262 /* N/stage point generic N stage butterfly (in place, 2 register) */
    263 STIN void mdct_butterfly_generic(DATA_TYPE *T,
    264                                          DATA_TYPE *x,
    265                                          int points,
    266                                          int trigint){
    267 
    268  DATA_TYPE *x1        = x          + points      - 8;
    269  DATA_TYPE *x2        = x          + (points>>1) - 8;
    270  REG_TYPE   r0;
    271  REG_TYPE   r1;
    272 
    273  do{
    274 
    275               r0      = x1[6]      -  x2[6];
    276               r1      = x1[7]      -  x2[7];
    277               x1[6]  += x2[6];
    278               x1[7]  += x2[7];
    279               x2[6]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
    280               x2[7]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
    281 
    282               T+=trigint;
    283 
    284               r0      = x1[4]      -  x2[4];
    285               r1      = x1[5]      -  x2[5];
    286               x1[4]  += x2[4];
    287               x1[5]  += x2[5];
    288               x2[4]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
    289               x2[5]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
    290 
    291               T+=trigint;
    292 
    293               r0      = x1[2]      -  x2[2];
    294               r1      = x1[3]      -  x2[3];
    295               x1[2]  += x2[2];
    296               x1[3]  += x2[3];
    297               x2[2]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
    298               x2[3]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
    299 
    300               T+=trigint;
    301 
    302               r0      = x1[0]      -  x2[0];
    303               r1      = x1[1]      -  x2[1];
    304               x1[0]  += x2[0];
    305               x1[1]  += x2[1];
    306               x2[0]   = MULT_NORM(r1 * T[1]  +  r0 * T[0]);
    307               x2[1]   = MULT_NORM(r1 * T[0]  -  r0 * T[1]);
    308 
    309               T+=trigint;
    310    x1-=8;
    311    x2-=8;
    312 
    313  }while(x2>=x);
    314 }
    315 
    316 STIN void mdct_butterflies(mdct_lookup *init,
    317                             DATA_TYPE *x,
    318                             int points){
    319 
    320  DATA_TYPE *T=init->trig;
    321  int stages=init->log2n-5;
    322  int i,j;
    323 
    324  if(--stages>0){
    325    mdct_butterfly_first(T,x,points);
    326  }
    327 
    328  for(i=1;--stages>0;i++){
    329    for(j=0;j<(1<<i);j++)
    330      mdct_butterfly_generic(T,x+(points>>i)*j,points>>i,4<<i);
    331  }
    332 
    333  for(j=0;j<points;j+=32)
    334    mdct_butterfly_32(x+j);
    335 
    336 }
    337 
    338 void mdct_clear(mdct_lookup *l){
    339  if(l){
    340    if(l->trig)_ogg_free(l->trig);
    341    if(l->bitrev)_ogg_free(l->bitrev);
    342    memset(l,0,sizeof(*l));
    343  }
    344 }
    345 
    346 STIN void mdct_bitreverse(mdct_lookup *init,
    347                            DATA_TYPE *x){
    348  int        n       = init->n;
    349  int       *bit     = init->bitrev;
    350  DATA_TYPE *w0      = x;
    351  DATA_TYPE *w1      = x = w0+(n>>1);
    352  DATA_TYPE *T       = init->trig+n;
    353 
    354  do{
    355    DATA_TYPE *x0    = x+bit[0];
    356    DATA_TYPE *x1    = x+bit[1];
    357 
    358    REG_TYPE  r0     = x0[1]  - x1[1];
    359    REG_TYPE  r1     = x0[0]  + x1[0];
    360    REG_TYPE  r2     = MULT_NORM(r1     * T[0]   + r0 * T[1]);
    361    REG_TYPE  r3     = MULT_NORM(r1     * T[1]   - r0 * T[0]);
    362 
    363              w1    -= 4;
    364 
    365              r0     = HALVE(x0[1] + x1[1]);
    366              r1     = HALVE(x0[0] - x1[0]);
    367 
    368              w0[0]  = r0     + r2;
    369              w1[2]  = r0     - r2;
    370              w0[1]  = r1     + r3;
    371              w1[3]  = r3     - r1;
    372 
    373              x0     = x+bit[2];
    374              x1     = x+bit[3];
    375 
    376              r0     = x0[1]  - x1[1];
    377              r1     = x0[0]  + x1[0];
    378              r2     = MULT_NORM(r1     * T[2]   + r0 * T[3]);
    379              r3     = MULT_NORM(r1     * T[3]   - r0 * T[2]);
    380 
    381              r0     = HALVE(x0[1] + x1[1]);
    382              r1     = HALVE(x0[0] - x1[0]);
    383 
    384              w0[2]  = r0     + r2;
    385              w1[0]  = r0     - r2;
    386              w0[3]  = r1     + r3;
    387              w1[1]  = r3     - r1;
    388 
    389              T     += 4;
    390              bit   += 4;
    391              w0    += 4;
    392 
    393  }while(w0<w1);
    394 }
    395 
    396 void mdct_backward(mdct_lookup *init, DATA_TYPE *in, DATA_TYPE *out){
    397  int n=init->n;
    398  int n2=n>>1;
    399  int n4=n>>2;
    400 
    401  /* rotate */
    402 
    403  DATA_TYPE *iX = in+n2-7;
    404  DATA_TYPE *oX = out+n2+n4;
    405  DATA_TYPE *T  = init->trig+n4;
    406 
    407  do{
    408    oX         -= 4;
    409    oX[0]       = MULT_NORM(-iX[2] * T[3] - iX[0]  * T[2]);
    410    oX[1]       = MULT_NORM (iX[0] * T[3] - iX[2]  * T[2]);
    411    oX[2]       = MULT_NORM(-iX[6] * T[1] - iX[4]  * T[0]);
    412    oX[3]       = MULT_NORM (iX[4] * T[1] - iX[6]  * T[0]);
    413    iX         -= 8;
    414    T          += 4;
    415  }while(iX>=in);
    416 
    417  iX            = in+n2-8;
    418  oX            = out+n2+n4;
    419  T             = init->trig+n4;
    420 
    421  do{
    422    T          -= 4;
    423    oX[0]       =  MULT_NORM (iX[4] * T[3] + iX[6] * T[2]);
    424    oX[1]       =  MULT_NORM (iX[4] * T[2] - iX[6] * T[3]);
    425    oX[2]       =  MULT_NORM (iX[0] * T[1] + iX[2] * T[0]);
    426    oX[3]       =  MULT_NORM (iX[0] * T[0] - iX[2] * T[1]);
    427    iX         -= 8;
    428    oX         += 4;
    429  }while(iX>=in);
    430 
    431  mdct_butterflies(init,out+n2,n2);
    432  mdct_bitreverse(init,out);
    433 
    434  /* roatate + window */
    435 
    436  {
    437    DATA_TYPE *oX1=out+n2+n4;
    438    DATA_TYPE *oX2=out+n2+n4;
    439    DATA_TYPE *iX =out;
    440    T             =init->trig+n2;
    441 
    442    do{
    443      oX1-=4;
    444 
    445      oX1[3]  =  MULT_NORM (iX[0] * T[1] - iX[1] * T[0]);
    446      oX2[0]  = -MULT_NORM (iX[0] * T[0] + iX[1] * T[1]);
    447 
    448      oX1[2]  =  MULT_NORM (iX[2] * T[3] - iX[3] * T[2]);
    449      oX2[1]  = -MULT_NORM (iX[2] * T[2] + iX[3] * T[3]);
    450 
    451      oX1[1]  =  MULT_NORM (iX[4] * T[5] - iX[5] * T[4]);
    452      oX2[2]  = -MULT_NORM (iX[4] * T[4] + iX[5] * T[5]);
    453 
    454      oX1[0]  =  MULT_NORM (iX[6] * T[7] - iX[7] * T[6]);
    455      oX2[3]  = -MULT_NORM (iX[6] * T[6] + iX[7] * T[7]);
    456 
    457      oX2+=4;
    458      iX    +=   8;
    459      T     +=   8;
    460    }while(iX<oX1);
    461 
    462    iX=out+n2+n4;
    463    oX1=out+n4;
    464    oX2=oX1;
    465 
    466    do{
    467      oX1-=4;
    468      iX-=4;
    469 
    470      oX2[0] = -(oX1[3] = iX[3]);
    471      oX2[1] = -(oX1[2] = iX[2]);
    472      oX2[2] = -(oX1[1] = iX[1]);
    473      oX2[3] = -(oX1[0] = iX[0]);
    474 
    475      oX2+=4;
    476    }while(oX2<iX);
    477 
    478    iX=out+n2+n4;
    479    oX1=out+n2+n4;
    480    oX2=out+n2;
    481    do{
    482      oX1-=4;
    483      oX1[0]= iX[3];
    484      oX1[1]= iX[2];
    485      oX1[2]= iX[1];
    486      oX1[3]= iX[0];
    487      iX+=4;
    488    }while(oX1>oX2);
    489  }
    490 }
    491 
    492 void mdct_forward(mdct_lookup *init, DATA_TYPE *in, DATA_TYPE *out){
    493  int n=init->n;
    494  int n2=n>>1;
    495  int n4=n>>2;
    496  int n8=n>>3;
    497  DATA_TYPE *w=alloca(n*sizeof(*w)); /* forward needs working space */
    498  DATA_TYPE *w2=w+n2;
    499 
    500  /* rotate */
    501 
    502  /* window + rotate + step 1 */
    503 
    504  REG_TYPE r0;
    505  REG_TYPE r1;
    506  DATA_TYPE *x0=in+n2+n4;
    507  DATA_TYPE *x1=x0+1;
    508  DATA_TYPE *T=init->trig+n2;
    509 
    510  int i=0;
    511 
    512  for(i=0;i<n8;i+=2){
    513    x0 -=4;
    514    T-=2;
    515    r0= x0[2] + x1[0];
    516    r1= x0[0] + x1[2];
    517    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
    518    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
    519    x1 +=4;
    520  }
    521 
    522  x1=in+1;
    523 
    524  for(;i<n2-n8;i+=2){
    525    T-=2;
    526    x0 -=4;
    527    r0= x0[2] - x1[0];
    528    r1= x0[0] - x1[2];
    529    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
    530    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
    531    x1 +=4;
    532  }
    533 
    534  x0=in+n;
    535 
    536  for(;i<n2;i+=2){
    537    T-=2;
    538    x0 -=4;
    539    r0= -x0[2] - x1[0];
    540    r1= -x0[0] - x1[2];
    541    w2[i]=   MULT_NORM(r1*T[1] + r0*T[0]);
    542    w2[i+1]= MULT_NORM(r1*T[0] - r0*T[1]);
    543    x1 +=4;
    544  }
    545 
    546 
    547  mdct_butterflies(init,w+n2,n2);
    548  mdct_bitreverse(init,w);
    549 
    550  /* roatate + window */
    551 
    552  T=init->trig+n2;
    553  x0=out+n2;
    554 
    555  for(i=0;i<n4;i++){
    556    x0--;
    557    out[i] =MULT_NORM((w[0]*T[0]+w[1]*T[1])*init->scale);
    558    x0[0]  =MULT_NORM((w[0]*T[1]-w[1]*T[0])*init->scale);
    559    w+=2;
    560    T+=2;
    561  }
    562 }
	tor-browser The Tor Browser
	git clone https://git.dasho.dev/tor-browser.git
	Log \| Files \| Refs \| README \| LICENSE