tor-browser

The Tor Browser
git clone https://git.dasho.dev/tor-browser.git
Log | Files | Refs | README | LICENSE

montmulfv8.s (60099B)


      1 !  
      2 ! This Source Code Form is subject to the terms of the Mozilla Public
      3 ! License, v. 2.0. If a copy of the MPL was not distributed with this
      4 ! file, You can obtain one at http://mozilla.org/MPL/2.0/.
      5 
      6 .section	".text",#alloc,#execinstr
      7 .file	"montmulf.c"
      8 
      9 .section	".rodata",#alloc
     10 .global	TwoTo16
     11 .align	8
     12 !
     13 ! CONSTANT POOL
     14 !
     15 .global TwoTo16
     16 TwoTo16:
     17 .word	1089470464
     18 .word	0
     19 .type	TwoTo16,#object
     20 .size	TwoTo16,8
     21 .global	TwoToMinus16
     22 !
     23 ! CONSTANT POOL
     24 !
     25 .global TwoToMinus16
     26 TwoToMinus16:
     27 .word	1055916032
     28 .word	0
     29 .type	TwoToMinus16,#object
     30 .size	TwoToMinus16,8
     31 .global	Zero
     32 !
     33 ! CONSTANT POOL
     34 !
     35 .global Zero
     36 Zero:
     37 .word	0
     38 .word	0
     39 .type	Zero,#object
     40 .size	Zero,8
     41 .global	TwoTo32
     42 !
     43 ! CONSTANT POOL
     44 !
     45 .global TwoTo32
     46 TwoTo32:
     47 .word	1106247680
     48 .word	0
     49 .type	TwoTo32,#object
     50 .size	TwoTo32,8
     51 .global	TwoToMinus32
     52 !
     53 ! CONSTANT POOL
     54 !
     55 .global TwoToMinus32
     56 TwoToMinus32:
     57 .word	1039138816
     58 .word	0
     59 .type	TwoToMinus32,#object
     60 .size	TwoToMinus32,8
     61 
     62 .section	".text",#alloc,#execinstr
     63 /* 000000	   0 */		.align	4
     64 !
     65 ! SUBROUTINE conv_d16_to_i32
     66 !
     67 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
     68 
     69                       	.global conv_d16_to_i32
     70                       conv_d16_to_i32:
     71 /* 000000	     */		save	%sp,-128,%sp
     72 ! FILE montmulf.c
     73 
     74 !   36		      !#define RF_INLINE_MACROS
     75 !   38		      !static const double TwoTo16=65536.0;
     76 !   39		      !static const double TwoToMinus16=1.0/65536.0;
     77 !   40		      !static const double Zero=0.0;
     78 !   41		      !static const double TwoTo32=65536.0*65536.0;
     79 !   42		      !static const double TwoToMinus32=1.0/(65536.0*65536.0);
     80 !   44		      !#ifdef RF_INLINE_MACROS
     81 !   46		      !double upper32(double);
     82 !   47		      !double lower32(double, double);
     83 !   48		      !double mod(double, double, double);
     84 !   50		      !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/, 
     85 !   51		      !			  const double * /* 2^16*/,
     86 !   52		      !			  const double * /* 0 */,
     87 !   53		      !			  double *       /*result16*/, 
     88 !   54		      !			  double *       /* result32 */,
     89 !   55		      !			  float *  /*source - should be unsigned int*
     90 !   56		      !		          	       converted to float* */);
     91 !   58		      !#else
     92 !   60		      !static double upper32(double x)
     93 !   61		      !{
     94 !   62		      !  return floor(x*TwoToMinus32);
     95 !   63		      !}
     96 !   65		      !static double lower32(double x, double y)
     97 !   66		      !{
     98 !   67		      !  return x-TwoTo32*floor(x*TwoToMinus32);
     99 !   68		      !}
    100 !   70		      !static double mod(double x, double oneoverm, double m)
    101 !   71		      !{
    102 !   72		      !  return x-m*floor(x*oneoverm);
    103 !   73		      !}
    104 !   75		      !#endif
    105 !   78		      !static void cleanup(double *dt, int from, int tlen)
    106 !   79		      !{
    107 !   80		      ! int i;
    108 !   81		      ! double tmp,tmp1,x,x1;
    109 !   83		      ! tmp=tmp1=Zero;
    110 !   84		      ! /* original code **
    111 !   85		      ! for(i=2*from;i<2*tlen-2;i++)
    112 !   86		      !   {
    113 !   87		      !     x=dt[i];
    114 !   88		      !     dt[i]=lower32(x,Zero)+tmp1;
    115 !   89		      !     tmp1=tmp;
    116 !   90		      !     tmp=upper32(x);
    117 !   91		      !   }
    118 !   92		      ! dt[tlen-2]+=tmp1;
    119 !   93		      ! dt[tlen-1]+=tmp;
    120 !   94		      ! **end original code ***/
    121 !   95		      ! /* new code ***/
    122 !   96		      ! for(i=2*from;i<2*tlen;i+=2)
    123 !   97		      !   {
    124 !   98		      !     x=dt[i];
    125 !   99		      !     x1=dt[i+1];
    126 !  100		      !     dt[i]=lower32(x,Zero)+tmp;
    127 !  101		      !     dt[i+1]=lower32(x1,Zero)+tmp1;
    128 !  102		      !     tmp=upper32(x);
    129 !  103		      !     tmp1=upper32(x1);
    130 !  104		      !   }
    131 !  105		      !  /** end new code **/
    132 !  106		      !}
    133 !  109		      !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen)
    134 !  110		      !{
    135 !  111		      !int i;
    136 !  112		      !long long t, t1, a, b, c, d;
    137 !  114		      ! t1=0;
    138 !  115		      ! a=(long long)d16[0];
    139 
    140 /* 0x0004	 115 */		ldd	[%i1],%f0
    141 /* 0x0008	 110 */		or	%g0,%i1,%o0
    142 
    143 !  116		      ! b=(long long)d16[1];
    144 !  117		      ! for(i=0; i<ilen-1; i++)
    145 
    146 /* 0x000c	 117 */		sub	%i3,1,%g2
    147 /* 0x0010	     */		cmp	%g2,0
    148 /* 0x0014	 114 */		or	%g0,0,%o4
    149 /* 0x0018	 115 */		fdtox	%f0,%f0
    150 /* 0x001c	     */		std	%f0,[%sp+120]
    151 /* 0x0020	 117 */		or	%g0,0,%o7
    152 /* 0x0024	 110 */		or	%g0,%i3,%o1
    153 /* 0x0028	     */		sub	%i3,2,%o2
    154 /* 0x002c	 116 */		ldd	[%o0+8],%f0
    155 /* 0x0030	 110 */		sethi	%hi(0xfc00),%o1
    156 /* 0x0034	     */		add	%o2,1,%g3
    157 /* 0x0038	     */		add	%o1,1023,%o1
    158 /* 0x003c	     */		or	%g0,%i0,%o5
    159 /* 0x0040	 116 */		fdtox	%f0,%f0
    160 /* 0x0044	     */		std	%f0,[%sp+112]
    161 /* 0x0048	     */		ldx	[%sp+112],%g1
    162 /* 0x004c	 115 */		ldx	[%sp+120],%g4
    163 /* 0x0050	 117 */		ble,pt	%icc,.L900000117
    164 /* 0x0054	     */		sethi	%hi(0xfc00),%g2
    165 /* 0x0058	 110 */		or	%g0,-1,%g2
    166 /* 0x005c	 117 */		cmp	%g3,3
    167 /* 0x0060	 110 */		srl	%g2,0,%o3
    168 /* 0x0064	 117 */		bl,pn	%icc,.L77000134
    169 /* 0x0068	     */		or	%g0,%o0,%g2
    170 
    171 !  118		      !   {
    172 !  119		      !     c=(long long)d16[2*i+2];
    173 
    174 /* 0x006c	 119 */		ldd	[%o0+16],%f0
    175 
    176 !  120		      !     t1+=a&0xffffffff;
    177 !  121		      !     t=(a>>32);
    178 !  122		      !     d=(long long)d16[2*i+3];
    179 !  123		      !     t1+=(b&0xffff)<<16;
    180 !  124		      !     t+=(b>>16)+(t1>>32);
    181 !  125		      !     i32[i]=t1&0xffffffff;
    182 !  126		      !     t1=t;
    183 !  127		      !     a=c;
    184 !  128		      !     b=d;
    185 
    186 /* 0x0070	 128 */		add	%o0,16,%g2
    187 /* 0x0074	 123 */		and	%g1,%o1,%o0
    188 /* 0x0078	     */		sllx	%o0,16,%g3
    189 /* 0x007c	 120 */		and	%g4,%o3,%o0
    190 /* 0x0080	 117 */		add	%o0,%g3,%o4
    191 /* 0x0084	 119 */		fdtox	%f0,%f0
    192 /* 0x0088	     */		std	%f0,[%sp+104]
    193 /* 0x008c	 125 */		and	%o4,%o3,%g5
    194 /* 0x0090	 122 */		ldd	[%g2+8],%f2
    195 /* 0x0094	 128 */		add	%o5,4,%o5
    196 /* 0x0098	 124 */		srax	%o4,32,%o4
    197 /* 0x009c	     */		stx	%o4,[%sp+112]
    198 /* 0x00a0	 122 */		fdtox	%f2,%f0
    199 /* 0x00a4	     */		std	%f0,[%sp+96]
    200 /* 0x00a8	 124 */		srax	%g1,16,%o0
    201 /* 0x00ac	     */		ldx	[%sp+112],%o7
    202 /* 0x00b0	 121 */		srax	%g4,32,%o4
    203 /* 0x00b4	 124 */		add	%o0,%o7,%g4
    204 /* 0x00b8	 128 */		or	%g0,1,%o7
    205 /* 0x00bc	 119 */		ldx	[%sp+104],%g3
    206 /* 0x00c0	 124 */		add	%o4,%g4,%o4
    207 /* 0x00c4	 122 */		ldx	[%sp+96],%g1
    208 /* 0x00c8	 125 */		st	%g5,[%o5-4]
    209 /* 0x00cc	 127 */		or	%g0,%g3,%g4
    210                       .L900000112:
    211 /* 0x00d0	 119 */		ldd	[%g2+16],%f0
    212 /* 0x00d4	 128 */		add	%o7,1,%o7
    213 /* 0x00d8	     */		add	%o5,4,%o5
    214 /* 0x00dc	     */		cmp	%o7,%o2
    215 /* 0x00e0	     */		add	%g2,16,%g2
    216 /* 0x00e4	 119 */		fdtox	%f0,%f0
    217 /* 0x00e8	     */		std	%f0,[%sp+104]
    218 /* 0x00ec	 122 */		ldd	[%g2+8],%f0
    219 /* 0x00f0	     */		fdtox	%f0,%f0
    220 /* 0x00f4	     */		std	%f0,[%sp+96]
    221 /* 0x00f8	 123 */		and	%g1,%o1,%g3
    222 /* 0x00fc	     */		sllx	%g3,16,%g5
    223 /* 0x0100	 120 */		and	%g4,%o3,%g3
    224 /* 0x0104	 117 */		add	%g3,%g5,%g3
    225 /* 0x0108	 124 */		srax	%g1,16,%g1
    226 /* 0x010c	 117 */		add	%g3,%o4,%g3
    227 /* 0x0110	 124 */		srax	%g3,32,%o4
    228 /* 0x0114	     */		stx	%o4,[%sp+112]
    229 /* 0x0118	 119 */		ldx	[%sp+104],%g5
    230 /* 0x011c	 121 */		srax	%g4,32,%o4
    231 /* 0x0120	 124 */		ldx	[%sp+112],%g4
    232 /* 0x0124	     */		add	%g1,%g4,%g4
    233 /* 0x0128	 122 */		ldx	[%sp+96],%g1
    234 /* 0x012c	 124 */		add	%o4,%g4,%o4
    235 /* 0x0130	 125 */		and	%g3,%o3,%g3
    236 /* 0x0134	 127 */		or	%g0,%g5,%g4
    237 /* 0x0138	 128 */		ble,pt	%icc,.L900000112
    238 /* 0x013c	     */		st	%g3,[%o5-4]
    239                       .L900000115:
    240 /* 0x0140	 128 */		ba	.L900000117
    241 /* 0x0144	     */		sethi	%hi(0xfc00),%g2
    242                       .L77000134:
    243 /* 0x0148	 119 */		ldd	[%g2+16],%f0
    244                       .L900000116:
    245 /* 0x014c	 120 */		and	%g4,%o3,%o0
    246 /* 0x0150	 123 */		and	%g1,%o1,%g3
    247 /* 0x0154	 119 */		fdtox	%f0,%f0
    248 /* 0x0158	 120 */		add	%o4,%o0,%o0
    249 /* 0x015c	 119 */		std	%f0,[%sp+104]
    250 /* 0x0160	 128 */		add	%o7,1,%o7
    251 /* 0x0164	 123 */		sllx	%g3,16,%o4
    252 /* 0x0168	 122 */		ldd	[%g2+24],%f2
    253 /* 0x016c	 128 */		add	%g2,16,%g2
    254 /* 0x0170	 123 */		add	%o0,%o4,%o0
    255 /* 0x0174	 128 */		cmp	%o7,%o2
    256 /* 0x0178	 125 */		and	%o0,%o3,%g3
    257 /* 0x017c	 122 */		fdtox	%f2,%f0
    258 /* 0x0180	     */		std	%f0,[%sp+96]
    259 /* 0x0184	 124 */		srax	%o0,32,%o0
    260 /* 0x0188	     */		stx	%o0,[%sp+112]
    261 /* 0x018c	 121 */		srax	%g4,32,%o4
    262 /* 0x0190	 122 */		ldx	[%sp+96],%o0
    263 /* 0x0194	 124 */		srax	%g1,16,%g5
    264 /* 0x0198	     */		ldx	[%sp+112],%g4
    265 /* 0x019c	 119 */		ldx	[%sp+104],%g1
    266 /* 0x01a0	 125 */		st	%g3,[%o5]
    267 /* 0x01a4	 124 */		add	%g5,%g4,%g4
    268 /* 0x01a8	 128 */		add	%o5,4,%o5
    269 /* 0x01ac	 124 */		add	%o4,%g4,%o4
    270 /* 0x01b0	 127 */		or	%g0,%g1,%g4
    271 /* 0x01b4	 128 */		or	%g0,%o0,%g1
    272 /* 0x01b8	     */		ble,a,pt	%icc,.L900000116
    273 /* 0x01bc	     */		ldd	[%g2+16],%f0
    274                       .L77000127:
    275 
    276 !  129		      !   }
    277 !  130		      !     t1+=a&0xffffffff;
    278 !  131		      !     t=(a>>32);
    279 !  132		      !     t1+=(b&0xffff)<<16;
    280 !  133		      !     i32[i]=t1&0xffffffff;
    281 
    282 /* 0x01c0	 133 */		sethi	%hi(0xfc00),%g2
    283                       .L900000117:
    284 /* 0x01c4	 133 */		or	%g0,-1,%g3
    285 /* 0x01c8	     */		add	%g2,1023,%g2
    286 /* 0x01cc	     */		srl	%g3,0,%g3
    287 /* 0x01d0	     */		and	%g1,%g2,%g2
    288 /* 0x01d4	     */		and	%g4,%g3,%g4
    289 /* 0x01d8	     */		sllx	%g2,16,%g2
    290 /* 0x01dc	     */		add	%o4,%g4,%g4
    291 /* 0x01e0	     */		add	%g4,%g2,%g2
    292 /* 0x01e4	     */		sll	%o7,2,%g4
    293 /* 0x01e8	     */		and	%g2,%g3,%g2
    294 /* 0x01ec	     */		st	%g2,[%i0+%g4]
    295 /* 0x01f0	     */		ret	! Result = 
    296 /* 0x01f4	     */		restore	%g0,%g0,%g0
    297 /* 0x01f8	   0 */		.type	conv_d16_to_i32,2
    298 /* 0x01f8	     */		.size	conv_d16_to_i32,(.-conv_d16_to_i32)
    299 
    300 .section	".text",#alloc,#execinstr
    301 /* 000000	   0 */		.align	8
    302 !
    303 ! CONSTANT POOL
    304 !
    305                       .L_const_seg_900000201:
    306 /* 000000	   0 */		.word	1127219200,0
    307 /* 0x0008	   0 */		.align	4
    308 /* 0x0008	     */		.skip	16
    309 !
    310 ! SUBROUTINE conv_i32_to_d32
    311 !
    312 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    313 
    314                       	.global conv_i32_to_d32
    315                       conv_i32_to_d32:
    316 /* 000000	     */		or	%g0,%o7,%g2
    317 
    318 !  135		      !}
    319 !  137		      !void conv_i32_to_d32(double *d32, unsigned int *i32, int len)
    320 !  138		      !{
    321 !  139		      !int i;
    322 !  141		      !#pragma pipeloop(0)
    323 !  142		      ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]);
    324 
    325 /* 0x0004	 142 */		cmp	%o2,0
    326                       .L900000210:
    327 /* 0x0008	     */		call	.+8
    328 /* 0x000c	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
    329 /* 0x0010	 142 */		or	%g0,0,%o5
    330 /* 0x0014	 138 */		add	%g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
    331 /* 0x0018	     */		or	%g0,%o0,%g5
    332 /* 0x001c	     */		add	%g4,%o7,%g1
    333 /* 0x0020	 142 */		ble,pt	%icc,.L77000140
    334 /* 0x0024	     */		or	%g0,%g2,%o7
    335 /* 0x0028	     */		sethi	%hi(.L_const_seg_900000201),%g2
    336 /* 0x002c	 138 */		or	%g0,%o1,%g4
    337 /* 0x0030	 142 */		add	%g2,%lo(.L_const_seg_900000201),%g2
    338 /* 0x0034	     */		sub	%o2,1,%g3
    339 /* 0x0038	     */		ld	[%g1+%g2],%g2
    340 /* 0x003c	     */		cmp	%o2,9
    341 /* 0x0040	     */		bl,pn	%icc,.L77000144
    342 /* 0x0044	     */		ldd	[%g2],%f8
    343 /* 0x0048	     */		add	%o1,16,%g4
    344 /* 0x004c	     */		sub	%o2,5,%g1
    345 /* 0x0050	     */		ld	[%o1],%f7
    346 /* 0x0054	     */		or	%g0,4,%o5
    347 /* 0x0058	     */		ld	[%o1+4],%f5
    348 /* 0x005c	     */		ld	[%o1+8],%f3
    349 /* 0x0060	     */		fmovs	%f8,%f6
    350 /* 0x0064	     */		ld	[%o1+12],%f1
    351                       .L900000205:
    352 /* 0x0068	     */		ld	[%g4],%f11
    353 /* 0x006c	     */		add	%o5,5,%o5
    354 /* 0x0070	     */		add	%g4,20,%g4
    355 /* 0x0074	     */		fsubd	%f6,%f8,%f6
    356 /* 0x0078	     */		std	%f6,[%g5]
    357 /* 0x007c	     */		cmp	%o5,%g1
    358 /* 0x0080	     */		add	%g5,40,%g5
    359 /* 0x0084	     */		fmovs	%f8,%f4
    360 /* 0x0088	     */		ld	[%g4-16],%f7
    361 /* 0x008c	     */		fsubd	%f4,%f8,%f12
    362 /* 0x0090	     */		fmovs	%f8,%f2
    363 /* 0x0094	     */		std	%f12,[%g5-32]
    364 /* 0x0098	     */		ld	[%g4-12],%f5
    365 /* 0x009c	     */		fsubd	%f2,%f8,%f12
    366 /* 0x00a0	     */		fmovs	%f8,%f0
    367 /* 0x00a4	     */		std	%f12,[%g5-24]
    368 /* 0x00a8	     */		ld	[%g4-8],%f3
    369 /* 0x00ac	     */		fsubd	%f0,%f8,%f12
    370 /* 0x00b0	     */		fmovs	%f8,%f10
    371 /* 0x00b4	     */		std	%f12,[%g5-16]
    372 /* 0x00b8	     */		ld	[%g4-4],%f1
    373 /* 0x00bc	     */		fsubd	%f10,%f8,%f10
    374 /* 0x00c0	     */		fmovs	%f8,%f6
    375 /* 0x00c4	     */		ble,pt	%icc,.L900000205
    376 /* 0x00c8	     */		std	%f10,[%g5-8]
    377                       .L900000208:
    378 /* 0x00cc	     */		fmovs	%f8,%f4
    379 /* 0x00d0	     */		add	%g5,32,%g5
    380 /* 0x00d4	     */		cmp	%o5,%g3
    381 /* 0x00d8	     */		fmovs	%f8,%f2
    382 /* 0x00dc	     */		fmovs	%f8,%f0
    383 /* 0x00e0	     */		fsubd	%f6,%f8,%f6
    384 /* 0x00e4	     */		std	%f6,[%g5-32]
    385 /* 0x00e8	     */		fsubd	%f4,%f8,%f4
    386 /* 0x00ec	     */		std	%f4,[%g5-24]
    387 /* 0x00f0	     */		fsubd	%f2,%f8,%f2
    388 /* 0x00f4	     */		std	%f2,[%g5-16]
    389 /* 0x00f8	     */		fsubd	%f0,%f8,%f0
    390 /* 0x00fc	     */		bg,pn	%icc,.L77000140
    391 /* 0x0100	     */		std	%f0,[%g5-8]
    392                       .L77000144:
    393 /* 0x0104	     */		ld	[%g4],%f1
    394                       .L900000211:
    395 /* 0x0108	     */		ldd	[%g2],%f8
    396 /* 0x010c	     */		add	%o5,1,%o5
    397 /* 0x0110	     */		add	%g4,4,%g4
    398 /* 0x0114	     */		cmp	%o5,%g3
    399 /* 0x0118	     */		fmovs	%f8,%f0
    400 /* 0x011c	     */		fsubd	%f0,%f8,%f0
    401 /* 0x0120	     */		std	%f0,[%g5]
    402 /* 0x0124	     */		add	%g5,8,%g5
    403 /* 0x0128	     */		ble,a,pt	%icc,.L900000211
    404 /* 0x012c	     */		ld	[%g4],%f1
    405                       .L77000140:
    406 /* 0x0130	     */		retl	! Result = 
    407 /* 0x0134	     */		nop
    408 /* 0x0138	   0 */		.type	conv_i32_to_d32,2
    409 /* 0x0138	     */		.size	conv_i32_to_d32,(.-conv_i32_to_d32)
    410 
    411 .section	".text",#alloc,#execinstr
    412 /* 000000	   0 */		.align	8
    413 !
    414 ! CONSTANT POOL
    415 !
    416                       .L_const_seg_900000301:
    417 /* 000000	   0 */		.word	1127219200,0
    418 /* 0x0008	   0 */		.align	4
    419 !
    420 ! SUBROUTINE conv_i32_to_d16
    421 !
    422 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    423 
    424                       	.global conv_i32_to_d16
    425                       conv_i32_to_d16:
    426 /* 000000	     */		save	%sp,-104,%sp
    427 /* 0x0004	     */		or	%g0,%i2,%o0
    428 
    429 !  143		      !}
    430 !  146		      !void conv_i32_to_d16(double *d16, unsigned int *i32, int len)
    431 !  147		      !{
    432 !  148		      !int i;
    433 !  149		      !unsigned int a;
    434 !  151		      !#pragma pipeloop(0)
    435 !  152		      ! for(i=0;i<len;i++)
    436 !  153		      !   {
    437 !  154		      !     a=i32[i];
    438 !  155		      !     d16[2*i]=(double)(a&0xffff);
    439 !  156		      !     d16[2*i+1]=(double)(a>>16);
    440 
    441 /* 0x0008	 156 */		sethi	%hi(.L_const_seg_900000301),%g2
    442                       .L900000310:
    443 /* 0x000c	     */		call	.+8
    444 /* 0x0010	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
    445 /* 0x0014	 152 */		cmp	%o0,0
    446 /* 0x0018	 147 */		add	%g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
    447 /* 0x001c	 152 */		ble,pt	%icc,.L77000150
    448 /* 0x0020	     */		add	%g3,%o7,%o2
    449 /* 0x0024	     */		sub	%i2,1,%o5
    450 /* 0x0028	 156 */		add	%g2,%lo(.L_const_seg_900000301),%o1
    451 /* 0x002c	 152 */		sethi	%hi(0xfc00),%o0
    452 /* 0x0030	     */		ld	[%o2+%o1],%o3
    453 /* 0x0034	     */		add	%o5,1,%g2
    454 /* 0x0038	     */		or	%g0,0,%g1
    455 /* 0x003c	     */		cmp	%g2,3
    456 /* 0x0040	     */		or	%g0,%i1,%o7
    457 /* 0x0044	     */		add	%o0,1023,%o4
    458 /* 0x0048	     */		or	%g0,%i0,%g3
    459 /* 0x004c	     */		bl,pn	%icc,.L77000154
    460 /* 0x0050	     */		add	%o7,4,%o0
    461 /* 0x0054	 155 */		ldd	[%o3],%f0
    462 /* 0x0058	 156 */		or	%g0,1,%g1
    463 /* 0x005c	 154 */		ld	[%o0-4],%o1
    464 /* 0x0060	   0 */		or	%g0,%o0,%o7
    465 /* 0x0064	 155 */		and	%o1,%o4,%o0
    466                       .L900000306:
    467 /* 0x0068	 155 */		st	%o0,[%sp+96]
    468 /* 0x006c	 156 */		add	%g1,1,%g1
    469 /* 0x0070	     */		add	%g3,16,%g3
    470 /* 0x0074	     */		cmp	%g1,%o5
    471 /* 0x0078	     */		add	%o7,4,%o7
    472 /* 0x007c	 155 */		ld	[%sp+96],%f3
    473 /* 0x0080	     */		fmovs	%f0,%f2
    474 /* 0x0084	     */		fsubd	%f2,%f0,%f2
    475 /* 0x0088	 156 */		srl	%o1,16,%o0
    476 /* 0x008c	 155 */		std	%f2,[%g3-16]
    477 /* 0x0090	 156 */		st	%o0,[%sp+92]
    478 /* 0x0094	     */		ld	[%sp+92],%f3
    479 /* 0x0098	 154 */		ld	[%o7-4],%o1
    480 /* 0x009c	 156 */		fmovs	%f0,%f2
    481 /* 0x00a0	     */		fsubd	%f2,%f0,%f2
    482 /* 0x00a4	 155 */		and	%o1,%o4,%o0
    483 /* 0x00a8	 156 */		ble,pt	%icc,.L900000306
    484 /* 0x00ac	     */		std	%f2,[%g3-8]
    485                       .L900000309:
    486 /* 0x00b0	 155 */		st	%o0,[%sp+96]
    487 /* 0x00b4	     */		fmovs	%f0,%f2
    488 /* 0x00b8	 156 */		add	%g3,16,%g3
    489 /* 0x00bc	     */		srl	%o1,16,%o0
    490 /* 0x00c0	 155 */		ld	[%sp+96],%f3
    491 /* 0x00c4	     */		fsubd	%f2,%f0,%f2
    492 /* 0x00c8	     */		std	%f2,[%g3-16]
    493 /* 0x00cc	 156 */		st	%o0,[%sp+92]
    494 /* 0x00d0	     */		fmovs	%f0,%f2
    495 /* 0x00d4	     */		ld	[%sp+92],%f3
    496 /* 0x00d8	     */		fsubd	%f2,%f0,%f0
    497 /* 0x00dc	     */		std	%f0,[%g3-8]
    498 /* 0x00e0	     */		ret	! Result = 
    499 /* 0x00e4	     */		restore	%g0,%g0,%g0
    500                       .L77000154:
    501 /* 0x00e8	 154 */		ld	[%o7],%o0
    502                       .L900000311:
    503 /* 0x00ec	 155 */		and	%o0,%o4,%o1
    504 /* 0x00f0	     */		st	%o1,[%sp+96]
    505 /* 0x00f4	 156 */		add	%g1,1,%g1
    506 /* 0x00f8	 155 */		ldd	[%o3],%f0
    507 /* 0x00fc	 156 */		srl	%o0,16,%o0
    508 /* 0x0100	     */		add	%o7,4,%o7
    509 /* 0x0104	     */		cmp	%g1,%o5
    510 /* 0x0108	 155 */		fmovs	%f0,%f2
    511 /* 0x010c	     */		ld	[%sp+96],%f3
    512 /* 0x0110	     */		fsubd	%f2,%f0,%f2
    513 /* 0x0114	     */		std	%f2,[%g3]
    514 /* 0x0118	 156 */		st	%o0,[%sp+92]
    515 /* 0x011c	     */		fmovs	%f0,%f2
    516 /* 0x0120	     */		ld	[%sp+92],%f3
    517 /* 0x0124	     */		fsubd	%f2,%f0,%f0
    518 /* 0x0128	     */		std	%f0,[%g3+8]
    519 /* 0x012c	     */		add	%g3,16,%g3
    520 /* 0x0130	     */		ble,a,pt	%icc,.L900000311
    521 /* 0x0134	     */		ld	[%o7],%o0
    522                       .L77000150:
    523 /* 0x0138	     */		ret	! Result = 
    524 /* 0x013c	     */		restore	%g0,%g0,%g0
    525 /* 0x0140	   0 */		.type	conv_i32_to_d16,2
    526 /* 0x0140	     */		.size	conv_i32_to_d16,(.-conv_i32_to_d16)
    527 
    528 .section	".text",#alloc,#execinstr
    529 /* 000000	   0 */		.align	8
    530 !
    531 ! CONSTANT POOL
    532 !
    533                       .L_const_seg_900000401:
    534 /* 000000	   0 */		.word	1127219200,0
    535 /* 0x0008	   0 */		.align	4
    536 /* 0x0008	     */		.skip	16
    537 !
    538 ! SUBROUTINE conv_i32_to_d32_and_d16
    539 !
    540 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    541 
    542                       	.global conv_i32_to_d32_and_d16
    543                       conv_i32_to_d32_and_d16:
    544 /* 000000	     */		save	%sp,-120,%sp
    545                       .L900000415:
    546 /* 0x0004	     */		call	.+8
    547 /* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4
    548 
    549 !  157		      !   }
    550 !  158		      !}
    551 !  161		      !void conv_i32_to_d32_and_d16(double *d32, double *d16, 
    552 !  162		      !			     unsigned int *i32, int len)
    553 !  163		      !{
    554 !  164		      !int i = 0;
    555 !  165		      !unsigned int a;
    556 !  167		      !#pragma pipeloop(0)
    557 !  168		      !#ifdef RF_INLINE_MACROS
    558 !  169		      ! for(;i<len-3;i+=4)
    559 
    560 /* 0x000c	 169 */		sub	%i3,3,%g2
    561 /* 0x0010	     */		cmp	%g2,0
    562 /* 0x0014	 163 */		add	%g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4
    563 
    564 !  170		      !   {
    565 !  171		      !     i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero,
    566 !  172		      !			  &(d16[2*i]), &(d32[i]), (float *)(&(i32[i])));
    567 
    568 /* 0x0018	 172 */		sethi	%hi(Zero),%g2
    569 /* 0x001c	 163 */		add	%g4,%o7,%o4
    570 /* 0x0020	 172 */		add	%g2,%lo(Zero),%g2
    571 /* 0x0024	     */		sethi	%hi(TwoToMinus16),%g3
    572 /* 0x0028	     */		ld	[%o4+%g2],%o1
    573 /* 0x002c	     */		sethi	%hi(TwoTo16),%g4
    574 /* 0x0030	     */		add	%g3,%lo(TwoToMinus16),%g2
    575 /* 0x0034	     */		ld	[%o4+%g2],%o3
    576 /* 0x0038	 164 */		or	%g0,0,%g5
    577 /* 0x003c	 172 */		add	%g4,%lo(TwoTo16),%g3
    578 /* 0x0040	     */		ld	[%o4+%g3],%o2
    579 /* 0x0044	 163 */		or	%g0,%i0,%i4
    580 /* 0x0048	 169 */		or	%g0,%i2,%o7
    581 /* 0x004c	     */		ble,pt	%icc,.L900000418
    582 /* 0x0050	     */		cmp	%g5,%i3
    583 /* 0x0054	 172 */		stx	%o7,[%sp+104]
    584 /* 0x0058	 169 */		sub	%i3,4,%o5
    585 /* 0x005c	     */		or	%g0,0,%g4
    586 /* 0x0060	     */		or	%g0,0,%g1
    587                       .L900000417:
    588 /* 0x0064	     */		ldd	[%o1],%f2
    589 /* 0x0068	 172 */		add	%i4,%g4,%g2
    590 /* 0x006c	     */		add	%i1,%g1,%g3
    591 /* 0x0070	     */		ldd	[%o3],%f0
    592 /* 0x0074	     */		add	%g5,4,%g5
    593 /* 0x0078	     */		fmovd	%f2,%f14
    594 /* 0x007c	     */		ld	[%o7],%f15
    595 /* 0x0080	     */		cmp	%g5,%o5
    596 /* 0x0084	     */		fmovd	%f2,%f10
    597 /* 0x0088	     */		ld	[%o7+4],%f11
    598 /* 0x008c	     */		add	%o7,16,%o7
    599 /* 0x0090	     */		ldx	[%sp+104],%o0
    600 /* 0x0094	     */		fmovd	%f2,%f6
    601 /* 0x0098	     */		stx	%o7,[%sp+112]
    602 /* 0x009c	     */		fxtod	%f14,%f14
    603 /* 0x00a0	     */		ld	[%o0+8],%f7
    604 /* 0x00a4	     */		fxtod	%f10,%f10
    605 /* 0x00a8	     */		ld	[%o0+12],%f3
    606 /* 0x00ac	     */		fxtod	%f6,%f6
    607 /* 0x00b0	     */		ldd	[%o2],%f16
    608 /* 0x00b4	     */		fmuld	%f0,%f14,%f12
    609 /* 0x00b8	     */		fxtod	%f2,%f2
    610 /* 0x00bc	     */		fmuld	%f0,%f10,%f8
    611 /* 0x00c0	     */		std	%f14,[%i4+%g4]
    612 /* 0x00c4	     */		ldx	[%sp+112],%o7
    613 /* 0x00c8	     */		add	%g4,32,%g4
    614 /* 0x00cc	     */		fmuld	%f0,%f6,%f4
    615 /* 0x00d0	     */		fdtox	%f12,%f12
    616 /* 0x00d4	     */		std	%f10,[%g2+8]
    617 /* 0x00d8	     */		fmuld	%f0,%f2,%f0
    618 /* 0x00dc	     */		fdtox	%f8,%f8
    619 /* 0x00e0	     */		std	%f6,[%g2+16]
    620 /* 0x00e4	     */		std	%f2,[%g2+24]
    621 /* 0x00e8	     */		fdtox	%f4,%f4
    622 /* 0x00ec	     */		fdtox	%f0,%f0
    623 /* 0x00f0	     */		fxtod	%f12,%f12
    624 /* 0x00f4	     */		std	%f12,[%g3+8]
    625 /* 0x00f8	     */		fxtod	%f8,%f8
    626 /* 0x00fc	     */		std	%f8,[%g3+24]
    627 /* 0x0100	     */		fxtod	%f4,%f4
    628 /* 0x0104	     */		std	%f4,[%g3+40]
    629 /* 0x0108	     */		fxtod	%f0,%f0
    630 /* 0x010c	     */		std	%f0,[%g3+56]
    631 /* 0x0110	     */		fmuld	%f12,%f16,%f12
    632 /* 0x0114	     */		fmuld	%f8,%f16,%f8
    633 /* 0x0118	     */		fmuld	%f4,%f16,%f4
    634 /* 0x011c	     */		fsubd	%f14,%f12,%f12
    635 /* 0x0120	     */		std	%f12,[%i1+%g1]
    636 /* 0x0124	     */		fmuld	%f0,%f16,%f0
    637 /* 0x0128	     */		fsubd	%f10,%f8,%f8
    638 /* 0x012c	     */		std	%f8,[%g3+16]
    639 /* 0x0130	     */		add	%g1,64,%g1
    640 /* 0x0134	     */		fsubd	%f6,%f4,%f4
    641 /* 0x0138	     */		std	%f4,[%g3+32]
    642 /* 0x013c	     */		fsubd	%f2,%f0,%f0
    643 /* 0x0140	     */		std	%f0,[%g3+48]
    644 /* 0x0144	     */		ble,a,pt	%icc,.L900000417
    645 /* 0x0148	     */		stx	%o7,[%sp+104]
    646                       .L77000159:
    647 
    648 !  173		      !   }
    649 !  174		      !#endif
    650 !  175		      ! for(;i<len;i++)
    651 
    652 /* 0x014c	 175 */		cmp	%g5,%i3
    653                       .L900000418:
    654 /* 0x0150	 175 */		bge,pt	%icc,.L77000164
    655 /* 0x0154	     */		nop
    656 
    657 !  176		      !   {
    658 !  177		      !     a=i32[i];
    659 !  178		      !     d32[i]=(double)(i32[i]);
    660 !  179		      !     d16[2*i]=(double)(a&0xffff);
    661 !  180		      !     d16[2*i+1]=(double)(a>>16);
    662 
    663 /* 0x0158	 180 */		sethi	%hi(.L_const_seg_900000401),%g2
    664 /* 0x015c	     */		add	%g2,%lo(.L_const_seg_900000401),%o1
    665 /* 0x0160	 175 */		sethi	%hi(0xfc00),%o0
    666 /* 0x0164	     */		ld	[%o4+%o1],%o2
    667 /* 0x0168	     */		sll	%g5,2,%o3
    668 /* 0x016c	     */		sub	%i3,%g5,%g3
    669 /* 0x0170	     */		sll	%g5,3,%g2
    670 /* 0x0174	     */		add	%o0,1023,%o4
    671 /* 0x0178	 178 */		ldd	[%o2],%f0
    672 /* 0x017c	     */		add	%i2,%o3,%o0
    673 /* 0x0180	 175 */		cmp	%g3,3
    674 /* 0x0184	     */		add	%i4,%g2,%o3
    675 /* 0x0188	     */		sub	%i3,1,%o1
    676 /* 0x018c	     */		sll	%g5,4,%g4
    677 /* 0x0190	     */		bl,pn	%icc,.L77000161
    678 /* 0x0194	     */		add	%i1,%g4,%o5
    679 /* 0x0198	 178 */		ld	[%o0],%f3
    680 /* 0x019c	 180 */		add	%o3,8,%o3
    681 /* 0x01a0	 177 */		ld	[%o0],%o7
    682 /* 0x01a4	 180 */		add	%o5,16,%o5
    683 /* 0x01a8	     */		add	%g5,1,%g5
    684 /* 0x01ac	 178 */		fmovs	%f0,%f2
    685 /* 0x01b0	 180 */		add	%o0,4,%o0
    686 /* 0x01b4	 179 */		and	%o7,%o4,%g1
    687 /* 0x01b8	 178 */		fsubd	%f2,%f0,%f2
    688 /* 0x01bc	     */		std	%f2,[%o3-8]
    689 /* 0x01c0	 180 */		srl	%o7,16,%o7
    690 /* 0x01c4	 179 */		st	%g1,[%sp+96]
    691 /* 0x01c8	     */		fmovs	%f0,%f2
    692 /* 0x01cc	     */		ld	[%sp+96],%f3
    693 /* 0x01d0	     */		fsubd	%f2,%f0,%f2
    694 /* 0x01d4	     */		std	%f2,[%o5-16]
    695 /* 0x01d8	 180 */		st	%o7,[%sp+92]
    696 /* 0x01dc	     */		fmovs	%f0,%f2
    697 /* 0x01e0	     */		ld	[%sp+92],%f3
    698 /* 0x01e4	     */		fsubd	%f2,%f0,%f2
    699 /* 0x01e8	     */		std	%f2,[%o5-8]
    700                       .L900000411:
    701 /* 0x01ec	 178 */		ld	[%o0],%f3
    702 /* 0x01f0	 180 */		add	%g5,2,%g5
    703 /* 0x01f4	     */		add	%o5,32,%o5
    704 /* 0x01f8	 177 */		ld	[%o0],%o7
    705 /* 0x01fc	 180 */		cmp	%g5,%o1
    706 /* 0x0200	     */		add	%o3,16,%o3
    707 /* 0x0204	 178 */		fmovs	%f0,%f2
    708 /* 0x0208	     */		fsubd	%f2,%f0,%f2
    709 /* 0x020c	     */		std	%f2,[%o3-16]
    710 /* 0x0210	 179 */		and	%o7,%o4,%g1
    711 /* 0x0214	     */		st	%g1,[%sp+96]
    712 /* 0x0218	     */		ld	[%sp+96],%f3
    713 /* 0x021c	     */		fmovs	%f0,%f2
    714 /* 0x0220	     */		fsubd	%f2,%f0,%f2
    715 /* 0x0224	 180 */		srl	%o7,16,%o7
    716 /* 0x0228	 179 */		std	%f2,[%o5-32]
    717 /* 0x022c	 180 */		st	%o7,[%sp+92]
    718 /* 0x0230	     */		ld	[%sp+92],%f3
    719 /* 0x0234	     */		fmovs	%f0,%f2
    720 /* 0x0238	     */		fsubd	%f2,%f0,%f2
    721 /* 0x023c	     */		std	%f2,[%o5-24]
    722 /* 0x0240	     */		add	%o0,4,%o0
    723 /* 0x0244	 178 */		ld	[%o0],%f3
    724 /* 0x0248	 177 */		ld	[%o0],%o7
    725 /* 0x024c	 178 */		fmovs	%f0,%f2
    726 /* 0x0250	     */		fsubd	%f2,%f0,%f2
    727 /* 0x0254	     */		std	%f2,[%o3-8]
    728 /* 0x0258	 179 */		and	%o7,%o4,%g1
    729 /* 0x025c	     */		st	%g1,[%sp+96]
    730 /* 0x0260	     */		ld	[%sp+96],%f3
    731 /* 0x0264	     */		fmovs	%f0,%f2
    732 /* 0x0268	     */		fsubd	%f2,%f0,%f2
    733 /* 0x026c	 180 */		srl	%o7,16,%o7
    734 /* 0x0270	 179 */		std	%f2,[%o5-16]
    735 /* 0x0274	 180 */		st	%o7,[%sp+92]
    736 /* 0x0278	     */		ld	[%sp+92],%f3
    737 /* 0x027c	     */		fmovs	%f0,%f2
    738 /* 0x0280	     */		fsubd	%f2,%f0,%f2
    739 /* 0x0284	     */		std	%f2,[%o5-8]
    740 /* 0x0288	     */		bl,pt	%icc,.L900000411
    741 /* 0x028c	     */		add	%o0,4,%o0
    742                       .L900000414:
    743 /* 0x0290	 180 */		cmp	%g5,%i3
    744 /* 0x0294	     */		bge,pn	%icc,.L77000164
    745 /* 0x0298	     */		nop
    746                       .L77000161:
    747 /* 0x029c	 178 */		ld	[%o0],%f3
    748                       .L900000416:
    749 /* 0x02a0	 178 */		ldd	[%o2],%f0
    750 /* 0x02a4	 180 */		add	%g5,1,%g5
    751 /* 0x02a8	 177 */		ld	[%o0],%o1
    752 /* 0x02ac	 180 */		add	%o0,4,%o0
    753 /* 0x02b0	     */		cmp	%g5,%i3
    754 /* 0x02b4	 178 */		fmovs	%f0,%f2
    755 /* 0x02b8	 179 */		and	%o1,%o4,%o7
    756 /* 0x02bc	 178 */		fsubd	%f2,%f0,%f2
    757 /* 0x02c0	     */		std	%f2,[%o3]
    758 /* 0x02c4	 180 */		srl	%o1,16,%o1
    759 /* 0x02c8	 179 */		st	%o7,[%sp+96]
    760 /* 0x02cc	 180 */		add	%o3,8,%o3
    761 /* 0x02d0	 179 */		fmovs	%f0,%f2
    762 /* 0x02d4	     */		ld	[%sp+96],%f3
    763 /* 0x02d8	     */		fsubd	%f2,%f0,%f2
    764 /* 0x02dc	     */		std	%f2,[%o5]
    765 /* 0x02e0	 180 */		st	%o1,[%sp+92]
    766 /* 0x02e4	     */		fmovs	%f0,%f2
    767 /* 0x02e8	     */		ld	[%sp+92],%f3
    768 /* 0x02ec	     */		fsubd	%f2,%f0,%f0
    769 /* 0x02f0	     */		std	%f0,[%o5+8]
    770 /* 0x02f4	     */		add	%o5,16,%o5
    771 /* 0x02f8	     */		bl,a,pt	%icc,.L900000416
    772 /* 0x02fc	     */		ld	[%o0],%f3
    773                       .L77000164:
    774 /* 0x0300	     */		ret	! Result = 
    775 /* 0x0304	     */		restore	%g0,%g0,%g0
    776 /* 0x0308	   0 */		.type	conv_i32_to_d32_and_d16,2
    777 /* 0x0308	     */		.size	conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
    778 
    779 .section	".text",#alloc,#execinstr
    780 /* 000000	   0 */		.align	4
    781 !
    782 ! SUBROUTINE adjust_montf_result
    783 !
    784 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    785 
    786                       	.global adjust_montf_result
    787                       adjust_montf_result:
    788 /* 000000	     */		or	%g0,%o2,%g5
    789 
    790 !  181		      !   }
    791 !  182		      !}
    792 !  185		      !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len)
    793 !  186		      !{
    794 !  187		      !long long acc;
    795 !  188		      !int i;
    796 !  190		      ! if(i32[len]>0) i=-1;
    797 
    798 /* 0x0004	 190 */		or	%g0,-1,%g4
    799 /* 0x0008	     */		sll	%o2,2,%g1
    800 /* 0x000c	     */		ld	[%o0+%g1],%g1
    801 /* 0x0010	     */		cmp	%g1,0
    802 /* 0x0014	     */		bleu,pn	%icc,.L77000175
    803 /* 0x0018	     */		or	%g0,%o1,%o3
    804 /* 0x001c	     */		ba	.L900000511
    805 /* 0x0020	     */		cmp	%g4,0
    806                       .L77000175:
    807 
    808 !  191		      ! else
    809 !  192		      !   {
    810 !  193		      !     for(i=len-1; i>=0; i--)
    811 
    812 /* 0x0024	 193 */		sub	%o2,1,%g4
    813 /* 0x0028	     */		sll	%g4,2,%g1
    814 /* 0x002c	     */		cmp	%g4,0
    815 /* 0x0030	     */		bl,pt	%icc,.L900000511
    816 /* 0x0034	     */		cmp	%g4,0
    817 /* 0x0038	     */		add	%o1,%g1,%g2
    818 
    819 !  194		      !       {
    820 !  195		      !	 if(i32[i]!=nint[i]) break;
    821 
    822 /* 0x003c	 195 */		ld	[%g2],%o5
    823 /* 0x0040	 193 */		add	%o0,%g1,%g3
    824                       .L900000510:
    825 /* 0x0044	 195 */		ld	[%g3],%o2
    826 /* 0x0048	     */		sub	%g4,1,%g1
    827 /* 0x004c	     */		sub	%g2,4,%g2
    828 /* 0x0050	     */		sub	%g3,4,%g3
    829 /* 0x0054	     */		cmp	%o2,%o5
    830 /* 0x0058	     */		bne,pn	%icc,.L77000182
    831 /* 0x005c	     */		nop
    832 /* 0x0060	   0 */		or	%g0,%g1,%g4
    833 /* 0x0064	 195 */		cmp	%g1,0
    834 /* 0x0068	     */		bge,a,pt	%icc,.L900000510
    835 /* 0x006c	     */		ld	[%g2],%o5
    836                       .L77000182:
    837 
    838 !  196		      !       }
    839 !  197		      !   }
    840 !  198		      ! if((i<0)||(i32[i]>nint[i]))
    841 
    842 /* 0x0070	 198 */		cmp	%g4,0
    843                       .L900000511:
    844 /* 0x0074	 198 */		bl,pn	%icc,.L77000198
    845 /* 0x0078	     */		sll	%g4,2,%g2
    846 /* 0x007c	     */		ld	[%o1+%g2],%g1
    847 /* 0x0080	     */		ld	[%o0+%g2],%g2
    848 /* 0x0084	     */		cmp	%g2,%g1
    849 /* 0x0088	     */		bleu,pt	%icc,.L77000191
    850 /* 0x008c	     */		nop
    851                       .L77000198:
    852 
    853 !  199		      !   {
    854 !  200		      !     acc=0;
    855 !  201		      !     for(i=0;i<len;i++)
    856 
    857 /* 0x0090	 201 */		cmp	%g5,0
    858 /* 0x0094	     */		ble,pt	%icc,.L77000191
    859 /* 0x0098	     */		nop
    860 /* 0x009c	     */		or	%g0,%g5,%g1
    861 /* 0x00a0	 198 */		or	%g0,-1,%g2
    862 /* 0x00a4	     */		srl	%g2,0,%g3
    863 /* 0x00a8	     */		sub	%g5,1,%g4
    864 /* 0x00ac	 200 */		or	%g0,0,%g5
    865 /* 0x00b0	 201 */		or	%g0,0,%o5
    866 /* 0x00b4	 198 */		or	%g0,%o0,%o4
    867 /* 0x00b8	     */		cmp	%g1,3
    868 /* 0x00bc	 201 */		bl,pn	%icc,.L77000199
    869 /* 0x00c0	     */		add	%o0,8,%g1
    870 /* 0x00c4	     */		add	%o1,4,%g2
    871 
    872 !  202		      !       {
    873 !  203		      !	 acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]);
    874 
    875 /* 0x00c8	 203 */		ld	[%o0],%o2
    876 /* 0x00cc	     */		ld	[%o1],%o1
    877 /* 0x00d0	   0 */		or	%g0,%g1,%o4
    878 /* 0x00d4	     */		or	%g0,%g2,%o3
    879 /* 0x00d8	 203 */		ld	[%o0+4],%g1
    880 
    881 !  204		      !	 i32[i]=acc&0xffffffff;
    882 !  205		      !	 acc=acc>>32;
    883 
    884 /* 0x00dc	 205 */		or	%g0,2,%o5
    885 /* 0x00e0	 201 */		sub	%o2,%o1,%o2
    886 /* 0x00e4	     */		or	%g0,%o2,%g5
    887 /* 0x00e8	 204 */		and	%o2,%g3,%o2
    888 /* 0x00ec	     */		st	%o2,[%o0]
    889 /* 0x00f0	 205 */		srax	%g5,32,%g5
    890                       .L900000505:
    891 /* 0x00f4	 203 */		ld	[%o3],%o2
    892 /* 0x00f8	 205 */		add	%o5,1,%o5
    893 /* 0x00fc	     */		add	%o3,4,%o3
    894 /* 0x0100	     */		cmp	%o5,%g4
    895 /* 0x0104	     */		add	%o4,4,%o4
    896 /* 0x0108	 201 */		sub	%g1,%o2,%g1
    897 /* 0x010c	     */		add	%g1,%g5,%g5
    898 /* 0x0110	 204 */		and	%g5,%g3,%o2
    899 /* 0x0114	 203 */		ld	[%o4-4],%g1
    900 /* 0x0118	 204 */		st	%o2,[%o4-8]
    901 /* 0x011c	 205 */		ble,pt	%icc,.L900000505
    902 /* 0x0120	     */		srax	%g5,32,%g5
    903                       .L900000508:
    904 /* 0x0124	 203 */		ld	[%o3],%g2
    905 /* 0x0128	 201 */		sub	%g1,%g2,%g1
    906 /* 0x012c	     */		add	%g1,%g5,%g1
    907 /* 0x0130	 204 */		and	%g1,%g3,%g2
    908 /* 0x0134	     */		retl	! Result = 
    909 /* 0x0138	     */		st	%g2,[%o4-4]
    910                       .L77000199:
    911 /* 0x013c	 203 */		ld	[%o4],%g1
    912                       .L900000509:
    913 /* 0x0140	 203 */		ld	[%o3],%g2
    914 /* 0x0144	     */		add	%g5,%g1,%g1
    915 /* 0x0148	 205 */		add	%o5,1,%o5
    916 /* 0x014c	     */		add	%o3,4,%o3
    917 /* 0x0150	     */		cmp	%o5,%g4
    918 /* 0x0154	 203 */		sub	%g1,%g2,%g1
    919 /* 0x0158	 204 */		and	%g1,%g3,%g2
    920 /* 0x015c	     */		st	%g2,[%o4]
    921 /* 0x0160	 205 */		add	%o4,4,%o4
    922 /* 0x0164	     */		srax	%g1,32,%g5
    923 /* 0x0168	     */		ble,a,pt	%icc,.L900000509
    924 /* 0x016c	     */		ld	[%o4],%g1
    925                       .L77000191:
    926 /* 0x0170	     */		retl	! Result = 
    927 /* 0x0174	     */		nop
    928 /* 0x0178	   0 */		.type	adjust_montf_result,2
    929 /* 0x0178	     */		.size	adjust_montf_result,(.-adjust_montf_result)
    930 
    931 .section	".text",#alloc,#execinstr
    932 /* 000000	   0 */		.align	4
    933 /* 000000	     */		.skip	16
    934 !
    935 ! SUBROUTINE mont_mulf_noconv
    936 !
    937 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    938 
    939                       	.global mont_mulf_noconv
    940                       mont_mulf_noconv:
    941 /* 000000	     */		save	%sp,-144,%sp
    942                       .L900000646:
    943 /* 0x0004	     */		call	.+8
    944 /* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5
    945 
    946 !  206		      !       }
    947 !  207		      !   }
    948 !  208		      !}
    949 !  213		      !/*
    950 !  214		      !** the lengths of the input arrays should be at least the following:
    951 !  215		      !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
    952 !  216		      !** all of them should be different from one another
    953 !  217		      !**
    954 !  218		      !*/
    955 !  219		      !void mont_mulf_noconv(unsigned int *result,
    956 !  220		      !		     double *dm1, double *dm2, double *dt,
    957 !  221		      !		     double *dn, unsigned int *nint,
    958 !  222		      !		     int nlen, double dn0)
    959 !  223		      !{
    960 !  224		      ! int i, j, jj;
    961 !  225		      ! int tmp;
    962 !  226		      ! double digit, m2j, nextm2j, a, b;
    963 !  227		      ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0;
    964 !  229		      ! pdm1=&(dm1[0]);
    965 !  230		      ! pdm2=&(dm2[0]);
    966 !  231		      ! pdn=&(dn[0]);
    967 !  232		      ! pdm2[2*nlen]=Zero;
    968 
    969 /* 0x000c	 232 */		ld	[%fp+92],%o1
    970 /* 0x0010	     */		sethi	%hi(Zero),%g2
    971 /* 0x0014	 223 */		ldd	[%fp+96],%f2
    972 /* 0x0018	     */		add	%g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5
    973 /* 0x001c	 232 */		add	%g2,%lo(Zero),%g2
    974 /* 0x0020	 223 */		st	%i0,[%fp+68]
    975 /* 0x0024	     */		add	%g5,%o7,%o3
    976 
    977 !  234		      ! if (nlen!=16)
    978 !  235		      !   {
    979 !  236		      !     for(i=0;i<4*nlen+2;i++) dt[i]=Zero;
    980 !  238		      !     a=dt[0]=pdm1[0]*pdm2[0];
    981 !  239		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
    982 
    983 /* 0x0028	 239 */		sethi	%hi(TwoToMinus16),%g3
    984 /* 0x002c	 232 */		ld	[%o3+%g2],%l0
    985 /* 0x0030	 239 */		sethi	%hi(TwoTo16),%g4
    986 /* 0x0034	 223 */		or	%g0,%i2,%o2
    987 /* 0x0038	     */		fmovd	%f2,%f16
    988 /* 0x003c	     */		st	%i5,[%fp+88]
    989 /* 0x0040	 239 */		add	%g3,%lo(TwoToMinus16),%g2
    990 /* 0x0044	 223 */		or	%g0,%i1,%i2
    991 /* 0x0048	 232 */		ldd	[%l0],%f0
    992 /* 0x004c	 239 */		add	%g4,%lo(TwoTo16),%g3
    993 /* 0x0050	 223 */		or	%g0,%i3,%o0
    994 /* 0x0054	 232 */		sll	%o1,4,%g4
    995 /* 0x0058	 239 */		ld	[%o3+%g2],%g5
    996 /* 0x005c	 223 */		or	%g0,%i3,%i1
    997 /* 0x0060	 239 */		ld	[%o3+%g3],%g1
    998 /* 0x0064	 232 */		or	%g0,%o1,%i0
    999 /* 0x0068	     */		or	%g0,%o2,%i3
   1000 /* 0x006c	 234 */		cmp	%o1,16
   1001 /* 0x0070	     */		be,pn	%icc,.L77000279
   1002 /* 0x0074	     */		std	%f0,[%o2+%g4]
   1003 /* 0x0078	 236 */		sll	%o1,2,%g2
   1004 /* 0x007c	     */		or	%g0,%o0,%o3
   1005 /* 0x0080	 232 */		sll	%o1,1,%o1
   1006 /* 0x0084	 236 */		add	%g2,2,%o2
   1007 /* 0x0088	     */		cmp	%o2,0
   1008 /* 0x008c	     */		ble,a,pt	%icc,.L900000660
   1009 /* 0x0090	     */		ldd	[%i2],%f0
   1010 
   1011 !  241		      !     pdtj=&(dt[0]);
   1012 !  242		      !     for(j=jj=0;j<2*nlen;j++,jj++,pdtj++)
   1013 !  243		      !       {
   1014 !  244		      !	 m2j=pdm2[j];
   1015 !  245		      !	 a=pdtj[0]+pdn[0]*digit;
   1016 !  246		      !	 b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16;
   1017 !  247		      !	 pdtj[1]=b;
   1018 !  249		      !#pragma pipeloop(0)
   1019 !  250		      !	 for(i=1;i<nlen;i++)
   1020 !  251		      !	   {
   1021 !  252		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
   1022 !  253		      !	   }
   1023 !  254		      ! 	 if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;}
   1024 !  255		      !	 
   1025 !  256		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
   1026 !  257		      !       }
   1027 !  258		      !   }
   1028 !  259		      ! else
   1029 !  260		      !   {
   1030 !  261		      !     a=dt[0]=pdm1[0]*pdm2[0];
   1031 !  263		      !     dt[65]=     dt[64]=     dt[63]=     dt[62]=     dt[61]=     dt[60]=
   1032 !  264		      !     dt[59]=     dt[58]=     dt[57]=     dt[56]=     dt[55]=     dt[54]=
   1033 !  265		      !     dt[53]=     dt[52]=     dt[51]=     dt[50]=     dt[49]=     dt[48]=
   1034 !  266		      !     dt[47]=     dt[46]=     dt[45]=     dt[44]=     dt[43]=     dt[42]=
   1035 !  267		      !     dt[41]=     dt[40]=     dt[39]=     dt[38]=     dt[37]=     dt[36]=
   1036 !  268		      !     dt[35]=     dt[34]=     dt[33]=     dt[32]=     dt[31]=     dt[30]=
   1037 !  269		      !     dt[29]=     dt[28]=     dt[27]=     dt[26]=     dt[25]=     dt[24]=
   1038 !  270		      !     dt[23]=     dt[22]=     dt[21]=     dt[20]=     dt[19]=     dt[18]=
   1039 !  271		      !     dt[17]=     dt[16]=     dt[15]=     dt[14]=     dt[13]=     dt[12]=
   1040 !  272		      !     dt[11]=     dt[10]=     dt[ 9]=     dt[ 8]=     dt[ 7]=     dt[ 6]=
   1041 !  273		      !     dt[ 5]=     dt[ 4]=     dt[ 3]=     dt[ 2]=     dt[ 1]=Zero;
   1042 !  275		      !     pdn_0=pdn[0];
   1043 !  276		      !     pdm1_0=pdm1[0];
   1044 !  278		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
   1045 !  279		      !     pdtj=&(dt[0]);
   1046 !  281		      !     for(j=0;j<32;j++,pdtj++)
   1047 
   1048 /* 0x0094	 281 */		add	%g2,2,%o0
   1049 /* 0x0098	 236 */		add	%g2,1,%o2
   1050 /* 0x009c	 281 */		cmp	%o0,3
   1051 /* 0x00a0	     */		bl,pn	%icc,.L77000280
   1052 /* 0x00a4	     */		or	%g0,1,%o0
   1053 /* 0x00a8	     */		add	%o3,8,%o3
   1054 /* 0x00ac	     */		or	%g0,1,%o4
   1055 /* 0x00b0	     */		std	%f0,[%o3-8]
   1056                       .L900000630:
   1057 /* 0x00b4	     */		std	%f0,[%o3]
   1058 /* 0x00b8	     */		add	%o4,2,%o4
   1059 /* 0x00bc	     */		add	%o3,16,%o3
   1060 /* 0x00c0	     */		cmp	%o4,%g2
   1061 /* 0x00c4	     */		ble,pt	%icc,.L900000630
   1062 /* 0x00c8	     */		std	%f0,[%o3-8]
   1063                       .L900000633:
   1064 /* 0x00cc	     */		cmp	%o4,%o2
   1065 /* 0x00d0	     */		bg,pn	%icc,.L77000285
   1066 /* 0x00d4	     */		add	%o4,1,%o0
   1067                       .L77000280:
   1068 /* 0x00d8	     */		std	%f0,[%o3]
   1069                       .L900000659:
   1070 /* 0x00dc	     */		ldd	[%l0],%f0
   1071 /* 0x00e0	     */		cmp	%o0,%o2
   1072 /* 0x00e4	     */		add	%o3,8,%o3
   1073 /* 0x00e8	     */		add	%o0,1,%o0
   1074 /* 0x00ec	     */		ble,a,pt	%icc,.L900000659
   1075 /* 0x00f0	     */		std	%f0,[%o3]
   1076                       .L77000285:
   1077 /* 0x00f4	 238 */		ldd	[%i2],%f0
   1078                       .L900000660:
   1079 /* 0x00f8	 238 */		ldd	[%i3],%f2
   1080 /* 0x00fc	     */		add	%o1,1,%o2
   1081 /* 0x0100	 242 */		cmp	%o1,0
   1082 /* 0x0104	     */		sll	%o2,1,%o0
   1083 /* 0x0108	     */		sub	%o1,1,%o1
   1084 /* 0x010c	 238 */		fmuld	%f0,%f2,%f0
   1085 /* 0x0110	     */		std	%f0,[%i1]
   1086 /* 0x0114	   0 */		or	%g0,0,%l1
   1087 /* 0x0118	     */		ldd	[%l0],%f6
   1088 /* 0x011c	     */		or	%g0,0,%g4
   1089 /* 0x0120	     */		or	%g0,%o2,%i5
   1090 /* 0x0124	     */		ldd	[%g5],%f2
   1091 /* 0x0128	     */		or	%g0,%o1,%g3
   1092 /* 0x012c	     */		or	%g0,%o0,%o3
   1093 /* 0x0130	     */		fdtox	%f0,%f0
   1094 /* 0x0134	     */		ldd	[%g1],%f4
   1095 /* 0x0138	 246 */		add	%i3,8,%o4
   1096 /* 0x013c	     */		or	%g0,0,%l2
   1097 /* 0x0140	     */		or	%g0,%i1,%o5
   1098 /* 0x0144	     */		sub	%i0,1,%o7
   1099 /* 0x0148	     */		fmovs	%f6,%f0
   1100 /* 0x014c	     */		fxtod	%f0,%f0
   1101 /* 0x0150	 239 */		fmuld	%f0,%f16,%f0
   1102 /* 0x0154	     */		fmuld	%f0,%f2,%f2
   1103 /* 0x0158	     */		fdtox	%f2,%f2
   1104 /* 0x015c	     */		fxtod	%f2,%f2
   1105 /* 0x0160	     */		fmuld	%f2,%f4,%f2
   1106 /* 0x0164	     */		fsubd	%f0,%f2,%f22
   1107 /* 0x0168	 242 */		ble,pt	%icc,.L900000653
   1108 /* 0x016c	     */		sll	%i0,4,%g2
   1109 /* 0x0170	 246 */		ldd	[%i4],%f0
   1110                       .L900000654:
   1111 /* 0x0174	 246 */		fmuld	%f0,%f22,%f8
   1112 /* 0x0178	     */		ldd	[%i2],%f0
   1113 /* 0x017c	 250 */		cmp	%i0,1
   1114 /* 0x0180	 246 */		ldd	[%o4+%l2],%f6
   1115 /* 0x0184	     */		add	%i2,8,%o0
   1116 /* 0x0188	 250 */		or	%g0,1,%o1
   1117 /* 0x018c	 246 */		ldd	[%o5],%f2
   1118 /* 0x0190	     */		add	%o5,16,%l3
   1119 /* 0x0194	     */		fmuld	%f0,%f6,%f6
   1120 /* 0x0198	     */		ldd	[%g5],%f4
   1121 /* 0x019c	     */		faddd	%f2,%f8,%f2
   1122 /* 0x01a0	     */		ldd	[%o5+8],%f0
   1123 /* 0x01a4	 244 */		ldd	[%i3+%l2],%f20
   1124 /* 0x01a8	 246 */		faddd	%f0,%f6,%f0
   1125 /* 0x01ac	     */		fmuld	%f2,%f4,%f2
   1126 /* 0x01b0	     */		faddd	%f0,%f2,%f18
   1127 /* 0x01b4	 247 */		std	%f18,[%o5+8]
   1128 /* 0x01b8	 250 */		ble,pt	%icc,.L900000658
   1129 /* 0x01bc	     */		srl	%g4,31,%g2
   1130 /* 0x01c0	     */		cmp	%o7,7
   1131 /* 0x01c4	 246 */		add	%i4,8,%g2
   1132 /* 0x01c8	 250 */		bl,pn	%icc,.L77000284
   1133 /* 0x01cc	     */		add	%g2,24,%o2
   1134 /* 0x01d0	 252 */		ldd	[%o0+24],%f12
   1135 /* 0x01d4	     */		add	%o5,48,%l3
   1136 /* 0x01d8	     */		ldd	[%o0],%f2
   1137 /* 0x01dc	   0 */		or	%g0,%o2,%g2
   1138 /* 0x01e0	 250 */		sub	%o7,2,%o2
   1139 /* 0x01e4	 252 */		ldd	[%g2-24],%f0
   1140 /* 0x01e8	     */		or	%g0,5,%o1
   1141 /* 0x01ec	     */		ldd	[%o0+8],%f6
   1142 /* 0x01f0	     */		fmuld	%f2,%f20,%f2
   1143 /* 0x01f4	     */		ldd	[%o0+16],%f14
   1144 /* 0x01f8	     */		fmuld	%f0,%f22,%f4
   1145 /* 0x01fc	     */		add	%o0,32,%o0
   1146 /* 0x0200	     */		ldd	[%g2-16],%f8
   1147 /* 0x0204	     */		fmuld	%f6,%f20,%f10
   1148 /* 0x0208	     */		ldd	[%o5+16],%f0
   1149 /* 0x020c	     */		ldd	[%g2-8],%f6
   1150 /* 0x0210	     */		faddd	%f2,%f4,%f4
   1151 /* 0x0214	     */		ldd	[%o5+32],%f2
   1152                       .L900000642:
   1153 /* 0x0218	 252 */		ldd	[%g2],%f24
   1154 /* 0x021c	     */		add	%o1,3,%o1
   1155 /* 0x0220	     */		add	%g2,24,%g2
   1156 /* 0x0224	     */		fmuld	%f8,%f22,%f8
   1157 /* 0x0228	     */		ldd	[%l3],%f28
   1158 /* 0x022c	     */		cmp	%o1,%o2
   1159 /* 0x0230	     */		add	%o0,24,%o0
   1160 /* 0x0234	     */		ldd	[%o0-24],%f26
   1161 /* 0x0238	     */		faddd	%f0,%f4,%f0
   1162 /* 0x023c	     */		add	%l3,48,%l3
   1163 /* 0x0240	     */		faddd	%f10,%f8,%f10
   1164 /* 0x0244	     */		fmuld	%f14,%f20,%f4
   1165 /* 0x0248	     */		std	%f0,[%l3-80]
   1166 /* 0x024c	     */		ldd	[%g2-16],%f8
   1167 /* 0x0250	     */		fmuld	%f6,%f22,%f6
   1168 /* 0x0254	     */		ldd	[%l3-32],%f0
   1169 /* 0x0258	     */		ldd	[%o0-16],%f14
   1170 /* 0x025c	     */		faddd	%f2,%f10,%f2
   1171 /* 0x0260	     */		faddd	%f4,%f6,%f10
   1172 /* 0x0264	     */		fmuld	%f12,%f20,%f4
   1173 /* 0x0268	     */		std	%f2,[%l3-64]
   1174 /* 0x026c	     */		ldd	[%g2-8],%f6
   1175 /* 0x0270	     */		fmuld	%f24,%f22,%f24
   1176 /* 0x0274	     */		ldd	[%l3-16],%f2
   1177 /* 0x0278	     */		ldd	[%o0-8],%f12
   1178 /* 0x027c	     */		faddd	%f28,%f10,%f10
   1179 /* 0x0280	     */		std	%f10,[%l3-48]
   1180 /* 0x0284	     */		fmuld	%f26,%f20,%f10
   1181 /* 0x0288	     */		ble,pt	%icc,.L900000642
   1182 /* 0x028c	     */		faddd	%f4,%f24,%f4
   1183                       .L900000645:
   1184 /* 0x0290	 252 */		fmuld	%f8,%f22,%f28
   1185 /* 0x0294	     */		ldd	[%g2],%f24
   1186 /* 0x0298	     */		faddd	%f0,%f4,%f26
   1187 /* 0x029c	     */		fmuld	%f12,%f20,%f8
   1188 /* 0x02a0	     */		add	%l3,32,%l3
   1189 /* 0x02a4	     */		cmp	%o1,%o7
   1190 /* 0x02a8	     */		fmuld	%f14,%f20,%f14
   1191 /* 0x02ac	     */		ldd	[%l3-32],%f4
   1192 /* 0x02b0	     */		add	%g2,8,%g2
   1193 /* 0x02b4	     */		faddd	%f10,%f28,%f12
   1194 /* 0x02b8	     */		fmuld	%f6,%f22,%f6
   1195 /* 0x02bc	     */		ldd	[%l3-16],%f0
   1196 /* 0x02c0	     */		fmuld	%f24,%f22,%f10
   1197 /* 0x02c4	     */		std	%f26,[%l3-64]
   1198 /* 0x02c8	     */		faddd	%f2,%f12,%f2
   1199 /* 0x02cc	     */		std	%f2,[%l3-48]
   1200 /* 0x02d0	     */		faddd	%f14,%f6,%f6
   1201 /* 0x02d4	     */		faddd	%f8,%f10,%f2
   1202 /* 0x02d8	     */		faddd	%f4,%f6,%f4
   1203 /* 0x02dc	     */		std	%f4,[%l3-32]
   1204 /* 0x02e0	     */		faddd	%f0,%f2,%f0
   1205 /* 0x02e4	     */		bg,pn	%icc,.L77000213
   1206 /* 0x02e8	     */		std	%f0,[%l3-16]
   1207                       .L77000284:
   1208 /* 0x02ec	 252 */		ldd	[%o0],%f0
   1209                       .L900000657:
   1210 /* 0x02f0	 252 */		ldd	[%g2],%f4
   1211 /* 0x02f4	     */		fmuld	%f0,%f20,%f2
   1212 /* 0x02f8	     */		add	%o1,1,%o1
   1213 /* 0x02fc	     */		ldd	[%l3],%f0
   1214 /* 0x0300	     */		add	%o0,8,%o0
   1215 /* 0x0304	     */		add	%g2,8,%g2
   1216 /* 0x0308	     */		fmuld	%f4,%f22,%f4
   1217 /* 0x030c	     */		cmp	%o1,%o7
   1218 /* 0x0310	     */		faddd	%f2,%f4,%f2
   1219 /* 0x0314	     */		faddd	%f0,%f2,%f0
   1220 /* 0x0318	     */		std	%f0,[%l3]
   1221 /* 0x031c	     */		add	%l3,16,%l3
   1222 /* 0x0320	     */		ble,a,pt	%icc,.L900000657
   1223 /* 0x0324	     */		ldd	[%o0],%f0
   1224                       .L77000213:
   1225 /* 0x0328	     */		srl	%g4,31,%g2
   1226                       .L900000658:
   1227 /* 0x032c	 254 */		cmp	%l1,30
   1228 /* 0x0330	     */		bne,a,pt	%icc,.L900000656
   1229 /* 0x0334	     */		fdtox	%f18,%f0
   1230 /* 0x0338	     */		add	%g4,%g2,%g2
   1231 /* 0x033c	     */		sra	%g2,1,%o0
   1232 /* 0x0340	 281 */		ldd	[%l0],%f0
   1233 /* 0x0344	     */		sll	%i5,1,%o2
   1234 /* 0x0348	     */		add	%o0,1,%g2
   1235 /* 0x034c	     */		sll	%g2,1,%o0
   1236 /* 0x0350	 254 */		sub	%o2,1,%o2
   1237 /* 0x0354	 281 */		fmovd	%f0,%f2
   1238 /* 0x0358	     */		sll	%g2,4,%o1
   1239 /* 0x035c	     */		cmp	%o0,%o3
   1240 /* 0x0360	     */		bge,pt	%icc,.L77000215
   1241 /* 0x0364	     */		or	%g0,0,%l1
   1242 /* 0x0368	 254 */		add	%i1,%o1,%o1
   1243 /* 0x036c	 281 */		ldd	[%o1],%f6
   1244                       .L900000655:
   1245 /* 0x0370	     */		fdtox	%f6,%f10
   1246 /* 0x0374	     */		ldd	[%o1+8],%f4
   1247 /* 0x0378	     */		add	%o0,2,%o0
   1248 /* 0x037c	     */		ldd	[%l0],%f12
   1249 /* 0x0380	     */		fdtox	%f6,%f6
   1250 /* 0x0384	     */		cmp	%o0,%o2
   1251 /* 0x0388	     */		fdtox	%f4,%f8
   1252 /* 0x038c	     */		fdtox	%f4,%f4
   1253 /* 0x0390	     */		fmovs	%f12,%f10
   1254 /* 0x0394	     */		fmovs	%f12,%f8
   1255 /* 0x0398	     */		fxtod	%f10,%f10
   1256 /* 0x039c	     */		fxtod	%f8,%f8
   1257 /* 0x03a0	     */		faddd	%f10,%f2,%f2
   1258 /* 0x03a4	     */		std	%f2,[%o1]
   1259 /* 0x03a8	     */		faddd	%f8,%f0,%f0
   1260 /* 0x03ac	     */		std	%f0,[%o1+8]
   1261 /* 0x03b0	     */		add	%o1,16,%o1
   1262 /* 0x03b4	     */		fitod	%f6,%f2
   1263 /* 0x03b8	     */		fitod	%f4,%f0
   1264 /* 0x03bc	     */		ble,a,pt	%icc,.L900000655
   1265 /* 0x03c0	     */		ldd	[%o1],%f6
   1266                       .L77000233:
   1267 /* 0x03c4	     */		or	%g0,0,%l1
   1268                       .L77000215:
   1269 /* 0x03c8	     */		fdtox	%f18,%f0
   1270                       .L900000656:
   1271 /* 0x03cc	     */		ldd	[%l0],%f6
   1272 /* 0x03d0	 256 */		add	%g4,1,%g4
   1273 /* 0x03d4	     */		add	%l2,8,%l2
   1274 /* 0x03d8	     */		ldd	[%g5],%f2
   1275 /* 0x03dc	     */		add	%l1,1,%l1
   1276 /* 0x03e0	     */		add	%o5,8,%o5
   1277 /* 0x03e4	     */		fmovs	%f6,%f0
   1278 /* 0x03e8	     */		ldd	[%g1],%f4
   1279 /* 0x03ec	     */		cmp	%g4,%g3
   1280 /* 0x03f0	     */		fxtod	%f0,%f0
   1281 /* 0x03f4	     */		fmuld	%f0,%f16,%f0
   1282 /* 0x03f8	     */		fmuld	%f0,%f2,%f2
   1283 /* 0x03fc	     */		fdtox	%f2,%f2
   1284 /* 0x0400	     */		fxtod	%f2,%f2
   1285 /* 0x0404	     */		fmuld	%f2,%f4,%f2
   1286 /* 0x0408	     */		fsubd	%f0,%f2,%f22
   1287 /* 0x040c	     */		ble,a,pt	%icc,.L900000654
   1288 /* 0x0410	     */		ldd	[%i4],%f0
   1289                       .L900000629:
   1290 /* 0x0414	 256 */		ba	.L900000653
   1291 /* 0x0418	     */		sll	%i0,4,%g2
   1292                       .L77000279:
   1293 /* 0x041c	 261 */		ldd	[%o2],%f6
   1294 /* 0x0420	 279 */		or	%g0,%o0,%o4
   1295 /* 0x0424	 281 */		or	%g0,0,%o3
   1296 /* 0x0428	 261 */		ldd	[%i2],%f4
   1297 /* 0x042c	 273 */		std	%f0,[%o0+8]
   1298 /* 0x0430	     */		std	%f0,[%o0+16]
   1299 /* 0x0434	 261 */		fmuld	%f4,%f6,%f4
   1300 /* 0x0438	     */		std	%f4,[%o0]
   1301 /* 0x043c	 273 */		std	%f0,[%o0+24]
   1302 /* 0x0440	     */		std	%f0,[%o0+32]
   1303 /* 0x0444	     */		fdtox	%f4,%f4
   1304 /* 0x0448	     */		std	%f0,[%o0+40]
   1305 /* 0x044c	     */		std	%f0,[%o0+48]
   1306 /* 0x0450	     */		std	%f0,[%o0+56]
   1307 /* 0x0454	     */		std	%f0,[%o0+64]
   1308 /* 0x0458	     */		std	%f0,[%o0+72]
   1309 /* 0x045c	     */		std	%f0,[%o0+80]
   1310 /* 0x0460	     */		std	%f0,[%o0+88]
   1311 /* 0x0464	     */		std	%f0,[%o0+96]
   1312 /* 0x0468	     */		std	%f0,[%o0+104]
   1313 /* 0x046c	     */		std	%f0,[%o0+112]
   1314 /* 0x0470	     */		std	%f0,[%o0+120]
   1315 /* 0x0474	     */		std	%f0,[%o0+128]
   1316 /* 0x0478	     */		std	%f0,[%o0+136]
   1317 /* 0x047c	     */		std	%f0,[%o0+144]
   1318 /* 0x0480	     */		std	%f0,[%o0+152]
   1319 /* 0x0484	     */		std	%f0,[%o0+160]
   1320 /* 0x0488	     */		std	%f0,[%o0+168]
   1321 /* 0x048c	     */		fmovs	%f0,%f4
   1322 /* 0x0490	     */		std	%f0,[%o0+176]
   1323 /* 0x0494	 281 */		or	%g0,0,%o1
   1324 /* 0x0498	 273 */		std	%f0,[%o0+184]
   1325 /* 0x049c	     */		fxtod	%f4,%f4
   1326 /* 0x04a0	     */		std	%f0,[%o0+192]
   1327 /* 0x04a4	     */		std	%f0,[%o0+200]
   1328 /* 0x04a8	     */		std	%f0,[%o0+208]
   1329 /* 0x04ac	 278 */		fmuld	%f4,%f2,%f2
   1330 /* 0x04b0	 273 */		std	%f0,[%o0+216]
   1331 /* 0x04b4	     */		std	%f0,[%o0+224]
   1332 /* 0x04b8	     */		std	%f0,[%o0+232]
   1333 /* 0x04bc	     */		std	%f0,[%o0+240]
   1334 /* 0x04c0	     */		std	%f0,[%o0+248]
   1335 /* 0x04c4	     */		std	%f0,[%o0+256]
   1336 /* 0x04c8	     */		std	%f0,[%o0+264]
   1337 /* 0x04cc	     */		std	%f0,[%o0+272]
   1338 /* 0x04d0	     */		std	%f0,[%o0+280]
   1339 /* 0x04d4	     */		std	%f0,[%o0+288]
   1340 /* 0x04d8	     */		std	%f0,[%o0+296]
   1341 /* 0x04dc	     */		std	%f0,[%o0+304]
   1342 /* 0x04e0	     */		std	%f0,[%o0+312]
   1343 /* 0x04e4	     */		std	%f0,[%o0+320]
   1344 /* 0x04e8	     */		std	%f0,[%o0+328]
   1345 /* 0x04ec	     */		std	%f0,[%o0+336]
   1346 /* 0x04f0	     */		std	%f0,[%o0+344]
   1347 /* 0x04f4	     */		std	%f0,[%o0+352]
   1348 /* 0x04f8	     */		std	%f0,[%o0+360]
   1349 /* 0x04fc	     */		std	%f0,[%o0+368]
   1350 /* 0x0500	     */		std	%f0,[%o0+376]
   1351 /* 0x0504	     */		std	%f0,[%o0+384]
   1352 /* 0x0508	     */		std	%f0,[%o0+392]
   1353 /* 0x050c	     */		std	%f0,[%o0+400]
   1354 /* 0x0510	     */		std	%f0,[%o0+408]
   1355 /* 0x0514	     */		std	%f0,[%o0+416]
   1356 /* 0x0518	     */		std	%f0,[%o0+424]
   1357 /* 0x051c	     */		std	%f0,[%o0+432]
   1358 /* 0x0520	     */		std	%f0,[%o0+440]
   1359 /* 0x0524	     */		std	%f0,[%o0+448]
   1360 /* 0x0528	     */		std	%f0,[%o0+456]
   1361 /* 0x052c	     */		std	%f0,[%o0+464]
   1362 /* 0x0530	     */		std	%f0,[%o0+472]
   1363 /* 0x0534	     */		std	%f0,[%o0+480]
   1364 /* 0x0538	     */		std	%f0,[%o0+488]
   1365 /* 0x053c	     */		std	%f0,[%o0+496]
   1366 /* 0x0540	     */		std	%f0,[%o0+504]
   1367 /* 0x0544	     */		std	%f0,[%o0+512]
   1368 /* 0x0548	     */		std	%f0,[%o0+520]
   1369 /* 0x054c	     */		ldd	[%g5],%f0
   1370 /* 0x0550	     */		ldd	[%g1],%f8
   1371 /* 0x0554	     */		fmuld	%f2,%f0,%f6
   1372 /* 0x0558	 275 */		ldd	[%i4],%f4
   1373 /* 0x055c	 276 */		ldd	[%i2],%f0
   1374 /* 0x0560	     */		fdtox	%f6,%f6
   1375 /* 0x0564	     */		fxtod	%f6,%f6
   1376 /* 0x0568	     */		fmuld	%f6,%f8,%f6
   1377 /* 0x056c	     */		fsubd	%f2,%f6,%f2
   1378 /* 0x0570	 286 */		fmuld	%f4,%f2,%f12
   1379 
   1380 !  282		      !       {
   1381 !  284		      !	 m2j=pdm2[j];
   1382 !  285		      !	 a=pdtj[0]+pdn_0*digit;
   1383 !  286		      !	 b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16;
   1384 
   1385 !  287		      !	 pdtj[1]=b;
   1386 !  289		      !	 /**** this loop will be fully unrolled:
   1387 !  290		      !	 for(i=1;i<16;i++)
   1388 !  291		      !	   {
   1389 !  292		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
   1390 !  293		      !	   }
   1391 !  294		      !	 *************************************/
   1392 !  295		      !	     pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit;
   1393 !  296		      !	     pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit;
   1394 !  297		      !	     pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit;
   1395 !  298		      !	     pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit;
   1396 !  299		      !	     pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit;
   1397 !  300		      !	     pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit;
   1398 !  301		      !	     pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit;
   1399 !  302		      !	     pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit;
   1400 !  303		      !	     pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit;
   1401 !  304		      !	     pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit;
   1402 !  305		      !	     pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit;
   1403 !  306		      !	     pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit;
   1404 !  307		      !	     pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit;
   1405 !  308		      !	     pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit;
   1406 !  309		      !	     pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit;
   1407 !  310		      !	 /* no need for cleenup, cannot overflow */
   1408 !  311		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
   1409 
   1410 fmovd %f2,%f0		! hand modified
   1411 fmovd %f16,%f18			! hand modified
   1412 ldd [%i4],%f2
   1413 ldd [%o4],%f8
   1414 ldd [%i2],%f10
   1415 ldd [%g5],%f14		! hand modified
   1416 ldd [%g1],%f16		! hand modified
   1417 ldd [%i3],%f24
   1418 
   1419 ldd [%i2+8],%f26
   1420 ldd [%i2+16],%f40
   1421 ldd [%i2+48],%f46
   1422 ldd [%i2+56],%f30
   1423 ldd [%i2+64],%f54
   1424 ldd [%i2+104],%f34
   1425 ldd [%i2+112],%f58
   1426 
   1427 ldd [%i4+8],%f28	
   1428 ldd [%i4+104],%f38
   1429 ldd [%i4+112],%f60
   1430 
   1431 .L99999999: 			!1
   1432 ldd	[%i2+24],%f32
   1433 fmuld	%f0,%f2,%f4 	!2
   1434 ldd	[%i4+24],%f36
   1435 fmuld	%f26,%f24,%f20 	!3
   1436 ldd	[%i2+40],%f42
   1437 fmuld	%f28,%f0,%f22 	!4
   1438 ldd	[%i4+40],%f44
   1439 fmuld	%f32,%f24,%f32 	!5
   1440 ldd	[%i3+8],%f6
   1441 faddd	%f4,%f8,%f4
   1442 fmuld	%f36,%f0,%f36 	!6
   1443 add	%i3,8,%i3
   1444 ldd	[%i4+56],%f50
   1445 fmuld	%f42,%f24,%f42 	!7
   1446 ldd	[%i2+72],%f52
   1447 faddd	%f20,%f22,%f20
   1448 fmuld	%f44,%f0,%f44 	!8
   1449 ldd	[%o4+16],%f22
   1450 fmuld	%f10,%f6,%f12 	!9
   1451 ldd	[%i4+72],%f56
   1452 faddd	%f32,%f36,%f32
   1453 fmuld	%f14,%f4,%f4 !10
   1454 ldd	[%o4+48],%f36
   1455 fmuld	%f30,%f24,%f48 	!11
   1456 ldd	[%o4+8],%f8
   1457 faddd	%f20,%f22,%f20
   1458 fmuld	%f50,%f0,%f50	!12
   1459 std	%f20,[%o4+16]
   1460 faddd	%f42,%f44,%f42
   1461 fmuld	%f52,%f24,%f52 	!13
   1462 ldd	[%o4+80],%f44
   1463 faddd	%f4,%f12,%f4
   1464 fmuld	%f56,%f0,%f56 	!14
   1465 ldd	[%i2+88],%f20
   1466 faddd	%f32,%f36,%f32 	!15
   1467 ldd	[%i4+88],%f22
   1468 faddd	%f48,%f50,%f48 	!16
   1469 ldd	[%o4+112],%f50
   1470 faddd	%f52,%f56,%f52 	!17
   1471 ldd	[%o4+144],%f56
   1472 faddd	%f4,%f8,%f8
   1473 fmuld	%f20,%f24,%f20 	!18
   1474 std	%f32,[%o4+48]
   1475 faddd	%f42,%f44,%f42
   1476 fmuld	%f22,%f0,%f22 	!19
   1477 std	%f42,[%o4+80]
   1478 faddd	%f48,%f50,%f48
   1479 fmuld	%f34,%f24,%f32 	!20
   1480 std	%f48,[%o4+112]
   1481 faddd	%f52,%f56,%f52
   1482 fmuld	%f38,%f0,%f36 	!21
   1483 ldd	[%i2+120],%f42
   1484 fdtox	%f8,%f4 		!22
   1485 std	%f52,[%o4+144]
   1486 faddd	%f20,%f22,%f20 	!23
   1487 ldd	[%i4+120],%f44 	!24
   1488 ldd	[%o4+176],%f22
   1489 faddd	%f32,%f36,%f32
   1490 fmuld	%f42,%f24,%f42 	!25
   1491 ldd	[%i4+16],%f50
   1492 fmovs	%f17,%f4 	!26
   1493 ldd	[%i2+32],%f52
   1494 fmuld	%f44,%f0,%f44 	!27
   1495 ldd	[%i4+32],%f56
   1496 fmuld	%f40,%f24,%f48 	!28
   1497 ldd	[%o4+208],%f36
   1498 faddd	%f20,%f22,%f20
   1499 fmuld	%f50,%f0,%f50 	!29
   1500 std	%f20,[%o4+176]
   1501 fxtod	%f4,%f4
   1502 fmuld	%f52,%f24,%f52 	!30
   1503 ldd	[%i4+48],%f22
   1504 faddd	%f42,%f44,%f42
   1505 fmuld	%f56,%f0,%f56 	!31
   1506 ldd	[%o4+240],%f44
   1507 faddd	%f32,%f36,%f32 	!32
   1508 std	%f32,[%o4+208]
   1509 faddd	%f48,%f50,%f48
   1510 fmuld	%f46,%f24,%f20 	!33
   1511 ldd	[%o4+32],%f50
   1512 fmuld	%f4,%f18,%f12 	!34
   1513 ldd	[%i4+64],%f36
   1514 faddd	%f52,%f56,%f52
   1515 fmuld	%f22,%f0,%f22 	!35
   1516 ldd	[%o4+64],%f56
   1517 faddd	%f42,%f44,%f42 	!36
   1518 std	%f42,[%o4+240]
   1519 faddd	%f48,%f50,%f48
   1520 fmuld	%f54,%f24,%f32 	!37
   1521 std	%f48,[%o4+32]
   1522 fmuld	%f12,%f14,%f4 !38
   1523 ldd	[%i2+80],%f42
   1524 faddd	%f52,%f56,%f56	! yes, tmp52!
   1525 fmuld	%f36,%f0,%f36 	!39
   1526 ldd	[%i4+80],%f44
   1527 faddd	%f20,%f22,%f20 	!40
   1528 ldd	[%i2+96],%f48
   1529 fmuld	%f58,%f24,%f52 	!41
   1530 ldd	[%i4+96],%f50
   1531 fdtox	%f4,%f4
   1532 fmuld	%f42,%f24,%f42 	!42
   1533 std	%f56,[%o4+64]	! yes, tmp52!
   1534 faddd	%f32,%f36,%f32
   1535 fmuld	%f44,%f0,%f44 	!43
   1536 ldd	[%o4+96],%f22
   1537 fmuld	%f48,%f24,%f48 	!44
   1538 ldd	[%o4+128],%f36
   1539 fmovd	%f6,%f24
   1540 fmuld	%f50,%f0,%f50 	!45
   1541 fxtod	%f4,%f4
   1542 fmuld	%f60,%f0,%f56 	!46
   1543 add	%o4,8,%o4
   1544 faddd	%f42,%f44,%f42 	!47
   1545 ldd	[%o4+160-8],%f44
   1546 faddd	%f20,%f22,%f20 	!48
   1547 std	%f20,[%o4+96-8]
   1548 faddd	%f48,%f50,%f48 	!49
   1549 ldd	[%o4+192-8],%f50
   1550 faddd	%f52,%f56,%f52
   1551 fmuld	%f4,%f16,%f4 	!50
   1552 ldd	[%o4+224-8],%f56
   1553 faddd	%f32,%f36,%f32 	!51
   1554 std	%f32,[%o4+128-8]
   1555 faddd	%f42,%f44,%f42 	!52
   1556 add	%o3,1,%o3
   1557 std	%f42,[%o4+160-8]
   1558 faddd	%f48,%f50,%f48 	!53
   1559 cmp	%o3,31
   1560 std	%f48,[%o4+192-8]
   1561 fsubd	%f12,%f4,%f0 	!54
   1562 faddd	%f52,%f56,%f52
   1563 ble,pt	%icc,.L99999999
   1564 std	%f52,[%o4+224-8] 	!55
   1565 std %f8,[%o4]
   1566 
   1567 !  312		      !       }
   1568 !  313		      !   }
   1569 !  315		      ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1);
   1570 
   1571 /* 0x07c8	 315 */		sll	%i0,4,%g2
   1572                       .L900000653:
   1573 /* 0x07cc	 315 */		add	%i1,%g2,%i1
   1574 /* 0x07d0	 242 */		ld	[%fp+68],%o0
   1575 /* 0x07d4	 315 */		or	%g0,0,%o4
   1576 /* 0x07d8	     */		ldd	[%i1],%f0
   1577 /* 0x07dc	     */		or	%g0,0,%g5
   1578 /* 0x07e0	     */		cmp	%i0,0
   1579 /* 0x07e4	 242 */		or	%g0,%o0,%o3
   1580 /* 0x07e8	 311 */		sub	%i0,1,%g1
   1581 /* 0x07ec	 315 */		fdtox	%f0,%f0
   1582 /* 0x07f0	     */		std	%f0,[%sp+120]
   1583 /* 0x07f4	 311 */		sethi	%hi(0xfc00),%o1
   1584 /* 0x07f8	     */		add	%g1,1,%g3
   1585 /* 0x07fc	     */		or	%g0,%o0,%g4
   1586 /* 0x0800	 315 */		ldd	[%i1+8],%f0
   1587 /* 0x0804	     */		add	%o1,1023,%o1
   1588 /* 0x0808	     */		fdtox	%f0,%f0
   1589 /* 0x080c	     */		std	%f0,[%sp+112]
   1590 /* 0x0810	     */		ldx	[%sp+112],%o5
   1591 /* 0x0814	     */		ldx	[%sp+120],%o7
   1592 /* 0x0818	     */		ble,pt	%icc,.L900000651
   1593 /* 0x081c	     */		sethi	%hi(0xfc00),%g2
   1594 /* 0x0820	 311 */		or	%g0,-1,%g2
   1595 /* 0x0824	 315 */		cmp	%g3,3
   1596 /* 0x0828	 311 */		srl	%g2,0,%o2
   1597 /* 0x082c	 315 */		bl,pn	%icc,.L77000287
   1598 /* 0x0830	     */		or	%g0,%i1,%g2
   1599 /* 0x0834	     */		ldd	[%i1+16],%f0
   1600 /* 0x0838	     */		and	%o5,%o1,%o0
   1601 /* 0x083c	     */		add	%i1,16,%g2
   1602 /* 0x0840	     */		sllx	%o0,16,%g3
   1603 /* 0x0844	     */		and	%o7,%o2,%o0
   1604 /* 0x0848	     */		fdtox	%f0,%f0
   1605 /* 0x084c	     */		std	%f0,[%sp+104]
   1606 /* 0x0850	     */		add	%o0,%g3,%o4
   1607 /* 0x0854	     */		ldd	[%i1+24],%f2
   1608 /* 0x0858	     */		srax	%o5,16,%o0
   1609 /* 0x085c	     */		add	%o3,4,%g4
   1610 /* 0x0860	     */		stx	%o0,[%sp+128]
   1611 /* 0x0864	     */		and	%o4,%o2,%o0
   1612 /* 0x0868	     */		stx	%o0,[%sp+112]
   1613 /* 0x086c	     */		srax	%o4,32,%o0
   1614 /* 0x0870	     */		fdtox	%f2,%f0
   1615 /* 0x0874	     */		stx	%o0,[%sp+136]
   1616 /* 0x0878	     */		srax	%o7,32,%o4
   1617 /* 0x087c	     */		std	%f0,[%sp+96]
   1618 /* 0x0880	     */		ldx	[%sp+128],%g5
   1619 /* 0x0884	     */		ldx	[%sp+136],%o7
   1620 /* 0x0888	     */		ldx	[%sp+104],%g3
   1621 /* 0x088c	     */		add	%g5,%o7,%o0
   1622 /* 0x0890	     */		or	%g0,1,%g5
   1623 /* 0x0894	     */		ldx	[%sp+112],%o7
   1624 /* 0x0898	     */		add	%o4,%o0,%o4
   1625 /* 0x089c	     */		ldx	[%sp+96],%o5
   1626 /* 0x08a0	     */		st	%o7,[%o3]
   1627 /* 0x08a4	     */		or	%g0,%g3,%o7
   1628                       .L900000634:
   1629 /* 0x08a8	     */		ldd	[%g2+16],%f0
   1630 /* 0x08ac	     */		add	%g5,1,%g5
   1631 /* 0x08b0	     */		add	%g4,4,%g4
   1632 /* 0x08b4	     */		cmp	%g5,%g1
   1633 /* 0x08b8	     */		add	%g2,16,%g2
   1634 /* 0x08bc	     */		fdtox	%f0,%f0
   1635 /* 0x08c0	     */		std	%f0,[%sp+104]
   1636 /* 0x08c4	     */		ldd	[%g2+8],%f0
   1637 /* 0x08c8	     */		fdtox	%f0,%f0
   1638 /* 0x08cc	     */		std	%f0,[%sp+96]
   1639 /* 0x08d0	     */		and	%o5,%o1,%g3
   1640 /* 0x08d4	     */		sllx	%g3,16,%g3
   1641 /* 0x08d8	     */		stx	%g3,[%sp+120]
   1642 /* 0x08dc	     */		and	%o7,%o2,%g3
   1643 /* 0x08e0	     */		stx	%o7,[%sp+128]
   1644 /* 0x08e4	     */		ldx	[%sp+120],%o7
   1645 /* 0x08e8	     */		add	%g3,%o7,%g3
   1646 /* 0x08ec	     */		ldx	[%sp+128],%o7
   1647 /* 0x08f0	     */		srax	%o5,16,%o5
   1648 /* 0x08f4	     */		add	%g3,%o4,%g3
   1649 /* 0x08f8	     */		srax	%g3,32,%o4
   1650 /* 0x08fc	     */		stx	%o4,[%sp+112]
   1651 /* 0x0900	     */		srax	%o7,32,%o4
   1652 /* 0x0904	     */		ldx	[%sp+112],%o7
   1653 /* 0x0908	     */		add	%o5,%o7,%o7
   1654 /* 0x090c	     */		ldx	[%sp+96],%o5
   1655 /* 0x0910	     */		add	%o4,%o7,%o4
   1656 /* 0x0914	     */		and	%g3,%o2,%g3
   1657 /* 0x0918	     */		ldx	[%sp+104],%o7
   1658 /* 0x091c	     */		ble,pt	%icc,.L900000634
   1659 /* 0x0920	     */		st	%g3,[%g4-4]
   1660                       .L900000637:
   1661 /* 0x0924	     */		ba	.L900000651
   1662 /* 0x0928	     */		sethi	%hi(0xfc00),%g2
   1663                       .L77000287:
   1664 /* 0x092c	     */		ldd	[%g2+16],%f0
   1665                       .L900000650:
   1666 /* 0x0930	     */		and	%o7,%o2,%o0
   1667 /* 0x0934	     */		and	%o5,%o1,%g3
   1668 /* 0x0938	     */		fdtox	%f0,%f0
   1669 /* 0x093c	     */		add	%o4,%o0,%o0
   1670 /* 0x0940	     */		std	%f0,[%sp+104]
   1671 /* 0x0944	     */		add	%g5,1,%g5
   1672 /* 0x0948	     */		sllx	%g3,16,%o4
   1673 /* 0x094c	     */		ldd	[%g2+24],%f2
   1674 /* 0x0950	     */		add	%g2,16,%g2
   1675 /* 0x0954	     */		add	%o0,%o4,%o4
   1676 /* 0x0958	     */		cmp	%g5,%g1
   1677 /* 0x095c	     */		srax	%o5,16,%o0
   1678 /* 0x0960	     */		stx	%o0,[%sp+112]
   1679 /* 0x0964	     */		and	%o4,%o2,%g3
   1680 /* 0x0968	     */		srax	%o4,32,%o5
   1681 /* 0x096c	     */		fdtox	%f2,%f0
   1682 /* 0x0970	     */		std	%f0,[%sp+96]
   1683 /* 0x0974	     */		srax	%o7,32,%o4
   1684 /* 0x0978	     */		ldx	[%sp+112],%o7
   1685 /* 0x097c	     */		add	%o7,%o5,%o7
   1686 /* 0x0980	     */		ldx	[%sp+104],%o5
   1687 /* 0x0984	     */		add	%o4,%o7,%o4
   1688 /* 0x0988	     */		ldx	[%sp+96],%o0
   1689 /* 0x098c	     */		st	%g3,[%g4]
   1690 /* 0x0990	     */		or	%g0,%o5,%o7
   1691 /* 0x0994	     */		add	%g4,4,%g4
   1692 /* 0x0998	     */		or	%g0,%o0,%o5
   1693 /* 0x099c	     */		ble,a,pt	%icc,.L900000650
   1694 /* 0x09a0	     */		ldd	[%g2+16],%f0
   1695                       .L77000236:
   1696 /* 0x09a4	     */		sethi	%hi(0xfc00),%g2
   1697                       .L900000651:
   1698 /* 0x09a8	     */		or	%g0,-1,%o0
   1699 /* 0x09ac	     */		add	%g2,1023,%g2
   1700 /* 0x09b0	     */		ld	[%fp+88],%o1
   1701 /* 0x09b4	     */		srl	%o0,0,%g3
   1702 /* 0x09b8	     */		and	%o5,%g2,%g2
   1703 /* 0x09bc	     */		and	%o7,%g3,%g4
   1704 
   1705 !  317		      ! adjust_montf_result(result,nint,nlen); 
   1706 
   1707 /* 0x09c0	 317 */		or	%g0,-1,%o5
   1708 /* 0x09c4	 311 */		sllx	%g2,16,%g2
   1709 /* 0x09c8	     */		add	%o4,%g4,%g4
   1710 /* 0x09cc	     */		add	%g4,%g2,%g2
   1711 /* 0x09d0	     */		sll	%g5,2,%g4
   1712 /* 0x09d4	     */		and	%g2,%g3,%g2
   1713 /* 0x09d8	     */		st	%g2,[%o3+%g4]
   1714 /* 0x09dc	 317 */		sll	%i0,2,%g2
   1715 /* 0x09e0	     */		ld	[%o3+%g2],%g2
   1716 /* 0x09e4	     */		cmp	%g2,0
   1717 /* 0x09e8	     */		bleu,pn	%icc,.L77000241
   1718 /* 0x09ec	     */		or	%g0,%o1,%o2
   1719 /* 0x09f0	     */		ba	.L900000649
   1720 /* 0x09f4	     */		cmp	%o5,0
   1721                       .L77000241:
   1722 /* 0x09f8	     */		sub	%i0,1,%o5
   1723 /* 0x09fc	     */		sll	%o5,2,%g2
   1724 /* 0x0a00	     */		cmp	%o5,0
   1725 /* 0x0a04	     */		bl,pt	%icc,.L900000649
   1726 /* 0x0a08	     */		cmp	%o5,0
   1727 /* 0x0a0c	     */		add	%o1,%g2,%o1
   1728 /* 0x0a10	     */		add	%o3,%g2,%o4
   1729 /* 0x0a14	     */		ld	[%o1],%g2
   1730                       .L900000648:
   1731 /* 0x0a18	     */		ld	[%o4],%g3
   1732 /* 0x0a1c	     */		sub	%o5,1,%o0
   1733 /* 0x0a20	     */		sub	%o1,4,%o1
   1734 /* 0x0a24	     */		sub	%o4,4,%o4
   1735 /* 0x0a28	     */		cmp	%g3,%g2
   1736 /* 0x0a2c	     */		bne,pn	%icc,.L77000244
   1737 /* 0x0a30	     */		nop
   1738 /* 0x0a34	   0 */		or	%g0,%o0,%o5
   1739 /* 0x0a38	 317 */		cmp	%o0,0
   1740 /* 0x0a3c	     */		bge,a,pt	%icc,.L900000648
   1741 /* 0x0a40	     */		ld	[%o1],%g2
   1742                       .L77000244:
   1743 /* 0x0a44	     */		cmp	%o5,0
   1744                       .L900000649:
   1745 /* 0x0a48	     */		bl,pn	%icc,.L77000288
   1746 /* 0x0a4c	     */		sll	%o5,2,%g2
   1747 /* 0x0a50	     */		ld	[%o2+%g2],%g3
   1748 /* 0x0a54	     */		ld	[%o3+%g2],%g2
   1749 /* 0x0a58	     */		cmp	%g2,%g3
   1750 /* 0x0a5c	     */		bleu,pt	%icc,.L77000224
   1751 /* 0x0a60	     */		nop
   1752                       .L77000288:
   1753 /* 0x0a64	     */		cmp	%i0,0
   1754 /* 0x0a68	     */		ble,pt	%icc,.L77000224
   1755 /* 0x0a6c	     */		nop
   1756 /* 0x0a70	 317 */		sub	%i0,1,%o7
   1757 /* 0x0a74	     */		or	%g0,-1,%g2
   1758 /* 0x0a78	     */		srl	%g2,0,%o4
   1759 /* 0x0a7c	     */		add	%o7,1,%o0
   1760 /* 0x0a80	 315 */		or	%g0,0,%o5
   1761 /* 0x0a84	     */		or	%g0,0,%g1
   1762 /* 0x0a88	     */		cmp	%o0,3
   1763 /* 0x0a8c	     */		bl,pn	%icc,.L77000289
   1764 /* 0x0a90	     */		add	%o3,8,%o1
   1765 /* 0x0a94	     */		add	%o2,4,%o0
   1766 /* 0x0a98	     */		ld	[%o1-8],%g2
   1767 /* 0x0a9c	   0 */		or	%g0,%o1,%o3
   1768 /* 0x0aa0	 315 */		ld	[%o0-4],%g3
   1769 /* 0x0aa4	   0 */		or	%g0,%o0,%o2
   1770 /* 0x0aa8	 315 */		or	%g0,2,%g1
   1771 /* 0x0aac	     */		ld	[%o3-4],%o0
   1772 /* 0x0ab0	     */		sub	%g2,%g3,%g2
   1773 /* 0x0ab4	     */		or	%g0,%g2,%o5
   1774 /* 0x0ab8	     */		and	%g2,%o4,%g2
   1775 /* 0x0abc	     */		st	%g2,[%o3-8]
   1776 /* 0x0ac0	     */		srax	%o5,32,%o5
   1777                       .L900000638:
   1778 /* 0x0ac4	     */		ld	[%o2],%g2
   1779 /* 0x0ac8	     */		add	%g1,1,%g1
   1780 /* 0x0acc	     */		add	%o2,4,%o2
   1781 /* 0x0ad0	     */		cmp	%g1,%o7
   1782 /* 0x0ad4	     */		add	%o3,4,%o3
   1783 /* 0x0ad8	     */		sub	%o0,%g2,%o0
   1784 /* 0x0adc	     */		add	%o0,%o5,%o5
   1785 /* 0x0ae0	     */		and	%o5,%o4,%g2
   1786 /* 0x0ae4	     */		ld	[%o3-4],%o0
   1787 /* 0x0ae8	     */		st	%g2,[%o3-8]
   1788 /* 0x0aec	     */		ble,pt	%icc,.L900000638
   1789 /* 0x0af0	     */		srax	%o5,32,%o5
   1790                       .L900000641:
   1791 /* 0x0af4	     */		ld	[%o2],%o1
   1792 /* 0x0af8	     */		sub	%o0,%o1,%o0
   1793 /* 0x0afc	     */		add	%o0,%o5,%o0
   1794 /* 0x0b00	     */		and	%o0,%o4,%o1
   1795 /* 0x0b04	     */		st	%o1,[%o3-4]
   1796 /* 0x0b08	     */		ret	! Result = 
   1797 /* 0x0b0c	     */		restore	%g0,%g0,%g0
   1798                       .L77000289:
   1799 /* 0x0b10	     */		ld	[%o3],%o0
   1800                       .L900000647:
   1801 /* 0x0b14	     */		ld	[%o2],%o1
   1802 /* 0x0b18	     */		add	%o5,%o0,%o0
   1803 /* 0x0b1c	     */		add	%g1,1,%g1
   1804 /* 0x0b20	     */		add	%o2,4,%o2
   1805 /* 0x0b24	     */		cmp	%g1,%o7
   1806 /* 0x0b28	     */		sub	%o0,%o1,%o0
   1807 /* 0x0b2c	     */		and	%o0,%o4,%o1
   1808 /* 0x0b30	     */		st	%o1,[%o3]
   1809 /* 0x0b34	     */		add	%o3,4,%o3
   1810 /* 0x0b38	     */		srax	%o0,32,%o5
   1811 /* 0x0b3c	     */		ble,a,pt	%icc,.L900000647
   1812 /* 0x0b40	     */		ld	[%o3],%o0
   1813                       .L77000224:
   1814 /* 0x0b44	     */		ret	! Result = 
   1815 /* 0x0b48	     */		restore	%g0,%g0,%g0
   1816 /* 0x0b4c	   0 */		.type	mont_mulf_noconv,2
   1817 /* 0x0b4c	     */		.size	mont_mulf_noconv,(.-mont_mulf_noconv)