tor-browser

The Tor Browser
git clone https://git.dasho.dev/tor-browser.git
Log | Files | Refs | README | LICENSE

montmulfv9.s (79580B)


      1 !  
      2 ! This Source Code Form is subject to the terms of the Mozilla Public
      3 ! License, v. 2.0. If a copy of the MPL was not distributed with this
      4 ! file, You can obtain one at http://mozilla.org/MPL/2.0/.
      5 
      6 .section	".text",#alloc,#execinstr
      7 .file	"montmulf.c"
      8 
      9 .section	".rodata",#alloc
     10 .global	TwoTo16
     11 .align	8
     12 !
     13 ! CONSTANT POOL
     14 !
     15 .global TwoTo16
     16 TwoTo16:
     17 .word	1089470464
     18 .word	0
     19 .type	TwoTo16,#object
     20 .size	TwoTo16,8
     21 .global	TwoToMinus16
     22 !
     23 ! CONSTANT POOL
     24 !
     25 .global TwoToMinus16
     26 TwoToMinus16:
     27 .word	1055916032
     28 .word	0
     29 .type	TwoToMinus16,#object
     30 .size	TwoToMinus16,8
     31 .global	Zero
     32 !
     33 ! CONSTANT POOL
     34 !
     35 .global Zero
     36 Zero:
     37 .word	0
     38 .word	0
     39 .type	Zero,#object
     40 .size	Zero,8
     41 .global	TwoTo32
     42 !
     43 ! CONSTANT POOL
     44 !
     45 .global TwoTo32
     46 TwoTo32:
     47 .word	1106247680
     48 .word	0
     49 .type	TwoTo32,#object
     50 .size	TwoTo32,8
     51 .global	TwoToMinus32
     52 !
     53 ! CONSTANT POOL
     54 !
     55 .global TwoToMinus32
     56 TwoToMinus32:
     57 .word	1039138816
     58 .word	0
     59 .type	TwoToMinus32,#object
     60 .size	TwoToMinus32,8
     61 
     62 .section	".text",#alloc,#execinstr
     63 /* 000000	   0 */		.register	%g3,#scratch
     64 /* 000000	     */		.register	%g2,#scratch
     65 /* 000000	   0 */		.align	8
     66 !
     67 ! SUBROUTINE conv_d16_to_i32
     68 !
     69 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
     70 
     71                       	.global conv_d16_to_i32
     72                       conv_d16_to_i32:
     73 /* 000000	     */		save	%sp,-208,%sp
     74 ! FILE montmulf.c
     75 
     76 !    1		      !/*
     77 !    2		      ! * The contents of this file are subject to the Mozilla Public
     78 !    3		      ! * License Version 1.1 (the "License"); you may not use this file
     79 !    4		      ! * except in compliance with the License. You may obtain a copy of
     80 !    5		      ! * the License at http://www.mozilla.org/MPL/
     81 !    6		      ! * 
     82 !    7		      ! * Software distributed under the License is distributed on an "AS
     83 !    8		      ! * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or
     84 !    9		      ! * implied. See the License for the specific language governing
     85 !   10		      ! * rights and limitations under the License.
     86 !   11		      ! * 
     87 !   12		      ! * The Original Code is SPARC optimized Montgomery multiply functions.
     88 !   13		      ! *
     89 !   14		      ! * The Initial Developer of the Original Code is Sun Microsystems Inc.
     90 !   15		      ! * Portions created by Sun Microsystems Inc. are 
     91 !   16		      ! * Copyright (C) 1999-2000 Sun Microsystems Inc.  All Rights Reserved.
     92 !   17		      ! * 
     93 !   18		      ! * Contributor(s):
     94 !   19		      ! *	Netscape Communications Corporation
     95 !   20		      ! * 
     96 !   21		      ! * Alternatively, the contents of this file may be used under the
     97 !   22		      ! * terms of the GNU General Public License Version 2 or later (the
     98 !   23		      ! * "GPL"), in which case the provisions of the GPL are applicable 
     99 !   24		      ! * instead of those above.	If you wish to allow use of your 
    100 !   25		      ! * version of this file only under the terms of the GPL and not to
    101 !   26		      ! * allow others to use your version of this file under the MPL,
    102 !   27		      ! * indicate your decision by deleting the provisions above and
    103 !   28		      ! * replace them with the notice and other provisions required by
    104 !   29		      ! * the GPL.  If you do not delete the provisions above, a recipient
    105 !   30		      ! * may use your version of this file under either the MPL or the
    106 !   31		      ! * GPL.
    107 !   34		      ! */
    108 !   36		      !#define RF_INLINE_MACROS
    109 !   38		      !static const double TwoTo16=65536.0;
    110 !   39		      !static const double TwoToMinus16=1.0/65536.0;
    111 !   40		      !static const double Zero=0.0;
    112 !   41		      !static const double TwoTo32=65536.0*65536.0;
    113 !   42		      !static const double TwoToMinus32=1.0/(65536.0*65536.0);
    114 !   44		      !#ifdef RF_INLINE_MACROS
    115 !   46		      !double upper32(double);
    116 !   47		      !double lower32(double, double);
    117 !   48		      !double mod(double, double, double);
    118 !   50		      !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/, 
    119 !   51		      !			  const double * /* 2^16*/,
    120 !   52		      !			  const double * /* 0 */,
    121 !   53		      !			  double *       /*result16*/, 
    122 !   54		      !			  double *       /* result32 */,
    123 !   55		      !			  float *  /*source - should be unsigned int*
    124 !   56		      !		          	       converted to float* */);
    125 !   58		      !#else
    126 !   60		      !static double upper32(double x)
    127 !   61		      !{
    128 !   62		      !  return floor(x*TwoToMinus32);
    129 !   63		      !}
    130 !   65		      !static double lower32(double x, double y)
    131 !   66		      !{
    132 !   67		      !  return x-TwoTo32*floor(x*TwoToMinus32);
    133 !   68		      !}
    134 !   70		      !static double mod(double x, double oneoverm, double m)
    135 !   71		      !{
    136 !   72		      !  return x-m*floor(x*oneoverm);
    137 !   73		      !}
    138 !   75		      !#endif
    139 !   78		      !static void cleanup(double *dt, int from, int tlen)
    140 !   79		      !{
    141 !   80		      ! int i;
    142 !   81		      ! double tmp,tmp1,x,x1;
    143 !   83		      ! tmp=tmp1=Zero;
    144 !   84		      ! /* original code **
    145 !   85		      ! for(i=2*from;i<2*tlen-2;i++)
    146 !   86		      !   {
    147 !   87		      !     x=dt[i];
    148 !   88		      !     dt[i]=lower32(x,Zero)+tmp1;
    149 !   89		      !     tmp1=tmp;
    150 !   90		      !     tmp=upper32(x);
    151 !   91		      !   }
    152 !   92		      ! dt[tlen-2]+=tmp1;
    153 !   93		      ! dt[tlen-1]+=tmp;
    154 !   94		      ! **end original code ***/
    155 !   95		      ! /* new code ***/
    156 !   96		      ! for(i=2*from;i<2*tlen;i+=2)
    157 !   97		      !   {
    158 !   98		      !     x=dt[i];
    159 !   99		      !     x1=dt[i+1];
    160 !  100		      !     dt[i]=lower32(x,Zero)+tmp;
    161 !  101		      !     dt[i+1]=lower32(x1,Zero)+tmp1;
    162 !  102		      !     tmp=upper32(x);
    163 !  103		      !     tmp1=upper32(x1);
    164 !  104		      !   }
    165 !  105		      !  /** end new code **/
    166 !  106		      !}
    167 !  109		      !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen)
    168 !  110		      !{
    169 !  111		      !int i;
    170 !  112		      !long long t, t1, a, b, c, d;
    171 !  114		      ! t1=0;
    172 !  115		      ! a=(long long)d16[0];
    173 
    174 /* 0x0004	 115 */		ldd	[%i1],%f2
    175 
    176 !  116		      ! b=(long long)d16[1];
    177 !  117		      ! for(i=0; i<ilen-1; i++)
    178 
    179 /* 0x0008	 117 */		sub	%i3,1,%o1
    180 /* 0x000c	 110 */		or	%g0,%i0,%g1
    181 /* 0x0010	 116 */		ldd	[%i1+8],%f4
    182 /* 0x0014	 117 */		cmp	%o1,0
    183 /* 0x0018	 114 */		or	%g0,0,%g5
    184 /* 0x001c	 115 */		fdtox	%f2,%f2
    185 /* 0x0020	     */		std	%f2,[%sp+2247]
    186 /* 0x0024	 117 */		or	%g0,0,%o0
    187 /* 0x0028	 116 */		fdtox	%f4,%f2
    188 /* 0x002c	     */		std	%f2,[%sp+2239]
    189 /* 0x0030	 110 */		sub	%o1,1,%o7
    190 /* 0x0034	     */		or	%g0,%i1,%o4
    191 /* 0x0038	     */		sethi	%hi(0xfc00),%o3
    192 /* 0x003c	     */		or	%g0,-1,%o1
    193 /* 0x0040	     */		or	%g0,2,%i1
    194 /* 0x0044	     */		srl	%o1,0,%g3
    195 /* 0x0048	     */		or	%g0,%o4,%g4
    196 /* 0x004c	 116 */		ldx	[%sp+2239],%i2
    197 /* 0x0050	     */		add	%o3,1023,%o5
    198 /* 0x0054	 117 */		sub	%o7,1,%o2
    199 /* 0x0058	 115 */		ldx	[%sp+2247],%i3
    200 /* 0x005c	 117 */		ble,pt	%icc,.L900000113
    201 /* 0x0060	     */		sethi	%hi(0xfc00),%g2
    202 /* 0x0064	     */		add	%o7,1,%g2
    203 
    204 !  118		      !   {
    205 !  119		      !     c=(long long)d16[2*i+2];
    206 !  120		      !     t1+=a&0xffffffff;
    207 !  121		      !     t=(a>>32);
    208 !  122		      !     d=(long long)d16[2*i+3];
    209 !  123		      !     t1+=(b&0xffff)<<16;
    210 
    211 /* 0x0068	 123 */		and	%i2,%o5,%i4
    212 /* 0x006c	     */		sllx	%i4,16,%o1
    213 /* 0x0070	 117 */		cmp	%g2,6
    214 /* 0x0074	     */		bl,pn	%icc,.L77000134
    215 /* 0x0078	     */		or	%g0,3,%i0
    216 /* 0x007c	 119 */		ldd	[%o4+16],%f0
    217 /* 0x0080	 120 */		and	%i3,%g3,%o3
    218 
    219 !  124		      !     t+=(b>>16)+(t1>>32);
    220 
    221 /* 0x0084	 124 */		srax	%i2,16,%i5
    222 /* 0x0088	 117 */		add	%o3,%o1,%i4
    223 /* 0x008c	 121 */		srax	%i3,32,%i3
    224 /* 0x0090	 119 */		fdtox	%f0,%f0
    225 /* 0x0094	     */		std	%f0,[%sp+2231]
    226 
    227 !  125		      !     i32[i]=t1&0xffffffff;
    228 
    229 /* 0x0098	 125 */		and	%i4,%g3,%l0
    230 /* 0x009c	 117 */		or	%g0,72,%o3
    231 /* 0x00a0	 122 */		ldd	[%g4+24],%f0
    232 /* 0x00a4	 117 */		or	%g0,64,%o4
    233 /* 0x00a8	     */		or	%g0,4,%o1
    234 
    235 !  126		      !     t1=t;
    236 !  127		      !     a=c;
    237 !  128		      !     b=d;
    238 
    239 /* 0x00ac	 128 */		or	%g0,5,%i0
    240 /* 0x00b0	     */		or	%g0,4,%i1
    241 /* 0x00b4	 119 */		ldx	[%sp+2231],%g2
    242 /* 0x00b8	 122 */		fdtox	%f0,%f0
    243 /* 0x00bc	 128 */		or	%g0,4,%o0
    244 /* 0x00c0	 122 */		std	%f0,[%sp+2223]
    245 /* 0x00c4	     */		ldd	[%g4+40],%f2
    246 /* 0x00c8	 120 */		and	%g2,%g3,%i2
    247 /* 0x00cc	 119 */		ldd	[%g4+32],%f0
    248 /* 0x00d0	 121 */		srax	%g2,32,%g2
    249 /* 0x00d4	 122 */		ldd	[%g4+56],%f4
    250 /* 0x00d8	     */		fdtox	%f2,%f2
    251 /* 0x00dc	     */		ldx	[%sp+2223],%g5
    252 /* 0x00e0	 119 */		fdtox	%f0,%f0
    253 /* 0x00e4	 125 */		st	%l0,[%g1]
    254 /* 0x00e8	 124 */		srax	%i4,32,%l0
    255 /* 0x00ec	 122 */		fdtox	%f4,%f4
    256 /* 0x00f0	     */		std	%f2,[%sp+2223]
    257 /* 0x00f4	 123 */		and	%g5,%o5,%i4
    258 /* 0x00f8	 124 */		add	%i5,%l0,%i5
    259 /* 0x00fc	 119 */		std	%f0,[%sp+2231]
    260 /* 0x0100	 123 */		sllx	%i4,16,%i4
    261 /* 0x0104	 124 */		add	%i3,%i5,%i3
    262 /* 0x0108	 119 */		ldd	[%g4+48],%f2
    263 /* 0x010c	 124 */		srax	%g5,16,%g5
    264 /* 0x0110	 117 */		add	%i2,%i4,%i2
    265 /* 0x0114	 122 */		ldd	[%g4+72],%f0
    266 /* 0x0118	 117 */		add	%i2,%i3,%i4
    267 /* 0x011c	 124 */		srax	%i4,32,%i5
    268 /* 0x0120	 119 */		fdtox	%f2,%f2
    269 /* 0x0124	 125 */		and	%i4,%g3,%i4
    270 /* 0x0128	 122 */		ldx	[%sp+2223],%i2
    271 /* 0x012c	 124 */		add	%g5,%i5,%g5
    272 /* 0x0130	 119 */		ldx	[%sp+2231],%i3
    273 /* 0x0134	 124 */		add	%g2,%g5,%g5
    274 /* 0x0138	 119 */		std	%f2,[%sp+2231]
    275 /* 0x013c	 122 */		std	%f4,[%sp+2223]
    276 /* 0x0140	 119 */		ldd	[%g4+64],%f2
    277 /* 0x0144	 125 */		st	%i4,[%g1+4]
    278                       .L900000108:
    279 /* 0x0148	 122 */		ldx	[%sp+2223],%i4
    280 /* 0x014c	 128 */		add	%o0,2,%o0
    281 /* 0x0150	     */		add	%i0,4,%i0
    282 /* 0x0154	 119 */		ldx	[%sp+2231],%l0
    283 /* 0x0158	 117 */		add	%o3,16,%o3
    284 /* 0x015c	 123 */		and	%i2,%o5,%g2
    285 /* 0x0160	     */		sllx	%g2,16,%i5
    286 /* 0x0164	 120 */		and	%i3,%g3,%g2
    287 /* 0x0168	 122 */		ldd	[%g4+%o3],%f4
    288 /* 0x016c	     */		fdtox	%f0,%f0
    289 /* 0x0170	     */		std	%f0,[%sp+2223]
    290 /* 0x0174	 124 */		srax	%i2,16,%i2
    291 /* 0x0178	 117 */		add	%g2,%i5,%g2
    292 /* 0x017c	 119 */		fdtox	%f2,%f0
    293 /* 0x0180	 117 */		add	%o4,16,%o4
    294 /* 0x0184	 119 */		std	%f0,[%sp+2231]
    295 /* 0x0188	 117 */		add	%g2,%g5,%g2
    296 /* 0x018c	 119 */		ldd	[%g4+%o4],%f2
    297 /* 0x0190	 124 */		srax	%g2,32,%i5
    298 /* 0x0194	 128 */		cmp	%o0,%o2
    299 /* 0x0198	 121 */		srax	%i3,32,%g5
    300 /* 0x019c	 124 */		add	%i2,%i5,%i2
    301 /* 0x01a0	     */		add	%g5,%i2,%i5
    302 /* 0x01a4	 117 */		add	%o1,4,%o1
    303 /* 0x01a8	 125 */		and	%g2,%g3,%g2
    304 /* 0x01ac	 127 */		or	%g0,%l0,%g5
    305 /* 0x01b0	 125 */		st	%g2,[%g1+%o1]
    306 /* 0x01b4	 128 */		add	%i1,4,%i1
    307 /* 0x01b8	 122 */		ldx	[%sp+2223],%i2
    308 /* 0x01bc	 119 */		ldx	[%sp+2231],%i3
    309 /* 0x01c0	 117 */		add	%o3,16,%o3
    310 /* 0x01c4	 123 */		and	%i4,%o5,%g2
    311 /* 0x01c8	     */		sllx	%g2,16,%l0
    312 /* 0x01cc	 120 */		and	%g5,%g3,%g2
    313 /* 0x01d0	 122 */		ldd	[%g4+%o3],%f0
    314 /* 0x01d4	     */		fdtox	%f4,%f4
    315 /* 0x01d8	     */		std	%f4,[%sp+2223]
    316 /* 0x01dc	 124 */		srax	%i4,16,%i4
    317 /* 0x01e0	 117 */		add	%g2,%l0,%g2
    318 /* 0x01e4	 119 */		fdtox	%f2,%f2
    319 /* 0x01e8	 117 */		add	%o4,16,%o4
    320 /* 0x01ec	 119 */		std	%f2,[%sp+2231]
    321 /* 0x01f0	 117 */		add	%g2,%i5,%g2
    322 /* 0x01f4	 119 */		ldd	[%g4+%o4],%f2
    323 /* 0x01f8	 124 */		srax	%g2,32,%i5
    324 /* 0x01fc	 121 */		srax	%g5,32,%g5
    325 /* 0x0200	 124 */		add	%i4,%i5,%i4
    326 /* 0x0204	     */		add	%g5,%i4,%g5
    327 /* 0x0208	 117 */		add	%o1,4,%o1
    328 /* 0x020c	 125 */		and	%g2,%g3,%g2
    329 /* 0x0210	 128 */		ble,pt	%icc,.L900000108
    330 /* 0x0214	     */		st	%g2,[%g1+%o1]
    331                       .L900000111:
    332 /* 0x0218	 122 */		ldx	[%sp+2223],%o2
    333 /* 0x021c	 123 */		and	%i2,%o5,%i4
    334 /* 0x0220	 120 */		and	%i3,%g3,%g2
    335 /* 0x0224	 123 */		sllx	%i4,16,%i4
    336 /* 0x0228	 119 */		ldx	[%sp+2231],%i5
    337 /* 0x022c	 128 */		cmp	%o0,%o7
    338 /* 0x0230	 124 */		srax	%i2,16,%i2
    339 /* 0x0234	 117 */		add	%g2,%i4,%g2
    340 /* 0x0238	 122 */		fdtox	%f0,%f4
    341 /* 0x023c	     */		std	%f4,[%sp+2223]
    342 /* 0x0240	 117 */		add	%g2,%g5,%g5
    343 /* 0x0244	 123 */		and	%o2,%o5,%l0
    344 /* 0x0248	 124 */		srax	%g5,32,%l1
    345 /* 0x024c	 120 */		and	%i5,%g3,%i4
    346 /* 0x0250	 119 */		fdtox	%f2,%f0
    347 /* 0x0254	 121 */		srax	%i3,32,%g2
    348 /* 0x0258	 119 */		std	%f0,[%sp+2231]
    349 /* 0x025c	 124 */		add	%i2,%l1,%i2
    350 /* 0x0260	 123 */		sllx	%l0,16,%i3
    351 /* 0x0264	 124 */		add	%g2,%i2,%i2
    352 /* 0x0268	     */		srax	%o2,16,%o2
    353 /* 0x026c	 117 */		add	%o1,4,%g2
    354 /* 0x0270	     */		add	%i4,%i3,%o1
    355 /* 0x0274	 125 */		and	%g5,%g3,%g5
    356 /* 0x0278	     */		st	%g5,[%g1+%g2]
    357 /* 0x027c	 119 */		ldx	[%sp+2231],%i3
    358 /* 0x0280	 117 */		add	%o1,%i2,%o1
    359 /* 0x0284	     */		add	%g2,4,%g2
    360 /* 0x0288	 124 */		srax	%o1,32,%i4
    361 /* 0x028c	 122 */		ldx	[%sp+2223],%i2
    362 /* 0x0290	 125 */		and	%o1,%g3,%g5
    363 /* 0x0294	 121 */		srax	%i5,32,%o1
    364 /* 0x0298	 124 */		add	%o2,%i4,%o2
    365 /* 0x029c	 125 */		st	%g5,[%g1+%g2]
    366 /* 0x02a0	 128 */		bg,pn	%icc,.L77000127
    367 /* 0x02a4	     */		add	%o1,%o2,%g5
    368 /* 0x02a8	     */		add	%i0,6,%i0
    369 /* 0x02ac	     */		add	%i1,6,%i1
    370                       .L77000134:
    371 /* 0x02b0	 119 */		sra	%i1,0,%o2
    372                       .L900000112:
    373 /* 0x02b4	 119 */		sllx	%o2,3,%o3
    374 /* 0x02b8	 120 */		and	%i3,%g3,%o1
    375 /* 0x02bc	 119 */		ldd	[%g4+%o3],%f0
    376 /* 0x02c0	 122 */		sra	%i0,0,%o3
    377 /* 0x02c4	 123 */		and	%i2,%o5,%o2
    378 /* 0x02c8	 122 */		sllx	%o3,3,%o3
    379 /* 0x02cc	 120 */		add	%g5,%o1,%o1
    380 /* 0x02d0	 119 */		fdtox	%f0,%f0
    381 /* 0x02d4	     */		std	%f0,[%sp+2231]
    382 /* 0x02d8	 123 */		sllx	%o2,16,%o2
    383 /* 0x02dc	     */		add	%o1,%o2,%o2
    384 /* 0x02e0	 128 */		add	%i1,2,%i1
    385 /* 0x02e4	 122 */		ldd	[%g4+%o3],%f0
    386 /* 0x02e8	 124 */		srax	%o2,32,%g2
    387 /* 0x02ec	 125 */		and	%o2,%g3,%o3
    388 /* 0x02f0	 124 */		srax	%i2,16,%o1
    389 /* 0x02f4	 128 */		add	%i0,2,%i0
    390 /* 0x02f8	 122 */		fdtox	%f0,%f0
    391 /* 0x02fc	     */		std	%f0,[%sp+2223]
    392 /* 0x0300	 125 */		sra	%o0,0,%o2
    393 /* 0x0304	     */		sllx	%o2,2,%o2
    394 /* 0x0308	 124 */		add	%o1,%g2,%g5
    395 /* 0x030c	 121 */		srax	%i3,32,%g2
    396 /* 0x0310	 128 */		add	%o0,1,%o0
    397 /* 0x0314	 124 */		add	%g2,%g5,%g5
    398 /* 0x0318	 128 */		cmp	%o0,%o7
    399 /* 0x031c	 119 */		ldx	[%sp+2231],%o4
    400 /* 0x0320	 122 */		ldx	[%sp+2223],%i2
    401 /* 0x0324	 125 */		st	%o3,[%g1+%o2]
    402 /* 0x0328	 127 */		or	%g0,%o4,%i3
    403 /* 0x032c	 128 */		ble,pt	%icc,.L900000112
    404 /* 0x0330	     */		sra	%i1,0,%o2
    405                       .L77000127:
    406 
    407 !  129		      !   }
    408 !  130		      !     t1+=a&0xffffffff;
    409 !  131		      !     t=(a>>32);
    410 !  132		      !     t1+=(b&0xffff)<<16;
    411 !  133		      !     i32[i]=t1&0xffffffff;
    412 
    413 /* 0x0334	 133 */		sethi	%hi(0xfc00),%g2
    414                       .L900000113:
    415 /* 0x0338	 133 */		or	%g0,-1,%g3
    416 /* 0x033c	     */		add	%g2,1023,%g2
    417 /* 0x0340	     */		srl	%g3,0,%g3
    418 /* 0x0344	     */		and	%i2,%g2,%g2
    419 /* 0x0348	     */		and	%i3,%g3,%g4
    420 /* 0x034c	     */		sllx	%g2,16,%g2
    421 /* 0x0350	     */		add	%g5,%g4,%g4
    422 /* 0x0354	     */		sra	%o0,0,%g5
    423 /* 0x0358	     */		add	%g4,%g2,%g4
    424 /* 0x035c	     */		sllx	%g5,2,%g2
    425 /* 0x0360	     */		and	%g4,%g3,%g3
    426 /* 0x0364	     */		st	%g3,[%g1+%g2]
    427 /* 0x0368	     */		ret	! Result = 
    428 /* 0x036c	     */		restore	%g0,%g0,%g0
    429 /* 0x0370	   0 */		.type	conv_d16_to_i32,2
    430 /* 0x0370	     */		.size	conv_d16_to_i32,(.-conv_d16_to_i32)
    431 
    432 .section	".text",#alloc,#execinstr
    433 /* 000000	   0 */		.align	8
    434 !
    435 ! CONSTANT POOL
    436 !
    437                       .L_const_seg_900000201:
    438 /* 000000	   0 */		.word	1127219200,0
    439 /* 0x0008	   0 */		.align	8
    440 /* 0x0008	     */		.skip	24
    441 !
    442 ! SUBROUTINE conv_i32_to_d32
    443 !
    444 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    445 
    446                       	.global conv_i32_to_d32
    447                       conv_i32_to_d32:
    448 /* 000000	     */		or	%g0,%o7,%g3
    449 
    450 !  135		      !}
    451 !  137		      !void conv_i32_to_d32(double *d32, unsigned int *i32, int len)
    452 !  138		      !{
    453 !  139		      !int i;
    454 !  141		      !#pragma pipeloop(0)
    455 !  142		      ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]);
    456 
    457 /* 0x0004	 142 */		cmp	%o2,0
    458                       .L900000210:
    459 /* 0x0008	     */		call	.+8
    460 /* 0x000c	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
    461 /* 0x0010	 142 */		or	%g0,0,%o3
    462 /* 0x0014	 138 */		add	%g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
    463 /* 0x0018	 142 */		sub	%o2,1,%o4
    464 /* 0x001c	 138 */		add	%g4,%o7,%g1
    465 /* 0x0020	 142 */		ble,pt	%icc,.L77000140
    466 /* 0x0024	     */		or	%g0,%g3,%o7
    467 /* 0x0028	     */		sethi	%hi(.L_const_seg_900000201),%g3
    468 /* 0x002c	     */		cmp	%o2,12
    469 /* 0x0030	     */		add	%g3,%lo(.L_const_seg_900000201),%g2
    470 /* 0x0034	     */		or	%g0,%o1,%g5
    471 /* 0x0038	     */		ldx	[%g1+%g2],%g4
    472 /* 0x003c	     */		or	%g0,0,%g1
    473 /* 0x0040	     */		or	%g0,24,%g2
    474 /* 0x0044	     */		bl,pn	%icc,.L77000144
    475 /* 0x0048	     */		or	%g0,0,%g3
    476 /* 0x004c	     */		ld	[%o1],%f13
    477 /* 0x0050	     */		or	%g0,7,%o3
    478 /* 0x0054	     */		ldd	[%g4],%f8
    479 /* 0x0058	     */		sub	%o2,5,%g3
    480 /* 0x005c	     */		or	%g0,8,%g1
    481 /* 0x0060	     */		ld	[%o1+4],%f11
    482 /* 0x0064	     */		ld	[%o1+8],%f7
    483 /* 0x0068	     */		fmovs	%f8,%f12
    484 /* 0x006c	     */		ld	[%o1+12],%f5
    485 /* 0x0070	     */		fmovs	%f8,%f10
    486 /* 0x0074	     */		ld	[%o1+16],%f3
    487 /* 0x0078	     */		fmovs	%f8,%f6
    488 /* 0x007c	     */		ld	[%o1+20],%f1
    489 /* 0x0080	     */		fsubd	%f12,%f8,%f12
    490 /* 0x0084	     */		std	%f12,[%o0]
    491 /* 0x0088	     */		fsubd	%f10,%f8,%f10
    492 /* 0x008c	     */		std	%f10,[%o0+8]
    493                       .L900000205:
    494 /* 0x0090	     */		ld	[%o1+%g2],%f11
    495 /* 0x0094	     */		add	%g1,8,%g1
    496 /* 0x0098	     */		add	%o3,5,%o3
    497 /* 0x009c	     */		fsubd	%f6,%f8,%f6
    498 /* 0x00a0	     */		add	%g2,4,%g2
    499 /* 0x00a4	     */		std	%f6,[%o0+%g1]
    500 /* 0x00a8	     */		cmp	%o3,%g3
    501 /* 0x00ac	     */		fmovs	%f8,%f4
    502 /* 0x00b0	     */		ld	[%o1+%g2],%f7
    503 /* 0x00b4	     */		fsubd	%f4,%f8,%f12
    504 /* 0x00b8	     */		add	%g1,8,%g1
    505 /* 0x00bc	     */		add	%g2,4,%g2
    506 /* 0x00c0	     */		fmovs	%f8,%f2
    507 /* 0x00c4	     */		std	%f12,[%o0+%g1]
    508 /* 0x00c8	     */		ld	[%o1+%g2],%f5
    509 /* 0x00cc	     */		fsubd	%f2,%f8,%f12
    510 /* 0x00d0	     */		add	%g1,8,%g1
    511 /* 0x00d4	     */		add	%g2,4,%g2
    512 /* 0x00d8	     */		fmovs	%f8,%f0
    513 /* 0x00dc	     */		std	%f12,[%o0+%g1]
    514 /* 0x00e0	     */		ld	[%o1+%g2],%f3
    515 /* 0x00e4	     */		fsubd	%f0,%f8,%f12
    516 /* 0x00e8	     */		add	%g1,8,%g1
    517 /* 0x00ec	     */		add	%g2,4,%g2
    518 /* 0x00f0	     */		fmovs	%f8,%f10
    519 /* 0x00f4	     */		std	%f12,[%o0+%g1]
    520 /* 0x00f8	     */		ld	[%o1+%g2],%f1
    521 /* 0x00fc	     */		fsubd	%f10,%f8,%f10
    522 /* 0x0100	     */		add	%g1,8,%g1
    523 /* 0x0104	     */		add	%g2,4,%g2
    524 /* 0x0108	     */		std	%f10,[%o0+%g1]
    525 /* 0x010c	     */		ble,pt	%icc,.L900000205
    526 /* 0x0110	     */		fmovs	%f8,%f6
    527                       .L900000208:
    528 /* 0x0114	     */		fmovs	%f8,%f4
    529 /* 0x0118	     */		ld	[%o1+%g2],%f11
    530 /* 0x011c	     */		add	%g1,8,%g3
    531 /* 0x0120	     */		fmovs	%f8,%f2
    532 /* 0x0124	     */		add	%g1,16,%g1
    533 /* 0x0128	     */		cmp	%o3,%o4
    534 /* 0x012c	     */		fmovs	%f8,%f0
    535 /* 0x0130	     */		add	%g1,8,%o1
    536 /* 0x0134	     */		add	%g1,16,%o2
    537 /* 0x0138	     */		fmovs	%f8,%f10
    538 /* 0x013c	     */		add	%g1,24,%g2
    539 /* 0x0140	     */		fsubd	%f6,%f8,%f6
    540 /* 0x0144	     */		std	%f6,[%o0+%g3]
    541 /* 0x0148	     */		fsubd	%f4,%f8,%f4
    542 /* 0x014c	     */		std	%f4,[%o0+%g1]
    543 /* 0x0150	     */		sra	%o3,0,%g1
    544 /* 0x0154	     */		fsubd	%f2,%f8,%f2
    545 /* 0x0158	     */		std	%f2,[%o0+%o1]
    546 /* 0x015c	     */		sllx	%g1,2,%g3
    547 /* 0x0160	     */		fsubd	%f0,%f8,%f0
    548 /* 0x0164	     */		std	%f0,[%o0+%o2]
    549 /* 0x0168	     */		fsubd	%f10,%f8,%f0
    550 /* 0x016c	     */		bg,pn	%icc,.L77000140
    551 /* 0x0170	     */		std	%f0,[%o0+%g2]
    552                       .L77000144:
    553 /* 0x0174	     */		ldd	[%g4],%f8
    554                       .L900000211:
    555 /* 0x0178	     */		ld	[%g5+%g3],%f13
    556 /* 0x017c	     */		sllx	%g1,3,%g2
    557 /* 0x0180	     */		add	%o3,1,%o3
    558 /* 0x0184	     */		sra	%o3,0,%g1
    559 /* 0x0188	     */		cmp	%o3,%o4
    560 /* 0x018c	     */		fmovs	%f8,%f12
    561 /* 0x0190	     */		sllx	%g1,2,%g3
    562 /* 0x0194	     */		fsubd	%f12,%f8,%f0
    563 /* 0x0198	     */		std	%f0,[%o0+%g2]
    564 /* 0x019c	     */		ble,a,pt	%icc,.L900000211
    565 /* 0x01a0	     */		ldd	[%g4],%f8
    566                       .L77000140:
    567 /* 0x01a4	     */		retl	! Result = 
    568 /* 0x01a8	     */		nop
    569 /* 0x01ac	   0 */		.type	conv_i32_to_d32,2
    570 /* 0x01ac	     */		.size	conv_i32_to_d32,(.-conv_i32_to_d32)
    571 
    572 .section	".text",#alloc,#execinstr
    573 /* 000000	   0 */		.align	8
    574 !
    575 ! CONSTANT POOL
    576 !
    577                       .L_const_seg_900000301:
    578 /* 000000	   0 */		.word	1127219200,0
    579 /* 0x0008	   0 */		.align	8
    580 /* 0x0008	     */		.skip	24
    581 !
    582 ! SUBROUTINE conv_i32_to_d16
    583 !
    584 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    585 
    586                       	.global conv_i32_to_d16
    587                       conv_i32_to_d16:
    588 /* 000000	     */		save	%sp,-192,%sp
    589                       .L900000310:
    590 /* 0x0004	     */		call	.+8
    591 /* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
    592 
    593 !  143		      !}
    594 !  146		      !void conv_i32_to_d16(double *d16, unsigned int *i32, int len)
    595 !  147		      !{
    596 !  148		      !int i;
    597 !  149		      !unsigned int a;
    598 !  151		      !#pragma pipeloop(0)
    599 !  152		      ! for(i=0;i<len;i++)
    600 
    601 /* 0x000c	 152 */		cmp	%i2,0
    602 /* 0x0010	 147 */		add	%g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
    603 /* 0x0014	 152 */		ble,pt	%icc,.L77000150
    604 /* 0x0018	     */		add	%g3,%o7,%o0
    605 
    606 !  153		      !   {
    607 !  154		      !     a=i32[i];
    608 !  155		      !     d16[2*i]=(double)(a&0xffff);
    609 !  156		      !     d16[2*i+1]=(double)(a>>16);
    610 
    611 /* 0x001c	 156 */		sethi	%hi(.L_const_seg_900000301),%g2
    612 /* 0x0020	 147 */		or	%g0,%i2,%o1
    613 /* 0x0024	 152 */		sethi	%hi(0xfc00),%g3
    614 /* 0x0028	 156 */		add	%g2,%lo(.L_const_seg_900000301),%g2
    615 /* 0x002c	 152 */		or	%g0,%o1,%g4
    616 /* 0x0030	 156 */		ldx	[%o0+%g2],%o5
    617 /* 0x0034	 152 */		add	%g3,1023,%g1
    618 /* 0x0038	 147 */		or	%g0,%i1,%o7
    619 /* 0x003c	 152 */		or	%g0,0,%i2
    620 /* 0x0040	     */		sub	%o1,1,%g5
    621 /* 0x0044	     */		or	%g0,0,%g3
    622 /* 0x0048	     */		or	%g0,1,%g2
    623 /* 0x004c	 154 */		or	%g0,0,%o2
    624 /* 0x0050	     */		cmp	%g4,6
    625 /* 0x0054	 152 */		bl,pn	%icc,.L77000154
    626 /* 0x0058	     */		ldd	[%o5],%f0
    627 /* 0x005c	     */		sub	%o1,2,%o3
    628 /* 0x0060	     */		or	%g0,16,%o2
    629 /* 0x0064	 154 */		ld	[%i1],%o4
    630 /* 0x0068	 156 */		or	%g0,3,%g2
    631 /* 0x006c	     */		or	%g0,2,%g3
    632 /* 0x0070	 155 */		fmovs	%f0,%f2
    633 /* 0x0074	 156 */		or	%g0,4,%i2
    634 /* 0x0078	 155 */		and	%o4,%g1,%o0
    635 /* 0x007c	     */		st	%o0,[%sp+2227]
    636 /* 0x0080	     */		fmovs	%f0,%f4
    637 /* 0x0084	 156 */		srl	%o4,16,%i4
    638 /* 0x0088	 152 */		or	%g0,12,%o4
    639 /* 0x008c	     */		or	%g0,24,%o0
    640 /* 0x0090	 155 */		ld	[%sp+2227],%f3
    641 /* 0x0094	     */		fsubd	%f2,%f0,%f2
    642 /* 0x0098	     */		std	%f2,[%i0]
    643 /* 0x009c	 156 */		st	%i4,[%sp+2223]
    644 /* 0x00a0	 154 */		ld	[%o7+4],%o1
    645 /* 0x00a4	 156 */		fmovs	%f0,%f2
    646 /* 0x00a8	 155 */		and	%o1,%g1,%i1
    647 /* 0x00ac	 156 */		ld	[%sp+2223],%f3
    648 /* 0x00b0	     */		srl	%o1,16,%o1
    649 /* 0x00b4	     */		fsubd	%f2,%f0,%f2
    650 /* 0x00b8	     */		std	%f2,[%i0+8]
    651 /* 0x00bc	     */		st	%o1,[%sp+2223]
    652 /* 0x00c0	 155 */		st	%i1,[%sp+2227]
    653 /* 0x00c4	 154 */		ld	[%o7+8],%o1
    654 /* 0x00c8	 156 */		fmovs	%f0,%f2
    655 /* 0x00cc	 155 */		and	%o1,%g1,%g4
    656 /* 0x00d0	     */		ld	[%sp+2227],%f5
    657 /* 0x00d4	 156 */		srl	%o1,16,%o1
    658 /* 0x00d8	     */		ld	[%sp+2223],%f3
    659 /* 0x00dc	     */		st	%o1,[%sp+2223]
    660 /* 0x00e0	 155 */		fsubd	%f4,%f0,%f4
    661 /* 0x00e4	     */		st	%g4,[%sp+2227]
    662 /* 0x00e8	 156 */		fsubd	%f2,%f0,%f2
    663 /* 0x00ec	 154 */		ld	[%o7+12],%o1
    664 /* 0x00f0	 155 */		std	%f4,[%i0+16]
    665 /* 0x00f4	 156 */		std	%f2,[%i0+24]
    666                       .L900000306:
    667 /* 0x00f8	 155 */		ld	[%sp+2227],%f5
    668 /* 0x00fc	 156 */		add	%i2,2,%i2
    669 /* 0x0100	     */		add	%g2,4,%g2
    670 /* 0x0104	     */		ld	[%sp+2223],%f3
    671 /* 0x0108	     */		cmp	%i2,%o3
    672 /* 0x010c	     */		add	%g3,4,%g3
    673 /* 0x0110	 155 */		and	%o1,%g1,%g4
    674 /* 0x0114	 156 */		srl	%o1,16,%o1
    675 /* 0x0118	 155 */		st	%g4,[%sp+2227]
    676 /* 0x011c	 156 */		st	%o1,[%sp+2223]
    677 /* 0x0120	 152 */		add	%o4,4,%o1
    678 /* 0x0124	 154 */		ld	[%o7+%o1],%o4
    679 /* 0x0128	 156 */		fmovs	%f0,%f2
    680 /* 0x012c	 155 */		fmovs	%f0,%f4
    681 /* 0x0130	     */		fsubd	%f4,%f0,%f4
    682 /* 0x0134	 152 */		add	%o2,16,%o2
    683 /* 0x0138	 156 */		fsubd	%f2,%f0,%f2
    684 /* 0x013c	 155 */		std	%f4,[%i0+%o2]
    685 /* 0x0140	 152 */		add	%o0,16,%o0
    686 /* 0x0144	 156 */		std	%f2,[%i0+%o0]
    687 /* 0x0148	 155 */		ld	[%sp+2227],%f5
    688 /* 0x014c	 156 */		ld	[%sp+2223],%f3
    689 /* 0x0150	 155 */		and	%o4,%g1,%g4
    690 /* 0x0154	 156 */		srl	%o4,16,%o4
    691 /* 0x0158	 155 */		st	%g4,[%sp+2227]
    692 /* 0x015c	 156 */		st	%o4,[%sp+2223]
    693 /* 0x0160	 152 */		add	%o1,4,%o4
    694 /* 0x0164	 154 */		ld	[%o7+%o4],%o1
    695 /* 0x0168	 156 */		fmovs	%f0,%f2
    696 /* 0x016c	 155 */		fmovs	%f0,%f4
    697 /* 0x0170	     */		fsubd	%f4,%f0,%f4
    698 /* 0x0174	 152 */		add	%o2,16,%o2
    699 /* 0x0178	 156 */		fsubd	%f2,%f0,%f2
    700 /* 0x017c	 155 */		std	%f4,[%i0+%o2]
    701 /* 0x0180	 152 */		add	%o0,16,%o0
    702 /* 0x0184	 156 */		ble,pt	%icc,.L900000306
    703 /* 0x0188	     */		std	%f2,[%i0+%o0]
    704                       .L900000309:
    705 /* 0x018c	 155 */		ld	[%sp+2227],%f5
    706 /* 0x0190	 156 */		fmovs	%f0,%f2
    707 /* 0x0194	     */		srl	%o1,16,%o3
    708 /* 0x0198	     */		ld	[%sp+2223],%f3
    709 /* 0x019c	 155 */		and	%o1,%g1,%i1
    710 /* 0x01a0	 152 */		add	%o2,16,%g4
    711 /* 0x01a4	 155 */		fmovs	%f0,%f4
    712 /* 0x01a8	     */		st	%i1,[%sp+2227]
    713 /* 0x01ac	 152 */		add	%o0,16,%o2
    714 /* 0x01b0	 156 */		st	%o3,[%sp+2223]
    715 /* 0x01b4	 154 */		sra	%i2,0,%o3
    716 /* 0x01b8	 152 */		add	%g4,16,%o1
    717 /* 0x01bc	 155 */		fsubd	%f4,%f0,%f4
    718 /* 0x01c0	     */		std	%f4,[%i0+%g4]
    719 /* 0x01c4	 152 */		add	%o0,32,%o0
    720 /* 0x01c8	 156 */		fsubd	%f2,%f0,%f2
    721 /* 0x01cc	     */		std	%f2,[%i0+%o2]
    722 /* 0x01d0	     */		sllx	%o3,2,%o2
    723 /* 0x01d4	 155 */		ld	[%sp+2227],%f5
    724 /* 0x01d8	 156 */		cmp	%i2,%g5
    725 /* 0x01dc	     */		add	%g2,6,%g2
    726 /* 0x01e0	     */		ld	[%sp+2223],%f3
    727 /* 0x01e4	     */		add	%g3,6,%g3
    728 /* 0x01e8	 155 */		fmovs	%f0,%f4
    729 /* 0x01ec	 156 */		fmovs	%f0,%f2
    730 /* 0x01f0	 155 */		fsubd	%f4,%f0,%f4
    731 /* 0x01f4	     */		std	%f4,[%i0+%o1]
    732 /* 0x01f8	 156 */		fsubd	%f2,%f0,%f0
    733 /* 0x01fc	     */		bg,pn	%icc,.L77000150
    734 /* 0x0200	     */		std	%f0,[%i0+%o0]
    735                       .L77000154:
    736 /* 0x0204	 155 */		ldd	[%o5],%f0
    737                       .L900000311:
    738 /* 0x0208	 154 */		ld	[%o7+%o2],%o0
    739 /* 0x020c	 155 */		sra	%g3,0,%o1
    740 /* 0x0210	     */		fmovs	%f0,%f2
    741 /* 0x0214	     */		sllx	%o1,3,%o2
    742 /* 0x0218	 156 */		add	%i2,1,%i2
    743 /* 0x021c	 155 */		and	%o0,%g1,%o1
    744 /* 0x0220	     */		st	%o1,[%sp+2227]
    745 /* 0x0224	 156 */		add	%g3,2,%g3
    746 /* 0x0228	     */		srl	%o0,16,%o1
    747 /* 0x022c	     */		cmp	%i2,%g5
    748 /* 0x0230	     */		sra	%g2,0,%o0
    749 /* 0x0234	     */		add	%g2,2,%g2
    750 /* 0x0238	     */		sllx	%o0,3,%o0
    751 /* 0x023c	 155 */		ld	[%sp+2227],%f3
    752 /* 0x0240	 154 */		sra	%i2,0,%o3
    753 /* 0x0244	 155 */		fsubd	%f2,%f0,%f2
    754 /* 0x0248	     */		std	%f2,[%i0+%o2]
    755 /* 0x024c	     */		sllx	%o3,2,%o2
    756 /* 0x0250	 156 */		st	%o1,[%sp+2223]
    757 /* 0x0254	     */		fmovs	%f0,%f2
    758 /* 0x0258	     */		ld	[%sp+2223],%f3
    759 /* 0x025c	     */		fsubd	%f2,%f0,%f0
    760 /* 0x0260	     */		std	%f0,[%i0+%o0]
    761 /* 0x0264	     */		ble,a,pt	%icc,.L900000311
    762 /* 0x0268	     */		ldd	[%o5],%f0
    763                       .L77000150:
    764 /* 0x026c	     */		ret	! Result = 
    765 /* 0x0270	     */		restore	%g0,%g0,%g0
    766 /* 0x0274	   0 */		.type	conv_i32_to_d16,2
    767 /* 0x0274	     */		.size	conv_i32_to_d16,(.-conv_i32_to_d16)
    768 
    769 .section	".text",#alloc,#execinstr
    770 /* 000000	   0 */		.align	8
    771 !
    772 ! CONSTANT POOL
    773 !
    774                       .L_const_seg_900000401:
    775 /* 000000	   0 */		.word	1127219200,0
    776 /* 0x0008	   0 */		.align	8
    777 /* 0x0008	     */		.skip	24
    778 !
    779 ! SUBROUTINE conv_i32_to_d32_and_d16
    780 !
    781 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
    782 
    783                       	.global conv_i32_to_d32_and_d16
    784                       conv_i32_to_d32_and_d16:
    785 /* 000000	     */		save	%sp,-192,%sp
    786                       .L900000415:
    787 /* 0x0004	     */		call	.+8
    788 /* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
    789 
    790 !  157		      !   }
    791 !  158		      !}
    792 !  161		      !void conv_i32_to_d32_and_d16(double *d32, double *d16, 
    793 !  162		      !			     unsigned int *i32, int len)
    794 !  163		      !{
    795 !  164		      !int i = 0;
    796 !  165		      !unsigned int a;
    797 !  167		      !#pragma pipeloop(0)
    798 !  168		      !#ifdef RF_INLINE_MACROS
    799 !  169		      ! for(;i<len-3;i+=4)
    800 !  170		      !   {
    801 !  171		      !     i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero,
    802 !  172		      !			  &(d16[2*i]), &(d32[i]), (float *)(&(i32[i])));
    803 
    804 /* 0x000c	 172 */		sethi	%hi(Zero),%g2
    805 /* 0x0010	 163 */		add	%g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
    806 /* 0x0014	     */		or	%g0,%i3,%g5
    807 /* 0x0018	     */		add	%g3,%o7,%o3
    808 /* 0x001c	 172 */		add	%g2,%lo(Zero),%g2
    809 /* 0x0020	     */		ldx	[%o3+%g2],%o0
    810 /* 0x0024	     */		sethi	%hi(TwoToMinus16),%g3
    811 /* 0x0028	 163 */		or	%g0,%i0,%i3
    812 /* 0x002c	 169 */		sub	%g5,3,%o1
    813 /* 0x0030	 172 */		sethi	%hi(TwoTo16),%g4
    814 /* 0x0034	 163 */		or	%g0,%i2,%i0
    815 /* 0x0038	 172 */		add	%g3,%lo(TwoToMinus16),%g2
    816 /* 0x003c	     */		ldx	[%o3+%g2],%o2
    817 /* 0x0040	 169 */		cmp	%o1,0
    818 /* 0x0044	 164 */		or	%g0,0,%i2
    819 /* 0x0048	 169 */		ble,pt	%icc,.L900000418
    820 /* 0x004c	     */		cmp	%i2,%g5
    821 /* 0x0050	     */		ldd	[%o0],%f2
    822 /* 0x0054	 172 */		add	%g4,%lo(TwoTo16),%g3
    823 /* 0x0058	     */		ldx	[%o3+%g3],%o1
    824 /* 0x005c	 169 */		sub	%g5,4,%o4
    825 /* 0x0060	     */		or	%g0,0,%o5
    826                       .L900000417:
    827 /* 0x0064	 172 */		sra	%i2,0,%g2
    828 /* 0x0068	     */		fmovd	%f2,%f14
    829 /* 0x006c	     */		ldd	[%o2],%f0
    830 /* 0x0070	     */		sllx	%g2,2,%g3
    831 /* 0x0074	     */		fmovd	%f2,%f10
    832 /* 0x0078	     */		ldd	[%o1],%f16
    833 /* 0x007c	     */		ld	[%g3+%i0],%f15
    834 /* 0x0080	     */		add	%i0,%g3,%g3
    835 /* 0x0084	     */		fmovd	%f2,%f6
    836 /* 0x0088	     */		ld	[%g3+4],%f11
    837 /* 0x008c	     */		sra	%o5,0,%g4
    838 /* 0x0090	     */		add	%i2,4,%i2
    839 /* 0x0094	     */		ld	[%g3+8],%f7
    840 /* 0x0098	     */		fxtod	%f14,%f14
    841 /* 0x009c	     */		sllx	%g2,3,%g2
    842 /* 0x00a0	     */		ld	[%g3+12],%f3
    843 /* 0x00a4	     */		fxtod	%f10,%f10
    844 /* 0x00a8	     */		sllx	%g4,3,%g3
    845 /* 0x00ac	     */		fxtod	%f6,%f6
    846 /* 0x00b0	     */		std	%f14,[%g2+%i3]
    847 /* 0x00b4	     */		add	%i3,%g2,%g4
    848 /* 0x00b8	     */		fxtod	%f2,%f2
    849 /* 0x00bc	     */		fmuld	%f0,%f14,%f12
    850 /* 0x00c0	     */		std	%f2,[%g4+24]
    851 /* 0x00c4	     */		fmuld	%f0,%f10,%f8
    852 /* 0x00c8	     */		std	%f10,[%g4+8]
    853 /* 0x00cc	     */		add	%i1,%g3,%g2
    854 /* 0x00d0	     */		fmuld	%f0,%f6,%f4
    855 /* 0x00d4	     */		std	%f6,[%g4+16]
    856 /* 0x00d8	     */		cmp	%i2,%o4
    857 /* 0x00dc	     */		fmuld	%f0,%f2,%f0
    858 /* 0x00e0	     */		fdtox	%f12,%f12
    859 /* 0x00e4	     */		add	%o5,8,%o5
    860 /* 0x00e8	     */		fdtox	%f8,%f8
    861 /* 0x00ec	     */		fdtox	%f4,%f4
    862 /* 0x00f0	     */		fdtox	%f0,%f0
    863 /* 0x00f4	     */		fxtod	%f12,%f12
    864 /* 0x00f8	     */		std	%f12,[%g2+8]
    865 /* 0x00fc	     */		fxtod	%f8,%f8
    866 /* 0x0100	     */		std	%f8,[%g2+24]
    867 /* 0x0104	     */		fxtod	%f4,%f4
    868 /* 0x0108	     */		std	%f4,[%g2+40]
    869 /* 0x010c	     */		fxtod	%f0,%f0
    870 /* 0x0110	     */		std	%f0,[%g2+56]
    871 /* 0x0114	     */		fmuld	%f12,%f16,%f12
    872 /* 0x0118	     */		fmuld	%f8,%f16,%f8
    873 /* 0x011c	     */		fmuld	%f4,%f16,%f4
    874 /* 0x0120	     */		fsubd	%f14,%f12,%f12
    875 /* 0x0124	     */		std	%f12,[%g3+%i1]
    876 /* 0x0128	     */		fmuld	%f0,%f16,%f0
    877 /* 0x012c	     */		fsubd	%f10,%f8,%f8
    878 /* 0x0130	     */		std	%f8,[%g2+16]
    879 /* 0x0134	     */		fsubd	%f6,%f4,%f4
    880 /* 0x0138	     */		std	%f4,[%g2+32]
    881 /* 0x013c	     */		fsubd	%f2,%f0,%f0
    882 /* 0x0140	     */		std	%f0,[%g2+48]
    883 /* 0x0144	     */		ble,a,pt	%icc,.L900000417
    884 /* 0x0148	     */		ldd	[%o0],%f2
    885                       .L77000159:
    886 
    887 !  173		      !   }
    888 !  174		      !#endif
    889 !  175		      ! for(;i<len;i++)
    890 
    891 /* 0x014c	 175 */		cmp	%i2,%g5
    892                       .L900000418:
    893 /* 0x0150	 175 */		bge,pt	%icc,.L77000164
    894 /* 0x0154	     */		nop
    895 
    896 !  176		      !   {
    897 !  177		      !     a=i32[i];
    898 !  178		      !     d32[i]=(double)(i32[i]);
    899 !  179		      !     d16[2*i]=(double)(a&0xffff);
    900 !  180		      !     d16[2*i+1]=(double)(a>>16);
    901 
    902 /* 0x0158	 180 */		sethi	%hi(.L_const_seg_900000401),%g2
    903 /* 0x015c	     */		add	%g2,%lo(.L_const_seg_900000401),%g2
    904 /* 0x0160	 175 */		sethi	%hi(0xfc00),%g3
    905 /* 0x0164	 180 */		ldx	[%o3+%g2],%g1
    906 /* 0x0168	 175 */		sll	%i2,1,%i4
    907 /* 0x016c	     */		sub	%g5,%i2,%g4
    908 /* 0x0170	 177 */		sra	%i2,0,%o3
    909 /* 0x0174	 175 */		add	%g3,1023,%g3
    910 /* 0x0178	 178 */		ldd	[%g1],%f2
    911 /* 0x017c	     */		sllx	%o3,2,%o2
    912 /* 0x0180	 175 */		add	%i4,1,%g2
    913 /* 0x0184	 177 */		or	%g0,%o3,%o1
    914 /* 0x0188	     */		cmp	%g4,6
    915 /* 0x018c	 175 */		bl,pn	%icc,.L77000161
    916 /* 0x0190	     */		sra	%i2,0,%o3
    917 /* 0x0194	 177 */		or	%g0,%o2,%o0
    918 /* 0x0198	 178 */		ld	[%i0+%o2],%f5
    919 /* 0x019c	 179 */		fmovs	%f2,%f8
    920 /* 0x01a0	 175 */		add	%o0,4,%o3
    921 /* 0x01a4	 177 */		ld	[%i0+%o0],%o7
    922 /* 0x01a8	 180 */		fmovs	%f2,%f6
    923 /* 0x01ac	 178 */		fmovs	%f2,%f4
    924 /* 0x01b0	     */		sllx	%o1,3,%o2
    925 /* 0x01b4	 175 */		add	%o3,4,%o5
    926 /* 0x01b8	 179 */		sra	%i4,0,%o0
    927 /* 0x01bc	 175 */		add	%o3,8,%o4
    928 /* 0x01c0	 178 */		fsubd	%f4,%f2,%f4
    929 /* 0x01c4	     */		std	%f4,[%i3+%o2]
    930 /* 0x01c8	 179 */		sllx	%o0,3,%i5
    931 /* 0x01cc	     */		and	%o7,%g3,%o0
    932 /* 0x01d0	     */		st	%o0,[%sp+2227]
    933 /* 0x01d4	 175 */		add	%i5,16,%o1
    934 /* 0x01d8	 180 */		srl	%o7,16,%g4
    935 /* 0x01dc	     */		add	%i2,1,%i2
    936 /* 0x01e0	     */		sra	%g2,0,%o0
    937 /* 0x01e4	 175 */		add	%o2,8,%o2
    938 /* 0x01e8	 179 */		fmovs	%f2,%f4
    939 /* 0x01ec	 180 */		sllx	%o0,3,%l0
    940 /* 0x01f0	     */		add	%i4,3,%g2
    941 /* 0x01f4	 179 */		ld	[%sp+2227],%f5
    942 /* 0x01f8	 175 */		add	%l0,16,%o0
    943 /* 0x01fc	 180 */		add	%i4,2,%i4
    944 /* 0x0200	 175 */		sub	%g5,1,%o7
    945 /* 0x0204	 180 */		add	%i2,3,%i2
    946 /* 0x0208	 179 */		fsubd	%f4,%f2,%f4
    947 /* 0x020c	     */		std	%f4,[%i1+%i5]
    948 /* 0x0210	 180 */		st	%g4,[%sp+2223]
    949 /* 0x0214	 177 */		ld	[%i0+%o3],%i5
    950 /* 0x0218	 180 */		fmovs	%f2,%f4
    951 /* 0x021c	     */		srl	%i5,16,%g4
    952 /* 0x0220	 179 */		and	%i5,%g3,%i5
    953 /* 0x0224	 180 */		ld	[%sp+2223],%f5
    954 /* 0x0228	     */		fsubd	%f4,%f2,%f4
    955 /* 0x022c	     */		std	%f4,[%i1+%l0]
    956 /* 0x0230	     */		st	%g4,[%sp+2223]
    957 /* 0x0234	 177 */		ld	[%i0+%o5],%g4
    958 /* 0x0238	 179 */		st	%i5,[%sp+2227]
    959 /* 0x023c	 178 */		fmovs	%f2,%f4
    960 /* 0x0240	 180 */		srl	%g4,16,%i5
    961 /* 0x0244	 179 */		and	%g4,%g3,%g4
    962 /* 0x0248	 180 */		ld	[%sp+2223],%f7
    963 /* 0x024c	     */		st	%i5,[%sp+2223]
    964 /* 0x0250	 178 */		ld	[%i0+%o3],%f5
    965 /* 0x0254	 180 */		fsubd	%f6,%f2,%f6
    966 /* 0x0258	 177 */		ld	[%i0+%o4],%o3
    967 /* 0x025c	 178 */		fsubd	%f4,%f2,%f4
    968 /* 0x0260	 179 */		ld	[%sp+2227],%f9
    969 /* 0x0264	 180 */		ld	[%sp+2223],%f1
    970 /* 0x0268	 179 */		st	%g4,[%sp+2227]
    971 /* 0x026c	     */		fsubd	%f8,%f2,%f8
    972 /* 0x0270	     */		std	%f8,[%i1+%o1]
    973 /* 0x0274	 180 */		std	%f6,[%i1+%o0]
    974 /* 0x0278	 178 */		std	%f4,[%i3+%o2]
    975                       .L900000411:
    976 /* 0x027c	 179 */		ld	[%sp+2227],%f13
    977 /* 0x0280	 180 */		srl	%o3,16,%g4
    978 /* 0x0284	     */		add	%i2,2,%i2
    979 /* 0x0288	     */		st	%g4,[%sp+2223]
    980 /* 0x028c	     */		cmp	%i2,%o7
    981 /* 0x0290	     */		add	%g2,4,%g2
    982 /* 0x0294	 178 */		ld	[%i0+%o5],%f11
    983 /* 0x0298	 180 */		add	%i4,4,%i4
    984 /* 0x029c	 175 */		add	%o4,4,%o5
    985 /* 0x02a0	 177 */		ld	[%i0+%o5],%g4
    986 /* 0x02a4	 179 */		and	%o3,%g3,%o3
    987 /* 0x02a8	     */		st	%o3,[%sp+2227]
    988 /* 0x02ac	 180 */		fmovs	%f2,%f0
    989 /* 0x02b0	 179 */		fmovs	%f2,%f12
    990 /* 0x02b4	 180 */		fsubd	%f0,%f2,%f8
    991 /* 0x02b8	 179 */		fsubd	%f12,%f2,%f4
    992 /* 0x02bc	 175 */		add	%o1,16,%o1
    993 /* 0x02c0	 180 */		ld	[%sp+2223],%f7
    994 /* 0x02c4	 178 */		fmovs	%f2,%f10
    995 /* 0x02c8	 179 */		std	%f4,[%i1+%o1]
    996 /* 0x02cc	 175 */		add	%o0,16,%o0
    997 /* 0x02d0	 178 */		fsubd	%f10,%f2,%f4
    998 /* 0x02d4	 175 */		add	%o2,8,%o2
    999 /* 0x02d8	 180 */		std	%f8,[%i1+%o0]
   1000 /* 0x02dc	 178 */		std	%f4,[%i3+%o2]
   1001 /* 0x02e0	 179 */		ld	[%sp+2227],%f9
   1002 /* 0x02e4	 180 */		srl	%g4,16,%o3
   1003 /* 0x02e8	     */		st	%o3,[%sp+2223]
   1004 /* 0x02ec	 178 */		ld	[%i0+%o4],%f5
   1005 /* 0x02f0	 175 */		add	%o4,8,%o4
   1006 /* 0x02f4	 177 */		ld	[%i0+%o4],%o3
   1007 /* 0x02f8	 179 */		and	%g4,%g3,%g4
   1008 /* 0x02fc	     */		st	%g4,[%sp+2227]
   1009 /* 0x0300	 180 */		fmovs	%f2,%f6
   1010 /* 0x0304	 179 */		fmovs	%f2,%f8
   1011 /* 0x0308	 180 */		fsubd	%f6,%f2,%f6
   1012 /* 0x030c	 179 */		fsubd	%f8,%f2,%f8
   1013 /* 0x0310	 175 */		add	%o1,16,%o1
   1014 /* 0x0314	 180 */		ld	[%sp+2223],%f1
   1015 /* 0x0318	 178 */		fmovs	%f2,%f4
   1016 /* 0x031c	 179 */		std	%f8,[%i1+%o1]
   1017 /* 0x0320	 175 */		add	%o0,16,%o0
   1018 /* 0x0324	 178 */		fsubd	%f4,%f2,%f4
   1019 /* 0x0328	 175 */		add	%o2,8,%o2
   1020 /* 0x032c	 180 */		std	%f6,[%i1+%o0]
   1021 /* 0x0330	     */		bl,pt	%icc,.L900000411
   1022 /* 0x0334	     */		std	%f4,[%i3+%o2]
   1023                       .L900000414:
   1024 /* 0x0338	 180 */		srl	%o3,16,%o7
   1025 /* 0x033c	     */		st	%o7,[%sp+2223]
   1026 /* 0x0340	 179 */		fmovs	%f2,%f12
   1027 /* 0x0344	 178 */		ld	[%i0+%o5],%f11
   1028 /* 0x0348	 180 */		fmovs	%f2,%f0
   1029 /* 0x034c	 179 */		and	%o3,%g3,%g4
   1030 /* 0x0350	 180 */		fmovs	%f2,%f6
   1031 /* 0x0354	 175 */		add	%o1,16,%o3
   1032 /* 0x0358	     */		add	%o0,16,%o7
   1033 /* 0x035c	 178 */		fmovs	%f2,%f10
   1034 /* 0x0360	 175 */		add	%o2,8,%o2
   1035 /* 0x0364	     */		add	%o1,32,%o5
   1036 /* 0x0368	 179 */		ld	[%sp+2227],%f13
   1037 /* 0x036c	 178 */		fmovs	%f2,%f4
   1038 /* 0x0370	 175 */		add	%o0,32,%o1
   1039 /* 0x0374	 180 */		ld	[%sp+2223],%f7
   1040 /* 0x0378	 175 */		add	%o2,8,%o0
   1041 /* 0x037c	 180 */		cmp	%i2,%g5
   1042 /* 0x0380	 179 */		st	%g4,[%sp+2227]
   1043 /* 0x0384	     */		fsubd	%f12,%f2,%f8
   1044 /* 0x0388	 180 */		add	%g2,6,%g2
   1045 /* 0x038c	 179 */		std	%f8,[%i1+%o3]
   1046 /* 0x0390	 180 */		fsubd	%f0,%f2,%f0
   1047 /* 0x0394	 177 */		sra	%i2,0,%o3
   1048 /* 0x0398	 180 */		std	%f0,[%i1+%o7]
   1049 /* 0x039c	 178 */		fsubd	%f10,%f2,%f0
   1050 /* 0x03a0	 180 */		add	%i4,6,%i4
   1051 /* 0x03a4	 178 */		std	%f0,[%i3+%o2]
   1052 /* 0x03a8	     */		sllx	%o3,2,%o2
   1053 /* 0x03ac	 179 */		ld	[%sp+2227],%f9
   1054 /* 0x03b0	 178 */		ld	[%i0+%o4],%f5
   1055 /* 0x03b4	 179 */		fmovs	%f2,%f8
   1056 /* 0x03b8	     */		fsubd	%f8,%f2,%f0
   1057 /* 0x03bc	     */		std	%f0,[%i1+%o5]
   1058 /* 0x03c0	 180 */		fsubd	%f6,%f2,%f0
   1059 /* 0x03c4	     */		std	%f0,[%i1+%o1]
   1060 /* 0x03c8	 178 */		fsubd	%f4,%f2,%f0
   1061 /* 0x03cc	 180 */		bge,pn	%icc,.L77000164
   1062 /* 0x03d0	     */		std	%f0,[%i3+%o0]
   1063                       .L77000161:
   1064 /* 0x03d4	 178 */		ldd	[%g1],%f2
   1065                       .L900000416:
   1066 /* 0x03d8	 178 */		ld	[%i0+%o2],%f5
   1067 /* 0x03dc	 179 */		sra	%i4,0,%o0
   1068 /* 0x03e0	 180 */		add	%i2,1,%i2
   1069 /* 0x03e4	 177 */		ld	[%i0+%o2],%o1
   1070 /* 0x03e8	 178 */		sllx	%o3,3,%o3
   1071 /* 0x03ec	 180 */		add	%i4,2,%i4
   1072 /* 0x03f0	 178 */		fmovs	%f2,%f4
   1073 /* 0x03f4	 179 */		sllx	%o0,3,%o4
   1074 /* 0x03f8	 180 */		cmp	%i2,%g5
   1075 /* 0x03fc	 179 */		and	%o1,%g3,%o0
   1076 /* 0x0400	 178 */		fsubd	%f4,%f2,%f0
   1077 /* 0x0404	     */		std	%f0,[%i3+%o3]
   1078 /* 0x0408	 180 */		srl	%o1,16,%o1
   1079 /* 0x040c	 179 */		st	%o0,[%sp+2227]
   1080 /* 0x0410	 180 */		sra	%g2,0,%o0
   1081 /* 0x0414	     */		add	%g2,2,%g2
   1082 /* 0x0418	 177 */		sra	%i2,0,%o3
   1083 /* 0x041c	 180 */		sllx	%o0,3,%o0
   1084 /* 0x0420	 179 */		fmovs	%f2,%f4
   1085 /* 0x0424	     */		sllx	%o3,2,%o2
   1086 /* 0x0428	     */		ld	[%sp+2227],%f5
   1087 /* 0x042c	     */		fsubd	%f4,%f2,%f0
   1088 /* 0x0430	     */		std	%f0,[%i1+%o4]
   1089 /* 0x0434	 180 */		st	%o1,[%sp+2223]
   1090 /* 0x0438	     */		fmovs	%f2,%f4
   1091 /* 0x043c	     */		ld	[%sp+2223],%f5
   1092 /* 0x0440	     */		fsubd	%f4,%f2,%f0
   1093 /* 0x0444	     */		std	%f0,[%i1+%o0]
   1094 /* 0x0448	     */		bl,a,pt	%icc,.L900000416
   1095 /* 0x044c	     */		ldd	[%g1],%f2
   1096                       .L77000164:
   1097 /* 0x0450	     */		ret	! Result = 
   1098 /* 0x0454	     */		restore	%g0,%g0,%g0
   1099 /* 0x0458	   0 */		.type	conv_i32_to_d32_and_d16,2
   1100 /* 0x0458	     */		.size	conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
   1101 
   1102 .section	".text",#alloc,#execinstr
   1103 /* 000000	   0 */		.align	8
   1104 !
   1105 ! SUBROUTINE adjust_montf_result
   1106 !
   1107 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
   1108 
   1109                       	.global adjust_montf_result
   1110                       adjust_montf_result:
   1111 /* 000000	     */		save	%sp,-176,%sp
   1112 /* 0x0004	     */		or	%g0,%i2,%o1
   1113 /* 0x0008	     */		or	%g0,%i0,%i2
   1114 
   1115 !  181		      !   }
   1116 !  182		      !}
   1117 !  185		      !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len)
   1118 !  186		      !{
   1119 !  187		      !long long acc;
   1120 !  188		      !int i;
   1121 !  190		      ! if(i32[len]>0) i=-1;
   1122 
   1123 /* 0x000c	 190 */		sra	%o1,0,%g2
   1124 /* 0x0010	     */		or	%g0,-1,%o2
   1125 /* 0x0014	     */		sllx	%g2,2,%g2
   1126 /* 0x0018	     */		ld	[%i2+%g2],%g2
   1127 /* 0x001c	     */		cmp	%g2,0
   1128 /* 0x0020	     */		bleu,pn	%icc,.L77000175
   1129 /* 0x0024	     */		or	%g0,%i1,%i0
   1130 /* 0x0028	     */		ba	.L900000511
   1131 /* 0x002c	     */		cmp	%o2,0
   1132                       .L77000175:
   1133 
   1134 !  191		      ! else
   1135 !  192		      !   {
   1136 !  193		      !     for(i=len-1; i>=0; i--)
   1137 
   1138 /* 0x0030	 193 */		sub	%o1,1,%o2
   1139 /* 0x0034	     */		cmp	%o2,0
   1140 /* 0x0038	     */		bl,pn	%icc,.L77000182
   1141 /* 0x003c	     */		sra	%o2,0,%g2
   1142                       .L900000510:
   1143 
   1144 !  194		      !       {
   1145 !  195		      !	 if(i32[i]!=nint[i]) break;
   1146 
   1147 /* 0x0040	 195 */		sllx	%g2,2,%g2
   1148 /* 0x0044	     */		sub	%o2,1,%o0
   1149 /* 0x0048	     */		ld	[%i1+%g2],%g3
   1150 /* 0x004c	     */		ld	[%i2+%g2],%g2
   1151 /* 0x0050	     */		cmp	%g2,%g3
   1152 /* 0x0054	     */		bne,pn	%icc,.L77000182
   1153 /* 0x0058	     */		nop
   1154 /* 0x005c	   0 */		or	%g0,%o0,%o2
   1155 /* 0x0060	 195 */		cmp	%o0,0
   1156 /* 0x0064	     */		bge,pt	%icc,.L900000510
   1157 /* 0x0068	     */		sra	%o2,0,%g2
   1158                       .L77000182:
   1159 
   1160 !  196		      !       }
   1161 !  197		      !   }
   1162 !  198		      ! if((i<0)||(i32[i]>nint[i]))
   1163 
   1164 /* 0x006c	 198 */		cmp	%o2,0
   1165                       .L900000511:
   1166 /* 0x0070	 198 */		bl,pn	%icc,.L77000198
   1167 /* 0x0074	     */		sra	%o2,0,%g2
   1168 /* 0x0078	     */		sllx	%g2,2,%g2
   1169 /* 0x007c	     */		ld	[%i1+%g2],%g3
   1170 /* 0x0080	     */		ld	[%i2+%g2],%g2
   1171 /* 0x0084	     */		cmp	%g2,%g3
   1172 /* 0x0088	     */		bleu,pt	%icc,.L77000191
   1173 /* 0x008c	     */		nop
   1174                       .L77000198:
   1175 
   1176 !  199		      !   {
   1177 !  200		      !     acc=0;
   1178 !  201		      !     for(i=0;i<len;i++)
   1179 
   1180 /* 0x0090	 201 */		cmp	%o1,0
   1181 /* 0x0094	     */		ble,pt	%icc,.L77000191
   1182 /* 0x0098	     */		nop
   1183 /* 0x009c	 198 */		or	%g0,-1,%g2
   1184 /* 0x00a0	 201 */		or	%g0,%o1,%g3
   1185 /* 0x00a4	 198 */		srl	%g2,0,%g2
   1186 /* 0x00a8	     */		sub	%o1,1,%g4
   1187 /* 0x00ac	     */		cmp	%o1,9
   1188 /* 0x00b0	 201 */		or	%g0,0,%i1
   1189 /* 0x00b4	 200 */		or	%g0,0,%g5
   1190 
   1191 !  202		      !       {
   1192 !  203		      !	 acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]);
   1193 
   1194 /* 0x00b8	 203 */		or	%g0,0,%o1
   1195 /* 0x00bc	 201 */		bl,pn	%icc,.L77000199
   1196 /* 0x00c0	     */		sub	%g3,4,%o7
   1197 /* 0x00c4	 203 */		ld	[%i2],%o1
   1198 
   1199 !  204		      !	 i32[i]=acc&0xffffffff;
   1200 !  205		      !	 acc=acc>>32;
   1201 
   1202 /* 0x00c8	 205 */		or	%g0,5,%i1
   1203 /* 0x00cc	 203 */		ld	[%i0],%o2
   1204 /* 0x00d0	 201 */		or	%g0,8,%o5
   1205 /* 0x00d4	     */		or	%g0,12,%o4
   1206 /* 0x00d8	 203 */		ld	[%i0+4],%o3
   1207 /* 0x00dc	 201 */		or	%g0,16,%g1
   1208 /* 0x00e0	 203 */		ld	[%i2+4],%o0
   1209 /* 0x00e4	 201 */		sub	%o1,%o2,%o1
   1210 /* 0x00e8	 203 */		ld	[%i0+8],%i3
   1211 /* 0x00ec	 204 */		and	%o1,%g2,%g5
   1212 /* 0x00f0	     */		st	%g5,[%i2]
   1213 /* 0x00f4	 205 */		srax	%o1,32,%g5
   1214 /* 0x00f8	 201 */		sub	%o0,%o3,%o0
   1215 /* 0x00fc	 203 */		ld	[%i0+12],%o2
   1216 /* 0x0100	 201 */		add	%o0,%g5,%o0
   1217 /* 0x0104	 204 */		and	%o0,%g2,%g5
   1218 /* 0x0108	     */		st	%g5,[%i2+4]
   1219 /* 0x010c	 205 */		srax	%o0,32,%o0
   1220 /* 0x0110	 203 */		ld	[%i2+8],%o1
   1221 /* 0x0114	     */		ld	[%i2+12],%o3
   1222 /* 0x0118	 201 */		sub	%o1,%i3,%o1
   1223                       .L900000505:
   1224 /* 0x011c	     */		add	%g1,4,%g3
   1225 /* 0x0120	 203 */		ld	[%g1+%i2],%g5
   1226 /* 0x0124	 201 */		add	%o1,%o0,%o0
   1227 /* 0x0128	 203 */		ld	[%i0+%g1],%i3
   1228 /* 0x012c	 201 */		sub	%o3,%o2,%o1
   1229 /* 0x0130	 204 */		and	%o0,%g2,%o2
   1230 /* 0x0134	     */		st	%o2,[%o5+%i2]
   1231 /* 0x0138	 205 */		srax	%o0,32,%o2
   1232 /* 0x013c	     */		add	%i1,4,%i1
   1233 /* 0x0140	 201 */		add	%g1,8,%o5
   1234 /* 0x0144	 203 */		ld	[%g3+%i2],%o0
   1235 /* 0x0148	 201 */		add	%o1,%o2,%o1
   1236 /* 0x014c	 203 */		ld	[%i0+%g3],%o3
   1237 /* 0x0150	 201 */		sub	%g5,%i3,%o2
   1238 /* 0x0154	 204 */		and	%o1,%g2,%g5
   1239 /* 0x0158	     */		st	%g5,[%o4+%i2]
   1240 /* 0x015c	 205 */		srax	%o1,32,%g5
   1241 /* 0x0160	     */		cmp	%i1,%o7
   1242 /* 0x0164	 201 */		add	%g1,12,%o4
   1243 /* 0x0168	 203 */		ld	[%o5+%i2],%o1
   1244 /* 0x016c	 201 */		add	%o2,%g5,%o2
   1245 /* 0x0170	 203 */		ld	[%i0+%o5],%i3
   1246 /* 0x0174	 201 */		sub	%o0,%o3,%o0
   1247 /* 0x0178	 204 */		and	%o2,%g2,%o3
   1248 /* 0x017c	     */		st	%o3,[%g1+%i2]
   1249 /* 0x0180	 205 */		srax	%o2,32,%g5
   1250 /* 0x0184	 203 */		ld	[%o4+%i2],%o3
   1251 /* 0x0188	 201 */		add	%g1,16,%g1
   1252 /* 0x018c	     */		add	%o0,%g5,%o0
   1253 /* 0x0190	 203 */		ld	[%i0+%o4],%o2
   1254 /* 0x0194	 201 */		sub	%o1,%i3,%o1
   1255 /* 0x0198	 204 */		and	%o0,%g2,%g5
   1256 /* 0x019c	     */		st	%g5,[%g3+%i2]
   1257 /* 0x01a0	 205 */		ble,pt	%icc,.L900000505
   1258 /* 0x01a4	     */		srax	%o0,32,%o0
   1259                       .L900000508:
   1260 /* 0x01a8	     */		add	%o1,%o0,%g3
   1261 /* 0x01ac	     */		sub	%o3,%o2,%o1
   1262 /* 0x01b0	 203 */		ld	[%g1+%i2],%o0
   1263 /* 0x01b4	     */		ld	[%i0+%g1],%o2
   1264 /* 0x01b8	 205 */		srax	%g3,32,%o7
   1265 /* 0x01bc	 204 */		and	%g3,%g2,%o3
   1266 /* 0x01c0	 201 */		add	%o1,%o7,%o1
   1267 /* 0x01c4	 204 */		st	%o3,[%o5+%i2]
   1268 /* 0x01c8	 205 */		cmp	%i1,%g4
   1269 /* 0x01cc	 201 */		sub	%o0,%o2,%o0
   1270 /* 0x01d0	 204 */		and	%o1,%g2,%o2
   1271 /* 0x01d4	     */		st	%o2,[%o4+%i2]
   1272 /* 0x01d8	 205 */		srax	%o1,32,%o1
   1273 /* 0x01dc	 203 */		sra	%i1,0,%o2
   1274 /* 0x01e0	 201 */		add	%o0,%o1,%o0
   1275 /* 0x01e4	 205 */		srax	%o0,32,%g5
   1276 /* 0x01e8	 204 */		and	%o0,%g2,%o1
   1277 /* 0x01ec	     */		st	%o1,[%g1+%i2]
   1278 /* 0x01f0	 205 */		bg,pn	%icc,.L77000191
   1279 /* 0x01f4	     */		sllx	%o2,2,%o1
   1280                       .L77000199:
   1281 /* 0x01f8	   0 */		or	%g0,%o1,%g1
   1282                       .L900000509:
   1283 /* 0x01fc	 203 */		ld	[%o1+%i2],%o0
   1284 /* 0x0200	 205 */		add	%i1,1,%i1
   1285 /* 0x0204	 203 */		ld	[%i0+%o1],%o1
   1286 /* 0x0208	     */		sra	%i1,0,%o2
   1287 /* 0x020c	 205 */		cmp	%i1,%g4
   1288 /* 0x0210	 203 */		add	%g5,%o0,%o0
   1289 /* 0x0214	     */		sub	%o0,%o1,%o0
   1290 /* 0x0218	 205 */		srax	%o0,32,%g5
   1291 /* 0x021c	 204 */		and	%o0,%g2,%o1
   1292 /* 0x0220	     */		st	%o1,[%g1+%i2]
   1293 /* 0x0224	     */		sllx	%o2,2,%o1
   1294 /* 0x0228	 205 */		ble,pt	%icc,.L900000509
   1295 /* 0x022c	     */		or	%g0,%o1,%g1
   1296                       .L77000191:
   1297 /* 0x0230	     */		ret	! Result = 
   1298 /* 0x0234	     */		restore	%g0,%g0,%g0
   1299 /* 0x0238	   0 */		.type	adjust_montf_result,2
   1300 /* 0x0238	     */		.size	adjust_montf_result,(.-adjust_montf_result)
   1301 
   1302 .section	".text",#alloc,#execinstr
   1303 /* 000000	   0 */		.align	8
   1304 /* 000000	     */		.skip	24
   1305 !
   1306 ! SUBROUTINE mont_mulf_noconv
   1307 !
   1308 ! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
   1309 
   1310                       	.global mont_mulf_noconv
   1311                       mont_mulf_noconv:
   1312 /* 000000	     */		save	%sp,-224,%sp
   1313                       .L900000643:
   1314 /* 0x0004	     */		call	.+8
   1315 /* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
   1316 /* 0x000c	     */		ldx	[%fp+2223],%l0
   1317 
   1318 !  206		      !       }
   1319 !  207		      !   }
   1320 !  208		      !}
   1321 !  213		      !/*
   1322 !  214		      !** the lengths of the input arrays should be at least the following:
   1323 !  215		      !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
   1324 !  216		      !** all of them should be different from one another
   1325 !  217		      !**
   1326 !  218		      !*/
   1327 !  219		      !void mont_mulf_noconv(unsigned int *result,
   1328 !  220		      !		     double *dm1, double *dm2, double *dt,
   1329 !  221		      !		     double *dn, unsigned int *nint,
   1330 !  222		      !		     int nlen, double dn0)
   1331 !  223		      !{
   1332 !  224		      ! int i, j, jj;
   1333 !  225		      ! int tmp;
   1334 !  226		      ! double digit, m2j, nextm2j, a, b;
   1335 !  227		      ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0;
   1336 !  229		      ! pdm1=&(dm1[0]);
   1337 !  230		      ! pdm2=&(dm2[0]);
   1338 !  231		      ! pdn=&(dn[0]);
   1339 !  232		      ! pdm2[2*nlen]=Zero;
   1340 
   1341 /* 0x0010	 232 */		sethi	%hi(Zero),%g2
   1342 /* 0x0014	 223 */		fmovd	%f14,%f30
   1343 /* 0x0018	     */		add	%g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
   1344 /* 0x001c	 232 */		add	%g2,%lo(Zero),%g2
   1345 /* 0x0020	     */		sll	%l0,1,%o3
   1346 /* 0x0024	 223 */		add	%g5,%o7,%o4
   1347 /* 0x0028	 232 */		sra	%o3,0,%g5
   1348 /* 0x002c	     */		ldx	[%o4+%g2],%o7
   1349 
   1350 !  234		      ! if (nlen!=16)
   1351 !  235		      !   {
   1352 !  236		      !     for(i=0;i<4*nlen+2;i++) dt[i]=Zero;
   1353 !  238		      !     a=dt[0]=pdm1[0]*pdm2[0];
   1354 !  239		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
   1355 
   1356 /* 0x0030	 239 */		sethi	%hi(TwoToMinus16),%g3
   1357 /* 0x0034	     */		sethi	%hi(TwoTo16),%g4
   1358 /* 0x0038	     */		add	%g3,%lo(TwoToMinus16),%g2
   1359 /* 0x003c	 232 */		ldd	[%o7],%f0
   1360 /* 0x0040	 239 */		add	%g4,%lo(TwoTo16),%g3
   1361 /* 0x0044	 223 */		or	%g0,%i4,%o0
   1362 /* 0x0048	 232 */		sllx	%g5,3,%g4
   1363 /* 0x004c	 239 */		ldx	[%o4+%g2],%o5
   1364 /* 0x0050	 223 */		or	%g0,%i5,%l3
   1365 /* 0x0054	     */		or	%g0,%i0,%l2
   1366 /* 0x0058	 239 */		ldx	[%o4+%g3],%o4
   1367 /* 0x005c	 234 */		cmp	%l0,16
   1368 /* 0x0060	 232 */		std	%f0,[%i2+%g4]
   1369 /* 0x0064	 234 */		be,pn	%icc,.L77000279
   1370 /* 0x0068	     */		or	%g0,%i3,%l4
   1371 /* 0x006c	 236 */		sll	%l0,2,%g2
   1372 /* 0x0070	 223 */		or	%g0,%o0,%i5
   1373 /* 0x0074	 236 */		add	%g2,2,%o0
   1374 /* 0x0078	 223 */		or	%g0,%i1,%i4
   1375 /* 0x007c	 236 */		cmp	%o0,0
   1376 /* 0x0080	 223 */		or	%g0,%i2,%l1
   1377 /* 0x0084	 236 */		ble,a,pt	%icc,.L900000657
   1378 /* 0x0088	     */		ldd	[%i1],%f6
   1379 
   1380 !  241		      !     pdtj=&(dt[0]);
   1381 !  242		      !     for(j=jj=0;j<2*nlen;j++,jj++,pdtj++)
   1382 !  243		      !       {
   1383 !  244		      !	 m2j=pdm2[j];
   1384 !  245		      !	 a=pdtj[0]+pdn[0]*digit;
   1385 !  246		      !	 b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16;
   1386 !  247		      !	 pdtj[1]=b;
   1387 !  249		      !#pragma pipeloop(0)
   1388 !  250		      !	 for(i=1;i<nlen;i++)
   1389 !  251		      !	   {
   1390 !  252		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
   1391 !  253		      !	   }
   1392 !  254		      ! 	 if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;}
   1393 !  255		      !	 
   1394 !  256		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
   1395 !  257		      !       }
   1396 !  258		      !   }
   1397 !  259		      ! else
   1398 !  260		      !   {
   1399 !  261		      !     a=dt[0]=pdm1[0]*pdm2[0];
   1400 !  263		      !     dt[65]=     dt[64]=     dt[63]=     dt[62]=     dt[61]=     dt[60]=
   1401 !  264		      !     dt[59]=     dt[58]=     dt[57]=     dt[56]=     dt[55]=     dt[54]=
   1402 !  265		      !     dt[53]=     dt[52]=     dt[51]=     dt[50]=     dt[49]=     dt[48]=
   1403 !  266		      !     dt[47]=     dt[46]=     dt[45]=     dt[44]=     dt[43]=     dt[42]=
   1404 !  267		      !     dt[41]=     dt[40]=     dt[39]=     dt[38]=     dt[37]=     dt[36]=
   1405 !  268		      !     dt[35]=     dt[34]=     dt[33]=     dt[32]=     dt[31]=     dt[30]=
   1406 !  269		      !     dt[29]=     dt[28]=     dt[27]=     dt[26]=     dt[25]=     dt[24]=
   1407 !  270		      !     dt[23]=     dt[22]=     dt[21]=     dt[20]=     dt[19]=     dt[18]=
   1408 !  271		      !     dt[17]=     dt[16]=     dt[15]=     dt[14]=     dt[13]=     dt[12]=
   1409 !  272		      !     dt[11]=     dt[10]=     dt[ 9]=     dt[ 8]=     dt[ 7]=     dt[ 6]=
   1410 !  273		      !     dt[ 5]=     dt[ 4]=     dt[ 3]=     dt[ 2]=     dt[ 1]=Zero;
   1411 !  275		      !     pdn_0=pdn[0];
   1412 !  276		      !     pdm1_0=pdm1[0];
   1413 !  278		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
   1414 !  279		      !     pdtj=&(dt[0]);
   1415 !  281		      !     for(j=0;j<32;j++,pdtj++)
   1416 
   1417 /* 0x008c	 281 */		or	%g0,%o0,%o1
   1418 /* 0x0090	 236 */		sub	%o0,1,%g1
   1419 /* 0x0094	     */		or	%g0,0,%g2
   1420 /* 0x0098	 281 */		cmp	%o1,5
   1421 /* 0x009c	     */		bl,pn	%icc,.L77000280
   1422 /* 0x00a0	     */		or	%g0,8,%o0
   1423 /* 0x00a4	     */		std	%f0,[%i3]
   1424 /* 0x00a8	     */		or	%g0,2,%g2
   1425 /* 0x00ac	     */		sub	%g1,2,%o1
   1426                       .L900000627:
   1427 /* 0x00b0	     */		add	%o0,8,%g3
   1428 /* 0x00b4	     */		std	%f0,[%i3+%o0]
   1429 /* 0x00b8	     */		add	%g2,3,%g2
   1430 /* 0x00bc	     */		add	%o0,16,%o2
   1431 /* 0x00c0	     */		std	%f0,[%i3+%g3]
   1432 /* 0x00c4	     */		cmp	%g2,%o1
   1433 /* 0x00c8	     */		add	%o0,24,%o0
   1434 /* 0x00cc	     */		ble,pt	%icc,.L900000627
   1435 /* 0x00d0	     */		std	%f0,[%i3+%o2]
   1436                       .L900000630:
   1437 /* 0x00d4	     */		cmp	%g2,%g1
   1438 /* 0x00d8	     */		bg,pn	%icc,.L77000285
   1439 /* 0x00dc	     */		std	%f0,[%i3+%o0]
   1440                       .L77000280:
   1441 /* 0x00e0	     */		ldd	[%o7],%f0
   1442                       .L900000656:
   1443 /* 0x00e4	     */		sra	%g2,0,%o0
   1444 /* 0x00e8	     */		add	%g2,1,%g2
   1445 /* 0x00ec	     */		sllx	%o0,3,%o0
   1446 /* 0x00f0	     */		cmp	%g2,%g1
   1447 /* 0x00f4	     */		std	%f0,[%i3+%o0]
   1448 /* 0x00f8	     */		ble,a,pt	%icc,.L900000656
   1449 /* 0x00fc	     */		ldd	[%o7],%f0
   1450                       .L77000285:
   1451 /* 0x0100	 238 */		ldd	[%i1],%f6
   1452                       .L900000657:
   1453 /* 0x0104	 238 */		ldd	[%i2],%f8
   1454 /* 0x0108	 242 */		cmp	%o3,0
   1455 /* 0x010c	     */		sub	%o3,1,%o1
   1456 /* 0x0110	 239 */		ldd	[%o7],%f10
   1457 /* 0x0114	     */		add	%o3,1,%o2
   1458 /* 0x0118	   0 */		or	%g0,0,%i2
   1459 /* 0x011c	 238 */		fmuld	%f6,%f8,%f6
   1460 /* 0x0120	     */		std	%f6,[%i3]
   1461 /* 0x0124	   0 */		or	%g0,0,%g3
   1462 /* 0x0128	 239 */		ldd	[%o5],%f8
   1463 /* 0x012c	   0 */		or	%g0,%o2,%g1
   1464 /* 0x0130	 236 */		sub	%l0,1,%i1
   1465 /* 0x0134	 239 */		ldd	[%o4],%f12
   1466 /* 0x0138	 236 */		or	%g0,1,%g4
   1467 /* 0x013c	     */		fdtox	%f6,%f0
   1468 /* 0x0140	     */		fmovs	%f10,%f0
   1469 /* 0x0144	     */		fxtod	%f0,%f6
   1470 /* 0x0148	 239 */		fmuld	%f6,%f14,%f6
   1471 /* 0x014c	     */		fmuld	%f6,%f8,%f8
   1472 /* 0x0150	     */		fdtox	%f8,%f8
   1473 /* 0x0154	     */		fxtod	%f8,%f8
   1474 /* 0x0158	     */		fmuld	%f8,%f12,%f8
   1475 /* 0x015c	     */		fsubd	%f6,%f8,%f20
   1476 /* 0x0160	 242 */		ble,pt	%icc,.L900000650
   1477 /* 0x0164	     */		sllx	%g5,3,%g2
   1478 /* 0x0168	   0 */		st	%o1,[%sp+2223]
   1479 /* 0x016c	 246 */		ldd	[%i5],%f6
   1480                       .L900000651:
   1481 /* 0x0170	 246 */		sra	%g4,0,%g2
   1482 /* 0x0174	     */		fmuld	%f6,%f20,%f6
   1483 /* 0x0178	     */		ldd	[%i3],%f12
   1484 /* 0x017c	     */		sllx	%g2,3,%g2
   1485 /* 0x0180	     */		ldd	[%i4],%f8
   1486 /* 0x0184	 250 */		cmp	%l0,1
   1487 /* 0x0188	 246 */		ldd	[%l1+%g2],%f10
   1488 /* 0x018c	 244 */		sra	%i2,0,%g2
   1489 /* 0x0190	     */		add	%i2,1,%i0
   1490 /* 0x0194	 246 */		faddd	%f12,%f6,%f6
   1491 /* 0x0198	     */		ldd	[%o5],%f12
   1492 /* 0x019c	 244 */		sllx	%g2,3,%g2
   1493 /* 0x01a0	 246 */		fmuld	%f8,%f10,%f8
   1494 /* 0x01a4	     */		ldd	[%i3+8],%f10
   1495 /* 0x01a8	     */		srl	%i2,31,%o3
   1496 /* 0x01ac	 244 */		ldd	[%l1+%g2],%f18
   1497 /* 0x01b0	   0 */		or	%g0,1,%l5
   1498 /* 0x01b4	 236 */		or	%g0,2,%g2
   1499 /* 0x01b8	 246 */		fmuld	%f6,%f12,%f6
   1500 /* 0x01bc	 250 */		or	%g0,32,%o1
   1501 /* 0x01c0	     */		or	%g0,48,%o2
   1502 /* 0x01c4	 246 */		faddd	%f10,%f8,%f8
   1503 /* 0x01c8	     */		faddd	%f8,%f6,%f16
   1504 /* 0x01cc	 250 */		ble,pn	%icc,.L77000213
   1505 /* 0x01d0	     */		std	%f16,[%i3+8]
   1506 /* 0x01d4	     */		cmp	%i1,8
   1507 /* 0x01d8	     */		sub	%l0,3,%o3
   1508 /* 0x01dc	     */		bl,pn	%icc,.L77000284
   1509 /* 0x01e0	     */		or	%g0,8,%o0
   1510 /* 0x01e4	 252 */		ldd	[%i5+8],%f0
   1511 /* 0x01e8	     */		or	%g0,6,%l5
   1512 /* 0x01ec	     */		ldd	[%i4+8],%f2
   1513 /* 0x01f0	     */		or	%g0,4,%g2
   1514 /* 0x01f4	 250 */		or	%g0,40,%o0
   1515 /* 0x01f8	 252 */		ldd	[%i5+16],%f8
   1516 /* 0x01fc	     */		fmuld	%f0,%f20,%f10
   1517 /* 0x0200	     */		ldd	[%i4+16],%f4
   1518 /* 0x0204	     */		fmuld	%f2,%f18,%f2
   1519 /* 0x0208	     */		ldd	[%i3+16],%f0
   1520 /* 0x020c	     */		fmuld	%f8,%f20,%f12
   1521 /* 0x0210	     */		ldd	[%i4+24],%f6
   1522 /* 0x0214	     */		fmuld	%f4,%f18,%f4
   1523 /* 0x0218	     */		ldd	[%i5+24],%f8
   1524 /* 0x021c	     */		faddd	%f2,%f10,%f2
   1525 /* 0x0220	     */		ldd	[%i4+32],%f14
   1526 /* 0x0224	     */		fmuld	%f6,%f18,%f10
   1527 /* 0x0228	     */		ldd	[%i5+32],%f6
   1528 /* 0x022c	     */		faddd	%f4,%f12,%f4
   1529 /* 0x0230	     */		ldd	[%i4+40],%f12
   1530 /* 0x0234	     */		faddd	%f0,%f2,%f0
   1531 /* 0x0238	     */		std	%f0,[%i3+16]
   1532 /* 0x023c	     */		ldd	[%i3+32],%f0
   1533 /* 0x0240	     */		ldd	[%i3+48],%f2
   1534                       .L900000639:
   1535 /* 0x0244	     */		add	%o2,16,%l6
   1536 /* 0x0248	 252 */		ldd	[%i5+%o0],%f22
   1537 /* 0x024c	     */		add	%l5,3,%l5
   1538 /* 0x0250	     */		fmuld	%f8,%f20,%f8
   1539 /* 0x0254	 250 */		add	%o0,8,%o0
   1540 /* 0x0258	 252 */		ldd	[%l6+%i3],%f26
   1541 /* 0x025c	     */		cmp	%l5,%o3
   1542 /* 0x0260	     */		ldd	[%i4+%o0],%f24
   1543 /* 0x0264	     */		faddd	%f0,%f4,%f0
   1544 /* 0x0268	     */		add	%g2,6,%g2
   1545 /* 0x026c	     */		faddd	%f10,%f8,%f10
   1546 /* 0x0270	     */		fmuld	%f14,%f18,%f4
   1547 /* 0x0274	     */		std	%f0,[%o1+%i3]
   1548 /* 0x0278	 250 */		add	%o2,32,%o1
   1549 /* 0x027c	 252 */		ldd	[%i5+%o0],%f8
   1550 /* 0x0280	     */		fmuld	%f6,%f20,%f6
   1551 /* 0x0284	 250 */		add	%o0,8,%o0
   1552 /* 0x0288	 252 */		ldd	[%o1+%i3],%f0
   1553 /* 0x028c	     */		ldd	[%i4+%o0],%f14
   1554 /* 0x0290	     */		faddd	%f2,%f10,%f2
   1555 /* 0x0294	     */		faddd	%f4,%f6,%f10
   1556 /* 0x0298	     */		fmuld	%f12,%f18,%f4
   1557 /* 0x029c	     */		std	%f2,[%o2+%i3]
   1558 /* 0x02a0	 250 */		add	%o2,48,%o2
   1559 /* 0x02a4	 252 */		ldd	[%i5+%o0],%f6
   1560 /* 0x02a8	     */		fmuld	%f22,%f20,%f22
   1561 /* 0x02ac	 250 */		add	%o0,8,%o0
   1562 /* 0x02b0	 252 */		ldd	[%o2+%i3],%f2
   1563 /* 0x02b4	     */		ldd	[%i4+%o0],%f12
   1564 /* 0x02b8	     */		faddd	%f26,%f10,%f10
   1565 /* 0x02bc	     */		std	%f10,[%l6+%i3]
   1566 /* 0x02c0	     */		fmuld	%f24,%f18,%f10
   1567 /* 0x02c4	     */		ble,pt	%icc,.L900000639
   1568 /* 0x02c8	     */		faddd	%f4,%f22,%f4
   1569                       .L900000642:
   1570 /* 0x02cc	 252 */		fmuld	%f8,%f20,%f24
   1571 /* 0x02d0	     */		faddd	%f0,%f4,%f8
   1572 /* 0x02d4	 250 */		add	%o2,16,%o3
   1573 /* 0x02d8	 252 */		ldd	[%o3+%i3],%f4
   1574 /* 0x02dc	     */		fmuld	%f14,%f18,%f0
   1575 /* 0x02e0	     */		cmp	%l5,%i1
   1576 /* 0x02e4	     */		std	%f8,[%o1+%i3]
   1577 /* 0x02e8	     */		fmuld	%f12,%f18,%f8
   1578 /* 0x02ec	 250 */		add	%o2,32,%o1
   1579 /* 0x02f0	 252 */		faddd	%f10,%f24,%f12
   1580 /* 0x02f4	     */		ldd	[%i5+%o0],%f22
   1581 /* 0x02f8	     */		fmuld	%f6,%f20,%f6
   1582 /* 0x02fc	     */		add	%g2,8,%g2
   1583 /* 0x0300	     */		fmuld	%f22,%f20,%f10
   1584 /* 0x0304	     */		faddd	%f2,%f12,%f2
   1585 /* 0x0308	     */		faddd	%f0,%f6,%f6
   1586 /* 0x030c	     */		ldd	[%o1+%i3],%f0
   1587 /* 0x0310	     */		std	%f2,[%o2+%i3]
   1588 /* 0x0314	     */		faddd	%f8,%f10,%f2
   1589 /* 0x0318	     */		sra	%l5,0,%o2
   1590 /* 0x031c	     */		sllx	%o2,3,%o0
   1591 /* 0x0320	     */		faddd	%f4,%f6,%f4
   1592 /* 0x0324	     */		std	%f4,[%o3+%i3]
   1593 /* 0x0328	     */		faddd	%f0,%f2,%f0
   1594 /* 0x032c	     */		std	%f0,[%o1+%i3]
   1595 /* 0x0330	     */		bg,a,pn	%icc,.L77000213
   1596 /* 0x0334	     */		srl	%i2,31,%o3
   1597                       .L77000284:
   1598 /* 0x0338	 252 */		ldd	[%i4+%o0],%f2
   1599                       .L900000655:
   1600 /* 0x033c	 252 */		ldd	[%i5+%o0],%f0
   1601 /* 0x0340	     */		fmuld	%f2,%f18,%f2
   1602 /* 0x0344	     */		sra	%g2,0,%o0
   1603 /* 0x0348	     */		sllx	%o0,3,%o1
   1604 /* 0x034c	     */		add	%l5,1,%l5
   1605 /* 0x0350	     */		fmuld	%f0,%f20,%f4
   1606 /* 0x0354	     */		ldd	[%o1+%i3],%f0
   1607 /* 0x0358	     */		sra	%l5,0,%o2
   1608 /* 0x035c	     */		sllx	%o2,3,%o0
   1609 /* 0x0360	     */		add	%g2,2,%g2
   1610 /* 0x0364	     */		cmp	%l5,%i1
   1611 /* 0x0368	     */		faddd	%f2,%f4,%f2
   1612 /* 0x036c	     */		faddd	%f0,%f2,%f0
   1613 /* 0x0370	     */		std	%f0,[%o1+%i3]
   1614 /* 0x0374	     */		ble,a,pt	%icc,.L900000655
   1615 /* 0x0378	     */		ldd	[%i4+%o0],%f2
   1616                       .L900000626:
   1617 /* 0x037c	     */		srl	%i2,31,%o3
   1618 /* 0x0380	 252 */		ba	.L900000654
   1619 /* 0x0384	     */		cmp	%g3,30
   1620                       .L77000213:
   1621 /* 0x0388	 254 */		cmp	%g3,30
   1622                       .L900000654:
   1623 /* 0x038c	     */		add	%i2,%o3,%o0
   1624 /* 0x0390	 254 */		bne,a,pt	%icc,.L900000653
   1625 /* 0x0394	     */		fdtox	%f16,%f0
   1626 /* 0x0398	 281 */		sra	%o0,1,%g2
   1627 /* 0x039c	     */		add	%g2,1,%g2
   1628 /* 0x03a0	     */		ldd	[%o7],%f0
   1629 /* 0x03a4	     */		sll	%g2,1,%o1
   1630 /* 0x03a8	     */		sll	%g1,1,%g2
   1631 /* 0x03ac	     */		or	%g0,%o1,%o2
   1632 /* 0x03b0	     */		fmovd	%f0,%f2
   1633 /* 0x03b4	     */		or	%g0,%g2,%o0
   1634 /* 0x03b8	     */		cmp	%o1,%o0
   1635 /* 0x03bc	     */		sub	%g2,1,%o0
   1636 /* 0x03c0	     */		bge,pt	%icc,.L77000215
   1637 /* 0x03c4	     */		or	%g0,0,%g3
   1638 /* 0x03c8	 254 */		add	%o1,1,%o1
   1639 /* 0x03cc	 281 */		sra	%o2,0,%g2
   1640                       .L900000652:
   1641 /* 0x03d0	     */		sllx	%g2,3,%g2
   1642 /* 0x03d4	     */		ldd	[%o7],%f6
   1643 /* 0x03d8	     */		add	%o2,2,%o2
   1644 /* 0x03dc	     */		sra	%o1,0,%g3
   1645 /* 0x03e0	     */		ldd	[%g2+%l4],%f8
   1646 /* 0x03e4	     */		cmp	%o2,%o0
   1647 /* 0x03e8	     */		sllx	%g3,3,%g3
   1648 /* 0x03ec	     */		add	%o1,2,%o1
   1649 /* 0x03f0	     */		ldd	[%l4+%g3],%f10
   1650 /* 0x03f4	     */		fdtox	%f8,%f12
   1651 /* 0x03f8	     */		fdtox	%f10,%f4
   1652 /* 0x03fc	     */		fmovd	%f12,%f8
   1653 /* 0x0400	     */		fmovs	%f6,%f12
   1654 /* 0x0404	     */		fmovs	%f6,%f4
   1655 /* 0x0408	     */		fxtod	%f12,%f6
   1656 /* 0x040c	     */		fxtod	%f4,%f12
   1657 /* 0x0410	     */		fdtox	%f10,%f4
   1658 /* 0x0414	     */		faddd	%f6,%f2,%f6
   1659 /* 0x0418	     */		std	%f6,[%g2+%l4]
   1660 /* 0x041c	     */		faddd	%f12,%f0,%f6
   1661 /* 0x0420	     */		std	%f6,[%l4+%g3]
   1662 /* 0x0424	     */		fitod	%f8,%f2
   1663 /* 0x0428	     */		fitod	%f4,%f0
   1664 /* 0x042c	     */		ble,pt	%icc,.L900000652
   1665 /* 0x0430	     */		sra	%o2,0,%g2
   1666                       .L77000233:
   1667 /* 0x0434	     */		or	%g0,0,%g3
   1668                       .L77000215:
   1669 /* 0x0438	     */		fdtox	%f16,%f0
   1670                       .L900000653:
   1671 /* 0x043c	 256 */		ldd	[%o7],%f6
   1672 /* 0x0440	     */		add	%g4,1,%g4
   1673 /* 0x0444	     */		or	%g0,%i0,%i2
   1674 /* 0x0448	     */		ldd	[%o5],%f8
   1675 /* 0x044c	     */		add	%g3,1,%g3
   1676 /* 0x0450	     */		add	%i3,8,%i3
   1677 /* 0x0454	     */		fmovs	%f6,%f0
   1678 /* 0x0458	     */		ldd	[%o4],%f10
   1679 /* 0x045c	     */		ld	[%sp+2223],%o0
   1680 /* 0x0460	     */		fxtod	%f0,%f6
   1681 /* 0x0464	     */		cmp	%i0,%o0
   1682 /* 0x0468	     */		fmuld	%f6,%f30,%f6
   1683 /* 0x046c	     */		fmuld	%f6,%f8,%f8
   1684 /* 0x0470	     */		fdtox	%f8,%f8
   1685 /* 0x0474	     */		fxtod	%f8,%f8
   1686 /* 0x0478	     */		fmuld	%f8,%f10,%f8
   1687 /* 0x047c	     */		fsubd	%f6,%f8,%f20
   1688 /* 0x0480	     */		ble,a,pt	%icc,.L900000651
   1689 /* 0x0484	     */		ldd	[%i5],%f6
   1690                       .L900000625:
   1691 /* 0x0488	 256 */		ba	.L900000650
   1692 /* 0x048c	     */		sllx	%g5,3,%g2
   1693                       .L77000279:
   1694 /* 0x0490	 261 */		ldd	[%i1],%f4
   1695 /* 0x0494	     */		ldd	[%i2],%f6
   1696 /* 0x0498	 273 */		std	%f0,[%i3+8]
   1697 /* 0x049c	     */		std	%f0,[%i3+16]
   1698 /* 0x04a0	 261 */		fmuld	%f4,%f6,%f6
   1699 /* 0x04a4	     */		std	%f6,[%i3]
   1700 /* 0x04a8	 273 */		std	%f0,[%i3+24]
   1701 /* 0x04ac	     */		std	%f0,[%i3+32]
   1702 /* 0x04b0	     */		fdtox	%f6,%f2
   1703 /* 0x04b4	     */		std	%f0,[%i3+40]
   1704 /* 0x04b8	     */		std	%f0,[%i3+48]
   1705 /* 0x04bc	     */		std	%f0,[%i3+56]
   1706 /* 0x04c0	     */		std	%f0,[%i3+64]
   1707 /* 0x04c4	     */		fmovs	%f0,%f2
   1708 /* 0x04c8	     */		std	%f0,[%i3+72]
   1709 /* 0x04cc	     */		std	%f0,[%i3+80]
   1710 /* 0x04d0	     */		std	%f0,[%i3+88]
   1711 /* 0x04d4	     */		std	%f0,[%i3+96]
   1712 /* 0x04d8	     */		std	%f0,[%i3+104]
   1713 /* 0x04dc	     */		std	%f0,[%i3+112]
   1714 /* 0x04e0	     */		std	%f0,[%i3+120]
   1715 /* 0x04e4	     */		std	%f0,[%i3+128]
   1716 /* 0x04e8	     */		std	%f0,[%i3+136]
   1717 /* 0x04ec	     */		std	%f0,[%i3+144]
   1718 /* 0x04f0	     */		std	%f0,[%i3+152]
   1719 /* 0x04f4	     */		std	%f0,[%i3+160]
   1720 /* 0x04f8	     */		std	%f0,[%i3+168]
   1721 /* 0x04fc	     */		fxtod	%f2,%f6
   1722 /* 0x0500	     */		std	%f0,[%i3+176]
   1723 /* 0x0504	 281 */		or	%g0,1,%o2
   1724 /* 0x0508	 273 */		std	%f0,[%i3+184]
   1725 
   1726 !  282		      !       {
   1727 !  284		      !	 m2j=pdm2[j];
   1728 !  285		      !	 a=pdtj[0]+pdn_0*digit;
   1729 !  286		      !	 b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16;
   1730 
   1731 /* 0x050c	 286 */		sra	%o2,0,%g2
   1732 /* 0x0510	 279 */		or	%g0,%i3,%o3
   1733 /* 0x0514	 273 */		std	%f0,[%i3+192]
   1734 /* 0x0518	 278 */		fmuld	%f6,%f14,%f6
   1735 /* 0x051c	 281 */		or	%g0,0,%g1
   1736 /* 0x0520	 273 */		std	%f0,[%i3+200]
   1737 /* 0x0524	     */		std	%f0,[%i3+208]
   1738 /* 0x0528	     */		std	%f0,[%i3+216]
   1739 /* 0x052c	     */		std	%f0,[%i3+224]
   1740 /* 0x0530	     */		std	%f0,[%i3+232]
   1741 /* 0x0534	     */		std	%f0,[%i3+240]
   1742 /* 0x0538	     */		std	%f0,[%i3+248]
   1743 /* 0x053c	     */		std	%f0,[%i3+256]
   1744 /* 0x0540	     */		std	%f0,[%i3+264]
   1745 /* 0x0544	     */		std	%f0,[%i3+272]
   1746 /* 0x0548	     */		std	%f0,[%i3+280]
   1747 /* 0x054c	     */		std	%f0,[%i3+288]
   1748 /* 0x0550	     */		std	%f0,[%i3+296]
   1749 /* 0x0554	     */		std	%f0,[%i3+304]
   1750 /* 0x0558	     */		std	%f0,[%i3+312]
   1751 /* 0x055c	     */		std	%f0,[%i3+320]
   1752 /* 0x0560	     */		std	%f0,[%i3+328]
   1753 /* 0x0564	     */		std	%f0,[%i3+336]
   1754 /* 0x0568	     */		std	%f0,[%i3+344]
   1755 /* 0x056c	     */		std	%f0,[%i3+352]
   1756 /* 0x0570	     */		std	%f0,[%i3+360]
   1757 /* 0x0574	     */		std	%f0,[%i3+368]
   1758 /* 0x0578	     */		std	%f0,[%i3+376]
   1759 /* 0x057c	     */		std	%f0,[%i3+384]
   1760 /* 0x0580	     */		std	%f0,[%i3+392]
   1761 /* 0x0584	     */		std	%f0,[%i3+400]
   1762 /* 0x0588	     */		std	%f0,[%i3+408]
   1763 /* 0x058c	     */		std	%f0,[%i3+416]
   1764 /* 0x0590	     */		std	%f0,[%i3+424]
   1765 /* 0x0594	     */		std	%f0,[%i3+432]
   1766 /* 0x0598	     */		std	%f0,[%i3+440]
   1767 /* 0x059c	     */		std	%f0,[%i3+448]
   1768 /* 0x05a0	     */		std	%f0,[%i3+456]
   1769 /* 0x05a4	     */		std	%f0,[%i3+464]
   1770 /* 0x05a8	     */		std	%f0,[%i3+472]
   1771 /* 0x05ac	     */		std	%f0,[%i3+480]
   1772 /* 0x05b0	     */		std	%f0,[%i3+488]
   1773 /* 0x05b4	     */		std	%f0,[%i3+496]
   1774 /* 0x05b8	 278 */		ldd	[%o5],%f8
   1775 /* 0x05bc	     */		ldd	[%o4],%f10
   1776 /* 0x05c0	     */		fmuld	%f6,%f8,%f8
   1777 /* 0x05c4	 273 */		std	%f0,[%i3+504]
   1778 /* 0x05c8	     */		std	%f0,[%i3+512]
   1779 /* 0x05cc	     */		std	%f0,[%i3+520]
   1780 /* 0x05d0	     */		fdtox	%f8,%f8
   1781 /* 0x05d4	 275 */		ldd	[%o0],%f0
   1782 /* 0x05d8	     */		fxtod	%f8,%f8
   1783 /* 0x05dc	     */		fmuld	%f8,%f10,%f8
   1784 /* 0x05e0	     */		fsubd	%f6,%f8,%f2
   1785 
   1786 !  287		      !	 pdtj[1]=b;
   1787 !  289		      !	 /**** this loop will be fully unrolled:
   1788 !  290		      !	 for(i=1;i<16;i++)
   1789 !  291		      !	   {
   1790 !  292		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
   1791 !  293		      !	   }
   1792 !  294		      !	 *************************************/
   1793 !  295		      !	     pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit;
   1794 !  296		      !	     pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit;
   1795 !  297		      !	     pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit;
   1796 !  298		      !	     pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit;
   1797 !  299		      !	     pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit;
   1798 !  300		      !	     pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit;
   1799 !  301		      !	     pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit;
   1800 !  302		      !	     pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit;
   1801 !  303		      !	     pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit;
   1802 !  304		      !	     pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit;
   1803 !  305		      !	     pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit;
   1804 !  306		      !	     pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit;
   1805 !  307		      !	     pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit;
   1806 !  308		      !	     pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit;
   1807 !  309		      !	     pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit;
   1808 !  310		      !	 /* no need for cleenup, cannot overflow */
   1809 !  311		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
   1810 
   1811 
   1812 fmovd %f2,%f0		! hand modified
   1813 fmovd %f30,%f18		! hand modified
   1814 ldd [%o0],%f2
   1815 ldd [%o3],%f8
   1816 ldd [%i1],%f10
   1817 ldd [%o5],%f14		! hand modified
   1818 ldd [%o4],%f16		! hand modified
   1819 ldd [%i2],%f24
   1820 
   1821 ldd [%i1+8],%f26
   1822 ldd [%i1+16],%f40
   1823 ldd [%i1+48],%f46
   1824 ldd [%i1+56],%f30
   1825 ldd [%i1+64],%f54
   1826 ldd [%i1+104],%f34
   1827 ldd [%i1+112],%f58
   1828 
   1829 ldd [%o0+8],%f28	
   1830 ldd [%o0+104],%f38
   1831 ldd [%o0+112],%f60
   1832 
   1833 .L99999999: 			!1
   1834 ldd	[%i1+24],%f32
   1835 fmuld	%f0,%f2,%f4 	!2
   1836 ldd	[%o0+24],%f36
   1837 fmuld	%f26,%f24,%f20 	!3
   1838 ldd	[%i1+40],%f42
   1839 fmuld	%f28,%f0,%f22 	!4
   1840 ldd	[%o0+40],%f44
   1841 fmuld	%f32,%f24,%f32 	!5
   1842 ldd	[%i2+8],%f6
   1843 faddd	%f4,%f8,%f4
   1844 fmuld	%f36,%f0,%f36 	!6
   1845 add	%i2,8,%i2
   1846 ldd	[%o0+56],%f50
   1847 fmuld	%f42,%f24,%f42 	!7
   1848 ldd	[%i1+72],%f52
   1849 faddd	%f20,%f22,%f20
   1850 fmuld	%f44,%f0,%f44 	!8
   1851 ldd	[%o3+16],%f22
   1852 fmuld	%f10,%f6,%f12 	!9
   1853 ldd	[%o0+72],%f56
   1854 faddd	%f32,%f36,%f32
   1855 fmuld	%f14,%f4,%f4 !10
   1856 ldd	[%o3+48],%f36
   1857 fmuld	%f30,%f24,%f48 	!11
   1858 ldd	[%o3+8],%f8
   1859 faddd	%f20,%f22,%f20
   1860 fmuld	%f50,%f0,%f50	!12
   1861 std	%f20,[%o3+16]
   1862 faddd	%f42,%f44,%f42
   1863 fmuld	%f52,%f24,%f52 	!13
   1864 ldd	[%o3+80],%f44
   1865 faddd	%f4,%f12,%f4
   1866 fmuld	%f56,%f0,%f56 	!14
   1867 ldd	[%i1+88],%f20
   1868 faddd	%f32,%f36,%f32 	!15
   1869 ldd	[%o0+88],%f22
   1870 faddd	%f48,%f50,%f48 	!16
   1871 ldd	[%o3+112],%f50
   1872 faddd	%f52,%f56,%f52 	!17
   1873 ldd	[%o3+144],%f56
   1874 faddd	%f4,%f8,%f8
   1875 fmuld	%f20,%f24,%f20 	!18
   1876 std	%f32,[%o3+48]
   1877 faddd	%f42,%f44,%f42
   1878 fmuld	%f22,%f0,%f22 	!19
   1879 std	%f42,[%o3+80]
   1880 faddd	%f48,%f50,%f48
   1881 fmuld	%f34,%f24,%f32 	!20
   1882 std	%f48,[%o3+112]
   1883 faddd	%f52,%f56,%f52
   1884 fmuld	%f38,%f0,%f36 	!21
   1885 ldd	[%i1+120],%f42
   1886 fdtox	%f8,%f4 		!22
   1887 std	%f52,[%o3+144]
   1888 faddd	%f20,%f22,%f20 	!23
   1889 ldd	[%o0+120],%f44 	!24
   1890 ldd	[%o3+176],%f22
   1891 faddd	%f32,%f36,%f32
   1892 fmuld	%f42,%f24,%f42 	!25
   1893 ldd	[%o0+16],%f50
   1894 fmovs	%f17,%f4 	!26
   1895 ldd	[%i1+32],%f52
   1896 fmuld	%f44,%f0,%f44 	!27
   1897 ldd	[%o0+32],%f56
   1898 fmuld	%f40,%f24,%f48 	!28
   1899 ldd	[%o3+208],%f36
   1900 faddd	%f20,%f22,%f20
   1901 fmuld	%f50,%f0,%f50 	!29
   1902 std	%f20,[%o3+176]
   1903 fxtod	%f4,%f4
   1904 fmuld	%f52,%f24,%f52 	!30
   1905 ldd	[%o0+48],%f22
   1906 faddd	%f42,%f44,%f42
   1907 fmuld	%f56,%f0,%f56 	!31
   1908 ldd	[%o3+240],%f44
   1909 faddd	%f32,%f36,%f32 	!32
   1910 std	%f32,[%o3+208]
   1911 faddd	%f48,%f50,%f48
   1912 fmuld	%f46,%f24,%f20 	!33
   1913 ldd	[%o3+32],%f50
   1914 fmuld	%f4,%f18,%f12 	!34
   1915 ldd	[%o0+64],%f36
   1916 faddd	%f52,%f56,%f52
   1917 fmuld	%f22,%f0,%f22 	!35
   1918 ldd	[%o3+64],%f56
   1919 faddd	%f42,%f44,%f42 	!36
   1920 std	%f42,[%o3+240]
   1921 faddd	%f48,%f50,%f48
   1922 fmuld	%f54,%f24,%f32 	!37
   1923 std	%f48,[%o3+32]
   1924 fmuld	%f12,%f14,%f4 !38
   1925 ldd	[%i1+80],%f42
   1926 faddd	%f52,%f56,%f56	! yes, tmp52!
   1927 fmuld	%f36,%f0,%f36 	!39
   1928 ldd	[%o0+80],%f44
   1929 faddd	%f20,%f22,%f20 	!40
   1930 ldd	[%i1+96],%f48
   1931 fmuld	%f58,%f24,%f52 	!41
   1932 ldd	[%o0+96],%f50
   1933 fdtox	%f4,%f4
   1934 fmuld	%f42,%f24,%f42 	!42
   1935 std	%f56,[%o3+64]	! yes, tmp52!
   1936 faddd	%f32,%f36,%f32
   1937 fmuld	%f44,%f0,%f44 	!43
   1938 ldd	[%o3+96],%f22
   1939 fmuld	%f48,%f24,%f48 	!44
   1940 ldd	[%o3+128],%f36
   1941 fmovd	%f6,%f24
   1942 fmuld	%f50,%f0,%f50 	!45
   1943 fxtod	%f4,%f4
   1944 fmuld	%f60,%f0,%f56 	!46
   1945 add	%o3,8,%o3
   1946 faddd	%f42,%f44,%f42 	!47
   1947 ldd	[%o3+160-8],%f44
   1948 faddd	%f20,%f22,%f20 	!48
   1949 std	%f20,[%o3+96-8]
   1950 faddd	%f48,%f50,%f48 	!49
   1951 ldd	[%o3+192-8],%f50
   1952 faddd	%f52,%f56,%f52
   1953 fmuld	%f4,%f16,%f4 	!50
   1954 ldd	[%o3+224-8],%f56
   1955 faddd	%f32,%f36,%f32 	!51
   1956 std	%f32,[%o3+128-8]
   1957 faddd	%f42,%f44,%f42 	!52
   1958 add	%g1,1,%g1
   1959 std	%f42,[%o3+160-8]
   1960 faddd	%f48,%f50,%f48 	!53
   1961 cmp	%g1,31
   1962 std	%f48,[%o3+192-8]
   1963 fsubd	%f12,%f4,%f0 	!54
   1964 faddd	%f52,%f56,%f52
   1965 ble,pt	%icc,.L99999999
   1966 std	%f52,[%o3+224-8] 	!55
   1967 std %f8,[%o3]
   1968 !  312		      !       }
   1969 !  313		      !   }
   1970 !  315		      ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1);
   1971 
   1972 /* 0x0844	 315 */		sllx	%g5,3,%g2
   1973                       .L900000650:
   1974 /* 0x0848	 315 */		ldd	[%g2+%l4],%f2
   1975 /* 0x084c	     */		add	%l4,%g2,%o0
   1976 /* 0x0850	     */		or	%g0,0,%g1
   1977 /* 0x0854	     */		ldd	[%o0+8],%f4
   1978 /* 0x0858	     */		or	%g0,0,%i2
   1979 /* 0x085c	     */		cmp	%l0,0
   1980 /* 0x0860	     */		fdtox	%f2,%f2
   1981 /* 0x0864	     */		std	%f2,[%sp+2255]
   1982 /* 0x0868	 311 */		sethi	%hi(0xfc00),%o3
   1983 /* 0x086c	 315 */		fdtox	%f4,%f2
   1984 /* 0x0870	     */		std	%f2,[%sp+2247]
   1985 /* 0x0874	 311 */		or	%g0,-1,%o2
   1986 /* 0x0878	     */		srl	%o2,0,%o5
   1987 /* 0x087c	     */		or	%g0,2,%g5
   1988 /* 0x0880	     */		sub	%l0,1,%g3
   1989 /* 0x0884	     */		or	%g0,%o0,%o7
   1990 /* 0x0888	     */		add	%o3,1023,%o4
   1991 /* 0x088c	 315 */		or	%g0,64,%o3
   1992 /* 0x0890	     */		ldx	[%sp+2255],%i0
   1993 /* 0x0894	     */		sub	%l0,2,%o1
   1994 /* 0x0898	     */		ldx	[%sp+2247],%i1
   1995 /* 0x089c	     */		ble,pt	%icc,.L900000648
   1996 /* 0x08a0	     */		sethi	%hi(0xfc00),%g2
   1997 /* 0x08a4	     */		cmp	%l0,6
   1998 /* 0x08a8	     */		and	%i0,%o5,%o2
   1999 /* 0x08ac	     */		bl,pn	%icc,.L77000287
   2000 /* 0x08b0	     */		or	%g0,3,%g4
   2001 /* 0x08b4	     */		ldd	[%o7+16],%f0
   2002 /* 0x08b8	     */		and	%i1,%o4,%i3
   2003 /* 0x08bc	     */		sllx	%i3,16,%o0
   2004 /* 0x08c0	     */		or	%g0,5,%g4
   2005 /* 0x08c4	     */		srax	%i1,16,%i4
   2006 /* 0x08c8	     */		fdtox	%f0,%f0
   2007 /* 0x08cc	     */		std	%f0,[%sp+2239]
   2008 /* 0x08d0	     */		srax	%i0,32,%i1
   2009 /* 0x08d4	     */		add	%o2,%o0,%i5
   2010 /* 0x08d8	     */		ldd	[%o7+24],%f0
   2011 /* 0x08dc	     */		and	%i5,%o5,%l1
   2012 /* 0x08e0	     */		or	%g0,72,%o2
   2013 /* 0x08e4	     */		or	%g0,4,%o0
   2014 /* 0x08e8	     */		or	%g0,4,%g5
   2015 /* 0x08ec	     */		ldx	[%sp+2239],%g1
   2016 /* 0x08f0	     */		fdtox	%f0,%f0
   2017 /* 0x08f4	     */		or	%g0,4,%i2
   2018 /* 0x08f8	     */		std	%f0,[%sp+2231]
   2019 /* 0x08fc	     */		ldd	[%o7+40],%f2
   2020 /* 0x0900	     */		and	%g1,%o5,%i3
   2021 /* 0x0904	     */		ldd	[%o7+32],%f0
   2022 /* 0x0908	     */		srax	%g1,32,%g1
   2023 /* 0x090c	     */		ldd	[%o7+56],%f4
   2024 /* 0x0910	     */		fdtox	%f2,%f2
   2025 /* 0x0914	     */		ldx	[%sp+2231],%g2
   2026 /* 0x0918	     */		fdtox	%f0,%f0
   2027 /* 0x091c	     */		st	%l1,[%l2]
   2028 /* 0x0920	     */		srax	%i5,32,%l1
   2029 /* 0x0924	     */		fdtox	%f4,%f4
   2030 /* 0x0928	     */		std	%f2,[%sp+2231]
   2031 /* 0x092c	     */		and	%g2,%o4,%i5
   2032 /* 0x0930	     */		add	%i4,%l1,%i4
   2033 /* 0x0934	     */		std	%f0,[%sp+2239]
   2034 /* 0x0938	     */		sllx	%i5,16,%i0
   2035 /* 0x093c	     */		add	%i1,%i4,%i1
   2036 /* 0x0940	     */		ldd	[%o7+48],%f2
   2037 /* 0x0944	     */		srax	%g2,16,%g2
   2038 /* 0x0948	     */		add	%i3,%i0,%i0
   2039 /* 0x094c	     */		ldd	[%o7+72],%f0
   2040 /* 0x0950	     */		add	%i0,%i1,%i3
   2041 /* 0x0954	     */		srax	%i3,32,%i4
   2042 /* 0x0958	     */		fdtox	%f2,%f2
   2043 /* 0x095c	     */		and	%i3,%o5,%i3
   2044 /* 0x0960	     */		ldx	[%sp+2231],%i1
   2045 /* 0x0964	     */		add	%g2,%i4,%g2
   2046 /* 0x0968	     */		ldx	[%sp+2239],%i0
   2047 /* 0x096c	     */		add	%g1,%g2,%g1
   2048 /* 0x0970	     */		std	%f2,[%sp+2239]
   2049 /* 0x0974	     */		std	%f4,[%sp+2231]
   2050 /* 0x0978	     */		ldd	[%o7+64],%f2
   2051 /* 0x097c	     */		st	%i3,[%l2+4]
   2052                       .L900000631:
   2053 /* 0x0980	     */		ldx	[%sp+2231],%i3
   2054 /* 0x0984	     */		add	%i2,2,%i2
   2055 /* 0x0988	     */		add	%g4,4,%g4
   2056 /* 0x098c	     */		ldx	[%sp+2239],%i5
   2057 /* 0x0990	     */		add	%o2,16,%o2
   2058 /* 0x0994	     */		and	%i1,%o4,%g2
   2059 /* 0x0998	     */		sllx	%g2,16,%i4
   2060 /* 0x099c	     */		and	%i0,%o5,%g2
   2061 /* 0x09a0	     */		ldd	[%o7+%o2],%f4
   2062 /* 0x09a4	     */		fdtox	%f0,%f0
   2063 /* 0x09a8	     */		std	%f0,[%sp+2231]
   2064 /* 0x09ac	     */		srax	%i1,16,%i1
   2065 /* 0x09b0	     */		add	%g2,%i4,%g2
   2066 /* 0x09b4	     */		fdtox	%f2,%f0
   2067 /* 0x09b8	     */		add	%o3,16,%o3
   2068 /* 0x09bc	     */		std	%f0,[%sp+2239]
   2069 /* 0x09c0	     */		add	%g2,%g1,%g1
   2070 /* 0x09c4	     */		ldd	[%o7+%o3],%f2
   2071 /* 0x09c8	     */		srax	%g1,32,%i4
   2072 /* 0x09cc	     */		cmp	%i2,%o1
   2073 /* 0x09d0	     */		srax	%i0,32,%g2
   2074 /* 0x09d4	     */		add	%i1,%i4,%i0
   2075 /* 0x09d8	     */		add	%g2,%i0,%i4
   2076 /* 0x09dc	     */		add	%o0,4,%o0
   2077 /* 0x09e0	     */		and	%g1,%o5,%g2
   2078 /* 0x09e4	     */		or	%g0,%i5,%g1
   2079 /* 0x09e8	     */		st	%g2,[%l2+%o0]
   2080 /* 0x09ec	     */		add	%g5,4,%g5
   2081 /* 0x09f0	     */		ldx	[%sp+2231],%i1
   2082 /* 0x09f4	     */		ldx	[%sp+2239],%i0
   2083 /* 0x09f8	     */		add	%o2,16,%o2
   2084 /* 0x09fc	     */		and	%i3,%o4,%g2
   2085 /* 0x0a00	     */		sllx	%g2,16,%i5
   2086 /* 0x0a04	     */		and	%g1,%o5,%g2
   2087 /* 0x0a08	     */		ldd	[%o7+%o2],%f0
   2088 /* 0x0a0c	     */		fdtox	%f4,%f4
   2089 /* 0x0a10	     */		std	%f4,[%sp+2231]
   2090 /* 0x0a14	     */		srax	%i3,16,%i3
   2091 /* 0x0a18	     */		add	%g2,%i5,%g2
   2092 /* 0x0a1c	     */		fdtox	%f2,%f2
   2093 /* 0x0a20	     */		add	%o3,16,%o3
   2094 /* 0x0a24	     */		std	%f2,[%sp+2239]
   2095 /* 0x0a28	     */		add	%g2,%i4,%g2
   2096 /* 0x0a2c	     */		ldd	[%o7+%o3],%f2
   2097 /* 0x0a30	     */		srax	%g2,32,%i4
   2098 /* 0x0a34	     */		srax	%g1,32,%g1
   2099 /* 0x0a38	     */		add	%i3,%i4,%i3
   2100 /* 0x0a3c	     */		add	%g1,%i3,%g1
   2101 /* 0x0a40	     */		add	%o0,4,%o0
   2102 /* 0x0a44	     */		and	%g2,%o5,%g2
   2103 /* 0x0a48	     */		ble,pt	%icc,.L900000631
   2104 /* 0x0a4c	     */		st	%g2,[%l2+%o0]
   2105                       .L900000634:
   2106 /* 0x0a50	     */		srax	%i1,16,%i5
   2107 /* 0x0a54	     */		ldx	[%sp+2231],%o1
   2108 /* 0x0a58	     */		and	%i1,%o4,%i3
   2109 /* 0x0a5c	     */		sllx	%i3,16,%i3
   2110 /* 0x0a60	     */		ldx	[%sp+2239],%i4
   2111 /* 0x0a64	     */		and	%i0,%o5,%g2
   2112 /* 0x0a68	     */		add	%g2,%i3,%g2
   2113 /* 0x0a6c	     */		and	%o1,%o4,%i3
   2114 /* 0x0a70	     */		fdtox	%f0,%f4
   2115 /* 0x0a74	     */		sllx	%i3,16,%i3
   2116 /* 0x0a78	     */		std	%f4,[%sp+2231]
   2117 /* 0x0a7c	     */		add	%g2,%g1,%g2
   2118 /* 0x0a80	     */		srax	%g2,32,%l1
   2119 /* 0x0a84	     */		and	%i4,%o5,%i1
   2120 /* 0x0a88	     */		fdtox	%f2,%f0
   2121 /* 0x0a8c	     */		srax	%i0,32,%g1
   2122 /* 0x0a90	     */		std	%f0,[%sp+2239]
   2123 /* 0x0a94	     */		add	%i5,%l1,%i0
   2124 /* 0x0a98	     */		srax	%o1,16,%o1
   2125 /* 0x0a9c	     */		add	%g1,%i0,%i0
   2126 /* 0x0aa0	     */		add	%o0,4,%g1
   2127 /* 0x0aa4	     */		add	%i1,%i3,%o0
   2128 /* 0x0aa8	     */		and	%g2,%o5,%g2
   2129 /* 0x0aac	     */		st	%g2,[%l2+%g1]
   2130 /* 0x0ab0	     */		add	%o0,%i0,%o0
   2131 /* 0x0ab4	     */		srax	%o0,32,%i3
   2132 /* 0x0ab8	     */		ldx	[%sp+2231],%i1
   2133 /* 0x0abc	     */		add	%g1,4,%g1
   2134 /* 0x0ac0	     */		ldx	[%sp+2239],%i0
   2135 /* 0x0ac4	     */		and	%o0,%o5,%g2
   2136 /* 0x0ac8	     */		add	%o1,%i3,%o1
   2137 /* 0x0acc	     */		srax	%i4,32,%o0
   2138 /* 0x0ad0	     */		cmp	%i2,%g3
   2139 /* 0x0ad4	     */		st	%g2,[%l2+%g1]
   2140 /* 0x0ad8	     */		bg,pn	%icc,.L77000236
   2141 /* 0x0adc	     */		add	%o0,%o1,%g1
   2142 /* 0x0ae0	     */		add	%g4,6,%g4
   2143 /* 0x0ae4	     */		add	%g5,6,%g5
   2144                       .L77000287:
   2145 /* 0x0ae8	     */		sra	%g5,0,%o1
   2146                       .L900000647:
   2147 /* 0x0aec	     */		sllx	%o1,3,%o2
   2148 /* 0x0af0	     */		and	%i0,%o5,%o0
   2149 /* 0x0af4	     */		ldd	[%o7+%o2],%f0
   2150 /* 0x0af8	     */		sra	%g4,0,%o2
   2151 /* 0x0afc	     */		and	%i1,%o4,%o1
   2152 /* 0x0b00	     */		sllx	%o2,3,%o2
   2153 /* 0x0b04	     */		add	%g1,%o0,%o0
   2154 /* 0x0b08	     */		fdtox	%f0,%f0
   2155 /* 0x0b0c	     */		std	%f0,[%sp+2239]
   2156 /* 0x0b10	     */		sllx	%o1,16,%o1
   2157 /* 0x0b14	     */		add	%o0,%o1,%o1
   2158 /* 0x0b18	     */		add	%g5,2,%g5
   2159 /* 0x0b1c	     */		ldd	[%o7+%o2],%f0
   2160 /* 0x0b20	     */		srax	%o1,32,%g1
   2161 /* 0x0b24	     */		and	%o1,%o5,%o2
   2162 /* 0x0b28	     */		srax	%i1,16,%o0
   2163 /* 0x0b2c	     */		add	%g4,2,%g4
   2164 /* 0x0b30	     */		fdtox	%f0,%f0
   2165 /* 0x0b34	     */		std	%f0,[%sp+2231]
   2166 /* 0x0b38	     */		sra	%i2,0,%o1
   2167 /* 0x0b3c	     */		sllx	%o1,2,%o1
   2168 /* 0x0b40	     */		add	%o0,%g1,%g2
   2169 /* 0x0b44	     */		srax	%i0,32,%g1
   2170 /* 0x0b48	     */		add	%i2,1,%i2
   2171 /* 0x0b4c	     */		add	%g1,%g2,%g1
   2172 /* 0x0b50	     */		cmp	%i2,%g3
   2173 /* 0x0b54	     */		ldx	[%sp+2239],%o3
   2174 /* 0x0b58	     */		ldx	[%sp+2231],%i1
   2175 /* 0x0b5c	     */		st	%o2,[%l2+%o1]
   2176 /* 0x0b60	     */		or	%g0,%o3,%i0
   2177 /* 0x0b64	     */		ble,pt	%icc,.L900000647
   2178 /* 0x0b68	     */		sra	%g5,0,%o1
   2179                       .L77000236:
   2180 /* 0x0b6c	     */		sethi	%hi(0xfc00),%g2
   2181                       .L900000648:
   2182 /* 0x0b70	     */		or	%g0,-1,%o0
   2183 /* 0x0b74	     */		add	%g2,1023,%g2
   2184 /* 0x0b78	     */		srl	%o0,0,%g3
   2185 /* 0x0b7c	     */		and	%i1,%g2,%g2
   2186 /* 0x0b80	     */		and	%i0,%g3,%g4
   2187 /* 0x0b84	     */		sllx	%g2,16,%g2
   2188 /* 0x0b88	     */		add	%g1,%g4,%g4
   2189 /* 0x0b8c	     */		sra	%i2,0,%g5
   2190 /* 0x0b90	     */		add	%g4,%g2,%g4
   2191 /* 0x0b94	     */		sllx	%g5,2,%g2
   2192 /* 0x0b98	     */		and	%g4,%g3,%g3
   2193 /* 0x0b9c	     */		st	%g3,[%l2+%g2]
   2194 
   2195 !  317		      ! adjust_montf_result(result,nint,nlen); 
   2196 
   2197 /* 0x0ba0	 317 */		sra	%l0,0,%g4
   2198 /* 0x0ba4	     */		sllx	%g4,2,%g2
   2199 /* 0x0ba8	     */		ld	[%l2+%g2],%g2
   2200 /* 0x0bac	     */		cmp	%g2,0
   2201 /* 0x0bb0	     */		bleu,pn	%icc,.L77000241
   2202 /* 0x0bb4	     */		or	%g0,-1,%o1
   2203 /* 0x0bb8	     */		ba	.L900000646
   2204 /* 0x0bbc	     */		cmp	%o1,0
   2205                       .L77000241:
   2206 /* 0x0bc0	     */		sub	%l0,1,%o1
   2207 /* 0x0bc4	     */		cmp	%o1,0
   2208 /* 0x0bc8	     */		bl,pn	%icc,.L77000244
   2209 /* 0x0bcc	     */		sra	%o1,0,%g2
   2210                       .L900000645:
   2211 /* 0x0bd0	     */		sllx	%g2,2,%g2
   2212 /* 0x0bd4	     */		sub	%o1,1,%o0
   2213 /* 0x0bd8	     */		ld	[%l3+%g2],%g3
   2214 /* 0x0bdc	     */		ld	[%l2+%g2],%g2
   2215 /* 0x0be0	     */		cmp	%g2,%g3
   2216 /* 0x0be4	     */		bne,pn	%icc,.L77000244
   2217 /* 0x0be8	     */		nop
   2218 /* 0x0bec	   0 */		or	%g0,%o0,%o1
   2219 /* 0x0bf0	 317 */		cmp	%o0,0
   2220 /* 0x0bf4	     */		bge,pt	%icc,.L900000645
   2221 /* 0x0bf8	     */		sra	%o1,0,%g2
   2222                       .L77000244:
   2223 /* 0x0bfc	     */		cmp	%o1,0
   2224                       .L900000646:
   2225 /* 0x0c00	     */		bl,pn	%icc,.L77000288
   2226 /* 0x0c04	     */		sra	%o1,0,%g2
   2227 /* 0x0c08	     */		sllx	%g2,2,%g2
   2228 /* 0x0c0c	     */		ld	[%l3+%g2],%g3
   2229 /* 0x0c10	     */		ld	[%l2+%g2],%g2
   2230 /* 0x0c14	     */		cmp	%g2,%g3
   2231 /* 0x0c18	     */		bleu,pt	%icc,.L77000224
   2232 /* 0x0c1c	     */		nop
   2233                       .L77000288:
   2234 /* 0x0c20	     */		cmp	%l0,0
   2235 /* 0x0c24	     */		ble,pt	%icc,.L77000224
   2236 /* 0x0c28	     */		nop
   2237 /* 0x0c2c	 317 */		or	%g0,-1,%g2
   2238 /* 0x0c30	 315 */		or	%g0,0,%i0
   2239 /* 0x0c34	 317 */		srl	%g2,0,%g2
   2240 /* 0x0c38	 315 */		or	%g0,0,%g4
   2241 /* 0x0c3c	     */		or	%g0,0,%o1
   2242 /* 0x0c40	 317 */		sub	%l0,1,%g5
   2243 /* 0x0c44	     */		cmp	%l0,9
   2244 /* 0x0c48	 315 */		or	%g0,8,%o5
   2245 /* 0x0c4c	     */		bl,pn	%icc,.L77000289
   2246 /* 0x0c50	     */		sub	%l0,4,%o7
   2247 /* 0x0c54	     */		ld	[%l2],%o1
   2248 /* 0x0c58	     */		or	%g0,5,%i0
   2249 /* 0x0c5c	     */		ld	[%l3],%o2
   2250 /* 0x0c60	     */		or	%g0,12,%o4
   2251 /* 0x0c64	     */		or	%g0,16,%g1
   2252 /* 0x0c68	     */		ld	[%l3+4],%o3
   2253 /* 0x0c6c	     */		ld	[%l2+4],%o0
   2254 /* 0x0c70	     */		sub	%o1,%o2,%o1
   2255 /* 0x0c74	     */		ld	[%l3+8],%i1
   2256 /* 0x0c78	     */		and	%o1,%g2,%g4
   2257 /* 0x0c7c	     */		st	%g4,[%l2]
   2258 /* 0x0c80	     */		srax	%o1,32,%g4
   2259 /* 0x0c84	     */		sub	%o0,%o3,%o0
   2260 /* 0x0c88	     */		ld	[%l3+12],%o2
   2261 /* 0x0c8c	     */		add	%o0,%g4,%o0
   2262 /* 0x0c90	     */		and	%o0,%g2,%g4
   2263 /* 0x0c94	     */		st	%g4,[%l2+4]
   2264 /* 0x0c98	     */		srax	%o0,32,%o0
   2265 /* 0x0c9c	     */		ld	[%l2+8],%o1
   2266 /* 0x0ca0	     */		ld	[%l2+12],%o3
   2267 /* 0x0ca4	     */		sub	%o1,%i1,%o1
   2268                       .L900000635:
   2269 /* 0x0ca8	     */		add	%g1,4,%g3
   2270 /* 0x0cac	     */		ld	[%g1+%l2],%g4
   2271 /* 0x0cb0	     */		add	%o1,%o0,%o0
   2272 /* 0x0cb4	     */		ld	[%l3+%g1],%i1
   2273 /* 0x0cb8	     */		sub	%o3,%o2,%o1
   2274 /* 0x0cbc	     */		and	%o0,%g2,%o2
   2275 /* 0x0cc0	     */		st	%o2,[%o5+%l2]
   2276 /* 0x0cc4	     */		srax	%o0,32,%o2
   2277 /* 0x0cc8	     */		add	%i0,4,%i0
   2278 /* 0x0ccc	     */		add	%g1,8,%o5
   2279 /* 0x0cd0	     */		ld	[%g3+%l2],%o0
   2280 /* 0x0cd4	     */		add	%o1,%o2,%o1
   2281 /* 0x0cd8	     */		ld	[%l3+%g3],%o3
   2282 /* 0x0cdc	     */		sub	%g4,%i1,%o2
   2283 /* 0x0ce0	     */		and	%o1,%g2,%g4
   2284 /* 0x0ce4	     */		st	%g4,[%o4+%l2]
   2285 /* 0x0ce8	     */		srax	%o1,32,%g4
   2286 /* 0x0cec	     */		cmp	%i0,%o7
   2287 /* 0x0cf0	     */		add	%g1,12,%o4
   2288 /* 0x0cf4	     */		ld	[%o5+%l2],%o1
   2289 /* 0x0cf8	     */		add	%o2,%g4,%o2
   2290 /* 0x0cfc	     */		ld	[%l3+%o5],%i1
   2291 /* 0x0d00	     */		sub	%o0,%o3,%o0
   2292 /* 0x0d04	     */		and	%o2,%g2,%o3
   2293 /* 0x0d08	     */		st	%o3,[%g1+%l2]
   2294 /* 0x0d0c	     */		srax	%o2,32,%g4
   2295 /* 0x0d10	     */		ld	[%o4+%l2],%o3
   2296 /* 0x0d14	     */		add	%g1,16,%g1
   2297 /* 0x0d18	     */		add	%o0,%g4,%o0
   2298 /* 0x0d1c	     */		ld	[%l3+%o4],%o2
   2299 /* 0x0d20	     */		sub	%o1,%i1,%o1
   2300 /* 0x0d24	     */		and	%o0,%g2,%g4
   2301 /* 0x0d28	     */		st	%g4,[%g3+%l2]
   2302 /* 0x0d2c	     */		ble,pt	%icc,.L900000635
   2303 /* 0x0d30	     */		srax	%o0,32,%o0
   2304                       .L900000638:
   2305 /* 0x0d34	     */		add	%o1,%o0,%g3
   2306 /* 0x0d38	     */		sub	%o3,%o2,%o1
   2307 /* 0x0d3c	     */		ld	[%g1+%l2],%o0
   2308 /* 0x0d40	     */		ld	[%l3+%g1],%o2
   2309 /* 0x0d44	     */		srax	%g3,32,%o7
   2310 /* 0x0d48	     */		and	%g3,%g2,%o3
   2311 /* 0x0d4c	     */		add	%o1,%o7,%o1
   2312 /* 0x0d50	     */		st	%o3,[%o5+%l2]
   2313 /* 0x0d54	     */		cmp	%i0,%g5
   2314 /* 0x0d58	     */		sub	%o0,%o2,%o0
   2315 /* 0x0d5c	     */		and	%o1,%g2,%o2
   2316 /* 0x0d60	     */		st	%o2,[%o4+%l2]
   2317 /* 0x0d64	     */		srax	%o1,32,%o1
   2318 /* 0x0d68	     */		sra	%i0,0,%o2
   2319 /* 0x0d6c	     */		add	%o0,%o1,%o0
   2320 /* 0x0d70	     */		srax	%o0,32,%g4
   2321 /* 0x0d74	     */		and	%o0,%g2,%o1
   2322 /* 0x0d78	     */		st	%o1,[%g1+%l2]
   2323 /* 0x0d7c	     */		bg,pn	%icc,.L77000224
   2324 /* 0x0d80	     */		sllx	%o2,2,%o1
   2325                       .L77000289:
   2326 /* 0x0d84	   0 */		or	%g0,%o1,%g1
   2327                       .L900000644:
   2328 /* 0x0d88	     */		ld	[%o1+%l2],%o0
   2329 /* 0x0d8c	     */		add	%i0,1,%i0
   2330 /* 0x0d90	     */		ld	[%l3+%o1],%o1
   2331 /* 0x0d94	     */		sra	%i0,0,%o2
   2332 /* 0x0d98	     */		cmp	%i0,%g5
   2333 /* 0x0d9c	     */		add	%g4,%o0,%o0
   2334 /* 0x0da0	     */		sub	%o0,%o1,%o0
   2335 /* 0x0da4	     */		srax	%o0,32,%g4
   2336 /* 0x0da8	     */		and	%o0,%g2,%o1
   2337 /* 0x0dac	     */		st	%o1,[%g1+%l2]
   2338 /* 0x0db0	     */		sllx	%o2,2,%o1
   2339 /* 0x0db4	     */		ble,pt	%icc,.L900000644
   2340 /* 0x0db8	     */		or	%g0,%o1,%g1
   2341                       .L77000224:
   2342 /* 0x0dbc	     */		ret	! Result = 
   2343 /* 0x0dc0	     */		restore	%g0,%g0,%g0
   2344 /* 0x0dc4	   0 */		.type	mont_mulf_noconv,2
   2345 /* 0x0dc4	     */		.size	mont_mulf_noconv,(.-mont_mulf_noconv)