cxgb4 : Fix missing initialization of win0_lock
[sfrench/cifs-2.6.git] / crypto / sha256_generic.c
1 /*
2  * Cryptographic API.
3  *
4  * SHA-256, as specified in
5  * http://csrc.nist.gov/groups/STM/cavp/documents/shs/sha256-384-512.pdf
6  *
7  * SHA-256 code by Jean-Luc Cooke <jlcooke@certainkey.com>.
8  *
9  * Copyright (c) Jean-Luc Cooke <jlcooke@certainkey.com>
10  * Copyright (c) Andrew McDonald <andrew@mcdonald.org.uk>
11  * Copyright (c) 2002 James Morris <jmorris@intercode.com.au>
12  * SHA224 Support Copyright 2007 Intel Corporation <jonathan.lynch@intel.com>
13  *
14  * This program is free software; you can redistribute it and/or modify it
15  * under the terms of the GNU General Public License as published by the Free
16  * Software Foundation; either version 2 of the License, or (at your option) 
17  * any later version.
18  *
19  */
20 #include <crypto/internal/hash.h>
21 #include <linux/init.h>
22 #include <linux/module.h>
23 #include <linux/mm.h>
24 #include <linux/types.h>
25 #include <crypto/sha.h>
26 #include <asm/byteorder.h>
27 #include <asm/unaligned.h>
28
29 static inline u32 Ch(u32 x, u32 y, u32 z)
30 {
31         return z ^ (x & (y ^ z));
32 }
33
34 static inline u32 Maj(u32 x, u32 y, u32 z)
35 {
36         return (x & y) | (z & (x | y));
37 }
38
39 #define e0(x)       (ror32(x, 2) ^ ror32(x,13) ^ ror32(x,22))
40 #define e1(x)       (ror32(x, 6) ^ ror32(x,11) ^ ror32(x,25))
41 #define s0(x)       (ror32(x, 7) ^ ror32(x,18) ^ (x >> 3))
42 #define s1(x)       (ror32(x,17) ^ ror32(x,19) ^ (x >> 10))
43
44 static inline void LOAD_OP(int I, u32 *W, const u8 *input)
45 {
46         W[I] = get_unaligned_be32((__u32 *)input + I);
47 }
48
49 static inline void BLEND_OP(int I, u32 *W)
50 {
51         W[I] = s1(W[I-2]) + W[I-7] + s0(W[I-15]) + W[I-16];
52 }
53
54 static void sha256_transform(u32 *state, const u8 *input)
55 {
56         u32 a, b, c, d, e, f, g, h, t1, t2;
57         u32 W[64];
58         int i;
59
60         /* load the input */
61         for (i = 0; i < 16; i++)
62                 LOAD_OP(i, W, input);
63
64         /* now blend */
65         for (i = 16; i < 64; i++)
66                 BLEND_OP(i, W);
67
68         /* load the state into our registers */
69         a=state[0];  b=state[1];  c=state[2];  d=state[3];
70         e=state[4];  f=state[5];  g=state[6];  h=state[7];
71
72         /* now iterate */
73         t1 = h + e1(e) + Ch(e,f,g) + 0x428a2f98 + W[ 0];
74         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
75         t1 = g + e1(d) + Ch(d,e,f) + 0x71374491 + W[ 1];
76         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
77         t1 = f + e1(c) + Ch(c,d,e) + 0xb5c0fbcf + W[ 2];
78         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
79         t1 = e + e1(b) + Ch(b,c,d) + 0xe9b5dba5 + W[ 3];
80         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
81         t1 = d + e1(a) + Ch(a,b,c) + 0x3956c25b + W[ 4];
82         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
83         t1 = c + e1(h) + Ch(h,a,b) + 0x59f111f1 + W[ 5];
84         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
85         t1 = b + e1(g) + Ch(g,h,a) + 0x923f82a4 + W[ 6];
86         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
87         t1 = a + e1(f) + Ch(f,g,h) + 0xab1c5ed5 + W[ 7];
88         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
89
90         t1 = h + e1(e) + Ch(e,f,g) + 0xd807aa98 + W[ 8];
91         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
92         t1 = g + e1(d) + Ch(d,e,f) + 0x12835b01 + W[ 9];
93         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
94         t1 = f + e1(c) + Ch(c,d,e) + 0x243185be + W[10];
95         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
96         t1 = e + e1(b) + Ch(b,c,d) + 0x550c7dc3 + W[11];
97         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
98         t1 = d + e1(a) + Ch(a,b,c) + 0x72be5d74 + W[12];
99         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
100         t1 = c + e1(h) + Ch(h,a,b) + 0x80deb1fe + W[13];
101         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
102         t1 = b + e1(g) + Ch(g,h,a) + 0x9bdc06a7 + W[14];
103         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
104         t1 = a + e1(f) + Ch(f,g,h) + 0xc19bf174 + W[15];
105         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
106
107         t1 = h + e1(e) + Ch(e,f,g) + 0xe49b69c1 + W[16];
108         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
109         t1 = g + e1(d) + Ch(d,e,f) + 0xefbe4786 + W[17];
110         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
111         t1 = f + e1(c) + Ch(c,d,e) + 0x0fc19dc6 + W[18];
112         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
113         t1 = e + e1(b) + Ch(b,c,d) + 0x240ca1cc + W[19];
114         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
115         t1 = d + e1(a) + Ch(a,b,c) + 0x2de92c6f + W[20];
116         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
117         t1 = c + e1(h) + Ch(h,a,b) + 0x4a7484aa + W[21];
118         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
119         t1 = b + e1(g) + Ch(g,h,a) + 0x5cb0a9dc + W[22];
120         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
121         t1 = a + e1(f) + Ch(f,g,h) + 0x76f988da + W[23];
122         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
123
124         t1 = h + e1(e) + Ch(e,f,g) + 0x983e5152 + W[24];
125         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
126         t1 = g + e1(d) + Ch(d,e,f) + 0xa831c66d + W[25];
127         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
128         t1 = f + e1(c) + Ch(c,d,e) + 0xb00327c8 + W[26];
129         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
130         t1 = e + e1(b) + Ch(b,c,d) + 0xbf597fc7 + W[27];
131         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
132         t1 = d + e1(a) + Ch(a,b,c) + 0xc6e00bf3 + W[28];
133         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
134         t1 = c + e1(h) + Ch(h,a,b) + 0xd5a79147 + W[29];
135         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
136         t1 = b + e1(g) + Ch(g,h,a) + 0x06ca6351 + W[30];
137         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
138         t1 = a + e1(f) + Ch(f,g,h) + 0x14292967 + W[31];
139         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
140
141         t1 = h + e1(e) + Ch(e,f,g) + 0x27b70a85 + W[32];
142         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
143         t1 = g + e1(d) + Ch(d,e,f) + 0x2e1b2138 + W[33];
144         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
145         t1 = f + e1(c) + Ch(c,d,e) + 0x4d2c6dfc + W[34];
146         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
147         t1 = e + e1(b) + Ch(b,c,d) + 0x53380d13 + W[35];
148         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
149         t1 = d + e1(a) + Ch(a,b,c) + 0x650a7354 + W[36];
150         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
151         t1 = c + e1(h) + Ch(h,a,b) + 0x766a0abb + W[37];
152         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
153         t1 = b + e1(g) + Ch(g,h,a) + 0x81c2c92e + W[38];
154         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
155         t1 = a + e1(f) + Ch(f,g,h) + 0x92722c85 + W[39];
156         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
157
158         t1 = h + e1(e) + Ch(e,f,g) + 0xa2bfe8a1 + W[40];
159         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
160         t1 = g + e1(d) + Ch(d,e,f) + 0xa81a664b + W[41];
161         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
162         t1 = f + e1(c) + Ch(c,d,e) + 0xc24b8b70 + W[42];
163         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
164         t1 = e + e1(b) + Ch(b,c,d) + 0xc76c51a3 + W[43];
165         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
166         t1 = d + e1(a) + Ch(a,b,c) + 0xd192e819 + W[44];
167         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
168         t1 = c + e1(h) + Ch(h,a,b) + 0xd6990624 + W[45];
169         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
170         t1 = b + e1(g) + Ch(g,h,a) + 0xf40e3585 + W[46];
171         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
172         t1 = a + e1(f) + Ch(f,g,h) + 0x106aa070 + W[47];
173         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
174
175         t1 = h + e1(e) + Ch(e,f,g) + 0x19a4c116 + W[48];
176         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
177         t1 = g + e1(d) + Ch(d,e,f) + 0x1e376c08 + W[49];
178         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
179         t1 = f + e1(c) + Ch(c,d,e) + 0x2748774c + W[50];
180         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
181         t1 = e + e1(b) + Ch(b,c,d) + 0x34b0bcb5 + W[51];
182         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
183         t1 = d + e1(a) + Ch(a,b,c) + 0x391c0cb3 + W[52];
184         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
185         t1 = c + e1(h) + Ch(h,a,b) + 0x4ed8aa4a + W[53];
186         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
187         t1 = b + e1(g) + Ch(g,h,a) + 0x5b9cca4f + W[54];
188         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
189         t1 = a + e1(f) + Ch(f,g,h) + 0x682e6ff3 + W[55];
190         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
191
192         t1 = h + e1(e) + Ch(e,f,g) + 0x748f82ee + W[56];
193         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
194         t1 = g + e1(d) + Ch(d,e,f) + 0x78a5636f + W[57];
195         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
196         t1 = f + e1(c) + Ch(c,d,e) + 0x84c87814 + W[58];
197         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
198         t1 = e + e1(b) + Ch(b,c,d) + 0x8cc70208 + W[59];
199         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
200         t1 = d + e1(a) + Ch(a,b,c) + 0x90befffa + W[60];
201         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
202         t1 = c + e1(h) + Ch(h,a,b) + 0xa4506ceb + W[61];
203         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
204         t1 = b + e1(g) + Ch(g,h,a) + 0xbef9a3f7 + W[62];
205         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
206         t1 = a + e1(f) + Ch(f,g,h) + 0xc67178f2 + W[63];
207         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
208
209         state[0] += a; state[1] += b; state[2] += c; state[3] += d;
210         state[4] += e; state[5] += f; state[6] += g; state[7] += h;
211
212         /* clear any sensitive info... */
213         a = b = c = d = e = f = g = h = t1 = t2 = 0;
214         memset(W, 0, 64 * sizeof(u32));
215 }
216
217
218 static int sha224_init(struct shash_desc *desc)
219 {
220         struct sha256_state *sctx = shash_desc_ctx(desc);
221         sctx->state[0] = SHA224_H0;
222         sctx->state[1] = SHA224_H1;
223         sctx->state[2] = SHA224_H2;
224         sctx->state[3] = SHA224_H3;
225         sctx->state[4] = SHA224_H4;
226         sctx->state[5] = SHA224_H5;
227         sctx->state[6] = SHA224_H6;
228         sctx->state[7] = SHA224_H7;
229         sctx->count = 0;
230
231         return 0;
232 }
233
234 static int sha256_init(struct shash_desc *desc)
235 {
236         struct sha256_state *sctx = shash_desc_ctx(desc);
237         sctx->state[0] = SHA256_H0;
238         sctx->state[1] = SHA256_H1;
239         sctx->state[2] = SHA256_H2;
240         sctx->state[3] = SHA256_H3;
241         sctx->state[4] = SHA256_H4;
242         sctx->state[5] = SHA256_H5;
243         sctx->state[6] = SHA256_H6;
244         sctx->state[7] = SHA256_H7;
245         sctx->count = 0;
246
247         return 0;
248 }
249
250 int crypto_sha256_update(struct shash_desc *desc, const u8 *data,
251                           unsigned int len)
252 {
253         struct sha256_state *sctx = shash_desc_ctx(desc);
254         unsigned int partial, done;
255         const u8 *src;
256
257         partial = sctx->count & 0x3f;
258         sctx->count += len;
259         done = 0;
260         src = data;
261
262         if ((partial + len) > 63) {
263                 if (partial) {
264                         done = -partial;
265                         memcpy(sctx->buf + partial, data, done + 64);
266                         src = sctx->buf;
267                 }
268
269                 do {
270                         sha256_transform(sctx->state, src);
271                         done += 64;
272                         src = data + done;
273                 } while (done + 63 < len);
274
275                 partial = 0;
276         }
277         memcpy(sctx->buf + partial, src, len - done);
278
279         return 0;
280 }
281 EXPORT_SYMBOL(crypto_sha256_update);
282
283 static int sha256_final(struct shash_desc *desc, u8 *out)
284 {
285         struct sha256_state *sctx = shash_desc_ctx(desc);
286         __be32 *dst = (__be32 *)out;
287         __be64 bits;
288         unsigned int index, pad_len;
289         int i;
290         static const u8 padding[64] = { 0x80, };
291
292         /* Save number of bits */
293         bits = cpu_to_be64(sctx->count << 3);
294
295         /* Pad out to 56 mod 64. */
296         index = sctx->count & 0x3f;
297         pad_len = (index < 56) ? (56 - index) : ((64+56) - index);
298         crypto_sha256_update(desc, padding, pad_len);
299
300         /* Append length (before padding) */
301         crypto_sha256_update(desc, (const u8 *)&bits, sizeof(bits));
302
303         /* Store state in digest */
304         for (i = 0; i < 8; i++)
305                 dst[i] = cpu_to_be32(sctx->state[i]);
306
307         /* Zeroize sensitive information. */
308         memset(sctx, 0, sizeof(*sctx));
309
310         return 0;
311 }
312
313 static int sha224_final(struct shash_desc *desc, u8 *hash)
314 {
315         u8 D[SHA256_DIGEST_SIZE];
316
317         sha256_final(desc, D);
318
319         memcpy(hash, D, SHA224_DIGEST_SIZE);
320         memset(D, 0, SHA256_DIGEST_SIZE);
321
322         return 0;
323 }
324
325 static int sha256_export(struct shash_desc *desc, void *out)
326 {
327         struct sha256_state *sctx = shash_desc_ctx(desc);
328
329         memcpy(out, sctx, sizeof(*sctx));
330         return 0;
331 }
332
333 static int sha256_import(struct shash_desc *desc, const void *in)
334 {
335         struct sha256_state *sctx = shash_desc_ctx(desc);
336
337         memcpy(sctx, in, sizeof(*sctx));
338         return 0;
339 }
340
341 static struct shash_alg sha256_algs[2] = { {
342         .digestsize     =       SHA256_DIGEST_SIZE,
343         .init           =       sha256_init,
344         .update         =       crypto_sha256_update,
345         .final          =       sha256_final,
346         .export         =       sha256_export,
347         .import         =       sha256_import,
348         .descsize       =       sizeof(struct sha256_state),
349         .statesize      =       sizeof(struct sha256_state),
350         .base           =       {
351                 .cra_name       =       "sha256",
352                 .cra_driver_name=       "sha256-generic",
353                 .cra_flags      =       CRYPTO_ALG_TYPE_SHASH,
354                 .cra_blocksize  =       SHA256_BLOCK_SIZE,
355                 .cra_module     =       THIS_MODULE,
356         }
357 }, {
358         .digestsize     =       SHA224_DIGEST_SIZE,
359         .init           =       sha224_init,
360         .update         =       crypto_sha256_update,
361         .final          =       sha224_final,
362         .descsize       =       sizeof(struct sha256_state),
363         .base           =       {
364                 .cra_name       =       "sha224",
365                 .cra_driver_name=       "sha224-generic",
366                 .cra_flags      =       CRYPTO_ALG_TYPE_SHASH,
367                 .cra_blocksize  =       SHA224_BLOCK_SIZE,
368                 .cra_module     =       THIS_MODULE,
369         }
370 } };
371
372 static int __init sha256_generic_mod_init(void)
373 {
374         return crypto_register_shashes(sha256_algs, ARRAY_SIZE(sha256_algs));
375 }
376
377 static void __exit sha256_generic_mod_fini(void)
378 {
379         crypto_unregister_shashes(sha256_algs, ARRAY_SIZE(sha256_algs));
380 }
381
382 module_init(sha256_generic_mod_init);
383 module_exit(sha256_generic_mod_fini);
384
385 MODULE_LICENSE("GPL");
386 MODULE_DESCRIPTION("SHA-224 and SHA-256 Secure Hash Algorithm");
387
388 MODULE_ALIAS("sha224");
389 MODULE_ALIAS("sha256");