11#include <botan/internal/twofish.h>
13#include <botan/internal/loadstor.h>
14#include <botan/internal/rotate.h>
21 uint32_t A, uint32_t B, uint32_t& C, uint32_t& D, uint32_t RK1, uint32_t RK2,
const secure_vector<uint32_t>& SB) {
36 uint32_t A, uint32_t B, uint32_t& C, uint32_t& D, uint32_t RK1, uint32_t RK2,
const secure_vector<uint32_t>& SB) {
59 uint32_t A0, B0, C0, D0;
60 uint32_t A1, B1, C1, D1;
61 load_le(in, A0, B0, C0, D0, A1, B1, C1, D1);
72 for(
size_t k = 8; k != 40; k += 4) {
73 TF_E(A0, B0, C0, D0, m_RK[k + 0], m_RK[k + 1], m_SB);
74 TF_E(A1, B1, C1, D1, m_RK[k + 0], m_RK[k + 1], m_SB);
76 TF_E(C0, D0, A0, B0, m_RK[k + 2], m_RK[k + 3], m_SB);
77 TF_E(C1, D1, A1, B1, m_RK[k + 2], m_RK[k + 3], m_SB);
89 store_le(out, C0, D0, A0, B0, C1, D1, A1, B1);
105 for(
size_t k = 8; k != 40; k += 4) {
106 TF_E(A, B, C, D, m_RK[k], m_RK[k + 1], m_SB);
107 TF_E(C, D, A, B, m_RK[k + 2], m_RK[k + 3], m_SB);
126 uint32_t A0, B0, C0, D0;
127 uint32_t A1, B1, C1, D1;
128 load_le(in, A0, B0, C0, D0, A1, B1, C1, D1);
139 for(
size_t k = 40; k != 8; k -= 4) {
140 TF_D(A0, B0, C0, D0, m_RK[k - 2], m_RK[k - 1], m_SB);
141 TF_D(A1, B1, C1, D1, m_RK[k - 2], m_RK[k - 1], m_SB);
143 TF_D(C0, D0, A0, B0, m_RK[k - 4], m_RK[k - 3], m_SB);
144 TF_D(C1, D1, A1, B1, m_RK[k - 4], m_RK[k - 3], m_SB);
156 store_le(out, C0, D0, A0, B0, C1, D1, A1, B1);
172 for(
size_t k = 40; k != 8; k -= 4) {
173 TF_D(A, B, C, D, m_RK[k - 2], m_RK[k - 1], m_SB);
174 TF_D(C, D, A, B, m_RK[k - 4], m_RK[k - 3], m_SB);
187 return !m_SB.empty();
193void Twofish::key_schedule(std::span<const uint8_t> key) {
199 for(
size_t i = 0; i != key.size(); ++i) {
204 uint8_t
X = POLY_TO_EXP[key[i] - 1];
206 uint8_t RS1 = RS[(4 * i) % 32];
207 uint8_t RS2 = RS[(4 * i + 1) % 32];
208 uint8_t RS3 = RS[(4 * i + 2) % 32];
209 uint8_t RS4 = RS[(4 * i + 3) % 32];
211 S[4 * (i / 8)] ^= EXP_TO_POLY[(
X + POLY_TO_EXP[RS1 - 1]) % 255];
212 S[4 * (i / 8) + 1] ^= EXP_TO_POLY[(
X + POLY_TO_EXP[RS2 - 1]) % 255];
213 S[4 * (i / 8) + 2] ^= EXP_TO_POLY[(
X + POLY_TO_EXP[RS3 - 1]) % 255];
214 S[4 * (i / 8) + 3] ^= EXP_TO_POLY[(
X + POLY_TO_EXP[RS4 - 1]) % 255];
218 if(key.size() == 16) {
219 for(
size_t i = 0; i != 256; ++i) {
220 m_SB[i] = MDS0[Q0[Q0[i] ^ S[0]] ^ S[4]];
221 m_SB[256 + i] = MDS1[Q0[Q1[i] ^ S[1]] ^ S[5]];
222 m_SB[512 + i] = MDS2[Q1[Q0[i] ^ S[2]] ^ S[6]];
223 m_SB[768 + i] = MDS3[Q1[Q1[i] ^ S[3]] ^ S[7]];
226 for(
size_t i = 0; i < 40; i += 2) {
227 uint32_t
X = MDS0[Q0[Q0[i] ^ key[8]] ^ key[0]] ^ MDS1[Q0[Q1[i] ^ key[9]] ^ key[1]] ^
228 MDS2[Q1[Q0[i] ^ key[10]] ^ key[2]] ^ MDS3[Q1[Q1[i] ^ key[11]] ^ key[3]];
229 uint32_t
Y = MDS0[Q0[Q0[i + 1] ^ key[12]] ^ key[4]] ^ MDS1[Q0[Q1[i + 1] ^ key[13]] ^ key[5]] ^
230 MDS2[Q1[Q0[i + 1] ^ key[14]] ^ key[6]] ^ MDS3[Q1[Q1[i + 1] ^ key[15]] ^ key[7]];
238 }
else if(key.size() == 24) {
239 for(
size_t i = 0; i != 256; ++i) {
240 m_SB[i] = MDS0[Q0[Q0[Q1[i] ^ S[0]] ^ S[4]] ^ S[8]];
241 m_SB[256 + i] = MDS1[Q0[Q1[Q1[i] ^ S[1]] ^ S[5]] ^ S[9]];
242 m_SB[512 + i] = MDS2[Q1[Q0[Q0[i] ^ S[2]] ^ S[6]] ^ S[10]];
243 m_SB[768 + i] = MDS3[Q1[Q1[Q0[i] ^ S[3]] ^ S[7]] ^ S[11]];
246 for(
size_t i = 0; i < 40; i += 2) {
248 MDS0[Q0[Q0[Q1[i] ^ key[16]] ^ key[8]] ^ key[0]] ^ MDS1[Q0[Q1[Q1[i] ^ key[17]] ^ key[9]] ^ key[1]] ^
249 MDS2[Q1[Q0[Q0[i] ^ key[18]] ^ key[10]] ^ key[2]] ^ MDS3[Q1[Q1[Q0[i] ^ key[19]] ^ key[11]] ^ key[3]];
250 uint32_t
Y = MDS0[Q0[Q0[Q1[i + 1] ^ key[20]] ^ key[12]] ^ key[4]] ^
251 MDS1[Q0[Q1[Q1[i + 1] ^ key[21]] ^ key[13]] ^ key[5]] ^
252 MDS2[Q1[Q0[Q0[i + 1] ^ key[22]] ^ key[14]] ^ key[6]] ^
253 MDS3[Q1[Q1[Q0[i + 1] ^ key[23]] ^ key[15]] ^ key[7]];
261 }
else if(key.size() == 32) {
262 for(
size_t i = 0; i != 256; ++i) {
263 m_SB[i] = MDS0[Q0[Q0[Q1[Q1[i] ^ S[0]] ^ S[4]] ^ S[8]] ^ S[12]];
264 m_SB[256 + i] = MDS1[Q0[Q1[Q1[Q0[i] ^ S[1]] ^ S[5]] ^ S[9]] ^ S[13]];
265 m_SB[512 + i] = MDS2[Q1[Q0[Q0[Q0[i] ^ S[2]] ^ S[6]] ^ S[10]] ^ S[14]];
266 m_SB[768 + i] = MDS3[Q1[Q1[Q0[Q1[i] ^ S[3]] ^ S[7]] ^ S[11]] ^ S[15]];
269 for(
size_t i = 0; i < 40; i += 2) {
270 uint32_t
X = MDS0[Q0[Q0[Q1[Q1[i] ^ key[24]] ^ key[16]] ^ key[8]] ^ key[0]] ^
271 MDS1[Q0[Q1[Q1[Q0[i] ^ key[25]] ^ key[17]] ^ key[9]] ^ key[1]] ^
272 MDS2[Q1[Q0[Q0[Q0[i] ^ key[26]] ^ key[18]] ^ key[10]] ^ key[2]] ^
273 MDS3[Q1[Q1[Q0[Q1[i] ^ key[27]] ^ key[19]] ^ key[11]] ^ key[3]];
274 uint32_t
Y = MDS0[Q0[Q0[Q1[Q1[i + 1] ^ key[28]] ^ key[20]] ^ key[12]] ^ key[4]] ^
275 MDS1[Q0[Q1[Q1[Q0[i + 1] ^ key[29]] ^ key[21]] ^ key[13]] ^ key[5]] ^
276 MDS2[Q1[Q0[Q0[Q0[i + 1] ^ key[30]] ^ key[22]] ^ key[14]] ^ key[6]] ^
277 MDS3[Q1[Q1[Q0[Q1[i + 1] ^ key[31]] ^ key[23]] ^ key[15]] ^ key[7]];
void assert_key_material_set() const
bool has_keying_material() const override
void encrypt_n(const uint8_t in[], uint8_t out[], size_t blocks) const override
void decrypt_n(const uint8_t in[], uint8_t out[], size_t blocks) const override
constexpr uint8_t get_byte(T input)
void zap(std::vector< T, Alloc > &vec)
constexpr T rotl(T input)
constexpr T rotr(T input)
constexpr auto store_le(ParamTs &&... params)
constexpr auto load_le(ParamTs &&... params)
std::vector< T, secure_allocator< T > > secure_vector