Реализация SHA-256 в Python

Я ищу реализацию Python хеш-функции SHA-256. Я хочу использовать его, чтобы лучше понять, как работает функция SHA-256, и я думаю, что Python — идеальный язык для этого. Псевдокод имеет ограничение, заключающееся в том, что я не могу запустить/проверить его, чтобы увидеть, что мои модификации кода делают с выводом.


person runeks    schedule 06.09.2011    source источник
comment
Однако для производственного использования (почти) всегда лучше использовать библиотечную версию криптографического кода. из Crypto.Hash импортировать SHA256   -  person MikeW    schedule 31.08.2017
comment
@MikeW, проверенный инструмент Pycrytodome? Есть ли другая альтернатива?   -  person Cloud Cho    schedule 17.07.2020


Ответы (6)


Исходный код PyPy содержит реализацию SHA-256 на чистом Python здесь. Покопавшись в этом каталоге, вы, вероятно, также найдете реализации других стандартных хэшей на чистом Python.

person Eli Collins    schedule 06.09.2011
comment
Внимание: ссылка битая :( - person rogamba; 28.09.2020
comment
Ссылка обновлена, снова работает - person MrRoboto; 18.04.2021

Некоторое время назад я также изучал SHA-256 и создал класс на чистом питоне, который реализует этот хеш. Если я правильно помню, в основном я взял алгоритм из Википедии Псевдокод SHA-256 и частично из некоторых проектов с открытым исходным кодом.

Алгоритм не импортирует никаких (даже стандартных) модулей. Конечно, он намного медленнее, чем вариант hashlib, и предназначен только для изучения.

Если вы просто запустите скрипт, он выполнит 1000 тестов, сравнивая hashlib и мой варианты. Только функция тестирования импортирует некоторые модули, сам класс алгоритма не нуждается ни в каких модулях. Интерфейс такой же, как в классе sha256 hashlib. См. функцию test() для примеров использования.

Попробуй онлайн!

class Sha256:
    ks = [
        0x428a2f98, 0x71374491, 0xb5c0fbcf, 0xe9b5dba5,
        0x3956c25b, 0x59f111f1, 0x923f82a4, 0xab1c5ed5,
        0xd807aa98, 0x12835b01, 0x243185be, 0x550c7dc3,
        0x72be5d74, 0x80deb1fe, 0x9bdc06a7, 0xc19bf174,
        0xe49b69c1, 0xefbe4786, 0x0fc19dc6, 0x240ca1cc,
        0x2de92c6f, 0x4a7484aa, 0x5cb0a9dc, 0x76f988da,
        0x983e5152, 0xa831c66d, 0xb00327c8, 0xbf597fc7,
        0xc6e00bf3, 0xd5a79147, 0x06ca6351, 0x14292967,
        0x27b70a85, 0x2e1b2138, 0x4d2c6dfc, 0x53380d13,
        0x650a7354, 0x766a0abb, 0x81c2c92e, 0x92722c85,
        0xa2bfe8a1, 0xa81a664b, 0xc24b8b70, 0xc76c51a3,
        0xd192e819, 0xd6990624, 0xf40e3585, 0x106aa070,
        0x19a4c116, 0x1e376c08, 0x2748774c, 0x34b0bcb5,
        0x391c0cb3, 0x4ed8aa4a, 0x5b9cca4f, 0x682e6ff3,
        0x748f82ee, 0x78a5636f, 0x84c87814, 0x8cc70208,
        0x90befffa, 0xa4506ceb, 0xbef9a3f7, 0xc67178f2,
    ]

    hs = [
        0x6a09e667, 0xbb67ae85, 0x3c6ef372, 0xa54ff53a,
        0x510e527f, 0x9b05688c, 0x1f83d9ab, 0x5be0cd19,
    ]

    M32 = 0xFFFFFFFF

    def __init__(self, m = None):
        self.mlen = 0
        self.buf = b''
        self.k = self.ks[:]
        self.h = self.hs[:]
        self.fin = False
        if m is not None:
            self.update(m)

    @staticmethod
    def pad(mlen):
        mdi = mlen & 0x3F
        length = (mlen << 3).to_bytes(8, 'big')
        padlen = 55 - mdi if mdi < 56 else 119 - mdi
        return b'\x80' + b'\x00' * padlen + length

    @staticmethod
    def ror(x, y):
        return ((x >> y) | (x << (32 - y))) & Sha256.M32

    @staticmethod
    def maj(x, y, z):
        return (x & y) ^ (x & z) ^ (y & z)

    @staticmethod
    def ch(x, y, z):
        return (x & y) ^ ((~x) & z)

    def compress(self, c):
        w = [0] * 64
        w[0 : 16] = [int.from_bytes(c[i : i + 4], 'big') for i in range(0, len(c), 4)]

        for i in range(16, 64):
            s0 = self.ror(w[i - 15],  7) ^ self.ror(w[i - 15], 18) ^ (w[i - 15] >>  3)
            s1 = self.ror(w[i -  2], 17) ^ self.ror(w[i -  2], 19) ^ (w[i -  2] >> 10)
            w[i] = (w[i - 16] + s0 + w[i - 7] + s1) & self.M32

        a, b, c, d, e, f, g, h = self.h

        for i in range(64):
            s0 = self.ror(a, 2) ^ self.ror(a, 13) ^ self.ror(a, 22)
            t2 = s0 + self.maj(a, b, c)
            s1 = self.ror(e, 6) ^ self.ror(e, 11) ^ self.ror(e, 25)
            t1 = h + s1 + self.ch(e, f, g) + self.k[i] + w[i]

            h = g
            g = f
            f = e
            e = (d + t1) & self.M32
            d = c
            c = b
            b = a
            a = (t1 + t2) & self.M32

        for i, (x, y) in enumerate(zip(self.h, [a, b, c, d, e, f, g, h])):
            self.h[i] = (x + y) & self.M32

    def update(self, m):
        if m is None or len(m) == 0:
            return

        assert not self.fin, 'Hash already finalized and can not be updated!'

        self.mlen += len(m)
        m = self.buf + m

        for i in range(0, len(m) // 64):
            self.compress(m[64 * i : 64 * (i + 1)])

        self.buf = m[len(m) - (len(m) % 64):]

    def digest(self):
        if not self.fin:
            self.update(self.pad(self.mlen))
            self.digest = b''.join(x.to_bytes(4, 'big') for x in self.h[:8])
            self.fin = True
        return self.digest

    def hexdigest(self):
        tab = '0123456789abcdef'
        return ''.join(tab[b >> 4] + tab[b & 0xF] for b in self.digest())

def test():
    import secrets, hashlib, random
    for itest in range(500):
        data = secrets.token_bytes(random.randrange(257))
        a, b = hashlib.sha256(data).hexdigest(), Sha256(data).hexdigest()
        assert a == b, (a, b)
    for itest in range(500):
        a, b = hashlib.sha256(), Sha256()
        for j in range(random.randrange(10)):
            data = secrets.token_bytes(random.randrange(129))
            a.update(data)
            b.update(data)
        a, b = a.hexdigest(), b.hexdigest()
        assert a == b, (a, b)
    print('Sha256 tested successfully.')

if __name__ == '__main__':
    test()
person Arty    schedule 14.05.2021

Если вам нужно только хеш-значение:

from hashlib import sha256
data = input('Enter plaintext data: ')
output = sha256(data.encode('utf-8'))
print(output)

Хэш-библиотека Python также имеет хэш-функции SHA-1, SHA-384, SHA-512 и MD5.

person Eric Jin    schedule 24.02.2019
comment
Широко ли используется встроенная в Python Hashlib в промышленности? Если нет, какой инструмент используется среди Pycrytpodome, Cryptogrphy или Pynacl? - person Cloud Cho; 17.07.2020

Вот мое предложение с Redis:

for i in range(len(rserver.keys())):
    mdp_hash = rserver.get(rserver.keys()[i])
    rserver.set(rserver.keys()[i], hashlib.sha256(mdp_hash.encode()).hexdigest())
person nisrine hammout    schedule 14.02.2021

Перевод http://en.wikipedia.org/wiki/SHA-2#SHA-256_.28a_SHA-2_variant.29_pseudocode для Python должен быть прямым.

person rocksportrocker    schedule 06.09.2011
comment
Это сложнее, чем кажется, потому что вся логика преобразования ввода/вывода не представлена, и это довольно нетривиально. - person sgauria; 04.03.2014

person    schedule
comment
Этот код выглядит так, как будто к нему прикреплена какая-то лицензия, которая не позволит вам опубликовать его здесь без указания авторства. - person Matt Timmermans; 24.02.2019
comment
@MattTimmermans Я написал сценарий. Что такого в коде, что заставляет вас так думать? Магия происходит в int() и format() - person Q-Club; 26.02.2019
comment
@MattTimmermans Тогда вы должны увидеть мои ответы SHA-3! Точно такой же стиль! - person Q-Club; 26.02.2019
comment
Это проверено? Я получил другой результат при вызове вашего print(str(sha_256("hi"))), чем при запуске echo "hi" | sha256sum - person Timothy Swan; 30.04.2020
comment
Я опаздываю на вечеринку, но алгоритм не на 100% правильный. Иногда он выводит строки, размер которых на 1 или 2 меньше, чем должен быть (62 или 63 вместо 64). Я сравниваю их с выводом hashlib, и все совпадает идеально, за исключением того, что по какой-то причине в выводе отсутствуют один или два нуля (примеры двух отсутствующих — B и s). Я предполагаю, что это из-за какой-то ошибки с прокладкой? - person EvilTaco; 12.04.2021
comment
Что-то не так с отступами, так как при вводе строки от 60 до 64 символов выводится совершенно другой хэш, а иногда в хеше есть случайные нули, что указывает на то, что неправильное заполнение больше, чем просто заполнение. - person Mikah; 14.04.2021
comment
После долгих отладок и сравнения кода с псевдокодом в Вики я обнаружил несколько проблем: формула заполнения работает, но не соответствует формуле Вики. Он не делает несколько фрагментов, поэтому он говорит, что работает с input_string ‹ 56 символов. Однако основная проблема заключается в том, что hex_return неправильно форматирует число, поэтому отсутствуют 00 и еще много чего. - person Mikah; 14.04.2021
comment
Хорошо, я исправил это и завершил редактирование с новым кодом. Я надеялся, что помог! (: - person Mikah; 14.04.2021