Как мне справиться с проблемами utf-8 и punycode в промежуточном программном обеспечении csrf Django?

У меня есть домен с символами, отличными от ascii, похожий на http://bl%C3%A5.no Домен зарегистрирован с его эквивалент Punycode:

xn--bl-zia.no

который также установлен в vhost Apache:

<VirtualHost *:443>
    ServerName xn--bl-zia.no
    ...

Проблема, которую я вижу, исходит из запроса, содержащего:

'HTTP_USER_AGENT': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko',
'HTTP_HOST': 'xn--bl-zia.no',
'SERVER_NAME': 'xn--bl-zia.no',
'HTTP_REFERER': 'https://bl\xc3\xa5.no/login/ka/?next=/start-exam/participant-login/',
'HTTP_X_REQUESTED_WITH': 'XMLHttpRequest',

т.е. реферер отправляется как utf-8, а не как punycode. Исключение, которое я получаю:

Traceback (most recent call last):

  File "/srv/cleanup-project/venv/dev/lib/python2.7/site-packages/django/core/handlers/base.py", line 153, in get_response
    response = callback(request, **param_dict)

  File "/srv/cleanup-project/venv/dev/lib/python2.7/site-packages/django/utils/decorators.py", line 87, in _wrapped_view
    result = middleware.process_view(request, view_func, args, kwargs)

  File "/srv/cleanup-project/venv/dev/lib/python2.7/site-packages/django/middleware/csrf.py", line 157, in process_view
    reason = REASON_BAD_REFERER % (referer, good_referer)

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 10: ordinal not in range(128)

Соответствующий код в csrf.py:

            good_referer = 'https://%s/' % request.get_host()
            if not same_origin(referer, good_referer):
                reason = REASON_BAD_REFERER % (referer, good_referer)

(get_host() использует SERVER_NAME из запроса)

Есть ли собственный способ Django справиться с этим, или мне нужно написать промежуточное ПО, которое преобразует utf-8 в punycode в доменной части заголовка referer?


person thebjorn    schedule 28.04.2015    source источник


Ответы (1)


Вот промежуточное решение ..

import urlparse


class PunyCodeU8RefererFixerMiddleware(object):
    def process_request(self, request):
        servername = request.META['SERVER_NAME']
        if 'xn--' not in servername:
            return None

        referer = request.META.get("HTTP_REFERER")
        if not referer:
            return None

        url = urlparse.urlparse(referer)
        try:
            netloc = url.netloc.decode('u8')
        except UnicodeDecodeError:
            return None

        def isascii(txt):
            return all(ord(ch) < 128 for ch in txt)

        netloc = '.'.join([
            str(p) if isascii(p) else 'xn--' + p.encode('punycode')
            for p in netloc.split('.')
        ])
        url = url._replace(netloc=netloc)
        request.META['HTTP_REFERER'] = urlparse.urlunparse(url)
        return None

он пытается спастись как можно раньше, когда обнаруживает, что не может сделать ничего полезного. Конечно, необходимо установить до промежуточного программного обеспечения csrf.

person thebjorn    schedule 28.04.2015