Проблема Datetime strptime со смещением часового пояса с двоеточием

В настоящее время мы работаем над приложением, которое пытается рассчитать время в пути по маршруту от a до b, используя API 2.db.transport.rest.

К сожалению, мы получаем метки времени со смещением часового пояса от этого API, например +01:00. Нам нужно смещение часового пояса без :, поэтому +0100.

В следующем примере выдается ошибка в Linux при использовании Python 3.6.7:

from datetime import datetime
datetimestring = "2019-01-19T15:13:00.000+01:00"
datetime.strptime(datetimestring, '%Y-%m-%dT%H:%M:%S.%f%z')

Этот пример кода создает это исключение:

ValueError: time data '2019-01-19T15:13:00.000+01:00' does not match format '%Y-%m-%dT%H:%M:%S.%f%z'

Если мы удалим : из входной строки, это сработает, никаких исключений не будет.

Код также работает, когда мы запускаем его в Windows, на Python 3.7.2.

Может ли это быть связано с разными версиями Python? Как мы можем разобрать или преобразовать это без ошибок?


person Bruno    schedule 19.01.2019    source источник


Ответы (1)


Да, это проблема версии. Вы полагаетесь на новую функцию, представленную в Python 3.7.

Из datetime.strptime() документации, сноска 6:

Изменено в версии 3.7: когда директива %z передается методу strptime(), смещения UTC могут иметь двоеточие в качестве разделителя между часами, минутами и секундами. Например, '+01:00:00' будет проанализировано как смещение в один час.

Если вы не можете везде перейти на Python 3.7, вы можете просто удалить эти двоеточия с некоторой предварительной обработкой:

import re

datetimestring = re.sub(r'([-+]\d{2}):(\d{2})(?:(\d{2}))?$', r'\1\2\3', datetimestring)

Регулярное выражение удаляет двоеточия из любого смещения HH:MM или HH:MM:SS (появляется в конце строки и предшествует - или +):

Демо:

>>> import re
>>> from datetime import datetime
>>> datetimestring = "2019-01-19T15:13:00.000+01:00"
>>> corrected = re.sub(r'([-+]\d{2}):(\d{2})(?:(\d{2}))?$', r'\1\2\3', datetimestring)
>>> corrected
'2019-01-19T15:13:00.000+0100'
>>> datetime.strptime(corrected, '%Y-%m-%dT%H:%M:%S.%f%z')
datetime.datetime(2019, 1, 19, 15, 13, tzinfo=datetime.timezone(datetime.timedelta(seconds=3600)))

Если бы вы везде обновлялись до Python 3.7, вы могли бы вообще отказаться от синтаксического анализа strptime() и просто использовать выделенный datetime.fromisoformat()метод; он может анализировать ваш ввод напрямую.

>>> datetime.fromisoformat(datetimestring)
datetime.datetime(2019, 1, 19, 15, 13, tzinfo=datetime.timezone(datetime.timedelta(seconds=3600)))
person Martijn Pieters    schedule 19.01.2019