Опитвам се да напиша регулярен израз за анализ на sfv файл в python. По принцип линиите са от формата
име на файл crc_bytes
но белите интервали могат да се добавят навсякъде, включително името на файла. така че реалният формат е
(бели интервали) име на файл (бели интервали) crc_bytes (бели интервали)
когато името на файла може да включва бели интервали.
Сега се опитвам да извлека име на файл и crc_bytes. Така че опитах:
'\s*(.+)\s+([^\s]+)'
но анализира
' filename with spaces crc '
as
'filename with spaces ', 'crc'
//твърде много интервали------------^
Някаква идея как да се отървете от тези пространства? вероятно, погледнете някак си назад?
бонус въпрос:
Коментарите в sfv файловете са редове, които започват с ';'. Ако някой би могъл да третира коментари в регулярния израз, завинаги ще съм му длъжник.
Благодаря!!
[^;]
- person Adam Matan   schedule 01.11.2012