Я пытаюсь разбить строку, используя Regex в С#. Я хочу разделить его на основе всех не буквенно-цифровых символов, но я хотел бы рассматривать слова с апострофами как целое слово, если оно содержит сокращение, такое как: 'd
, 's
, 't
.
Пример должен пояснить, чего я хотел бы достичь . Дана фраза типа:
"Steve's dog is mine 'not yours' I know you'd like'it"
Я хотел бы получить следующие токены:
steve's, dog, is, mine, not, yours, i, know, you'd, like, it
На данный момент я использую:
Regex.Split(str.ToLower(), @"[^a-zA-Z0-9_']").Where(s => s != String.Empty).ToArray<string>();
Он возвращает:
steve's , dog , is , mine , 'not , yours', i , know, you'd, like'it
the Hundred Years' War
- илиsay: 'the Hundred Years' War of yours'
!? ;). - person shA.t   schedule 27.08.2017.Select(s => s.Trim('\''))
после того, какWhere
решит проблему? - person Alexander Petrov   schedule 27.08.2017