Во-первых, прежде чем вы что-нибудь скажете, я ДОЛЖЕН сделать это, потому что RSS искажен, но я не могу исправить это со своей стороны. Итак, хотя я пытался использовать синтаксический анализатор RSS и XML, они терпят неудачу, и у меня есть только доступ к внешнему интерфейсу. Тем не менее, я очень близок, но я не могу понять, почему это не совпадет.
Фид (это длинная строка из 1 строки): http://pastebin.com/5dJhXCvf а>
Первый пример:
<title>(.+)</title>
Я подумал, что это отлично сработало с моим тестом только:
<title>"cterrorism task force" location:oregon - Google News</title>
Но проблема в том, что он соответствует всему, а затем одному совпадению, например:
<title>"cterrorism task force" location:oregon - Google News</title><title>"cterrorism task force" location:oregon - Google News</title>
Равняется 1 элементу результата в моем массиве из exec()
и match()
Итак, я попытался:
<title>([\w\d\s\=\%\_\`\~\+\!\@\#\$\%\^\&\*\(\)\:\'\"\[\]\{\}\|\,\.\/]+)</title>
Но это ничего не возвращает... Есть идеи?
[^<>]
- person Alan Moore   schedule 03.12.2010