Я хочу выделить слова между; и: из файла XML, например, здесь слово Index
бла бла бла; Индекс: bla bla
файл загружается по его URL с помощью file_get_contents
$output = file_get_contents("https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Exporter/Base_de_donn%C3%A9es");
preg_match_all('/\;.[a-zA-Z]+.\:/', $output, $matches, PREG_SET_ORDER, 0);
var_dump($matches);
Шаблон регулярного выражения отлично работает с тем же содержимым файла, используя regex101, а также когда я копирую текст в строковую переменную. Но приведенный выше код не работает, он возвращает только последнее совпадение.
Что я делаю неправильно ?
PS: Я также попытался загрузить файл XML с помощью DOMDocument .. Тот же результат.
/;[^:;]+:/
- person revo   schedule 03.06.2017Index
,Vue matérialisée
,Partitionnement
,[[RAID (informatique)|RAID]] (''Redundant array of inexpensive disks'')
,Table de Hashage (anglais ''hashing'')
, ...,Journal
- person Casimir et Hippolyte   schedule 03.06.2017regex
вместоre
? - person Scott Weaver   schedule 03.06.2017