Как мне использовать регулярное выражение в этом? (php)

Мне нужно удалить данные со страницы, а исходный код в файле такой:

                <td class="pl-15">
                                            <a class="job-item" id="job-92837" href="http://www.jobs.com/job/looking-for-c-and-net-rockstar-developers/92837" >
                        Looking Rockstar Developers!                        </a>


                </td>
                <td >

                    <a href="http://www.jobs.com/employer/spidron/7388" class="joblist">    

                        Spidron                                             </a>

Шаблон, который я использовал, выглядит просто так:

        $pattern = '/<a class="job-item" id="(.*?)" href="(.*?)">(.*?)\/a>/';

        preg_match_all($pattern, $content, $matches);

Проблема с этим шаблоном заключается в том, что я получаю данные в массиве третьих, например:

                Looking for Rockstar Developers!                        </a>


                </td>
                <td >

                    <a href="http://www.jobs.com/employer/spidron/7388" class="joblist">    

                        Spidron     

Как мне получить "Ищу разработчиков Rockstar!" в одном массиве следующая ссылка "http://www.jobs.com/employer/spidron/7388" в другом массиве и "Спидрон" в другом.

Просто новичок в использовании регулярных выражений, помощь очень ценится. :)


person Pratish Shrestha    schedule 29.08.2015    source источник
comment
Итак, вы хотите украсть объявления о вакансиях, созданные другим агентством, и выдать их за свои? качал головой   -  person arkascha    schedule 29.08.2015
comment
Нет, это просто пример, который я пытаюсь использовать для практики в качестве моего задания по очистке данных с использованием PHP, это никоим образом не будет развернуто или что-то в этом роде.   -  person Pratish Shrestha    schedule 29.08.2015


Ответы (1)


Здесь у вас две проблемы:

  1. Ваши данные охватывают несколько строк. Поэтому вы должны добавить 's' в конце вашего регулярного выражения.
  2. У вас есть пробел перед закрывающим тегом. Вы должны принять это во внимание.

Вместо этого используйте это регулярное выражение:

$pattern = '/\<a class="job-item" id="(.*?)" href="(.*?)".*>(.*?)<\/a>/s';
person uri2x    schedule 29.08.2015