Работя върху PHP анализатор, който анализира страницата с HTML „групи“ на моето училище. Това са страници с уникален URL адрес въз основа на името на курса и няколко други променливи. Страницата се състои от куп HTML <table>
.
Зареждането на HTML от url работи добре, докато не се натъкне на )
в съдържанието на файла. След това просто спира да зарежда и съхранява само това, което е получило до момента. Очевидно зареденият HTML не е създаден от мен и няма начин да попреча на такива знаци да присъстват в HTML кода.
Въпреки това работи добре, когато го стартирам локално с помощта на MAMP. Опитах се да потърся отговори, но не намерих нищо, което да реши проблема ми.
Как мога да избягам от тези знаци, преди да го заредя?
Текущият ми PHP:
$dom = new DOMDocument;
libxml_use_internal_errors(true); // the HTML i parse contains a lot of unclosed tags, this to prevent the errors from displaying on the page
$dom->loadHTMLFile('http://isarog.hhs.nl/Web_Site/HHS/ICTM/Public/Iris_Roster/Timetables/11_2/11_2-CMD-4vt-p2.html');
echo $dom->getElementsByTagName('html')->item(0)->nodeValue;
nodeValue
на етикета<html>
, той показва всичко до момента, в който тази скоба влезе в действие. - person Joey   schedule 22.11.2011.. <TD>Senad Mato):evic</TD> ..
. Когато се разпечата, той показва:.. <TD>Senad Mato
Сега ще опитам същата страница. - person Joey   schedule 22.11.2011