мне нужно автоматически загрузить файл на сайт клиента, сайт защищен учетными данными для входа. Теперь у меня действительно большая проблема, потому что страница входа в систему (и, возможно, остальная часть сайта ...) имеют искаженный HTML. Как я могу обрабатывать эти страницы? кажется, что casperJS не может обрабатывать искаженный HTML
ПРИМЕР искаженного HTML (это страница сайта немного подчищена, но исходные проблемы, такие как tr или td, не закрыты и т. д.):
<html>
<head>
<title>TEST Login Page</title>
</head>
<body>
<div>
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<form name="loginForm" method="post" action="test.do">
<tr>
<input type="username" name="username" size="12" value=""></td>
<input type="password" name="password" size="12" value=""></td>
<input type="submit" value="Login" class="submit"></td>
</tr>
</form>
<tr>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
</div>
</body>
</html>
ЧИСТЫЙ HTML
!DOCTYPE html>
<html>
<head>
<title>TEST Login Page</title>
</head>
<body>
<div>
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<tr>
<td>
<table>
<tbody>
<tr>
<td>
<form name="loginForm" method="post" action="test.do" id="loginForm">
<input type="username" name="username" size="12" value="" />
<input type="password" name="password" size="12" value="" />
<input type="submit" value="Login" class="submit" />
</form>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
</div>
</body>
</html>
Пример Casper JS:
casper.start(serverName, function(){
this.echo(this.getHTML('form[name="loginForm"]'));
});
casper.run();
С искаженным кодом ничего не возвращается, но с очищенным кодом все работает нормально!
есть способ справиться с этой проблемой?