Използвам този код, за да получа всички таблици в моя html документ:
var tables = document.DocumentNode.SelectNodes("table[@class='something']");
Във всяка таблица имам множество редове и множество колони. Имам нещо подобно досега:
HtmlNodeCollection rows = tables[0].SelectNodes(".//TR");
for (int i = 0; i < rows.Count; ++i)
{
HtmlNodeCollection cols = rows[i].SelectNodes(".//TD");
for (int j = 0; j < cols.Count; ++j)
{
string value = cols[j].InnerText;
}
}
Имам нужда от помощ, за да разбера използването на XPATH, тъй като не мога да намеря онлайн документация. Например как бих получил съдържанието, ако моят html документ е като този:
<table class="something">
<colgroup>...</colgroup>
<thead>
<tr>
<td>...</td>
</tr>
</thead>
<thead>...</thead>
<tbody>
<tr>
<td>...</td>
<td>...</td>
</tr>
<tr>
<td>...</td>
<td>...</td>
</tr>
</tbody>
</table>
Искам само съдържанието на "td"