Михаил
Новичок
Парсер html. Как быть?
Вообщем у меня такая заморочка.
Есть html-документ (41 Kb). Из него нужно получить данные для дальнейшей работы скрипта.
Вот как выглядит документ(нужный кусок):
....
....
....
</tr>
<tr class="Title">
<td width="100%">Results:</td>
</tr>
<tr>
<td id="ReportData">
<table border="0" cellpadding="2">
<tbody>
<tr>
<td class="ReportColumnHeader" align="right" nowrap="nowrap">Amount</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Channel</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Email</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Game</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Order Date/Time</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Order ID</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">3.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">DoubleGames.COM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">haljeszoo@XXXXX</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Sewer Run</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 2:15:58 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">8LD116B3HB584354K</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">4.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">Alexp</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">sotele@XXXXX</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Virtual Villagers</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 7:11:01 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">2JB95068AX3024912</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">5.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">Alexp</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">[email protected]</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Virtual Villagers</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 7:11:45 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">0611040710004</td>
</tr>
</tbody>
</table>
</td>
</tr>
....
....
....
Выше это часть этого самого html документа. Мне нужно выдрать цифровые значения из полей таблицы и в дальнейшем их использовать (записать в базу).
Может кто знает как получить эти данные. Заранее благодарен всем ответившим.
Вообщем у меня такая заморочка.
Есть html-документ (41 Kb). Из него нужно получить данные для дальнейшей работы скрипта.
Вот как выглядит документ(нужный кусок):
....
....
....
</tr>
<tr class="Title">
<td width="100%">Results:</td>
</tr>
<tr>
<td id="ReportData">
<table border="0" cellpadding="2">
<tbody>
<tr>
<td class="ReportColumnHeader" align="right" nowrap="nowrap">Amount</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Channel</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Email</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Game</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Order Date/Time</td>
<td class="ReportColumnHeader" align="left" nowrap="nowrap">Order ID</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">3.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">DoubleGames.COM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">haljeszoo@XXXXX</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Sewer Run</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 2:15:58 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">8LD116B3HB584354K</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">4.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">Alexp</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">sotele@XXXXX</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Virtual Villagers</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 7:11:01 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">2JB95068AX3024912</td>
</tr>
<tr>
<td class="ReportData" align="right" nowrap="nowrap" width="50">5.95</td>
<td class="ReportData" align="left" nowrap="nowrap" width="100">Alexp</td>
<td class="ReportData" align="left" nowrap="nowrap" width="180">[email protected]</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">Virtual Villagers</td>
<td class="ReportData" nowrap="nowrap" width="150">12/4/2006 7:11:45 AM</td>
<td class="ReportData" align="left" nowrap="nowrap" width="80">0611040710004</td>
</tr>
</tbody>
</table>
</td>
</tr>
....
....
....
Выше это часть этого самого html документа. Мне нужно выдрать цифровые значения из полей таблицы и в дальнейшем их использовать (записать в базу).
Может кто знает как получить эти данные. Заранее благодарен всем ответившим.