RigVan
Постоянный член клуба
вопрос по оптимизации регулярных выражений в цикле
есть куча нтмл-файлов, следующей структуры:
[ненужный текст][page №][ненужный текст][Глава: №][название главы][ненужный текст]
названия этих файлов я помещаю в массив $textarr
далее перебираю массив файлов и для каждого файла задаю условия, через рег. выражения.
Код выглядит так:
Скрипт работает очень медлено, просто тормоз какой-то! Я даже еще и названия глав не "вытаскивал", только номера страниц.... Есть ли какой способ улучшить скрипт?
есть куча нтмл-файлов, следующей структуры:
[ненужный текст][page №][ненужный текст][Глава: №][название главы][ненужный текст]
названия этих файлов я помещаю в массив $textarr
далее перебираю массив файлов и для каждого файла задаю условия, через рег. выражения.
Код выглядит так:
PHP:
set_time_limit($MAX_TIME); // эту строку поставил от безисходности, иначе выскакивал "Maximum execution time of..."
echo "<table border=1>";
foreach ($textarr as $value)
{
$link = file_get_contents("http://www.somesite.ru/{$value}");
preg_match("/page \- ([0-9]+)/", $link, $numpage);
if ($numpage[1]<=0){$numpage[1]="ошибка";}
echo "<tr>
<td>$numpage[1]</td>
<td>{$value} <a href=\"http://www.somesite.ru/{$value}\"> читать </a></td>
</tr>";
}
echo "</table>";
Во блин! А совет, то дельный! Похоже, что тормозит "file_get_contents". Ну и изначально я торможу 