Видимо в который раз требуется ликбез ) Попробую изложить как можно доступнее.
CGI это очень простая штука - каждый раз запускается php. На обработку каждого запроса. Думаю всем понятно, что запуск программы это длительная операция, хотите померьте exec в unix. Плюс к тому, при запуске php необходимы действия по инициализации, которые тоже не такие уж легкие.
Fastcgi это такая штука (мы рассматриваем только внешний fastcgi). Php запускается как fastcgi-сервер. Грубо говоря, примерно как и веб сервер - только протокол не http а fastcgi %) в цикле принимаем соединения, обрабатываем и отдаем результат. На обработку одного соединения нужен один процесс, потому для распараллеливания запускается несколько копий php - воркеров - таким образом, чтобы не было случаев, когда ответить долго некому (все воркеры заняты, а очередь входящих соединений копится и переполняется), но и чтобы не было слишком много воркеров (зря тратим ресурсы, если вдруг нахлынет пик соединений - получим неотвечающую системву с запредельным load average).
Apache+mod_php. Фактически - то же самое =) только соединения обрабатываются не fastcgi sapi, а апачом. Апач умеет число воркеров регулировать автоматически, но это уже детали не столь существенные.
Существенно то, что на самом деле - не совсем то же самое. В первом случае у нас помимо fastcgi висит веб сервер, обычно nginx, который и смотрит наружу и обрабатывает внешние соединения. Во втором случае, если вешать апач наружу, то может произойти "ой", когда у нас слишком много открытых соединений. На каждое соединение апачу нужен отдельный процесс - а теперь для наглядности представим себе 10 000 диалапщиков, которые к нам зашли - у нас висит 10 000 нехилых таких по размеру процессов апача, ОС жужжа свопом переключает туда-сюда контекст между 10 000 процессов, картина еще та. Почему используют nginx? Nginx все делает в одном процессе (для многоядерных серверов запускают столько процессов, сколько ядер) - он устроен как конечный автомат, и (тут я упрощаю совсем) занимается по сути обработкой очередей, и только делает быстрые операции по разбору http запросов и говорит операционной системе - а вот пошли этот файл в этот сокет. А тут вспоминаем оценку сложности: при раздаче ядром зависимость от числа соединений близка к O(const), если же раздавать кучей процессов переключаясь между ними, то чем больше переключений, тем больше мы процессорного времени теряем впустую, и получится там скорее всего что-то типа O(n^2). Так что - что получается - с бекенда же nginx по той же схеме вытягивает запрос в свой кэш, откуда медленно и печально раздает клиенту (раздает по сути ядро

). Тем, кто заинтересован в изложении этой темы более научном, чем мои жесты руками и подсчеты на пальцах, советую почитать
http://groups.google.com/group/fido7.ru.unix.prog/browse_thread/thread/44db58f70be988ad
Парадоксально не так ли, я только что написал все то же самое, что в статье, которую выше дико раскритиковал

) А вот почему.
Конечно же fastcgi ничего не ускоряет. Это cgi все замедляет, но его как атавизм времен, когда уже 5 соединений в секунду были чем-то немыслимым, и рассматривать нечего. Схема nginx + apache-mod_php так же эффективна как схема nginx+php-fpm, если речь не идет о маньячной оптимизации, когда становится критичным то, что апач вообще-то потяжелее php-fpm. Для мамбы это критично, для подавляющего большинства здесь присутствующих - нет, подавляющему большинству присутствующих для начала надо оптимизировать sql-запросы.
О бредовости сравнения с CGI думаю все уже поняли. Сравнение с перлом - в том смысле, что там приходится вручную разрабатывать fastcgi-обработчик, делать цикл приема соединений, счетчик, который сделает рестарт, когда мы наликали памяти.

Конечно, у такого подхода - когда все ручками - есть и преимущества - не надо каждый раз инициализировать одно и то же - но посчитайте время на эту инициализацию в своем приложении: оно либо мизерно, либо вам надо прочитать про кеширование и lazy load
Про акселераторы - это вообще другая история - не имеющая НИКАКОГО отношения к используемому SAPI. На самом деле это не они акселераторы, а в пхп "замедлятор": то, что, пока php-исходник не изменился, не надо каждый раз его компилировать в байткод, понятно последнему ламеру, а соответствующий функционал кастрирован явно из коммерческих соображений - надо же продавать zend-овский performance suite =) То, что лексический анализ - операция сложная и длительная, ясно любому, кто хоть раз в жизни писал парсеры.