В Perl цикл while обычно быстрее, чем цикл for?

Я провел небольшой эксперимент, как будет показано ниже, и похоже, что цикл while работает быстрее, чем цикл for в Perl. Но поскольку эксперимент был довольно грубым, а предмет мог быть намного сложнее, чем кажется, я хотел бы услышать, что вы можете сказать по этому поводу. Как всегда спасибо за любые комментарии/предложения :)

В следующих двух небольших скриптах я пробовал циклы while и for отдельно для вычисления факториала 100 000. Тот, у которого есть цикл while, занял 57 минут 17 секунд, в то время как эквивалент цикла for занял 1 час 7 минут 54 секунды.

Скрипт с циклом while:

use strict;
use warnings;
use bigint;

my $now = time;

my $n = shift;
my $s = 1;

while(1){
$s *= $n;
$n--;
last if $n==2;
}

print $s*$n;
$now = time - $now;
printf("\n\nTotal running time: %02d:%02d:%02d\n\n", int($now / 3600),
            int(($now % 3600) / 60), int($now % 60));

Скрипт с циклом for:

use strict;
use warnings;
use bigint;

my $now = time;

my $n =shift;
my $s=1;

for (my $i=2; $i<=$n;$i++) {
$s = $s*$i;
}

print $s;
$now = time - $now;
printf("\n\nTotal running time: %02d:%02d:%02d\n\n", int($now / 3600),
            int(($now % 3600) / 60), int($now % 60));

person Mike    schedule 20.03.2010    source источник
comment
Вы, вероятно, пытаетесь оптимизировать не ту вещь. Мне интересно, почему вы считаете, что именно эта часть языка так важна?   -  person Ether    schedule 20.03.2010
comment
Запустите их несколько раз, и в среднем они, вероятно, будут примерно одинаковыми.   -  person CaffGeek    schedule 20.03.2010
comment
@Чад, на самом деле я уже пару раз тестировал код. Им требовалось разное время, чтобы закончить одну и ту же работу. Я думаю, что объяснение @Jonathan Leffler с кодом иллюстрации имеет очень хороший смысл.   -  person Mike    schedule 20.03.2010
comment
@ Эфир, мне просто любопытно. это все. в любом случае спасибо за оставленный комментарий :)   -  person Mike    schedule 20.03.2010
comment
Обычно быстрее не заботиться о том, какой из них быстрее.   -  person brian d foy    schedule 20.03.2010


Ответы (3)


Циклы не эквивалентны, и вы в первую очередь перебираете пакет bigint, и это не имеет никакого отношения к for против while как таковому.

В цикле while используется обозначение «$s *= $i», а в цикле for — «$s = $s * $i». Достаточно просто показать, что они не идентичны. Также считается одна петля; другой отсчитывает. Это влияет на то, насколько велики числа, которые нужно умножить. Это эффект второго порядка, но не совсем незначительный.

[Обновление: исправлено, чтобы показать только одну версию кода с точностью до секунды. Есть основания думать, что печать следует исключить из расчетов времени; это делает вещи более грязными, поэтому я не беспокоился. Я исправил ошибку в предыдущей версии: петля 4 была такой же, как петля 3 - теперь это не так. Я также начал форматирование вывода (хотя обработка доли секунды могла бы быть улучшена — упражнение для читателя), а также улучшена «отчетность о проделанной работе».]

Результаты синхронизации на Mac Mini (Snow Leopard 10.6.2):

Count up   $s *= $i:      00:00:12.663337
Count up   $s  = $s * $i: 00:00:20.686111
Count down $s *= $i:      00:00:14.201797
Count down $s  = $s * $i: 00:00:23.269874

Сценарий:

use Time::HiRes qw(gettimeofday);
use strict;
use warnings;
use bigint;
use constant factorial_of => 13000;

sub delta_t
{
    my($tag, $t1, $t2) = @_;
    my($d) = int($t2 - $t1);
    my($f) = ($t2 - $t1) - $d;
    my($s) = sprintf("%.6f", $f);
    $s =~ s/^0//;
    printf "%-25s %02d:%02d:%02d%s\n",
           $tag, int($d/3600), int(($d % 3600) / 60), int($d % 60), $s;
}

my $t1 = gettimeofday;

{
    my $n = factorial_of;
    my $s = 1;
    for (my $i = 2; $i <= $n; $i++)
    {
        $s *= $i;
    }
    print "$s\n: Loop 1\n";
}

my $t2 = gettimeofday;
delta_t('Count up   $s *= $i:',      $t1, $t2);

{
    my $n = factorial_of;
    my $s = 1;
    for (my $i = 2; $i <= $n; $i++)
    {
        $s = $s * $i;
    }
    print "$s\n: Loop 2\n";
}

my $t3 = gettimeofday;
delta_t('Count up   $s *= $i:',      $t1, $t2);
delta_t('Count up   $s  = $s * $i:', $t2, $t3);

{
    my $n = factorial_of;
    my $s = 1;
    for (my $i = $n; $i > 1; $i--)
    {
        $s *= $i;
    }
    print "$s\n: Loop 3\n";
}

my $t4 = gettimeofday;
delta_t('Count up   $s *= $i:',      $t1, $t2);
delta_t('Count up   $s  = $s * $i:', $t2, $t3);
delta_t('Count down $s *= $i:',      $t3, $t4);

{
    my $n = factorial_of;
    my $s = 1;
    for (my $i = $n; $i > 1; $i--)
    {
        $s = $s * $i;
    }
    print "$s\n: Loop 4\n";
}

my $t5 = gettimeofday;
delta_t('Count up   $s *= $i:',      $t1, $t2);
delta_t('Count up   $s  = $s * $i:', $t2, $t3);
delta_t('Count down $s *= $i:',      $t3, $t4);
delta_t('Count down $s  = $s * $i:', $t4, $t5);

А вот гораздо более компактная версия приведенного выше кода, расширенная для проверки циклов «пока», а также циклов «для». Он также имеет дело с большинством вопросов синхронизации. Единственное, что не идеально (для меня), это то, что он использует пару глобальных переменных, и я немного сократил код в ссылках на код, чтобы он умещался в одну строку, не вызывая полосу прокрутки (во всяком случае, на моем дисплее). ). Ясно, что, немного поработав, тестирование можно было бы упаковать в массив, чтобы тестирование выполнялось итеративно — цикл по массиву, запускающий функцию таймера для информации в массиве. И т.д... это SMOP - простое программирование. (Он печатает хэш MD5 факториала, а не сам факториал, потому что легче сравнивать результаты и т. д. Он указал на пару ошибок, когда я рефакторил код выше. Да, MD5 небезопасен - но я использую его не для безопасности, просто для обнаружения непреднамеренных изменений.)

use Time::HiRes qw(gettimeofday);
use Digest::MD5 qw(md5_hex);
use strict;
use warnings;
use bigint;
use constant factorial_of => 13000;

my ($s, $i);

my $l1 = sub {my($n) = @_; for ($i = 2;  $i <= $n; $i++) { $s *= $i;     }};
my $l2 = sub {my($n) = @_; for ($i = 2;  $i <= $n; $i++) { $s = $s * $i; }};
my $l3 = sub {my($n) = @_; for ($i = $n; $i > 1;   $i--) { $s *= $i;     }};
my $l4 = sub {my($n) = @_; for ($i = $n; $i > 1;   $i--) { $s = $s * $i; }};
my $l5 = sub {my($n) = @_; $i = 2;  while ($i <= $n) { $s *= $i;     $i++; }};
my $l6 = sub {my($n) = @_; $i = 2;  while ($i <= $n) { $s = $s * $i; $i++; }};
my $l7 = sub {my($n) = @_; $i = $n; while ($i > 1)   { $s *= $i;     $i--; }};
my $l8 = sub {my($n) = @_; $i = $n; while ($i > 1)   { $s = $s * $i; $i--; }};

sub timer
{
    my($n, $code, $tag) = @_;
    my $t1 = gettimeofday;
    $s = 1;
    &$code(factorial_of);
    my $t2 = gettimeofday;
    my $md5 = md5_hex($s);
    printf "Loop %d: %-33s %09.6f (%s)\n", $n, $tag, $t2 - $t1, $md5;
}

my $count = 1;
timer($count++, $l1, 'for   - Count up   $s *= $i:');
timer($count++, $l2, 'for   - Count up   $s  = $s * $i:');
timer($count++, $l3, 'for   - Count down $s *= $i:');
timer($count++, $l4, 'for   - Count down $s  = $s * $i:');
timer($count++, $l5, 'while - Count up   $s *= $i:');
timer($count++, $l6, 'while - Count up   $s  = $s * $i:');
timer($count++, $l7, 'while - Count down $s *= $i:');
timer($count++, $l8, 'while - Count down $s  = $s * $i:');

Пример вывода (контрольная сумма MD5 сжата, чтобы избежать разрыва строки — полное значение равно 584b3ab832577fd1390970043efc0ec8):

Loop 1: for   - Count up   $s *= $i:      12.853630 (584b3ab8...3efc0ec8)
Loop 2: for   - Count up   $s  = $s * $i: 20.854735 (584b3ab8...3efc0ec8)
Loop 3: for   - Count down $s *= $i:      14.798155 (584b3ab8...3efc0ec8)
Loop 4: for   - Count down $s  = $s * $i: 23.699913 (584b3ab8...3efc0ec8)
Loop 5: while - Count up   $s *= $i:      12.972428 (584b3ab8...3efc0ec8)
Loop 6: while - Count up   $s  = $s * $i: 21.192956 (584b3ab8...3efc0ec8)
Loop 7: while - Count down $s *= $i:      14.555620 (584b3ab8...3efc0ec8)
Loop 8: while - Count down $s  = $s * $i: 23.790795 (584b3ab8...3efc0ec8)

Я постоянно вижу небольшой (‹1%) штраф за цикл while по сравнению с соответствующим циклом for, но у меня нет хорошего объяснения этому.

person Jonathan Leffler    schedule 20.03.2010
comment
@ Джонатан Леффлер, большое спасибо! Ваш код иллюстрации очень поучителен для меня. Спасибо :) - person Mike; 20.03.2010
comment
@Joanthan, спасибо за обновленный код. Я всегда думал, что $s *= $i' и '$s = $s * $i', $i++ и $i-- делают одно и то же по-разному, но я ошибался .Большое спасибо за указание на это :) Теперь я изменил while vs для сценариев, и теперь у меня есть: my $now = time; мой $n = сдвиг; мой $i=2; мой $s=1; for (;$i‹=$n;$i++) { $s *=$i; } И мой $n =shift; мой $i=2; мой $s=1; в то время как ($i‹=$n){ $s *= $n; $я++; } Они похожи. Результат: пока быстрее. Я не уверен, но что-то не так с планом моего эксперимента? Я запустил ваш код, результат был медленнее. - person Mike; 21.03.2010
comment
@Mike: Я плохо понимаю, что такое остаточные проблемы. Основные моменты: (1) проблема в основном в «bigint» и (2) вполне вероятно, что остаточные различия «пока и для» скрыты глубоко в байтовом коде Perl. У меня были некоторые различия в таймингах - в основном порядка 0,1 секунды или около того, если только не выполнялось резервное копирование (TimeMachine на TimeCapsule); Я выбрал 13000 в качестве номера теста, чтобы получить достаточно большое число, чтобы получить разумное время, но не настолько большое, чтобы было неудобно запускать тесты (например, 1 час — это слишком долго). - person Jonathan Leffler; 21.03.2010
comment
Я только что попробовал код на своем MacBook Pro (3 ГГц, 4 ГБ). С 32-битным Perl время было медленнее, чем на Mac Mini (20-30 секунд вместо 12-23); с 64-битным Perl время было быстрее (7-15 секунд). И, печатая такие диапазоны, я вижу, что соотношение между лучшей и худшей производительностью составляет примерно 2: 1. Но главное отличие не в «пока» и «для». На данный момент я бы выбрал все, что вам подходит, - зная, что вычисления bigint несколько чувствительны к тому, как они написаны. - person Jonathan Leffler; 21.03.2010

Я был бы потрясен, если бы на самом деле была какая-то «реальная» разница между циклами while и for. Предполагая, что они делают «точно» одно и то же, интерпретатор должен оптимизировать их, чтобы они были более или менее идентичными.

Могу поспорить, что разница, вероятно, была не чем иным, как другими процессами, которые по-разному боролись за ресурсы во время двух выполнений.

Даже если есть разница, не увлекайтесь Грустная трагедия театра микрооптимизации.

person Morinar    schedule 20.03.2010
comment
@ Моринар, я только что закончил статью, которую ты предложил. Я понимаю, что вы делаете, спасибо. - person Mike; 20.03.2010

Одним из ключей к бенчмаркингу является упрощение. Проблема заключается в скорости for против while. Но эксперимент включает в себя несколько ненужных сложностей.

  • Две петли не так похожи, как могли бы быть. Один использует $s *= $n, а другой использует $s = $s * $i (как указывает Джонатан Леффлер). Один использует $n--, а другой использует $i++ (кто знает, отличаются ли они по скорости?).

  • Если нас интересует for против while, нет необходимости привлекать bigint. Это только запутывает тему. В частности, ваш сценарий while зависит только от одного объекта bigint ($s), тогда как ваш сценарий for использует два из них ($s и $i). Меня не удивляет, что скрипт for работает медленнее.

Перепишите свои циклы, чтобы они были как можно более похожими, делайте факториалы достаточно маленькими, чтобы вам не приходилось использовать bigint, и используйте модуль Benchmark. Затем вы можете провести честную гонку лицом к лицу for против while. Мне будет любопытно посмотреть, что вы найдете.

person FMc    schedule 20.03.2010
comment
@FM, мой эксперимент был настолько плохо спланирован, что мой вывод из результата почти не имел отношения к вопросу, который я разместил. Это был полный провал. Что ж, в любом случае спасибо, что оставили мне эти поучительные комментарии. Похоже, я всегда могу чему-то научиться у вас, ребята :) - person Mike; 21.03.2010
comment
@Майк Не будь слишком строг к себе. Бенчмаркинг дело непростое, и даже опытные программисты допускают ошибки при его настройке. Например: stackoverflow.com/ вопросы/1083269/ и stackoverflow.com/questions/1960779/. Ваш тест может быть ошибочным, но вопрос был успешным, потому что вы узнали некоторые полезные вещи. :) - person FMc; 21.03.2010