сравнить 4 или более файлов

Есть ли утилита командной строки или скрипт php/py, который будет генерировать html diff, чтобы можно было сравнить несколько файлов, чтобы сравнить 4 или более файлов.

Каждый из моих файлов имеет максимум 10 тыс. строк каждый.

Примечание: эти файлы являются обычными текстовыми файлами. не хтмл. Содержат только A-Za-z0-9=., . и никаких HTML-тегов


person Sairam    schedule 11.11.2010    source источник
comment
stackoverflow.com/ вопросы/86905/   -  person ArK    schedule 11.11.2010
comment
вопрос был в том, чтобы сравнить 2 html файла. Я сравниваю простые текстовые файлы здесь   -  person Sairam    schedule 11.11.2010
comment
хороший вопрос, но вывод HTML нечитаемый? сравнение 2 файлов немного менее запутанно, простой способ diff A B > /tmp/diff.a.b; diff A C > /tmp/diff.a.c; diff A D > /tmp/diff.a.d; cat /tmp/diff.a.*; вы можете позже украсить его с помощью HTML, не совсем то, что вы хотите, может быть, просто попытка ошибки   -  person ajreal    schedule 11.11.2010


Ответы (1)


Это зависит от того, какой тип данных вы сравниваете/анализируете.

Основное решение

  • file_get_contents дает вам строки данных файла
  • strcmp выполнит «безопасное бинарное сравнение» данных

Вы, вероятно, захотите explode() свои данные, чтобы как-то разграничить их и сравнить разделы данных.

Другой вариант - разграничить, перебрать и сделать «коэффициент сравнения», который укажет, в какой степени файлы отклоняются от нормы. Например, в файле 1 копия=3, в файле 4 копия=8. Файл 4 будет более близким совпадением.

Последняя проблема, с которой вы столкнетесь, — это ограничение памяти на сервере. Вы можете изменить это в php.ini.

//РЕДАКТИРОВАТЬ

Только что заметил тег diff, но я все равно оставлю это, если это как-то поможет.

person Ben    schedule 11.11.2010