Вы когда-нибудь экспортировали чат WhatsApp в виде текстового файла только для того, чтобы понять, что это беспорядок из временных меток и имен отправителей, которые затрудняют анализ? Ну, не бойся! Эта программа Python здесь, чтобы спасти положение. В этой статье мы рассмотрим, как использовать эту программу для очистки стенограмм чата WhatsApp.
WhatsApp Transcript Cleaner — это программа на Python, предназначенная для очистки расшифровок чатов WhatsApp, экспортированных в виде текстовых файлов. Программа предлагает три варианта:
- Удалите метку времени и имя отправителя.
- Удалить только метку времени
- Выберите, что делать с каждым отдельным файлом (вариант 1 или вариант 2)
С помощью этой программы вы можете быстро и легко очистить сразу несколько расшифровок чата WhatsApp, сэкономив ваше время и усилия.
Вот ссылка на репозиторий Github: WhatsApp Transcript Cleaner
Начиная
Чтобы начать работу с WhatsApp Transcript Cleaner, убедитесь, что на вашем компьютере установлен Python 3. Если у вас его нет, вы можете скачать его с официального сайта.
После установки Python вы можете выполнить следующие шаги, чтобы запустить WhatsApp Transcript Cleaner:
ШАГ 1.Клонируйте репозиторий на свой локальный компьютер.
ШАГ 2.Экспортируйте чаты WhatsApp, которые вы хотите очистить, в виде текстовых файлов. Каждый чат должен быть сохранен в отдельный текстовый файл. Инструкции по экспорту чата см. в этой статье поддержки WhatsApp.
ШАГ 3.Поместите все экспортированные текстовые файлы в тот же каталог, что и репозиторий. Убедитесь, что в каталоге нет других текстовых файлов, которые вы не хотите очищать.
ШАГ 4.Откройте окно терминала и перейдите в каталог, в который вы клонировали репозиторий.
ШАГ 5.Запустите программу с помощью следующей команды:
python whatsapp_transcript_cleaner.py
Следуйте инструкциям на экране, чтобы выбрать параметр, который вы хотите использовать для каждого файла чата.
Как это работает
WhatsApp Transcript Cleaner использует библиотеки Python os
и open
для чтения и изменения текстовых файлов. Когда вы запускаете программу, она предлагает вам три варианта:
- Массовое удаление метки времени и имени отправителя
Этот параметр удаляет как временную метку, так и имя отправителя из каждой строки стенограммы чата. Во-первых, программа создает новый каталог с именем Modified_Files
, используя функцию os.makedirs()
, которая принимает аргумент exist_ok=True
, чтобы избежать возникновения ошибки, если каталог уже существует.
Чтобы удалить метку времени и имя отправителя, программа использует цикл for
для повторения каждой строки текстового файла. Затем он использует еще один цикл for
для перебора каждого символа в строке, пока не найдет третий символ двоеточия :
. Этот символ отмечает конец имени отправителя и метки времени, поэтому программа удаляет все до него и сохраняет очищенную строку в выходном файле.
2. Массовое удаление только метки времени
Эта опция удаляет только метку времени из каждой строки стенограммы чата, оставляя имя отправителя нетронутым, она создает папку Modified_Files
так же, как и в первом варианте.
Здесь вместо поиска третьего символа двоеточия программа просто удаляет из каждой строки первые 23 символа, соответствующие метке времени, а затем удаляет пробелы для учета меток времени различной длины.
3. Выберите, что делать с каждым отдельным файлом (вариант 1 или вариант 2)
Когда пользователь выбирает вариант 3 в программе, ему предоставляется возможность обработки файла за файлом.
Он создает папку Modified_Files
, как и в предыдущих вариантах, затем программа ищет все текстовые файлы в текущем рабочем каталоге, а затем продолжает циклически просматривать их один за другим. Для каждого файла, используя простой цикл, программа отображает имя файла и предлагает пользователю выбрать между вариантами 1 и 2 для этого конкретного файла.
Содействие
Вклад приветствуется. Если у вас есть какие-либо отчеты об ошибках, запросы функций или улучшения кода, отправьте их как проблемы или запросы на включение на GitHub.