У меня есть каталог с несколькими сотнями файлов multi-FASTA. Эти файлы называются по названию вида или рода, например:
Bubo_bubo.fasta
Poa_CC7849.fasta
Homo_sapiens.fasta
...
Внутри каждого файла заголовки автоматически генерируются ассемблером Trinity и выглядят примерно так:
>c5_g1_i1 len=168 path=[174:0-148 24:148-168]
Я хотел бы переименовать заголовки в каждом из этих файлов, добавив информацию о видах, из которых он исходит. Другими словами, заголовок должен содержать в начале имя файла. Например, если заголовок выше исходит от Bubo_bubo.fasta
, он должен выглядеть так:
>Bubu_bubo_c5_g1_i1 len=168 path=[174:0-148 24:148-168]
Итак, я хочу написать цикл, который будет принимать имя файла и использовать его для добавления этой информации в каждый заголовок fasta в этом конкретном файле, и я хочу сделать это для всех файлов в каталоге.
>
в начале строки. Содержимое строки может быть любым. В каждом файле будет несколько заголовков. Строки, следующие за заголовком, обычно представляют собой последовательность символов, представляющих некоторые биологические данные. - person kvantour   schedule 10.12.2018