Создание логотипа последовательности для последовательностей, выровненных по ДНК

Как создать логотип последовательности для выровненных последовательностей ДНК? Для данных последовательностей в книге Кевина Мерфи (глава 2, рисунок 2.5), я получаю логотип, используя эту wiki_link Я не получаю ожидаемых результатов.

Последовательности ДНК:

  1. a t a g c c g g t a c g g c a
  2. t t a g c t g c a a c c g c a
  3. t c a g c c a c t a g a g c a
  4. a t a a c c g c g a c c g c a
  5. t t a g c c g c t a a g g t a
  6. t a a g c c t c g t a c g t a
  7. t t a g c c g t t a c g g c c
  8. a t a t c c g g t a c a g t a
  9. a t a g c a g g t a c c g a a
  10. a c a t c c g t g a c g g a a

person Navjot Kaur    schedule 29.01.2018    source источник
comment
Каких результатов вы ожидали, какие результаты вы получили и как выглядит минимальный, полный, проверяемый пример вашей программы? Обратите внимание, что, несмотря на утверждение в заголовке, пример логотипа на рис. 2.5(b) этого PDF-файла явно не представляет последовательности, показанные на 2.5(a), поэтому не следует ожидать, что ваша программа создаст этот логотип. Текст также не совпадает: в нем говорится, что столбец 7 состоит из G, но на самом деле этот столбец содержит T. По-видимому, это известная ошибка в книге. См. cs.ubc.ca/~murphyk/MLbook/errata.html для большего количества ошибок.   -  person ottomeister    schedule 30.01.2018
comment
Я вычислил размер символа на основе относительной частоты. Например, 5-я последовательность имеет C с полной вероятностью, и, следовательно, соответствующий символ должен быть большим логотипом C в последовательности. Точно так же 13-я позиция будет большой G. Но не 7-й символ. Спасибо, что поделились ссылкой на ошибку. :)   -  person Navjot Kaur    schedule 30.01.2018


Ответы (2)


Если вам нужно разрабатывать собственную версию:

Для решения этой проблемы есть библиотека python.

https://pypi.python.org/pypi/weblogo

или веб-версия

http://weblogo.berkeley.edu/logo.cgi

person Colin Anthony    schedule 07.03.2018

Вы можете сделать это, используя weblogo, как было добавлено выше, вот небольшой код, чтобы сделать это в python.

from Bio.Seq import Seq
from Bio import motifs
instances = df['binding'] #just input the list of DNA sequences 
m = motifs.create(instances)
m.weblogo('logo.png')

Здесь вы должны предоставить экземпляры в виде списка последовательностей ДНК, и результат будет сохранен как logo.png, или вы можете изменить png на jpeg или tiff, как хотите.

person Kay    schedule 04.06.2019