User Tools

Site Tools


단일_contig_서열의_후처리

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
단일_contig_서열의_후처리 [2016/02/18 09:18]
hyjeong [GC skew 그리기]
단일_contig_서열의_후처리 [2016/02/22 10:07] (current)
hyjeong
Line 4: Line 4:
 {{ :​circle.png?​480 |}} {{ :​circle.png?​480 |}}
 ==== 서열 말단의 overlap 검출 ==== ==== 서열 말단의 overlap 검출 ====
 +Contig 서열의 앞부분 20 kb 정도를 끊어내어 이를 query로 사용, 서열의 전체에 대해서 blastn으로 검색을 한다. 서열의 끝부분에 같은 방향으로 match가 발견되면 circular conformation을 이루는 것으로 추정할 수 있다. 그러나 단순한 repeat이 발생한 것이 아닌지 의심해 보아야 한다. 서열의 시작과 끝부분은 일반적으로 quality가 좋지 않으므로 100% identical한 alignment를 하지 못할 수도 있으니 유의해야 한다.
 ==== 서열의 전환과 일반적인 편집 ==== ==== 서열의 전환과 일반적인 편집 ====
 [[http://​emboss.sourceforge.net/​|EMBOSS package]]에는 서열의 조작을 비롯한 다양한 생명정보 분석용 프로그램이 포함되어 있다. 설치하기가 불편하면 EMBOSS server([[http://​www.bioinformatics.nl/​emboss-explorer/​|사례]]를 이용해도 된다. ​ [[http://​emboss.sourceforge.net/​|EMBOSS package]]에는 서열의 조작을 비롯한 다양한 생명정보 분석용 프로그램이 포함되어 있다. 설치하기가 불편하면 EMBOSS server([[http://​www.bioinformatics.nl/​emboss-explorer/​|사례]]를 이용해도 된다. ​
Line 21: Line 22:
   - Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다.   - Subsequence를 취하지 않고 전체를 reverse complementary sequence로 전환하려면 revseq를 사용한다.
  
 +==== Overlap 탐색의 실제 ====
 +다음은 NCBI blast+를 사용한 사례이다. [[http://​cube.univie.ac.at/​gepard|Gepard(GEnome PAir Rapid Dotter)]]도 도움이 될 것이다.
 +  $ seqret -sbegin 1 -send 20000 SB_HGAP_old.fa:​SB_hgap1_14 query.fa
 +  $ makeblastdb -in SB_HGAP_old.fa -dbtype nucl
 +  $ blastn -db SB_HGAP_old.fa -query query.fa –out blast.out
  
 ==== GC skew 그리기 ==== ==== GC skew 그리기 ====
Line 29: Line 35:
   gnuplot> plot "​gc.txt"​ using 1:3 with lines (cumulative GC skew)   gnuplot> plot "​gc.txt"​ using 1:3 with lines (cumulative GC skew)
 {{ :​skew.png?​480 |}} {{ :​skew.png?​480 |}}
- 
단일_contig_서열의_후처리.txt · Last modified: 2016/02/22 10:07 by hyjeong