User Tools

Site Tools


cmg-biotools의_활용

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
cmg-biotools의_활용 [2018/03/12 17:41]
hyjeong [공유 폴더]
cmg-biotools의_활용 [2018/03/12 17:41] (current)
hyjeong [공유 폴더]
Line 1: Line 1:
 +====== CMG-biotools 기능 실습 ======
 +===== 개요 =====
 +VirtualBox 환경에서 [[http://​www.cbs.dtu.dk/​biotools/​CMGtools/​|CMG-biotools]] 가상머신을 켠 후 바탕화면에서 마우스 오른쪽 버튼을 클릭하여('​Open Terminal Here') 터미널창을 띄운 뒤 다음에 소개하는 명령어를 입력하여 실습을 진행한다. CMG-biotools의 명령어(스크립트)들은 /​usr/​biotools에 있으니 필요하다면 다른 리눅스 시스템에 복사하여 사용해도 된다.
 +===== GenBanke에서 파일 받기 =====
 +  $ gbk_get -a CP001509 > file.gbk
 +  ​
 +===== GenBank file에서 organism name 추출하기 =====
 +  $ gbk_ExtractName file.gbk (organism name을 파일명으로 하는 새로운 GenBank file 생성)
 +  ​
 +===== GenBank file에서 염기서열 출력하기 =====
 +  $ saco_convert –I genbank –O fasta file.gbk > file.fa
 +
 +===== GenBank file에서 유전자(nt)/​아미노산 서열 출력하기 =====
 +  $ gbk_ExtractGeneProt file.gbk (.fna, .fsa 생성)
 +
 +===== Prodigal을 이용한 유전자 예측하기 =====
 +  $ prodigalrunner file.fa (.gff, .gbk, .fna, .fsa 생성)
 +
 +===== Genome 기본 특성 구하기(크기,​ %GC 등의 정보를 화면으로 출력) =====
 +  $ stats_genomeDNA file.fa
 +
 +===== Genome atlast 그리기 =====
 +  $ atlas_createConfig –ref file.gbk
 +  $ atlas –f file.gbk –c file.gbk.atlas.cf –o file.gbk.atlas.ps
 +  $ evince file.gbk.atlas.ps
 +  ​
 +===== rRNA gene 찾기 =====
 +  $ rnamer –S bac –m ssu –f file.rrna file.fa (ssu for 5/8S, lsu 23/28S)
 +  ​
 +===== 5종의 대장균 유전체 서열을 이용한 BLAST atlas 그리기(가상머신에서는 장시간 소요) =====
 +  $ gbk_get -a NC_000913 > K-12.gbk
 +  $ gbk_get -a CP001509 > BL21_DE3.gbk
 +  $ gbk_get -a NC_002695 > O157_H7.gbk
 +  $ gbk_get -a NC_011750 > IAI39.gbk
 +  $ gbk_get NC_017634 > O83_H1.gbk
 +  $ fox x in *gbk
 +  > do
 +  > gbk_ExtractGeneProt $x
 +  > done
 +  $ atlas_createConfig -ref K-12.gbk (K-12를 reference로 설정)
 +  $ atlas_addBlastlane -f K-12.gbk.fsa -c K-12.gbk.atlas.cf -col 000090 -name K-12 (.cf 파일에 blast lane 추가)
 +  $ atlas_addBlastlane -f BL21_DE3.fsa -c K-12.gbk.atlas.cf -col 009000 -name BL21_DE3
 +  $ atlas_addBlastlane -f IAI38.gbk.fsa -c K-12.gbk.atlas.cf -col 900000 -name IAI38
 +  $ atlas_addBlastlane -f O157_H7.gbk.fsa -c K-12.gbk.atlas.cf -col 000050 -name O157_H7
 +  $ atlas_addBlastlane -f O83_H1.gbk.fsa -c K-12.gbk.atlas.cf -col 005000 -name O83_H1
 +  $ atlas -f K-12.gbk -c K-12.gbk.atlas.cf -o K-12.gbk.blastatlas.ps
 +  $ evince K-12.gbk.blastatlas.ps
 +  ​
 +===== BLAST matrix 그리기(가상머신에서는 장시간 소요) =====
 +  $ mkdir blastmatrix
 +  $ cp *fsa blastmatrix
 +  $ cd blastmatrix
 +  $ matrix_createConfig > matrix.xml (표시되는 텍스트를 바꾸려면 .xml을 수정)
 +  $ matrix -cpu 5 matrix.xml > blastmatrix.ps
 +  $ evince blastmatrix.ps
 +
 +===== 참고자료 =====
 +리눅스 가상머신 환경에서 일루미나 read를 이용한 de novo assembly부터 genome annotation까지를 실행할 수 있는 [[http://​www.sciencedirect.com/​science/​article/​pii/​S0167701215001207|MyPro]]가 최근 발표되었다. 이 시스템에서는 복수의 de novo assembler를 실행하여 얻은 결과를 [[http://​journals.plos.org/​plosone/​article?​id=10.1371/​journal.pone.0060843|CISA contig integrator]]로 통합하여 최적의 결과를 만들어내는 것이 특징이다. 리눅스만을 할당하여 돌릴 하드웨어가 마련되지 않은 상황이라면,​ 이러한 가상머신을 적극적으로 활용하는 것도 좋은 대안이 될 것이다. MyPro의 활용에 관란 문서는 [[MyPro 활용하기|여기]]를 참조하라.
 +
 +====== Bio-Linux 기능 실습 ======
 +  * 웹사이트:​ http://​environmentalomics.org/​bio-linux/​ (latest: version 8, released July 2014)
 +  * 설치 방법: http://​environmentalomics.org/​bio-linux-installation/​ (.ova file로 설치하는 경우 ID와 password는 전부 manager이다)
 +
 +===== 설정 =====
 +==== 일반 ====
 +클립보드 공유를 '​양방향'​으로 세팅한다(설정->​일반->​고급)
 +==== 공유 폴더 ====
 +게스트 확장을 먼저 설치해야 한다.
 +{{ :​공유폴더_bio-linux.png?​400 |}}
 +자동 마운트를 설정하였으므로 이미 /​media/​sf_vbox에 마운트된 상태이다. CMG-biotools와는 무엇이 다른지 알아보라.
 +  manager@bl8vbox[manager] df                                           [ 8:41AM]
 +  Filesystem ​    ​1K-blocks ​     Used Available Use% Mounted on
 +  /​dev/​sda1 ​      ​98595436 ​  ​9176352 ​ 84387612 ​ 10% /
 +  none                   ​4 ​        ​0 ​        ​4 ​  0% /​sys/​fs/​cgroup
 +  udev             ​1014168 ​        ​4 ​  ​1014164 ​  1% /dev
 +  tmpfs             ​204992 ​      ​816 ​   204176 ​  1% /run
 +  none                5120         ​0 ​     5120   0% /run/lock
 +  none             ​1024956 ​       76   ​1024880 ​  1% /run/shm
 +  none              102400 ​       52    102348 ​  1% /run/user
 +  vbox           ​488283156 247657740 240625416 ​ 51% /​media/​sf_vbox
  
cmg-biotools의_활용.txt · Last modified: 2018/03/12 17:41 by hyjeong