User Tools

Site Tools


ont_sequencing_data_analysis

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
ont_sequencing_data_analysis [2019/03/18 12:45]
hyjeong [Data analysis for Oxford Nanopore sequencing]
ont_sequencing_data_analysis [2019/09/17 13:34] (current)
hyjeong [QC using poretools]
Line 3: Line 3:
   * MinION Mk1B (product code MIN-101B)   * MinION Mk1B (product code MIN-101B)
   * Flow cell: Spot-On Flow cell MkI (product code FLO-MIN106 R9)   * Flow cell: Spot-On Flow cell MkI (product code FLO-MIN106 R9)
-  * 구동용 컴퓨터 I: Xeon E5520 @2.27, 16 GB memory, Ubuntu 14.04.5 LTS +  * 구동용 컴퓨터 I: Xeon E5520 @2.27, 16 GB memory, Ubuntu 14.04.5 LTS. (uname -a 명령 시 4.4.0-134-generic #160~14.04.1-Ubuntu). USB 3.0 인터페이스 카드는 Via 805를 사용한 ipTIME PX300 Plus) MinKNOW v2.0.0으로 잘 동작. 
-  * 구동용 컴퓨터 II:+  * 구동용 컴퓨터 II: microbe server(Xeon E5-2640 x 2, SuperMicro X9DRI-F)에 같은 OS와 카드를 설치하였으나 인식이 되지 않음. /etc/default/grub 파일에서 GRUB_CMDLINE_LINUX를 다음과 같이 변경하고 sudo update-grub을 한 뒤 재부팅을 하면 된다고 하였으나([[https://bugzilla.redhat.com/show_bug.cgi?id=1376455|참고 1]] [[https://askubuntu.com/questions/812372/usb-3-0-express-card|참고 2]]) 여전히 여기에 꽂힌 USB 장비를 읽지 못함. 그러나 USB 3.0 카드를 다른 위치에 꽂으니 정상 작동함. 세상에 이럴 수가... 
 + 
 +  GRUB_CMDLINE_LINUX="iommu=soft" 
 +  GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pciehp.pciehp_force=1" 
 + 
 +EPI2ME에서는 더 이상 basecall을 진행하지 않으므로 Albacore를 설치하여 local basecalling을 하라는 고객 센터의 알림이 있었다. 단, MinKNOW 설정 창의 Basecalling(Live or None 중에 선택)에서 나타나는 Live basecalling은 Albacore를 뜻하는 것이 아니라 1D  sequencing protocol을 위해 내장된 것이다. 파이썬 2.7과 3.5(Albacore)를 번갈아 이용해야 하므로 pyenv를 활용하는 것을 권장한다. 혹은 anaconda도 좋다. 
 +===== 새로 시작하기 ===== 
 +이 글은 2019년 5월 2일부터 작성하기 시작한다. 다음 섹션(처음에 해야 할 것) 이후의 글은 더 이상 유효하지 않다. MinKNOW를 이용하면 albacore를 별도로 설치하지 않아도 basecalling이 진행되고, 새로운 pomoxis에서는 wrapper script가 많은 것을 알아서 진행한다. 
 +==== Best long read mapper? ==== 
 +한동안 BWA-mem이 널리 쓰여 왔으나, 이제는 pomoxis에 포함되어 있는 minimap2가 최선인 것으로 보인다([[https://lh3.github.io/2018/04/02/minimap2-and-the-future-of-bwa|참고 글]]
  
-EPI2ME에서는 더 이상 basecall을 진행하지 않으므로 Albacore를 설치하여 local basecalling을 하라는 고객 센터의 알림이 있었다. 단, MinKNOW 설정 창의 Basecalling(Live or None 중에 선택)에서 나타나는 Live basecalling은 Albacore를 뜻하는 것이 아니라 1D  sequencing protocol을 위해 내장된 것이다. 파이썬 2.7과 3.5(Albacore)를 번갈아 이용해야 하므로 pyenv를 활용하는 것을 권장한다. 
 ===== 처음에 해야 할 것 ===== ===== 처음에 해야 할 것 =====
 ==== 프로그램 설치 ==== ==== 프로그램 설치 ====
Line 34: Line 42:
 만약 ONT cloud에서 basecall을 했다면(즉 Metrichor를 이용했다면) 업로드된 fast5 파일은 처리를 거쳐서 pass와 fail 디렉토리로 나뉘어 다운로드된다. pass에는 바코드에 의해 성공적으로 분리되고 사전에 정의된 threshold를 넘는 mean base quality score를 넘는 read들이 쌓인다. 만약 ONT cloud에서 basecall을 했다면(즉 Metrichor를 이용했다면) 업로드된 fast5 파일은 처리를 거쳐서 pass와 fail 디렉토리로 나뉘어 다운로드된다. pass에는 바코드에 의해 성공적으로 분리되고 사전에 정의된 threshold를 넘는 mean base quality score를 넘는 read들이 쌓인다.
 ===== QC using poretools ===== ===== QC using poretools =====
-[[https://poretools.readthedocs.io/en/latest/|portools]]를 사용하려면 basecall 정보가 담긴 fast5이 필요하므로, MinKNOW가 생성한 fast5 파일을 그대로 사용하면 안된다. 아래에서 설명한 바와 같이 Albacore를 사용하여 basecall을 한 fast5 파일을 먼저 만들도록 한다. 처음에는 이와 같은 사실을 몰라서 왜 첫 러닝한 fast5에 아무런 정보가 없는 것일까하고 무척 고민을 많이 하였다.+[[https://poretools.readthedocs.io/en/latest/|poretools]]를 사용하려면 basecall 정보가 담긴 fast5이 필요하므로, MinKNOW가 생성한 fast5 파일을 그대로 사용하면 안된다. 아래에서 설명한 바와 같이 Albacore를 사용하여 basecall을 한 fast5 파일을 먼저 만들도록 한다. 처음에는 이와 같은 사실을 몰라서 왜 첫 러닝한 fast5에 아무런 정보가 없는 것일까하고 무척 고민을 많이 하였다.
  
 poretools에서는 유용한 diagnostic plot을 만들어내는 기능이 있다. 그러나 십중팔구 다음과 같은 에러 메시지가 나올 가능성이 크다. 참고로 Tkinter는 파이썬 모듈, _tkinter는 C 모듈이다. poretools에서는 유용한 diagnostic plot을 만들어내는 기능이 있다. 그러나 십중팔구 다음과 같은 에러 메시지가 나올 가능성이 크다. 참고로 Tkinter는 파이썬 모듈, _tkinter는 C 모듈이다.
ont_sequencing_data_analysis.1552880737.txt.gz · Last modified: 2019/03/18 12:45 by hyjeong