User Tools

Site Tools


Sidebar

This is the sidebar. Without it, the main text is too wide!

bioinfo

Bioinformatics Resources

일러두기

이 사이트에는 새롭게 작성하거나 업데이트된 글들의 현황을 첫머리에 보여주는 기능이 없습니다. 블로그처럼 최신 글이 가장 처음에 나타나지도 않습니다. 따라서 특정 주제의 글을 찾으려면 오른쪽 위의 검색창, 오른쪽의 목차, 또는 사이트맵 기능을 사용하시기 바랍니다. 호스팅 사이트라서 본 사이트 내의 위키 페이지는 구글에서 검색이 되지도 않습니다. 이를 어떻게 해결할지에 대해서는 고민하는 중입니다. 생명정보학(주로 미생물 유전체의 해독과 분석)과 관련한 주요 글은 이 위키 사이트보다 오히려 제 개인 블로그에 더 많은 것이 현실입니다. 차라리 생명정보학에 관한 글은 블로그에 지속적으로 작성하되, 이 위키사이트에는 별도의 페이지를 만들어서 블로그에 올렸던 글의 제목과 링크를 게시하는 것을 심각하게 고려하고 있습니다. — Haeyoung Jeong 2017/10/12 08:23


Main topic list

생명정보학 카테고리가 확정되면 왼쪽의 사이드바로 옮겨갈 수도 있음. 각 주제마다 별도의 페이지를 만들고, 그 내부에는 이 위키 내부에 작성된 페이지 및 외부의 링크를 수록함.


외부 생명정보학 교육 프로그램 참여 기록

2018 PacBio User Group Meeting in Seoul

“Completing and polishing prokaryotic genome assemblies using PacBio long-read sequencing technology”라는 제목으로 발표를 하였다. 발표 자료(축약본) 발표자료 PDF도 나중에 업로드할것.

2017 4th Cho & Kim Genomics, 미래BIT융합교육사업단 공동주최 Bioinformatics Analysis Workshop

2일차 교육 주제인 비교유전체학 기반 종간 진화 분석에 흥미가 느껴져서 수강생 신분으로 참석하였다. 실습용 프로그램과 자료를 VirtualBox 가상머신(.ova)에 담아서 USB 플래시 드라이브로 제공하여 편의를 더하였다. 그러나 내가 가져간 노트북 컴퓨터는 보안 프로그램이 설치된 상태여서 외부의 USB 드라이브를 전혀 인식하지 못하였다. 정확히 말하자면 연구원 내 네트웍을 통해서 보안 정책을 받을 수 없는 상황이어서 아예 불능 상태가 된 것이었다. 다행스럽게도 주최측에서 노트북 컴퓨터를 대여해 주어서 무사히 실습을 마칠 수 있었다.

본 교육 과정에서 제공한 분석용 스크립트는 재사용 가치가 매우 높은 것이라서 실제로 내 시스템에서 복습을 한 뒤 정리하여 본 위키 페이지에 올렸다. 이번 교육 과정에서 다루어진 주제는 다음과 같다. 실습 환경을 가상머신으로 제공하였기에 프로그램의 설치에 대해서는 다루어지지 않았다.

  1. Genome resequencing analysis: bowtie2, Picard tools, GATK, SnpEff
  2. Transcriptome analysis: generalized linear model에 대한 소개, edgeR
  3. dN/dS를 이용한 종간 관계 분석: PAML, TAAS
  4. 이외에도 Cho & Kim Genomics에서 개발한 Bio Analysis Pro(BAP) server에 대한 소개도 있었다.

가상머신의 로그인 화면. 암호는 '1234'이다.

KOBIC 차세대 생명정보학 교육 프로그램

국가생명연구자원정보센터(KOBIC)에서는 Next-Generation Sequencing에 기반한 차세대 생명정보학 분야의 저변 확대를 위해 교육 워크샵을 실시하고 있다. 특히 제22차 교육 워크샵(2014년 10월)부터는 생명정보 컨설팅 전문기업인 (주)인실리코젠과 공동으로 프로그램이 진행되는 중이다. 참가자들의 편의를 위하여 28차(2015년 10월)과 30차(2016년 2월)에 열린 미생물 유전체 및 대사회로 분석 강좌의 실습 자료를 이곳에 공개한다. 30차 교육은 정원 제한에 의해 28차 교육에 참여하지 못한 신청자들을 위한 재교육으로서 강의 및 실습 내용은 거의 동일하다.

KOBIC 교육 지원 관련 사이트

이 페이지(30회 교육)에서 소개하는 것은 미생물 유전체 de novo assemby 및 후속 분석 기법 중 극히 일부에 불과하다. 강좌에서 미처 다루지 못한 심화적인 내용과 계속 발전 중에 있는 최신 기법으로 계속 업데이트해 나갈 것이다. 또한 앞으로 강사 혹은 수강생으로 본 교육 과정에 참여한 기록을 여기에 남길 예정이다.

제30회 2일차 교육(2016.2)

제33회 교육("데이터 과학을 위한 파이썬 기초" - 수강생으로 참석, 2016.10)

제37회 교육(R을 이용한 데이터 통계 분석 및 시각화 - 수강생으로 참석)

  • 일시 및 장소: 2017년 11월 30일-12월 1일, KT인재개발원(대전)
  • 강사: 인하대학교 통계학과 유동현 교수
  • R Studio를 이용한 통합 개발 환경 소개, 데이터 구조, 시각화 등을 실습함

미생물 유전체의 성공적인 de novo assembly를 위한 제안(Illumina)

미생물 유전체 해독의 기술적인 측면을 다룬 나의 최초의 논문은 An optimized strategy for genome assembly of Sanger/pyrosequencing hybrid data using available software (Genomics Inform 2008)이다. 당시는 최초의 차세대 유전체 해독기법인 Roche/454 pyrosequencing이 인기를 끌기 시작하던 시절이었다. Sanger data를 phred/phrap/consed에서 주무르던 것에 익숙했던 나에게 NGS는 새로운 도전이 되었다. 21C프론티어 미생물유전체활용기술개발사업단이 실질적으로 주도하였던 한국 미생물유전체 연구의 역사는 Recent progress of microbial genome projects in Korea (Biotechnol J 2008)에 발표하였다.

바야흐로 NGS 기술은 single molecule에서 실시간 서열 정보 획득을 실현한 3세대로 전환되었으며, One SMRT cell, one contig의 시대가 도래하였다. 이제는 미생물 유전체 해독을 하면서 더 이상 contig나 N50의 개념을 설명할 필요조차 없게 되었다. 이러한 과도기적인 입장에서 PacBio와 “재래식” NGS(2세대) 기법을 버무려서 최적의 미생물 유전체 해독을 하는 방법에 관한 논문 Toward Complete Bacterial Genome Sequencing Through the Combined Use of Multiple Next-Generation Sequencing Platforms (J Microbiol Biotechno 2016l)을 냈었다. 앞으로는 deep metagenomic sequencing 말고는 일루미나 데이터를 처리하는 기술의 발전이 더 진전될 것 같지도 않다. 그러나 과거에 생산한 데이터(당시에는 assembly 결과가 좋지 않아서 묻어둔 것들을 포함하여)를 계속 새로운 시각으로 재평가하는 일은 여전히 필요하다. 이러한 노력의 일환으로 일루미나 어셈블리가 실패하는 가장 중요한 요인 중 하나는 오염이며, k-mer analysis & filtering을 통해서 일부 개선이 가능하다는 논문인 Contamination as a major factor in poor Illumina assembly of microbial isolate genomes (bioRxiv 2016)을 발표하였다.

이 페이지에서는 일루미나 시퀀싱 데이터를 이용하여 최적의 미생물 유전체 서열을 조립하기 위한 방법을 기술하고자 한다. 링크

제2회 KOBIC 생명정보 분석 활용 워크샵

Lake Arrowhead 2016 meeting

10 년 만에 다시 찾은 Lake Arrowhead Microbial Genomic Conference는 genomics에서 metagenomics를 거쳐서 이제는 완전히 microbiome으로 변모해 있었다. 상세한 출장 내역은 보고서에 정리하였다. 이 학술행사에서 얻은 가장 중요한 성과는 미생물 유전체 분석을 위한 최신 기법(소프트웨어 및 데이터베이스)을 접할 수 있었다는 것이다. 이에 설명을 곁들인 간단한 목록을 소개하고자 한다. 추억의 사진 두 장과 함께.

  • MyTaxa: assign taxonomy to metagenomic fragments
  • The enveomics collection: a toolbox for specialized analysis of microbial genomes and metagenomes
  • iRep: in situ replication rates for uncultivated bacteria in microbial communities
  • MIDAS: an integrated pipeline for estimating strain-level genomic variation from metagenomic data
  • ggKbase
  • metawatt: metagenomic reads binner
  • STAMP: statistical analysis of taxonomic and functional profiles
  • MinHASH 알고리즘에 의한 long read assembler와 기타 도구
  • Pilon: automated assembly improvement and variant calling
  • ReaPepPipe: reference-guided assembler

FEMS 2017

유럽의 미생물학 관련 학술단체로 구성된 FEMS(Federation of European Microbiological Societies)는 매 2년을 주기로 개최된다. 2015년 네덜란드 마스트리히트에 이어서 2017년 대회는 스페인의 발렌시아에서 개최되었다. 포스터 발표를 겸하여 참석한 이번 학술대회에서는 항생제 내성, 메타지노믹스 등 소속 부서에서 중점적으로 다르는 연구 분야의 최신 동향을 파악하는데 특히 중점을 두었다. 상세한 참가 기록은 출장보고서를 참조할 것.

Lake Arrowhead Microbial Genomics (LAMG) 2018 meeting

2018년 LAMG는 9월 16일부터 20일까지 개최되었다. 다제내성 Acinetobacter baumannii의 비교유전체학적 분석에 관한 포스터를 발표하였다.

기타 외부 자료들

bioinfo.txt · Last modified: 2018/11/09 19:10 by hyjeong