오믹스 분석 및 건강성 평가 기법 가이드라인

수생태계 건강성 평가를 위한 미생물 메타지노믹스(Metagenomics) 가이드라인

  • Step. 01

    현장 수체시료 여과

  • Step. 02

    DNA 추출 및 정제

  • Step. 03

    라이브러리 제작

  • Step. 04

    염기서열 분석

    (Sequencing)

  • Step. 05

    데이터 분석

  • Step. 06

    건강성 예측

Step. 01

현장 수체시료 여과

  • (1)

    표층수 채수

  • (2)

    25 µm 체로 부유물·모래 제거

  • (3)

    여과 : 0.22 µm S-Pak® mixed cellulose ester (MCE) membrane filter (Millipore) 사용
    채수량은 현장의 탁도를 고려하여 조정 (100-500 mL)

  • (4)

    여과지는 튜브에 담아 드라이아이스에 고정

  • (5)

    시료는 드라이아이스가 있는 아이스박스로 운반하고 영하 80℃ 딥프리저에 보관

Step. 02

DNA 추출 및 정제

Use ChargeSwitch®  Forensic DNA Purification Kit (InvitrogenTM)

  • (1)

    시료 용해(Lyse sample)

  • (2)

    DNA를 ChargeSwith® 자성 비드(magnetic beads)에 결합

  • (3)

    DNA가 결합된 비드를 세척하여 오염물 제거

  • (4)

    비드에서 DNA 용출

자세한 내용은 링크를 통해 참고하세요.

Step. 03

라이브러리 제작 (증폭 및 정제)

  • (1)

    Amplicon PCR (박테리아 16S rRNA V3-V4 영역)
    341F: CCTACGGGNGGCWGCAG
    805R: GACTACHVGGGTATCTAATCC

  • (2)

    PCR 정제

  • (3)

    Index PCR (FC‐131‐1001 or FC‐131‐1002)
    Nextera XT Index 1 Primers (N7XX)
    Nextera XT Index 2 Primers (S5XX)

  • (4)

    PCR 정제 2차

  • (5)

    라이브러리 정량화(quantification), 정규화(normalization), 그리고 풀링(pooling)

자세한 내용은 링크를 통해 참고하세요.

Step. 04

염기서열 분석(Sequencing)

Illumina MiSeq, 2×300 bp 플랫폼 이용

  • (1)

    라이브러리 검증

  • (2)

    라이브러리 변성(Denaturing)

  • (3)

    MiSeq 샘플 로딩

  • (4)

    Raw FASTQ (R1, R2) 확보

Step. 05

데이터 분석

1. DADA2 파이프라인

  • (1)

    FASTQ 파일의 리드(read) 품질 프로파일 검사

  • (2)

    필터링 및 트리밍
    데이터에 따라 조정(R1: 270~290, R2: 210~240)

  • (3)

    오류율 학습

  • (4)

    양방향으로 읽은 리드 병합(겹침≥20–30 bp 권장)

  • (5)

    키메라(Chimera) 제거

  • (6)

    서열에 분류학적 정보 부여 (SILVA v138.1)

  • (7)

    결과 저장 및 병합

자세한 내용은 링크를 통해 참고하세요.

 2. 노이즈 데이터 제거 (remove noise data)

 3. 정규화 (Total sum scaling, 100%)

Step. 06

건강성 예측

1. 선별된 바이오마커 67개 균주에 대한 상대풍부도 값 정렬

  • (1)

    선별된 바이오마커 67개 균주(ASV)의 시퀀스와 매칭되는 데이터 정렬

  • (2)

    67개 균주의 상대풍부도 값으로 구성된 모델 및 테스트 데이터셋 확보

  • 마커정보는 링크를 통해 확인하세요.

2. 랜덤 포레스트(Random Forest) 예측 모델 구동

  • (1)

    패키지 설치 및 불러오기

  • (2)

    모델 데이터셋 불러오기

  • (3)

    데이터 증강

  • (4)

    훈련 및 테스트(Internal test) 데이터 분할

  • (5)

    하이퍼파라미터 튜닝 설정

  • (6)

    모델 학습

  • (7)

    테스트할 데이터셋 불러오기(External test)

  • (8)

    건강성 점수 예측

  • (9)

    건강성 점수를 등급으로 변환

Copyright © 2025 오믹스 Corp. All Right Reserved.