• Taiwan BioBank 宗旨
  • 臺灣人體生物資料庫成立目的是結合生活習慣、環境因子與生物標誌等資訊, 建立屬於臺灣本土的人體生物資料庫,為生物醫學研究蒐集龐大的生物檢體與健康資訊,提供國內各領域的研究學者申請使用。

    自2003年全世界第一例全基體定序結果公佈後,全世界的生物醫學研究藉由這結果有了大規模的進步。 而臺灣人體生物資料庫希望透過建立全基因體相關資料,協助生物醫學研究學者找出對抗疾病的發生,進展和治療上的線索,促進國人未來的健康。

    本資料庫採用全基因體定型與全基因體掃描兩個策略建立基因體資料,資料之釋出將去除身份識別資訊, 以確保達到保護參與者隱私權益,提供各領域的研究學者申請使用,進行描述性分析,作為基因醫學研究的基礎,以建立研究之初步假說。

    【全基因體定序】

    本資料庫同時選用Ion Proton與Illumina平台,透過血液中萃取的DNA檢體進行次世代全基因體的定序, 將會有助於全面性的了解臺灣國民基因遺傳變異以及在基因層次上健康與疾病的關係,將為國內生物醫學研究上帶來幾點助益:

    • 1. 建立臺灣自己的參考序列
    • 2. 為臺灣建立健康對照組的序列資訊
    • 3. 作為基因填補法(genetic imputation)的模板,增加研究效益
    • 4. 提供台灣健康族群低頻率變異(rare allele)分布情形
    • 5. 有助於發展全基因體關聯性研究(genome-wide association study)

    Ion Proton

    利用Thermo Fisher Scientific公司Ion Proton質子流桌上型定序儀進行全基因體定序, 其原理是利用DNA合成反應時所釋放出的氫離子造成的電位差改變,呈現在半導體晶片上做即時的偵測與數據分析。 當核酸試劑 (A、 T、 C、 G)通過流體通路,進入Ion Proton半導體晶片中,密布於晶片上的微反應孔立即成為上億個微反應器。 利用獨特的流體體系和半導體技術的組合, 使得Ion Torrent有簡單、經濟及快速的特性。

    Illumina

    利用Illumina公司Hiseq平台,其原理為利用獨特的定序化學sequencing by synthesis(SBS),在鹼基延伸過程中, 每個迴圈反應延伸一個正確亙補的鹼基,根據不同的螢光信號確認鹼基種類,保證最終的核酸序列品質,以及其免PCR的樣品製備技術, 可達到最佳準確度。

    【全基因體定型】

    • TWB
      基因型鑑定採用Thermo Fisher Scientific公司所研發之Axiom Genome-Wide Array Plate技術平台,以Axiom Genome-Wide CHB晶片為基礎,客製化挑選與癌症相關、在臺灣族群具有多型性、和藥物反應、藥物代謝相關等,共約 65萬個單一核苷酸多型性(Single Nucleotide Polymorphisms, SNPs),命名為TWB定型晶片。

    • TWB 2.0
      透過資料庫執行TWB定型晶片的經驗和1000名參與者全基因體定序的資訊,與國家基因體醫學研究中心、Thermo Fisher Scientific公司進一步針對臺灣族群共同開發TWB 2.0定型晶片,包含可立即應用到臨床以及作為精準醫學研究用的SNPs,共約75萬個。與TWB定型晶片相同的SNPs約有10萬個。

    • 資料庫透過基因型插補的方式,將TWB晶片和TWB 2.0晶片進行合併。另設置TWB PheWeb網頁(https://pheweb.twbiobank.org.tw:5038/)來呈現問卷訪談、身體檢測、檢體檢驗值等各種表現型的全基因體關聯性分析(Genome-Wide Association Study, GWAS)結果,將可提供:

      • ■ 以SNP、基因或是表現型進行GWAS結果的搜尋
      • ■ 瞭解表現型間的遺傳相關性(genetic correlation)


    • 【甲基化晶片】
      使用Illumina Infinium MethylationEPIC BeadChip人類全基因甲基化分析晶片,此晶片可直接偵測單一位點的甲基化比例並提供超過85萬的CpG位點偵測, 透過血液中血球萃取的DNA來偵測甲基化的程度。

    • 【人類白血球組織抗原分型資料】
      人類白血球組織抗原位於染色體6q,與參與個案的免疫系統相關。 此實驗採用NXType試劑進行實驗, 利用次世代定序的方式定型class I︰HLA-A、HLA-B、HLA-C,及class II︰HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRB1、HLA-DRB345共9個基因分型。使用此實驗技術最深可得到4 field的人類白血球組織抗原分型資料。
  • NGS資料分析工具
  • Ion Proton

    目標 使用工具 版本
    Reads mapping TMAP 4.4
    SNV/INDEL calling TVC (torrent variant caller) 4.2.2
    Homozygous reference calling Samtools and tabix 0.1.19 and 0.2.5
    Coverage and sequencing volume statistics Picard and BEDtools 1.97 and 2.19.1
    Variation annotation(GRCh37) Ensembl VEP 74
    Variation annotation(GRCh38) Ensembl VEP 92

    Illumina

    目標 使用工具 版本
    Reads mapping Isaac (aligner) 01.13.10.21
    SNV/INDEL calling(GRCh37) Isaac Variant Caller (variant caller) 2.0.17
    SNV/INDEL calling(GRCh38) GATK 3.8
    Bam file operation Samtools 0.1.18
    Structural variant Grouper 1.4.2
    CNV variant call CNVseg 2.2.4
    Variation annotation(GRCh37) annovar 2014 Jul 14
    Variation annotation(GRCh38) Ensembl VEP 92
  • NGS資料分析流程
  • [GRCh37]

    Ion Proton

    DNA透過IonProton定序之後,使用Proton內建的TMAP與人類的參考序列(hg19)進行比對, 利用Picard 和BEDtools統計比對成功的序列資料量是否有達到標準(30X)。當定序資料高於標準之後,使用TVC 進行染色體的變異位點(SNP以及Insertion/Deletion) 的偵測。所有偵測出來的變異位點將會利用VEP以及Ensembl資料庫內的資料進行註解。 此外,針對觀察到某些變異位點並非所有個案同時帶有的話,針對不帶有變異位點個案,利用samtools與tabix確認 沒有變異位點原因,是否為與參考序列一致或是沒有定序資料所致。

    基因體定序資料分析之流程

    Illumina

    基因體定序資料分析之流程

    [GRCh38]

    Ion Proton & Illumina

    GRCh38分析流程