TogoVar収録データセット一覧 (GRCh37)

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法対象集団健常者罹患者サンプル数バリアント数
(座位数)
含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60995,863,463
(90,280,248)
6データセット
JGA-NGSWES日本人1254,679,0257データセット
JGA-SNPSNP-Chip日本人183,8841,249,7243データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアント頻度データ

データベース名解析手法対象集団健常者罹患者サンプル数アレル数
(座位数)
作成者バージョン/
最終更新日
Genome Aggregation Database (gnomAD) exomesWES複数125,74817,209,972Broad Institutev2.1.1
Genome Aggregation Database (gnomAD) genomesWGS複数15,708261,942,336Broad Institutev2.1.1
Human Genetic Variation Database (HGVD)WES日本人1,208554,461
(501,556)
京都大学Version 2.30
(2017/08/02)
ToMMo 8.3KJPN-SNP/INDEL Allele Frequency Panel(8.3KJPN)WGS日本人8,38095,085,851
(79,359,228)
東北メディカル・メガバンク機構v20200831

注:8.3KJPNの内訳はSNV(Autosome、chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDEL(AutosomeおよびchrX(PAR1+PAR2+XTR))です。

バリアント頻度以外のデータ

データベース名バージョン/最終更新日内容作成者
ClinVar2023/09/11バリアントの臨床的意義NCBI
ColilAPIで取得生命科学分野の文献間の引用関係の情報DBCLS
GRCh37.p132013/06/28ヒトゲノムリファレンス配列GRC
GWAS Catalog2023/09/05ゲノムワイド関連解析(GWAS)情報NHGRI-EBI
HGNC symbol report2023/09/05遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
PubMed2023/09/01文献情報NCBI
PubTator Central2023/09/03バリアント名が出現する文献情報NCBI

注:ClinVarはGRCh37上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。

データ加工に利用したツール

ツール名バージョン内容作成者
bcftoolsmultiallelicバリアントのbiallelicバリアントへの分割Genome Research Ltd.
BioReTNGSデータからバリアントを特定するツール群を一括実行アメリエフ
Variant Effect Predictor (VEP)Ensembl rel. 110バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーションEMBL-EBI