TogoVar収録データセット一覧 (GRCh37)

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法対象集団健常者罹患者サンプル数バリアント数
(座位数)
含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60995,863,463
(90,280,248)
6データセット
JGA-SNPSNP-Chip日本人183,8841,249,7243データセット
JGA-WESWES日本人1254,679,0257データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアント頻度データ

データベース名解析手法対象集団健常者罹患者サンプル数アレル数
(座位数)
作成者バージョン/
最終更新日
Genome Aggregation Database (gnomAD) exomesWES複数125,74817,209,972Broad Institutev2.1.1
Genome Aggregation Database (gnomAD) genomesWGS複数15,708261,942,336Broad Institutev2.1.1
Human Genetic Variation Database (HGVD)WES日本人1,208554,400京都大学Version 2.30
(2017/08/02)
ToMMo 8.3KJPN-SNP/INDEL Allele Frequency Panel(8.3KJPN)WGS日本人8,38095,085,851
(79,359,228)
東北メディカル・メガバンク機構v20200831

注:8.3KJPNの内訳はSNV(Autosome、chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDEL(AutosomeおよびchrX(PAR1+PAR2+XTR))です。

バリアント頻度以外のデータ

データベース名バージョン/最終更新日内容作成者
ClinVar2024/10/03バリアントの臨床的意義NCBI
ColilAPIで取得生命科学分野の文献間の引用関係の情報DBCLS
GRCh37.p132013/06/28ヒトゲノムリファレンス配列GRC
GWAS Catalog2024/10/15ゲノムワイド関連解析(GWAS)情報NHGRI-EBI
HGNC symbol report2024/08/27遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
MedGen2024/10/15遺伝医学に関連する症状や表現型に関する情報を集約したポータルデータベースNCBI
MGeND2024/03/08日本人集団から収集されたバリアントの臨床的意義NCGM
PubMed2024/10/14文献情報NCBI
PubTator Central2024/01/04バリアント名が出現する文献情報NCBI

注:ClinVarはGRCh37上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。
注:MGeNDの疾患名を独自の方法でMedGenにマッピングしていますので、MGeNDに記載されている疾患名と一致しない場合があります。

データ加工に利用したツール

ツール名バージョン内容作成者
bcftools1.20多アリルサイトを2アリルバリアントに分割し、リファレンス不一致バリアントを除外して、正規化Genome Research Ltd.
BioReTJGAのWESデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成アメリエフ
Variant Effect Predictor (VEP)Ensembl rel. 112バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーションEMBL-EBI