TogoVar収録データセット一覧 (GRCh37)
NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ
データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。
頻度データセット名 | 解析手法 | 対象集団 | 健常者 | 罹患者 | サンプル数 | バリアント数 (座位数) | 含まれる制限公開データセット |
---|---|---|---|---|---|---|---|
GEM Japan Whole Genome Aggregation (GEM-J WGA) Panel | WGS | 日本人 | ✔ | 7,609 | 95,863,463 (90,280,248) | 6データセット | |
JGA-SNP | SNP-Chip | 日本人 | ✔ | ✔ | 183,884 | 1,249,724 | 3データセット |
JGA-WES | WES | 日本人 | ✔ | ✔ | 125 | 4,679,025 | 7データセット |
∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など
その他のバリアント頻度データ
データベース名 | 解析手法 | 対象集団 | 健常者 | 罹患者 | サンプル数 | アレル数 (座位数) | 作成者 | バージョン/ 最終更新日 |
---|---|---|---|---|---|---|---|---|
Genome Aggregation Database (gnomAD) exomes | WES | 複数 | ✔ | ✔ | 125,748 | 17,209,972 | Broad Institute | v2.1.1 |
Genome Aggregation Database (gnomAD) genomes | WGS | 複数 | ✔ | ✔ | 15,708 | 261,942,336 | Broad Institute | v2.1.1 |
Human Genetic Variation Database (HGVD) | WES | 日本人 | ✔ | 1,208 | 554,400 | 京都大学 | Version 2.30 (2017/08/02) | |
ToMMo 8.3KJPN-SNP/INDEL Allele Frequency Panel(8.3KJPN) | WGS | 日本人 | ✔ | 8,380 | 95,085,851 (79,359,228) | 東北メディカル・メガバンク機構 | v20200831 |
注:8.3KJPNの内訳はSNV(Autosome、chrX(PAR1+PAR2+XTR)およびchrMT)ならびにINDEL(AutosomeおよびchrX(PAR1+PAR2+XTR))です。
バリアント頻度以外のデータ
データベース名 | バージョン/最終更新日 | 内容 | 作成者 |
---|---|---|---|
ClinVar | 2024/10/03 | バリアントの臨床的意義 | NCBI |
Colil | APIで取得 | 生命科学分野の文献間の引用関係の情報 | DBCLS |
GRCh37.p13 | 2013/06/28 | ヒトゲノムリファレンス配列 | GRC |
GWAS Catalog | 2024/10/15 | ゲノムワイド関連解析(GWAS)情報 | NHGRI-EBI |
HGNC symbol report | 2024/08/27 | 遺伝子シンボルや関連リソースの情報 | HGNC |
LitVar | APIで取得 | バリアント名が出現する文献情報 | NCBI |
MedGen | 2024/10/15 | 遺伝医学に関連する症状や表現型に関する情報を集約したポータルデータベース | NCBI |
MGeND | 2024/03/08 | 日本人集団から収集されたバリアントの臨床的意義 | NCGM |
PubMed | 2024/10/14 | 文献情報 | NCBI |
PubTator Central | 2024/01/04 | バリアント名が出現する文献情報 | NCBI |
注:ClinVarはGRCh37上の位置が決定しているバリアントのみを含むVCFファイルからデータを取得しています。
注:MGeNDの疾患名を独自の方法でMedGenにマッピングしていますので、MGeNDに記載されている疾患名と一致しない場合があります。
データ加工に利用したツール
ツール名 | バージョン | 内容 | 作成者 |
---|---|---|---|
bcftools | 1.20 | 多アリルサイトを2アリルバリアントに分割し、リファレンス不一致バリアントを除外して、正規化 | Genome Research Ltd. |
BioReT | — | JGAのWESデータから生殖細胞系のショートバリアント(SNPおよびインデル)を特定し、VCF形式でジョイントコールセットを生成 | アメリエフ |
Variant Effect Predictor (VEP) | Ensembl rel. 112 | バリアントに遺伝子名、Consequence、有害性予測(AlphaMissense, SIFT, PolyPhen)等をアノテーション | EMBL-EBI |