Help
TogoVar全般
利用条件に関して
TogoVar収録データに関して
TogoVar検索システムに関して
TogoVar全般
TogoVarの目的や有用性は何でしょうか。
ゲノムの解読はNGSにより低頻度の変異を取得することが可能となりました。しかし、欧米の既存データベースには、十分なサンプル数の日本人集団における頻度データはありません。この問題を解決するため、公開されている日本人のゲノム変異情報やNBDCに寄託されたヒトデータベースからの情報を集積し、より信頼性の高い頻度情報を提供することを目指します。
また、ヒトゲノムの参照配列は常に一定ではなく更新される情報であるため、同じバリアントであっても参照配列が異なるとゲノム上の位置が異なります。そこで、当データベースでは同じバリアントにはユニークなIDを付与することで、研究者が行っているバリアントの位置情報を参照配列間で変換する作業を省力化します。
利用条件に関して
TogoVarデータベースの利用は無償でしょうか。
すべて無償での利用が可能です。データベースの利用については、Termsのページを参照してください。
TogoVarデータベースを論文で引用するにはどうすれば良いでしょうか。
Termsのクレジットの表示例を参考にしてください。
商用利用は可能でしょうか。
TogoVarのwebサイトの閲覧や公開予定のdockerイメージは商用利用可能です。TogoVarが取り込んでいる第三者作成データに関してはそれそれの利用条件に従ってください。詳しくはTermsをご覧ください。
TogoVar収録データに関して
個人レベルの表現型情報の取得は可能でしょうか。
当データベースは個人情報を保持しておらず、また、個人ごとの表現型情報は現在のところ提供はしておりません。表現型情報の詳細については、JGA-NGSデータセット及びJGA-SNPデータセットに記載されている研究グループに直接お問い合わせ下さい。
遺伝子発現やタンパク質の情報とは結び付かないのでしょうか。
当データベースはヒトゲノムの遺伝子変異について、日本人の公開情報を中心として統合したものです。当データベースはRDFの技術をベースとして利用している為、遺伝子発現やタンパク質の情報がRDFを利用しているデータベースである場合は、容易に拡張が可能と考えております。遺伝子発現やタンパク質の情報への拡張は順次実施する予定です。
バリアントの検出の際に使用したソフトウェアおよび品質管理の方法を教えてください。
TogoVarデータセット作成方法を参照ください。
TogoVarで対象としているバリアントの種類は何ですか。
SNV、Insertion、Deletion、Indel、Substitutionの5種類です。HGVSがType of variantsに列挙した5種類のうち、DuplicationはInsertionに、DeletionとInsertionの長さが同じIndelはSubstitionに分類されています。なお、バリアントの種類の特定には、Variant Effect Predictor (VEP)を利用しています。
Consequenceの値はどのように計算していますか。
Variant Effect Predictor (VEP)のvariant consequenceの値を表示しています。1バリアントに対応するトランスクリプトが複数ある場合は、一番重大なconsequenceのみを表示している場合があります。
SIFTとPolyPhenとは何ですか。
バリアントによってアミノ酸配列が変化する場合、それがタンパク質の機能に与える影響を予測したものです。Variant Effect Predictor (VEP)で計算した値を表示しています。アイコンの意味は以下の通りです。
- SIFT< 0.05Deleterious≥ 0.05Tolerated
- PolyPhen> 0.908Probably Damaging> 0.446Possibly Damaging≤ 0.446Benign
Clinical Significanceの値はどのように計算していますか。
ClinVarのclinical significanceの値を表示しています。
バリアントデータ作成時にリフトオーバツールを利用しましたか。
はい。GRCh38ゲノムリファレンスを用いて検出されたバリアントデータセットがない場合、CrossMapを用いてGRCh37データセットをGRCh38にリフトオーバーしています。
TogoVarの検索システムに関して
検索結果のFrequency列に表示される頻度メーターは何を表現していますか。
各データセットにおけるAlternative allele頻度を表現しています。頻度メータの色はデータセットに割り当てられた色に対応しています。データの有無や頻度の値を9段階で表現しています。
バリアントタイプごとにPosition、Ref、Altはそれぞれどのように記述されますか。
以下に、各バリアントタイプ毎の例を示します。染色体の最初の塩基の位置は1です。
Variant Type | ID | Position | Ref / Alt | 説明 |
---|---|---|---|---|
SNV | tgv41 | 1 13116 | TG | 1番染色体13116番目の塩基TがGに置換された |
Ins | tgv1019 | 1 138646 | A | 1番染色体138646番目と138647番目の塩基の間に塩基Aが挿入された |
Del | tgv63 | 1 13486 | GC | 1番染色体13486番目と13487番目の塩基GCが欠失した |
Indel | tgv1537710 | 1 53676691 | CTA | 1番染色体53676691番目の塩基Cが欠失して、その場所にTAが挿入された |
Substitution | tgv675673 | 1 21889705 | ACCA | 1番染色体21889705番目の塩基ACが欠失して、その場所にCAが挿入された |
TogoVarでは、どのようにバリアントを表記していますか。
TogoVarでは、ゲノム上の位置及びreference allele、alternative allele、ヒトゲノム標準配列のビルド番号の組み合わせでバリアントを一意に識別します。TogoVar及びdbSNP、VCF、HGVSでの表記例を下の表に示しています。
TogoVar | dbSNP | VCF | HGVS | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ID | Position | Ref / Alt | ID | Position(GRCh37) | Alleles | Position | Ref | Alt | ||||||
SNV | tgv30913364 | 7 127254587 | GA | rs114202595 | chr7:127254587 | G>A | 7:127254587 | G | A | 7:g.127254587:G>A | ||||
tgv30913365 | GT | G>T | G | T | 7:g.127254587:G>T | |||||||||
Ins | tgv1019 | 1 138646 | A | rs761725800 | chr1:138646 | dupA | 1:138646 | C | CA | 1:g.138646_138647insA | ||||
Del | tgv63 | 1 13486 | GC | rs780379327 | chr1:13486-13487 | delGC | 1:13485 | AGC | A | 1:g.13486_13487del | ||||
Indel | tgv1537710 | 1 53676691 | CTA | rs1057517525 | chr1:53676691 | delCinsTA | 1:53676691 | C | TA | 1:g.53676691delinsTA | ||||
Substitution | tgv675673 | 1 21889705 | ACCA | rs786204530 | chr1:21889705-21889706 | AC>CA | 1:21889705 | AC | CA | 1:g.21889705_21889706delinsCA |
Human Genome Variation Society (HGVS) 表記(例:ALDH2:p.Glu504Lys) で検索できますか。
はい。HGVSc (例:ALDH2:c.1510G>A)とHGVSp (例:ALDH2:p.Glu504Lys)で検索可能です。Variant RecorderでHGVS表記をGRCh37座標に変換します。
Advanced searchでできることは何でしょうか。
代替アレル頻度やClinical significanceなどの検索条件をANDやORで結合したクエリーを作成できます。使い方は、Q:日本人集団とその他の集団で代替アレル頻度が異なるバリアントを検索できますかをご覧ください。
日本人集団とその他の集団で代替アレル頻度が異なるバリアントを検索できますか。
はい。Advanced searchによる検索が可能です。
代替アレル頻度の比較対象のバリアントは以下の通りです。- 日本人集団はGEM-J WGAまたは8.3KJPNのいずれかに含まれるバリアント
- gnomADはgnomaAD genomesまたはexomesのいずれかに含まれるバリアント
- 画面上部のAdvanced searchタブを選択します。
- Add conditionメニューからAlternative allele frequency/countを選択します。
- 以下の画面でデータセット(GEM-J WGA)と代替アレル頻度(>=0.3)を指定します。代替アレル数でも指定できます。
- OKボタンを押下します。検索条件が設定されました。
- 同様の手順でデータセットToMMo 8.3KJPN、gnomAD genomes、gnomAD exomesについても検索条件を設定します。
- 日本人集団(GEM-J WGAとToMMo 8.3KJPN)の検索条件をOR結合にします。
- GEM-J WGAとToMMo 8.3KJPNの検索条件をクリックして選択します。選択状態では黄枠で囲まれます。
- Groupメニューを選択します。選択した2つがOR条件になります。なお、AND条件に変更する場合は、左端のORアイコンをクリックします。
- 同様にgnomAD genomesとgnomAD exomesもOR条件にします。
- GEM-J WGAとToMMo 8.3KJPNの検索条件をクリックして選択します。選択状態では黄枠で囲まれます。
AND
(freq(gnomAD genomes) <= 0.05) OR (freq(gnomAD exomes) <= 0.05))検索条件が変更される度に検索が自動的に実行され、条件に合致するバリアントの一覧が更新されます。

- Add condition: 検索条件を追加します。
- Group: 選択された検索条件(黄枠表示)をOR条件で結合します。ORアイコンをクリックするとAND結合に変更できます。
- Ungroup:結合された検索条件を分離します。Groupとは反対の操作です。
- Delete:選択した 検索条件を削除します。
:検索条件を編集します。
:検索条件を削除します。
GRCh37、GRCh38のどちらの位置でもバリアントを検索できますか。
