こんにちは、翡翠です。
---
※ この内容は既にTwitterで発信した情報になりますが、noteの方にもまとめておきたいと思います。
---
今、新型コロナは存在しない派の中では、『GISAID(Global Initiative on Sharing Avian Influenza Data)』にログインしないと、国立感染症研究所(感染研)が最初に登録したSARS-CoV-2の遺伝子配列情報が確認できない。本当は情報がないんじゃないか?=「新型コロナウイルス(SARS-CoV-2)は存在しない!」というデマが広がっています。
まさ @sambadouro
返信先: @sambadouroさん
「データはGISAIDという別の登録サイトに移して公開中です」と感染研は説明。しかし公開はされていません。登録されているのかもわかりません。実質的な「データ取り下げ」なので、感染研のウイルス分離発表は無効ということになります。
午後8:19 · 2021年5月26日·Twitter Web App
では、『GISAID』に感染研が最初に分離したSARS-CoV-2の遺伝子配列情報が登録・公開されているか一緒に確認していきましょうか。
「「Let's ファクトチェック!!」」
まず基本的な情報として、『GISAID(Global Initiative on Sharing Avian Influenza Data)』(日本語では『鳥インフルエンザ情報共有の国際推進機構』)はその名の通り、2008年に、鳥インフルエンザウイルスの遺伝子配列情報を共有するためのデータベースとして構築されたものになります。
なぜ、NCBIの『GenBank』などの既存のデータベースを使用せず、新しい鳥インフルエンザウイルスのデータベースを構築したかについては、当時、高病原性の鳥インフルエンザウイルスの遺伝子配列情報へのアクセスが極めて制限されてたことが理由として挙げられます。
例えば、高病原性の鳥インフルエンザウイルスの遺伝子配列情報が、テロリストの手に渡り、その情報からヒトに感染する危険なウイルスを人工的に作られてしまったら、『生物兵器テロ』に使用されてしまう可能性があります。これを世界中のウイルス学者は危惧していました。
しかしながら、同時に、その情報へのアクセスを極端に制限してしまうこともまた、ウイルス研究に透明性がなくなることを意味し、迅速なワクチンや抗ウイルス薬の開発などの研究を妨げる可能性も危惧されていました。
そこで、身分を明らかにすれば、自由に鳥インフルエンザウイルスの遺伝子配列情報を閲覧・登録できる『GISAID』が構築されました。(ちなみに、その中でSARS-CoV-2の遺伝子配列情報を登録し、共有するデータベースは『EpiCov』と名付けられています。)
GISAID設立の経緯から考えても、最低限、本名(例:研究太郎)、所属機関(京都大学)、そして、それを識別できる所属機関のメールアドレス(tarou-kenkyu@kyoto-u.ac.jpなど)を登録する必要があることは明白です。
これは新型コロナは存在しない派の人たちにも理解して欲しいと思います。(中には登録を試みる人もいるようです。)
GISAID(EpiCov)は、ただ「感染研のSARS-CoV-2の遺伝子配列情報が存在するか確認したいから」という理由で一般人が登録して利用するようなものではありません。
GISAIDの役割を正しく理解してください。お願いします。
GISAIDへの登録フォームは以下のようになっています。
ここに必要事項を入力していきます。
https://www.gisaid.org/registration/register/
GmailなどのWebメールアドレスを登録すると、優先度が低下したり、承認までの時間が大幅に遅れたりする可能性があると書かれています。
実際、私は自分の研究でGISAIDを使うことは考えていなかったので、まずは試しにGmail(***@gmail.com)で5月14日にユーザー登録しましたが、数日経っても承認メールは届かず、私は待ちきれずに18日に私が所属する京都大学のドメイン(***@kyoto-u.ac.jp)のメールアドレスで再度ユーザー登録手続きしたところ、およそ半日でGISAID事務局から承認メールが届きました。
メールアドレス以外の情報は全く同じ(もちろん本名、所属研究室を明記)で登録しましたが、Gmailでユーザー登録したアカウントへの承認メールは25日現在も届いていません。(もしかしたら、18日の登録情報の重複で自動的にキャンセルされたかもしれません。)
やはり、『本名』、『所属機関』、そして、『それを識別できる所属機関のメールアドレス』の登録は必須であることが分かります。
そして、承認メールに記載されたユーザーIDとパスワードでGISAIDにログインし、『EpiCov』で、感染研が最初に分離し登録したSARS-CoV-2の遺伝子配列情報(Accession ID)『EPI_ISL_408667』を検索したところ、確かにその遺伝子配列情報がありました。削除もされていません。
Data Availability
Data have been deposited in the Global Initiative on Sharing All Influenza Data (GISAID) database with accession ID EPI_ISL_408667.
https://www.pnas.org/content/117/13/7001
感染研のSARS-CoV-2分離の論文
Proc Natl Acad Sci U S A. 2020 Mar 31;117(13):7001-7003. doi: 10.1073/pnas.2002589117. Epub 2020 Mar 12.
Enhanced isolation of SARS-CoV-2 by TMPRSS2-expressing cells
https://www.pnas.org/content/117/13/7001
GISAID設立の経緯、そしてその性質から考えても分かるように、一般人が自由にアクセスすることはできませんが、間違いなく感染研が最初に分離し登録したSARS-CoV-2の遺伝子配列『EPI_ISL_408667』は登録・公開されていました。もちろん、遺伝子配列をダウンロードすることも問題なくできました。
以上、まとめます。
「感染研は一般人が確認できないような形でSARS-CoV-2の情報を隠している!」
→ 別に隠してはいません。あなた方にそれを閲覧する資格がないだけです。
「GISAIDに感染研が最初に登録した遺伝子配列情報は存在しない!」
→ 嘘です。嘘はダメ!
「「ファクトチェック完了!」」
The ARTIC Network provides a common resource of PCR primer sequences and recommendations for amplifying SARS-CoV-2 genomes. The initial tiling strategy was developed with the reference genome Wuhan-01, and subsequent iterations have addressed areas of low amplification and sequence drop out. Recently, a new version (V4) was released, based on new variant genome sequences, in response to the realization that some V3 primers were located in regions with key mutations. Herein, we compare the performance of the ARTIC V3 and V4 primer sets with a matched set of 663 SARS-CoV-2 clinical samples sequenced with an Illumina NovaSeq 6000 instrument. We observe general improvements in sequencing depth and quality, and improved resolution of the SNP causing the D950N variation in the spike protein. Importantly, we also find nearly universal presence of spike protein substitution G142D in Delta-lineage samples. Due to the prior release and widespread use of the ARTIC V3 primers during the initial surge of the Delta variant, it is likely that the G142D amino acid substitution is substantially underrepresented among early Delta variant genomes deposited in public repositories. In addition to the improved performance of the ARTIC V4 primer set, this study also illustrates the importance of the primer scheme in downstream analyses.
ARTIC Networkは、SARS-CoV-2ゲノムを増幅するためのPCRプライマー配列と推奨事項をまとめた共通のリソースを提供するものである。最初のタイリング戦略は参照ゲノムであるWuhan-01を用いて開発され、その後の反復により増幅率の低い領域や配列の脱落に対処してきた。最近、一部のV3プライマーが重要な変異を持つ領域に位置していることが判明したため、新しい変異ゲノム配列に基づく新バージョン(V4)がリリースされた。ここでは、イルミナのNovaSeq 6000装置でシーケンスされた663のSARS-CoV-2臨床サンプルのマッチングセットで、ARTIC V3およびV4プライマーセットの性能を比較した。シーケンスの深さと質が全般的に向上し、スパイクタンパク質のD950N変異の原因となるSNPの分解能が向上したことが確認されました。重要なのは、デルタ系統のサンプルにスパイクタンパク質置換G142Dがほぼ共通して存在することも見いだしたことです。Delta変種が急増した初期にARTIC V3プライマーが事前にリリースされ広く使用されたため、G142Dアミノ酸置換は公的リポジトリに寄託された初期のDelta変種ゲノムの中ではかなり過小評価されている可能性があります。ARTIC V4プライマーセットの性能が向上したことに加え、本研究は、下流解析におけるプライマーのスキームの重要性を示している。
Importance ARTIC Network primers are commonly used by laboratories worldwide to amplify and sequence SARS-CoV-2 present in clinical samples. As new variants have evolved and spread, it was found that the V3 primer set poorly amplified several key mutations. In this report, we compare the results of sequencing a matched set of samples with the V3 and V4 primer sets. We find that adoption of the ARTIC V4 primer set is critical for accurate sequencing of the SARS-CoV-2 spike region. The absence of metadata describing the primer scheme used will negatively impact the downstream use of publicly available SARS-Cov-2 sequencing reads and assembled genomes.
重要性 ARTIC Networkプライマーは、臨床サンプルに存在するSARS-CoV-2の増幅と配列決定に、世界中の研究室で一般的に使用されている。新しい変異型が進化し広まるにつれ、V3プライマーセットはいくつかの重要な変異の増幅が不十分であることが判明している。本報告では、V3およびV4プライマーセットを用いて、一致するサンプル群の配列を決定した結果を比較した。その結果、SARS-CoV-2スパイク領域の正確な塩基配列決定には、ARTIC V4プライマーセットの採用が重要であることがわかった。使用したプライマーのスキームを記述するメタデータがないことは、一般に入手可能なSARS-Cov-2シーケンスリードとアセンブルゲノムのダウンストリーム使用に悪影響を与える。
The authors have declared no competing interest.
著者らは、競合する利害関係を宣言していない。
Paper in collection COVID-19 SARS-CoV-2 preprints from medRxiv and bioRxiv
COVID-19 SARS-CoV-2 preprints from medRxiv and bioRxivのコレクションに含まれる論文