理研外部調査委員会報告の内容整理3−STAP論文で不正認定されなかった項目

STAP細胞論文に関する理研外部調査委員会報告のSTAP細胞に関する解析結果の内容整理をしました。
(*を付けた文章は、私のコメント)

理研外部調査委員会報告の内容整理1−STAP細胞の正体はES細胞
http://d.hatena.ne.jp/warbler/20141230/1419934465

理研外部調査委員会報告の内容整理2−STAP論文の不正認定http://d.hatena.ne.jp/warbler/20150114/1421255558

の続き

<ES細胞混入を故意に行ったかどうか>
1)STAP細胞等の作製時にES細胞が混入したか。ES細胞を混入した者を特定できるか。研究不正は認められるか。
(1)ES細胞混入の根拠
・STAP幹細胞とFI幹細胞はES細胞に由来すると結論。また、いずれもES細胞がSTAP幹細胞とFI幹細胞よりも先に樹立されていた事から、STAP幹細胞とFI幹細胞の作製時に混入したと認められる。
・STAP細胞やSTAP幹細胞から作製されたとされるキメラマウスやテラトーマも、全てES細胞由来である。

(2)ES細胞の混入を行った者を特定できるか
・これだけ頻繁にES細胞が混入するのは単なる不注意ではなく、誰かが意図的に混入した可能性が高い。

[STAP細胞作製のためのマウス]
・若山氏がマウスを交配し、小保方氏に手渡し。
・Oct4-GFPを持つSTAP細胞作製時のみ、CDB若山研メンバーが管理していたGOFマウスのケージから、小保方氏が子マウスを取り出して使用。

[STAP細胞作製]
・STAP幹細胞・FI幹細胞・キメラマウス・テラトーマの作製に到達したSTAP細胞は、全て小保方氏が作製。
・CDB若山研のメンバーで挑戦した者は多いが、小保方氏を除いて成功せず。
・一度だけ、小保方氏が付き添って指導した時に、若山氏がSTAP細胞からSTAP幹細胞の作製までできた。(FLS-T1,T2:論文には使用せず)
*小保方氏が関わった時のみ、STAP細胞作製に成功。
・STAP細胞の作製は、酸処理から7日間、細胞をインキュベーター内に放置。この間、多くの人達が夜中にこの部屋に入りES細胞を混入させることが可能であった。
*バカンティー研では、どうだったのか?
[STAP幹細胞・FI幹細胞・キメラマウスの作製]
・小保方氏がディッシュの蓋などに載せて持ってきたSTAP細胞塊
→若山氏が切り刻んでマウス胚に注入し、キメラ作製
→残りのSTAP細胞塊から、若山氏がSTAP幹細胞やFI幹細胞を作製
*STAP細胞塊の時点で、ESが混入していた可能性
・1回だけ、小保方氏がFI幹細胞を作製。(解析には使わず、保存もしなかった)
・小保方氏は、STAP幹細胞樹立を試みたが成功しなかった。(本人談)

[テラトーマの作製]
・全て小保方氏が作製。

[ES細胞FES1の謎]
FES1は、2005年に当時のCDB若山研メンバー(大田浩研究員)によって樹立。
→2010年3月(CDBでSTAP研究が始まる前)にそのメンバーが転出した時に、全て持ち出したとされる。
→当該メンバーの他に、FES1を使用した記録無し。
→小保方研のフリーザーに残っていた「129/GFP ES」が、FES1とほぼ同一。
この細胞について、小保方氏、若山氏、CDB若山研メンバーは、全く知らないと回答。

[関係者全員がES細胞の混入を否定]
・残存試料・実験記録・関係者間のメール送信記録・その他の客観的試料の分析検討でも、混入者特定となる証拠は得られなかった。

(3)故意か過失か
・不正と断定するに足りる証拠がない。


<ChIP-seqやRNA-seqなどの公開データに関する疑義>
1)実際にChIP-seq、RNA-seqに用いた細胞株/マウス系統が、論文記載・公共データベース登録内容と異なっている。
・解析に用いた細胞はCD45+細胞とTS細胞を除いて、126×B6ヘテロマウス系統由来で、挿入されているのはCAG-GFPまたはOct4-GFPのはず。
→ChIP-seq inputデータ解析:FI幹細胞・STAP幹細胞は、論文に記載のないAcr-GFP /CAG-GFPが挿入された細胞
→RNA-seq(Truseq)データ解析:FI幹細胞は、論文とは違うマウス系統

(調査結果報告のスライド資料より)

・これらの実験でのサンプル調製は全て小保方氏が行う。
→その当時あった細胞を集めて用意したとの説明のみ。実験ノートの記載無し

2)FI幹細胞のRNA-seqデータは2種類の細胞種を含んだサンプルに由来・大多数のアレルはB6ゲノム配列と一致するのに対し、5-10%程度のアレル頻度を持つSNPsヵ所が多く認められる。
→大部分はB6ホモ系統マウス由来の細胞で、少量の別系統由来の細胞が混ざっている可能性。

3)STAP細胞由来ChIP-seq(input)サンプルは129B6 G1ES1から取得・小保方氏がCDBゲノム資源解析ユニット(GRAS)に持参し、残されていたSTAP細胞由来ChIP-seq(input)サンプル
→再度NGS解析:CAG-GFPの挿入を持つ129×B6ヘテロ系統由来の細胞と判明
→SNPs解析・特異的欠損変異の解析:129B6 G1ES1由来のデータとほぼ同一

4)未登録(論文には用いられていない)RNA-seqデータ解析により、用いられた細胞株/マウス系統は論文と異なっており、Letter Fig.2iは再現できない。

Letter Fig.2i Cluster tree diagram from hierarchical clustering of global expression profiles. Red, approximately unbiased P values.
網羅的な発現プロファイルによる階層的クラスター樹形図。赤字は、近似的に不偏なp値

・2012年8月に第1回目として、TS細胞とFI幹細胞のRNA-seq用サンプル(TS1とFI-SC1)が小保方氏からGRASに提供されシーケンス実施。
→残されたデータを解析:TS1は129×B6ヘテロ系統でCAG-GFP挿入、FI-SC1は129×B6ヘテロ系統でAcr-GFP/CAG-GFP挿入。
解析結果が想定されたものと異なっているという理由で、小保方氏には再度サンプルを提供することになる。
・2013年1月と6月に、GRASに再度サンプル(TS2, FI-SC2, FI-SC3)を提供。
→再シーケンスの結果:FI-SC2は129×B6ヘテロ系統でAcr-GFP/CAG-GFP挿入。FI-SC3はB6ホモ系統でOct4-GFP挿入+少量の別細胞(CD1の可能性が高い)で、こちらが論文に採用された。

(調査結果報告のスライド資料より)

・これらのデータのどれを採用するかでLetter Fig.2iの系統樹が変わる。
→論文採用データの取捨をしたのは小保方氏と笹井氏。
→小保方氏はサンプルの中で中間的なものを示そうと考えたと説明。

(評価)
・小保方氏が様々なバックグラウンドの細胞を寄せ集めてRNA-seq解析、ChIP-seq解析を行った事は自明で、論文の記載や公共データベースの登録と異なるマウス系統を使用したり、本来比較対象とならないデータを並べて論文に使用した。
→聞き取り調査などから、小保方氏は「条件を揃える」という研究者としての基本原理を認識していなかった可能性が高く、意図的な捏造と断定できない。
*基本原理を理解していないという、「研究者としての欠陥」が不正認定逃れになった。これは変では?(無知ならデタラメなサンプルを使っても許されるならば、素人同然である方が有利になってしまう)
・FI幹細胞データについて、当初の解析結果が望んだ分布をとならず追加解析を実施している事や、第1回目と第2回目の解析に使用したマウス系統が異なり複数種類の細胞を混ぜた可能性が高い事について。
→どの様にサンプルを用意したかを含めて小保方氏の記憶しかなく、意図的な捏造と断定できない
*実験ノート等の記録の不備が不正認定逃れとなった。これも、杜撰なデータ管理をしていた方が有利になり、変である。
・GRASでシーケンス後に計算機上で混ぜられたものではない。
→GRAS関係者は混入の不正行為をしていない。


<その他の図表や本文等に関する疑義>
3)Article Fig.2eExtended Data Fig. 4a-c:同じスライドから得られたテラトーマの画像を、2つの異なる試料から得られた画像だとしてる?

・テラトーマのスライドグラス試料「6weeks+PGA 12/27移植 Haruko」を顕微鏡観察すると、Article Fig.2eExtended Data Fig. 4a-cの両方の画像が得られた。

過失による画像の取り違えの可能性があり、不正と認定せず

4)Letter Extended Data Fig. 1a2Nキメラとされていた。矢印は胎盤卵黄嚢としている。

Letter Extended Data Fig. 1aの説明:B6GFP × 129/Sv マウスからのCD45+細胞に由来するSTAP細胞で作製したキメラマウス

・マウス胚撮影に用いたPCに残存する写真(2011年11月28日撮影)と若山氏の実験ノートから、4Nキメラ胚であったと確認。
・専門家の意見によると、2つの矢印で示されている組織は、両方とも卵黄嚢である可能性が高い。
*胎盤への寄与は、STAP細胞の重要な特徴であった。この写真で胎盤とされていたものが誤認による可能性が高いと判明。
過失による可能性が高い。マウスの表記法は「メス×オス」で書くのが通常であり、「129/Sv×B6GFP」が正しいが、不注意による間違いと判断。不正と認定せず

5)Letter Fig. 1a, 1b:(a)はES細胞、(b)はSTAP細胞由来のキメラであり、一番右側の写真は、胎盤を長時間露光したものとしていた。


Letter Fig. 1a, 1bの説明:ES細胞(a)とSTAP細胞(b)を胚盤胞に注入して作製した胎児

・蛍光顕微鏡附属のハードディスクに残存する写真(2012年7月17日撮影)と若山氏のメモにより、(a)と(b)は両方ともSTAP細胞由来のキメラだと確認。
長時間露光の写真は、ハードディスクには存在せず、デジタル的に増感させた跡も確認できなかった。

→悪意であったと認められず、不正と認定せず
*2014年6月の会見で若山氏が説明していたが、胎盤がGFPの蛍光で光って見えるのは、胎盤を流れる血液などによる可能性があり、(b)の写真からSTAP細胞が胎盤に寄与していると判断することはできない。

6)Article Fig.3b:コントラスト補正すると、ControlでRチャンネルにシグナルが見られる。また、 ControlでBright-fieldとOct4-GFPの細胞位置が一致しない。

   ↓コントラストと明るさを調整すると、緑ではなく赤い発色が現れる。

Article Fig.3bの説明:低pH処理により脂肪組織由来の間充織細胞から7日後に誘導されたOct4-GFP+細胞集団。

・小保方氏にオリジナルデータの提出を求めたが、提出されなかった。
・CDBとCDB若山研の蛍光顕微鏡附属のハードディスクにもオリジナルデータは残されていなかった。

→機器やソフトに対する知識不足による間違いや、画像ファイルの取り違えの可能性があり、不正と認定せず
*機器やソフトに対する知識不足による間違いは、こうしたデータを取り扱う研究者として、あってはならない事である。

7)Article Extended Fig.2f:同一視野から得られた写真?

Article Extended Fig.2fの説明:T細胞由来のSTAP細胞

・小保方氏にオリジナルデータの提出を求めたが、提出されなかった。

→不一致の確認をする事ができず、不正と認定せず
*これも、「杜撰なデータ管理」が不正認定を回避する結果となり、有利に働いた。

8)Article Extended Fig.5fExtended Fig.8k:H3K27me3染色のRチャンネルに画像情報が殆ど含まれていない。Rチャンネルの削除、極端な調整が行われた?

・小保方氏にオリジナルデータの提出を求めたが、提出されなかった。
→不正操作の確認をする事ができず、不正と認定せず
*これも、「杜撰なデータ管理」が不正認定を回避する結果。

9)Article Fig. 2b, 3d, 3gExtended Data Fig. 1a, 6d:各種棒グラフのエラーバーが不自然?

Extended Data Fig. 1aについて過去に投稿された論文原稿を遡ると、グラフが投稿毎に一致していないこと(特にエラーバーのサイズ、有無など)を確認。
・小保方氏の聞き取り調査で、本人としてもエラーバーが不自然であると認識。しかし、表計算ソフトではこの様なことはよく起きると考えていた。
・小保方氏にオリジナルデータの提出を求めたが、提出されなかった。

→不正操作の確認をする事ができず、不正と認定せず
*これも、「杜撰なデータ管理」が不正認定を回避する結果。

10)Letter Extended Data Fig. 5g, Fig. 3c-d:GFP蛍光とintegrin α7(PE)蛍光の漏れ込み補正が行われていない? 検出器の感度設定がサンプルによって異なる?
これらの細胞集団を解析した結果の信頼性は?

Letter Extended Data Fig. 5g の説明:Fgf4誘導幹細胞におけるintegrin α7 発現のFACS解析


Letter Fig. 3c-dの説明:FACSで選別したOct4-GFP Fg4誘導細胞
*FI幹細胞が有していたのはOct4-GFPではなく、Acr-GFP/CAG-GFPであった可能性が高く、この結果は信頼できない。

・小保方氏の聞き取り調査で、主にCDBに設置されていた装置(FACS Aria)を用いてFACS解析をしたが、装置と技術に習熟する機会がないまま、実験を行っていたと確認。
・Letter Extended Data Fig. 5g では右45度方向に多くの細胞が分布しており、死細胞除去が適切に行われていなかったか、GFPとintegrin抗体に付与した蛍光色素の間で光の漏れ込みがあったと考えられる。
・GFPシグナルを比較すると、GFPシグナル強度分布(縦軸方向)が大きく異なるが、同じ実験で得られた細胞サンプルを2つに分けた実験であればGFPシグナル強度分布は同様になるはずであり、不自然なデータである。
・小保方氏は、この様な問題を多く含むFACSデータについて共同研究者から指摘されなかったと説明。
・使用された装置に残っていたデータを再解析したが、論文の図に合致するものは特定できなかった。

→小保方氏は、装置に関する知識がほとんどないまま、対照実験や必要な補正をすることなくデータを取得していたと判断。
→GFPシグナル分布が2つのグラフで大きく異なることから、不適切な操作や測定が行われた可能性が高い。
→オリジナルデータを調査することはできず、不正と認定せず
*これも、「杜撰なデータ管理」が不正認定を回避する結果。

11)Letter Fig. 2b-e, Extended Data Fig. 5, Fig.6:そもそも、Oct4-GFPを持つFI幹細胞の存在がない?(小保方研とCDB若山研に保存されているFI幹細胞を調査した限りでは、Acr-GFP/CAG-GFPを持つものしかない)

・FI幹細胞CTS1は、若山氏が渡したCAG-GFPを有する129X1とB6Nを掛け合わせたF1マウスから小保方氏が作製したSTAP細胞から、若山氏が2012年5月に樹立(5月21日に作製開始し、5月28に樹立)したことになっている。
・若山氏の実験ノートから、2012年7月9日にも若山氏はFI幹細胞を作製しているが、使用したマウスの記載がなく、遺伝的背景は不明。ただし、若山氏の記憶ではCAG-GFPを有する129B6F1マウスからしかFI幹細胞を樹立していない。
・「2012年5月25日作製(1ライン)」はCDB A棟フリーザー内「Call TS-1」、「2012年7月9日作製(3ライン)」はCDB A棟フリーザー内「Call TS-11〜TS13」として保管。
・FI幹細胞を樹立したのは、若山氏のみ。
・論文に使用されたFI幹細胞CTS1(Call TS-1)のゲノム解析結果は、Acr-GFP/CAG-GFPが挿入されており、ES細胞FES1由来と判明。
・小保方氏は、若山氏から渡されたマウスの遺伝的背景を把握しておらず、Oct4-GFPを有するGOFマウスだと思い込んでいた。

→2012年7月に作製されたマウスの遺伝的背景が不明で、GOFマウス由来のSTAP細胞にES細胞FES1が混入した可能性を否定できない。
→ES細胞混入者が特定できないので、不正と認定せず

12)Letter Fig. 2i, Extended Data Fig. 6dLetter Fig. 2iでは、系統樹の一部が除かれている? Extended Data Fig. 6dでは、元になったデータは2012年にSMARTERキットによるRNA-seqであるが、この解析結果を返された際にはCallus1(STAP細胞)と名付けられていた試料が、論文ではCD45+となっている?

・RNA-seq解析と系統樹の作成は、CDB機能ゲノミクスユニットとGRASのメンバーが担当。マウスのリファレンスゲノムのバージョンアップがあったので、再度マッピングをやり直し、系統樹を作成した。
・当初の系統樹ではCallus1Callus2と名付けられたサンプルを含むが、2013年3月のNature再投稿で小保方氏から図のスタイル変更とサンプル名付加の要請があり、Callus1とCallus2はそれぞれSTAP細胞CD45+細胞とされた。
・TSとFI幹細胞は複数サカプルを用意してシーケンスしたが、予想外にデータのバラツキがあった。小保方氏の説明では、FI幹細胞は系統樹中で中間に位置するものを最終的に作図に用いた。TSは細胞培養時に分化したことが考えられたので、丹羽研のメンバーが培養・サンプル調整を行ったものを追加して作図した。

→CD45+細胞にSTAP細胞と同義のCallusという名称を付けていたのは混乱を招く。
CDB若山研では、異なるサンプルに区別困難な類似名称を付与することが散見されていた事が遠因の可能性。
→系統樹をGRASスタッフに依頼する過程で、解析結果について討論せずに、図を改訂依頼するのは共同研究として不十分であった。
→混乱を招く名称付けと討論不十分であり、不正と認定せず


<論文作成過程における疑義>

1)TCR遺伝子再構成に関する不整合データ隠蔽の疑い
・小保方氏は、STAP細胞塊と一部のSTAP幹細胞にTCR遺伝子の再構成が見られるとCDBの若山研で最初に報告。小保方氏は後に、8系統のSTAP幹細胞のTCR遺伝子の再構成を調べたが確認できなかった。これらのSTAP幹細胞は小保方氏が継代培養を繰り返していたものであった。
・小保方氏の依頼でCDB若山研メンバーがTCR遺伝子再構成を調べたが、再構成は認められなかった。(若山研メンバーの実験ノート)
・丹羽氏は、小保方氏が継代培養を繰り返した8系統のSTAP幹細胞のTCR遺伝子再構成が確認されなかった事を、2013年1月(論文作成参加時)に聞いていた。
・丹羽氏は、笹井氏にTCR遺伝子再構成を論文に含める事には慎重にすべきだとの意見を伝えた。
・笹井氏らは、STAP幹細胞がヘテロな集団であり、長期的な継代培養によって再構成が起きていた細胞が消失したという解釈を採った。
*人間の心理には『確証バイアス』というクセがあり、ある事を信じてしまうとそれに反する事が出てきても軽視しやすくなる傾向を持っている。これもその1つの事例。・Article論文にはSTAP細胞塊のTCR遺伝子再構成は記載されたが、STAP幹細胞のTCR遺伝子再構成の実験結果は記載しなかった。
*STAP幹細胞の元のSTAP細胞にTCR遺伝子再構成があるとされていたので、STAP幹細胞での実験結果を示さなかった事は、STAP幹細胞にもTCR遺伝子再構成があると思わせて誤認を誘導するものであった。・丹羽氏のProtocol Exchangeへの投稿は、小保方氏のブロトコールでは不十分と考えて、詳細なものを公表した。当時、小保方氏と笹井氏は論文の訂正で多忙であり、丹羽氏が執筆した。詳細プトコールは2014年3月5日に公表されたが、その中で8系統のSTAP幹細胞にはTCR遺伝子再構成が認められないと記載した。
*STAP幹細胞にはTCR遺伝子再構成が無いことが、ここでようやく公知された。・丹羽氏によると、若山氏は小保方氏からSTAP幹細胞の初期の継代細胞ではTCR遺伝子再構成はあったと聞いていた。

→STAP幹細胞のTCR遺伝子再構成が確認されなかったにも関わらず、実験結果を自分達のアイデアに沿う様に採用した。
→しかし、Protocol ExchangeでSTAP幹細胞のTCR遺伝子再構成が確認されなかった事を公表したことから、意図的な隠蔽はないと判断し、不正と認定せず

2)STAP作製プロトコールが論文の記載と異なる(酸性化に関するATP不記載)
・Articleでは低pH処理にHClを用いたと記載されているが、小保方と若山氏の聞き取り調査から、実際には主にATPが使用されていたと判明。
・小保方氏はHClでも作製できており、論文記載の実験の一部はHClで実施したと説明。
・若山氏は、ATPとHClの使用では実験結果にさほど差が無く、ATP使用の方が若干成績が良かった程度の認識であったと説明。
・丹羽氏は、小保方氏からArticleの実験では全てHClを使っていたと聞いたので、Protocol ExchangeにはHClを記載したと説明。
・HClを用いたとの記載は、2013年9月のArticle改訂原稿から認められる。(それ以前の投稿では、酸性化に使われた物質は明記されていない)

→小保方氏からHClを使用した実験の特定とオリジナルデータの提出がなされず、証拠不十分により不正と認定せず
*これも、「杜撰なデータ管理」が不正認定を回避する結果。