論文不正に関する不適切な画像処理について

科学論文での不適切な画像処理について、標準的な見解を示した論文があります。
What's in a picture? The temptation of image manipulation
Rossner and Yamada JCB 166 (1): 11 Published July 6, 2004
http://jcb.rupress.org/content/166/1/11.full

2005年以降に出された、特に生命科学系の論文はこの標準的な見解に従っています。

また、日本語で書かれたもとしては、次の解説が参考になります。
「Photoshopによるゲル画像の調整」(中山敬一著)
蛋白質核酸酵素Vol.53 No.15(2008)
http://www.mbsj.jp/admins/ethics_and_edu/PNE/1_article.pdf (PDFファイル)

上記解説より、不適切とされる画像処理

1.コピー&ペースト(あたりまえ)←しかし,過去の捏造の大部分はこれ
2.タッチアップ(写真の傷を修正するためのツール)の使用
3.画面の一部のみ,明るさやコントラストを変更すること
4.異なった時間・場所で行なった実験結果を,あたかもひとつのデータのようにみせること(たとえば,同じ電気泳動ゲル上の離れたレーンを近づけた場合でも,あいだには境界線を描かなければならない)

※これらの他に、画像全体の明るさやコントラストを変更している場合でも、過度の操作によって本来見えていたバンド等が消えてしまう状態にまでするのは不適切です。

不適切とされる画像処理の中でも、一般の人達には分かり難いと思われる項目をピックアップして解説します。

(A)別々に電気泳動した画像を切り貼りして一緒に電気泳動した様に見せてはいけない

・電気泳動する時の微妙な違い(使用したゲル[寒天・アルリルアミド等]の濃度・分子量等、泳動に使った試薬の種類や濃度、実験をした時の温度、泳動時間、電圧・電流、etc.)、検出時の微妙な違い(染色の濃さやムラ、写真撮影の諸条件、etc.)で結果が違って見える。
・同じ電気泳動ゲル上でも、離れている場所では使用したゲルの濃度ゆらぎなどの微妙な違いが生じるので、並べて示す時は原則として間に境界線を入れて誤認を防ぐことが必要になります。

例) 同じ試料を別々に電気泳動すると… 
[NHKクローズアップ現代:STAP細胞はあるのか 〜検証 小保方実験]より
http://www.nhk.or.jp/gendai/kiroku/detail02_3482_1.html

「左の寒天には線が3本現れていますが、右の寒天には線が2本しか現れていません」
この様に、結果が違って見えることはよくあります。
そのため、別々のゲルで流した写真を、同一のゲルで流したかの様に切り貼りして表示することは不適切になります。

他にも、泳動時間や電流・電圧の違いにより移動度が異なってくるので、必ずコントロールとしてマーカーなどの標準試料を一緒に泳動して各実験毎にそれを示す必要があります。


(B)画像の一部のみ,明るさやコントラストを変更してはいけない
一部のバンド等の濃さを操作して、正しい比較をできなくすることにより誤認を招く行為です。
特に説明は要らないと思いますが、例を示します。
次の様に画像の一部のみ,明るさやコントラストを操作するのは不適切です。



一部のみ,明るさやコントラストを操作

※バックグラウンドの「染み」や「汚れ」の部分を操作して薄くしたり消したりするのも不適切です。
(画像操作した本人は「汚れ」のつもりでも、実は意味のある情報を持っている場合があります)
画像を部分的に濃くしたり薄くしたりして「お化粧」すると画像の見栄えが良くなったりしますが、やってはいけない操作です。

バックグラウンドの汚れなどが見苦しければ、その部分を薄くする画像操作をする等の反則をせず、面倒でも実験をやり直すべきです。


(C)画像全体への操作でも、過度の明るさ・コントラスト等の操作によって本来見えていたバンド等が消えてしまう状態にするのは不適切

例) 

Figure 3. Manipulation of blots: brightness and contrast adjustments.
Rossner and Yamada JCB 166 (1): 11 より

この例の場合は、データを見た人達に、本来は見えていた一部のバンドが無かった様に誤認させてしまうことになります。

<その他の不適切な行為に関しては、適宜追記していきます>

元調査委員の研究論文の疑義に関する予備調査結果についての検証

2014年9月19日、理研から石井俊輔上席研究員(石井分子遺伝学研究室)が責任著者をつとめる研究論文2報についての疑義についての予備調査の報告がありましたので、これに関する検証を行いました。
http://www.riken.jp/pr/topics/2014/20140919_1/

・石井俊輔上席研究員(石井分子遺伝学研究室)が責任著者をつとめる研究論文2報についての疑義
http://d.hatena.ne.jp/warbler/20140424/1398320093

(注)文字の色づけは、私の方でしました。

論文1に関する疑義および検証結果


提出された生データ

[疑義1]
図4eのAtf-2の16は、図5dのN5-15と同一のデータである可能性。パターンが指紋の様に酷似しており、データの使い回しの疑いがある。

[疑義2]
図4eのGadd45αの16、18も、図5dの12、13と同一データである可能性。ドットのパターンが指紋の様に酷似しており、データの使い回しの疑いがある。

[検証結果1]
図の作成を担当した者が図の作成の際に、本来使うべきデータの隣のデータを使ったことが確認できた。後述の(疑義12)でも述べる通り、この者は、図4e及び図5dの作成過程で、本来使うべきバンドの隣のレーンのバンドを使うという誤りを3回繰り返している

指摘された図の加工が結果を良く見せる性質を持たず、また、オリジナルデータで真正な結果が確認できた。よって、過失であったと考えるのが合理的であり、研究不正には当たらないと判断した。

[検証結果2]
図5dの12、13をGadd45αの16、18にも使った可能性があると考えられた。いずれも、指摘された図の加工が結果を良く見せる性質を持たず、また、オリジナルデータで真正な結果が確認できた。よって、過失であったと考えるのが合理的であり、研究不正には当たらないと判断した。

[片瀬コメント]
「本来使うべきデータの隣のデータを使う」事を頻繁に行った理由が明確ではない。
画像のコピペをする場合は、発覚し難いように、バックグラウンドの差が少ない隣などの近い部分の画像を使うという手口が知られており、単なる過失と判断できるのか慎重な判断が求められる。

また、修正後の電気泳動画像について、2枚の別々のゲルに流した実験結果を並べており、間に境界線を入れているものの、断り書きを入れるか、図にもう1枚のゲルでのマーカーとコントロールを入れる方が良い。

[疑義3]
図4eと図5dのMarkerとControlはMaspin以外全て同じデータが二度使われている可能性がある。 同じゲルを使用したため共通のMarkerとControlを採用したと言うなら、Maspinのみ別のMarkerとControlを使用した理由が説明つかず、データを捏造した疑いがある。

[検証結果3]
2枚のゲルに同じマーカーを流して移動度を確認していることがオリジナルデータから確認できた。Maspinのみ別のマーカーとコントロールを使っているのは、Maspinのみ異なる順番で泳動したためであると理解できた。よって、結果の真正さを損なわせるものではなく、研究不正に当たらないと判断した。

[片瀬コメント]
修正後の画像では切り貼り部分に境界線が入れられているが、2枚のゲルで泳動した別々の実験結果を並べており、不適切である。
理由は、 http://d.hatena.ne.jp/warbler/20140920/1411173696 の(A)で解説している。少なくとも、別のゲルで流した結果を合わせている事を図の説明に明記するか、図にもう1つのゲルで流したマーカーとコントロールを入れた方が良いと考える。

[疑義4]
図5dのMaspinでは、11と13とN7-17は他のサンプルに見られるバンド下の非特異的な横縞模様が見えず、3も下の縞模様が他と異なり、全く別のデータを切り貼りして並べた可能性がある。

[疑義5]
図5dのMaspinでは、サンプル番号4、5、7、10、14、N5−15で指紋の様に同一の縞模様が見え、同じ画像データを6回も繰り返し使い回して貼付けた疑いがある。

[疑義6]
図5dのMaspinの画像がいくつかの箇所で切り貼りされ、著者の都合に合わせてデータをジグソーパズルの様に並べて作成した疑いがある。


[検証結果4]
図のバックグラウンドに見られる縞模様や指紋のような模様は、オリジナルデータでは確認できず、画像処理過程において生じたノイズ等であると考えられた。

[検証結果5]
図のバックグラウンドに見られる縞模様や指紋のような模様は、オリジナルデータでは確認できず、画像処理過程において生じたノイズ等であると考えられた。

[検証結果6]
サンプル数が多いため、2枚のゲルに分けて同時に行った電気泳動で得られた結果を、他の因子のサンプルの順番とあわせて、並べ替えたものであることが確認できた。

[片瀬コメント]

修正後の画像では切り貼り部分に境界線が入れられているが、2枚のゲルで泳動した別々の実験結果を並べており、不適切である。
理由は、 http://d.hatena.ne.jp/warbler/20140920/1411173696 の(A)で解説している。少なくとも、別のゲルで流した結果を合わせている事を図の説明に明記するか、図にもう1つのゲルで流したマーカーとコントロールを入れた方が良いと考える。

[疑義7]
図4eのMaspinでは、図5dに見られる縞模様(バンドがなくても縞模様はある) が全く見えず、同じサンプルのデータではない可能性があり、全く別のサンプルのデータを貼付けた疑いがある。

[検証結果7]
図のバックグラウンドに見られる縞模様や指紋のような模様は、オリジナルデータでは確認できず、画像処理過程において生じたノイズ等であると考えられた。

[疑義8]
図4eのp53の2は別のデータの貼付け、または画像処理がされている疑いがある。16と18はコントラストを上下で画像処理されている疑いがある。

[検証結果8]
二つのゲルに分けて電気泳動を行った結果を一つの図にしたものである。これらについては、加工は加えられているものの結果の真正さを損なわせるものではなく研究不正には当たらないと判断した。

[片瀬コメント]
二つのゲルに分けて電気泳動を行った結果を一つの図にした事は、既に何度か指摘しているが、不適切である。
理由は、 http://d.hatena.ne.jp/warbler/20140920/1411173696 の(A)で解説している。少なくとも、別のゲルで流した結果を合わせている事を図の説明に明記するか、図にもう1つのゲルで流したマーカーとコントロールを入れた方が良いと考える。

以下に示す様に、バンド周囲の明るさ・コントラストを変えてバンドをくっきりとさせており、「お化粧」が施されている。
http://d.hatena.ne.jp/warbler/20140920/1411173696 の(B)で解説しているが、こうした操作はバンドの濃さや泳動された時の形状(尾の引き方など試料の特徴的な性質)を他の試料と正しく比較することをできなくしてしまう。

また、「真正さを損なわせるもの」でなければ不適切な加工がされていても許容されるという判定には疑問がある。
過去の事例として、2014年3月31日に出された筑波大学「本学生命環境系教授及び元講師論文に関する調査報告書」では、複数の画像について、再現性はあり科学的には真性であるが図に意図的な加工が認められたとして「改ざん」として認定されている。
http://www.tsukuba.ac.jp/wp-content/uploads/af444edae7f265802fb47e3e26143939.pdf
不正行為の深刻さについては個別に考えて行く必要があるが、こうした図の加工(お化粧)を許容してしまうのは問題があると考える。

[疑義9]
図4eのGapdhの2と図5dの3は、拡大すると特徴あるバンドの形が類似しており、同一データを使い回した疑いがある。

[検証結果9]
指摘されたバンドが同一であると判断できなかった

[疑義10]
図4eのGapdhは、Markerから2までと16から18までの泳動パターンが異なる。同一ゲル解析データではなく切り貼りされている可能性がある。

[検証結果10]
二つのゲルに分けて電気泳動を行った結果を一つの図にしたものである。これらについては、加工は加えられているものの結果の真正さを損なわせるものではなく研究不正には当たらないと判断した。

[片瀬コメント]
二つのゲルに分けて電気泳動を行った結果を一つの図にした事は、既に何度か指摘しているが、不適切である。
理由は、 http://d.hatena.ne.jp/warbler/20140920/1411173696 の(A)で解説している。少なくとも、別のゲルで流した結果を合わせている事を図の説明に明記するか、図にもう1つのゲルで流したマーカーとコントロールを入れた方が良いと考える。

[疑義11]
図4eのAtf-2 の2も図5dのAtf-2の3と同一で、捏造データの可能性がある。

[検証結果11]
指摘されたバンドが同一であると判断できなかった

[疑義12]
論文1図4eは、石井上席研究員が掲載誌に訂正を申し入れ、受理された図である。この図のGapdhの18のバンド(下図では、一番右下の部分)は、訂正前画像では、シグナルが明確であるが、訂正後の画像ではバンドが消失している。石井上席研究員がウェブサイトで公開したオリジナルデータでは、バンドが薄く写っている。

(生データ)

[検証結果12]
著者らは、GapdhのデータにおいてTumor-18のバンドが大変薄いので、左隣のN7-17のバンドを、一番右端のTumor-18のバンドと見誤ったのではないかと説明した。本実験においては、最初にRNA量が一定であることを確認するために、まずp53のRT-PCRを行い、全サンプルにおいて十分な量のRNAが存在していることを確かめた上で、Atf-2、Gadd45α、Gapdhの実験が行われたこと、著者らがGapdhの18のバンドのシグナルが低いことを認識していたことを実験当時の資料で確認した。著者らは、Gapdhの18のシグナルが何らかの理由で薄くなったが、p53のシグナルが十分存在するという事実を基に考察を進めたことがうかがわれ、Gapdhの18のシグナルが強く出現しなくても、論旨に影響はない。 また、図の作成を担当した者は、本来使うべきデータと隣のデータを取り違えたことを認めており、この者は疑義?の検証結果でも同様に、本来使うべきデータとその隣のデータを取り違えている。さらに、図5dのN7-17でも同じように隣のデータを取り違えている。同一の研究者が二つの図の作成過程で、複数個所で同じようなデータの貼り間違いをしており、敢えてこのようなデータの取り違えをする理由が見当たらず、これは過失であったとの説明に不自然な点は感じられない。Gapdhに真正でない図を貼ったことは過失であったと考えるのが合理的であり、研究不正には当たらないと判断した。

次に、石井上席研究員が訂正を申し出て受理された図では、オリジナルデータで確認できるGapdhの18の薄いバンドが消失していた。石井上席研究員は、この変化は元の写真画像をスキャナで取り込む際に生じうる程度の変化であると説明した。

これについては、石井上席研究員は掲載誌に図の訂正を申し入れる際にSupplementary Figureとして薄いもののバンドが発現しているオリジナルデータを掲載誌に提出していること、バンドが消失した図を見せることが結果を良く見せる性質を持たないことから、故意にバンドを消失させる理由が見あたらず、研究不正には当たらないと判断した。

[片瀬コメント]
最初のコメントでも指摘したが、「本来使うべきデータの隣のデータを使う」事を頻繁に行った理由が明確ではない。
画像のコピペをする場合は、発覚し難いように、バックグラウンドの差が少ない隣などの近い部分の画像を使うという手口が知られており、単なる過失と判断できるのか慎重な判断が求められる。

「Gapdhの18のシグナルが強く出現しなくても、論旨に影響はない」とされているが、Gapdhの発現量は実験のコントロールとして行っており、これが不揃いであれば実験をやり直すなどをして実験の精度を高めてから論文にまとめた方が良い。


論文2に関する疑義および検証結果

[疑義1]
図1Aのc-Mybのウェスタンブロッティング(WB)バンドの画像と相対量のデータを図3Bでも使用している疑いがある。図4Bのc-Mybの左図のWBバンド画像は、図1A、図3Bのものとは異なり、++の条件ではバンドが見えていないのに、右のグラフの相対量は図1A、図3Bと殆ど同じ(同一?)結果であり、エラーバーの幅もほぼ一致していて不自然さを感じる。v-MybのWBバンドの相対的な濃さは、図1A(Wnt-1-と++)と図3B(Wnt-1-と+)で若干異なって見えているにもかかわらず、相対量のグラフでは両方の実験結果がエラーバーの幅も含めてほぼ一致しており、不自然さを感じる。

[検証結果1]
図1Aの-と++を、図3Bでは-と+の図として表していること、グラフ作成に使われた数値は、3つの図の棒グラフで共通していること、図4bの棒グラフは図1Aの棒グラフと同じであることはオリジナルデータで確認できた(下図)。図で示された結果は真正であり、研究不正には当たらないと判断した。

[疑義2]
図5Aでレーンの切り貼りが見える。

[検証結果2]

図5Aは同一ゲル上の必要なデータを加工したものであることがオリジナルデータで確認できた(右図)。これらについては、加工は加えられているものの結果の真正さを損なわせるものではなく、研究不正には当たらないと判断した。

[片瀬コメント]
これについては、同一ゲル上のデータの切り貼りであり、大きな問題はない。
しかし、 http://d.hatena.ne.jp/warbler/20140920/1411173696 の(A)で解説した通り、同じ電気泳動ゲル上でも、離れている場所では使用したゲルの濃度ゆらぎなどの微妙な違いが生じるので、並べて示す時は間に境界線を入れて誤認を防ぐことが必要になる。(2004年に出された論文なので、こうした標準的な見解が普及する端境期であったと考えられ、当時の実験データの提示方法として不適切とまでは言えない)

[疑義3]
論文2の図4Bは、c-Mybの++バンドが見えないが、オリジナルデータでは薄く現れている。

[検証結果3]
石井上席研究員は、論文では、短い露光時間で得たフィルムを使用したか、或いは、論文1の疑義?の訂正後の図と同様、この変化は元のX線フィルム画像をスキャナで取り込む際に生じうる程度の変化であると説明した。そのバンドが非常に薄いか、或いはないことは併記されたグラフでも読み取れた。これについては、バンドが消失した図を見せることが結果を良く見せる性質を持たず、また故意にバンドを消失させる理由が見あたらないことから、研究不正には当たらないと判断した。

[片瀬コメント]
この論文では、Wint1シグナルに応じてc-Mybが分解されるというストリーに沿ったもので、図4Bの問題の図は、Wint1の量が多くなるに従って(「−」>「+」>「++」の順)c-Mybのバンドが薄くなるのが理想である。
よって、「バンドが消失した図を見せることが結果を良く見せる性質を持たず」という判断には疑問がある。

論文に掲載された画像をチェックしていて気が付いたのが次の点である。

さらに、生データの「−」のバンドの濃さを同じにして、バンド幅を揃えて並べてみると、「++」のバンドの位置が隣のバンドと一部重なってしまう。