科学研究の組み立て方−アップルペクチン(ビタペクト)論文の検証付き

もうダマされないための「科学」講義』 (光文社新書)−「付録」に記載のURL集はこちら
http://d.hatena.ne.jp/warbler/20111009/1318150706


関連エントリー:科学についての概説 
http://d.hatena.ne.jp/warbler/20111031/1320025816

[科学研究の組み立て方]

科学実験をする時の重要なポイントは、適切な対照実験を行うことです。
例えば、ある事をする効果を調べたい時には、ある事をした場合としない場合(対照実験)での結果を比較することで確かめることができますが、その他の条件を揃えて行うことが基本になります。できれば、時期による違いの影響などがでないように、それらを同時に行うことが望ましくなります。

実験の結果に影響を与える可能性がある条件として、例えば植物を育てる場合でしたら、気温、湿度、水やりの量と頻度、肥料の種類と濃度、育てる土の質、日照時間、病虫害の有無、などが考えられます。ある肥料の効果を調べたい時に、肥料の他に気温や水やりの状態なども変わってしまうと、その結果が肥料による効果なのか、気温の違いによるのか、水やりの量の違いのせいなのかどうかを判別することが難しくなります。肥料の効果を調べたければ、肥料についてだけ変化させて、その他の条件は変えずに実験を行うと結果の解釈がし易くなります。(実験計画法という解析手法によって複数の因子の条件を同時に変化させて相互作用などを調べる方法もありますが、解析がちょっと複雑になります)
 
ここで、注意をしなければならないのは、実験に使う植物の数です。この植物を全く同じ条件で育てても背丈や実の数などにある程度の差が出るのが普通です。それぞれの条件で育てる植物の数(サンプル数)が少しずつ(1〜3株)の比較だと偶然に背の高いものや実の少ないものばかり集まってしまうことが考えられるので、それぞれの条件で育てる植物をもっと多い株数(例えば20株ずつ)にしてその平均値で比較する方がより正確になります。

何かを測定してデータを出す場合、常に誤差というものが入ってきます。計測する装置が出す数値のふらつき、目盛りを読み取る人の目分量による微妙な差など、同じ物を測定しても必ずしも全く同じ値が常に出されるわけではありません。1つのサンプル(試料)を何度も測定したり、サンプル数をなるべく多くして実験したりすることで、誤差の影響を減らすことができます。そのデータを統計という手法を使って平均値(データの分布の状況によってはデータを小さい順に並べたとき中央に位置する値=中央値を出す場合もあります)とデータの分布の幅やその確からしさの範囲を出して比較するのが慎重なやり方です。(よく使われるのが95%信頼限界という範囲で、この範囲すなわち信頼区間の間に真実の値が含まれている確率が95%になります。より正確な解説はこちら:)。データの確からしさの範囲を見ながら比較をするのも大切なポイントです。この確からしさの範囲は、グラフにエラーバーとして表示されたりします。

特に人を対象にして何かの効果を調べる場合はプラセボ効果ホーソン効果などによる心理的な影響を考慮する必要もあります。

プラセボ効果とは、効果が全く無い「偽物の薬(プラセボ)」を飲んだ人が、それを「本物の薬」だと思い込んだ結果として出る効果で、「薬を飲んだのだから、この症状はきっと良くなるはずだ」という暗示によって実際に症状が軽くなったと感じられたりする効果です。プラセボ効果は色々な状況で影響を及ぼしますが、特に痛みや気分が悪いなどの主観的な症状に対してよく現れることが知られています。「偽物の薬」には<プラセボ効果>、「本物の薬」には<薬の効果+プラセボ効果>がでます。<薬の効果>を調べるには、対照実験として「偽薬」を使ったものも同様に行い、プラセボ効果を差し引いて判定できるようにする必要があります。

※患者を未治療にする危険性を回避するために、偽薬の代わりに別の従来から使われている薬を使って、その薬との効果の比較検討をすることもよく行われています。この場合、「新薬A」には<Aの効果+プラセボ効果>、「従来薬B」には<Bの効果+プラセボ効果>がでることになります。両方を比較して、新薬Aの効果を判定します。

ホーソン効果とは、「誰かが自分に関心を持ってくれている、期待してくれている」と意識することで行動パターンを変えてしまうことによる効果です。医師の熱心な態度や与えられたものが「良く効く薬」だと思えば、それによる改善を期待して前向きに生活するけれども、一方で自分に与えられたものが「偽薬」だと思い込めば自分はハズレの方に振り分けられたのだと、がっかりして後ろ向きの生活をするかもしれません。こういった態度の差が出てしまっても結果に影響してきます。

それらの効果に影響されない為に、対象者にも、それを渡す医師にもどれが「本物の薬」でどれが「偽物の薬」なのか分からない様に工夫して行う必要があります。こうした方法を二重盲検法といいます。(対象者のみが、どちらか分からない様にした方法を一重盲検法といいます)

また、必要な工夫はそれだけではありません。「本物の薬」と「偽物の薬」を与える対象者のグループ分けを無作為(ランダム)抽出により行うことです。病院に来た前半組と後半組、偶数番目と奇数番目などの様に規則正しく振り分けると、途中で医師が患者の薬の効き具合のパターンに気がついてしまったり、患者同士の情報交換でその振り分けのパターンに気が付いてしまったりする恐れがあります。どれが偽物の薬なのかバレてしまうと、盲検化した実験は失敗します。また、例えば花粉症などの場合を考えると、時期によって花粉が飛んでいる量が異なることで症状に差が出る可能性が高くなりますが、病院に来た順番で前半組と後半組にグループ分けをしてしまうと、それぞれのグループの対象者が吸い込んだ花粉の量の平均が異なってしまい、グループ間に薬以外の影響を与える原因が存在してしまうことになり、正しい効果の比較ができなくなるという問題もあります。色々な状況を考慮すると、対象者の各グループの振り分け方は、できるだけ不規則(ランダム)に行うことが好ましくなります。グループ分けをランダムに行った試験をランダム化比較試験(RCT)と言います。これに二重盲検法を組み合わせたものを二重盲検ランダム化比較試験と言い、人を対象とした研究ではこれが最も信頼性が高い研究とされます。

さらに、その研究の検証のポイントとしては、他の従来の知見との整合性がとれるかという事も挙げられます。従来の知見と大きく異なる結果や結論が出された場合は、特に慎重に検討する必要があります。

科学研究を行った後は論文などの形にして報告をしますが、別の人がそれを読んで、その実験などをきちんと再現して確認できるように、どの様に条件を整えて、どの様な方法でデータをとり、どの様にして解析したかなどについて詳しく書くことが求められます。これがきちんと書けているものほど信頼性が高くなります。他の人達がその論文を読んで再現実験を行い、同じ結果が出て再現性が確かめられたらその研究の信頼性はさらに上がります。論文を発表するのには専門分野の科学誌に投稿するのが普通ですが、この場合には同じ分野を専門とする他の科学者達のチェック(査読)を受けてから出される査読誌に掲載された論文の方が、信頼性が高くなります。査読された論文の中にもピンからキリまであるのですが、一般的には掲載された科学誌の信頼性が高いものほど、きちんとした論文である場合が多いです。(一流誌でもまれに捏造論文が発覚したりするので、例外もあります)
次に、具体的な検証例を示します。


[不完全な論文]−例:アップルペクチン(ビタペクト)
Reducing the 137Cs-load in the organism of “Chernobyl” children with apple-pectin
V. B. Nesterenko, A. V. Nesterenko, V. I. Babenko, T. V. Yerkovich, I. V. Babenko
SWISS MED WKLY 2 0 0 4 ; 1 3 4 : 2 4 – 2 7
http://www.smw.ch/docs/pdf200x/2004/01/2004-01-10223.pdf

ペクチンの働きが消化管の中でセシウム137を吸着することで吸収を妨げる働きだけなのかどうかを調べています。セシウム137が含まれていない食べ物をとっている場合は、この消化管からの吸収を防ぐ効果は関係なくなります。もし、この状態でペクチンの経口摂取により体内のセシウム137の量が減るならば、経口摂取したペクチンが体内に蓄積したセシウム137の排出を促進する効果があることを証明できるとしています。

64人(途中脱落6人)のゴメリに住む子ども達をSilver Springというサナトリウムに宿泊させて、その間は放射能汚染の無い食物を与え、3週間にわたり1日に2回、5gのアップルペクチン粉末を与えたグループ(ペクチン群:28人)と、アップルペクチン粉末とよく似た偽薬を与えたグループ(プラセボ群:30人)とに分け、二重盲検ランダム化比較試験を行っています。各グループには32人ずつ割り振りましたが、途中で抜けた人達がいて最終的な人数はペクチン群28人とプラセボ群30人となりました。

その結果、体内のセシウム137の量がペクチンでは約62.6%も減少したのに対して、プラセボでは約13.9%しか減少しませんでした。よって、ペクチンは体内に蓄積したセシウム137の排出を促進する働きがあると結論しています。

この研究で行われた実験方法について検討すると、対象者の人数(サンプル数)は充分あり、二重盲検ランダム化比較試験をしているので、これらはOKです。

問題点1−いつ実施されたかの記載がありません。(子ども達の生年が記載してありますが、試験当時の年齢が不明となっています) 放射性セシウムの体内からの排出の速さは年齢によって大きく変わるので、被験者の年齢はとても大事な情報です。
※補足:Chernobyl Consequences of the Catastrophe for People and the Environment
(Alexey V. YABLOKOV、 Vassily B. NESTERENKO、 Alexey V. NESTERENKO)
ANNAls of the New york AcAdemy of scieNces VOLUME 1181.
のP305に、この研究が2001年の6〜7月に実施された事が記載されていたので、実施時の対象者の年齢は7歳〜11歳と推定されます。本来こういう大事な情報はその成果を報告した論文の中にきちんと書くべきです。

問題点2−実験方法を書いてあるMethodの項目に、計測装置名は記載されていますが、これをどの様に使って1人当たりどれくらいの時間をかけて計測したのかなどの具体的な記述がありません

問題点3−どの統計解析法を使ったのか具体的に書いていません。また、それぞれの子どもに対して繰り返して測定しているのであれば、それらの平均値で出しているのかどうかも記載がないし、それぞれの子どもの測定データの信頼区間も書いていません。1人につき一回だけの測定しかしていないのならば、そうした記述も必要です。

問題点4−データは、Bq/Kgの単位で出されていますが、成人女性を除くすべての年齢集団及び性別でセシウム137の生物学的半減期と体重の間に高い相関性がみられたという報告もあり(Melo DR, Lipsztein JL, Oliveira CAN, et al. A 137Cs age-dependent biokinetic study. Health Phys 1994; 66(6): S25-S26)、結果に影響する因子として、それぞれの対象者の体重についての記載もあった方が参考になったと思います。

次に、結果について検討してみます。大事なポイントとして、この実験でプラセボ群はセシウム137の(生物的な)自然減を示すと考えられます。

問題点5−従来の知見との整合性について。
セシウム137の生物学的半減期については、
放射性物質に関する緊急とりまとめ 2011年3月 食品安全委員会
http://www.fsc.go.jp/sonota/emerg/emerg_torimatome_20110329.pdf 
のP8の放射性崩壊及び生物学的半減期(Argonne National Laboratory 2005b、The Merck Index 2006)の項に記載。

また、セシウム137の生物半減期についての過去の研究については、
◇評価書(案)食品中に含まれる放射性物質 2011年7月 食品安全委員会
放射性物質の食品健康影響評価に関するワーキンググループ
http://www.fsc.go.jp/iken-bosyu/pc1_risk_radio_230729.pdf 
のP75の(4)排泄の項でまとめられています。

さらに詳しいセシウム137の生物学的半減期は、次の資料に記載されています。
◇国際放射線防護委員会(ICRP)の放射性核種の体内摂取に伴う線量評価モデルについて
(独)日本原子力研究開発機構 東海研究開発センター核燃料サイクル工学研究所 栗原治
http://www.mhlw.go.jp/stf/shingi/2r9852000001cyyt-att/2r9852000001cz7c.pdf 
P15 ICRP Publ.67 Table C-8.1の表

(1)仮に一律に指数的に減るとして計算すると、
[プラセボ群が21日で13.9%減(残り86.1%)→半減期約97日]
放射性物質に関する緊急とりまとめ(食品安全委員会)」にも記載されている一般的な知見での生物学的半減期は、だいたい0〜1歳で9日、2〜9歳で38日、10〜30歳で70日、31〜50歳で90日です。対象者は1990〜1994年生まれなので、2001年に実施されたとすると7歳〜11歳の時点になります。何もしないので通常の生物学的半減期で減ることが見込まれるプラセボ群が30日で13.9%しか減少しないのは成人並みであり、30〜50歳の人よりも代謝が悪くてセシウムの排出がかなり遅くなっている状態に見えます。

(2)次にICRP Publ.30のモデルを使ってより精密にスタートから21日間でどれくらい減るかを計算すると、最終的に摂取したセシウム137の時期の違いにより幅があり、5歳で57.1%〜38.1%減、10歳で45.2%〜25.3%減、15歳で25.6%〜14.5%減、成人で21.1%〜12.4%減となります。この論文ではそれぞれの子ども達が最終的に摂取したセシウム137の時期が不明なのですが、対象者が7歳〜11歳の範囲(試験実施が2003年だとしても対象者は9歳〜13歳の範囲)だとして考えるとプラセボ13.9%減というのは、やはり一般的な知見よりも遅くなっています

プラセボ群の減り方がとても遅いことから、論文には記載されていないセシウムの代謝に関わる様な何か別の要因が関与している可能性もあります。特に、ペクチン群とプラセボ群の試験開始前の食生活の状態がほぼ等しく調整されていたのかという点も含めて、一般的な知見と異なってしまった結果の原因が判明しなければこの研究データをそのまま信用するのは難しいのではないかと考えられます。(もしこちらのデータが正しいとすると、一般的な知見の方を見直さなければなりませんが、他の多くの研究結果との整合性を考えると、こちらのデータの方の信憑性が先に問われるでしょう) この論文はいくつかの記載内容の不備に加えて、出されたデータについても他の知見との整合性が見られないことから、この論文の信頼性は低いだろうと判断されます。

問題1の解決法−試験を実施した時の、被験者達の年齢を記載することです。

問題2の解決法−Methodの項目に、計測装置をどの様に使って1人当たりどれくらいの時間をかけて計測したのかなどを具体的に記述することです。

問題3の解決法−どの様にデータを集め、どの統計解析法を使って出した数値なのかを詳しく記載することです。

問題4の解決法−既にセシウム137の生物学的半減期と高い相関性があることが報告されている体重のデータについても、それぞれの被験者について記載するとより参考になると思います。

問題5の解決法−特に問題となるセシウム137の摂取時期により結果に差が出てしまうという条件統一の問題を回避するには、最初と最後だけのデータだけではなく途中の減り方の経過データがあれば、その減衰の様子からそれぞれの被験者のセシウム137の間近の摂取時期の違いがある程度判別可能になるかと思われます。また、ペクチン群とプラセボ群とでセシウム汚染のない食事をしながら投与中止後に同じ様な減り方になるかについても確認したデータがあると参考になったでしょう。また、摂取時期による排出状態の変動が大きい子ども達だけではなく、そういった変動の少ない成人についても同様に試験するとこの問題は回避しやすくなると思われます。

論文としての欠点ではありませんが、ビタミンやミネラル類のペクチンによる吸収阻害など、懸念される副作用などが起きないかどうかについて、効果があったとする投与量でどの程度起きるかという検査なども行われるとより安全面での検証がされると思います。