今回は少し専門的な記事になります。
「もっと専門的な話題もあると…」というご意見をいただいたので、どの分野の記事にしようか迷ったのですが、
個人的に最も期待している「遺伝情報と環境情報の統合解析」のお話をしたいと思います。
4章構成で、今回は『遺伝子発現情報のメリット・デメリットー発現量の有効性とノイズ』として、
「遺伝子発現情報の有効性」について解説する予定です。
ある程度「遺伝学」の知識がある方を対象とさせていただきますので、
用語説明については省略させていただきます。
一応、誰にでも通用する文章は心掛けるつもりですので、興味のある方はぜひお読みください。
スポンサーリンク
『遺伝子発現情報のメリット・デメリット』ー発現量の有効性とノイズ(応用編1)
遺伝子発現情報を用いるメリット・デメリット
近年では、量的形質の予測や遺伝子ネットワーク解析に際して、遺伝子発現情報を用いた分析が広く行われています。
発現情報には遺伝情報で反映では反映されない後天的な情報を含むというメリットがある一方、
環境要因や実験過程によるノイズを大きく含むというデメリットがあります。
もう少しだけ詳しく説明しておきましょう。
発現情報を供する場合には、SNP型などの遺伝情報とは異なり、
発現量を測定した時点における(組織固有の)生理的現象を反映できるメリットがあります。
つまり、より正確な環境効果をモデルに組み込むことが可能です。
その反面、食事や生活習慣、気候といった種々のノイズを効果に含むため、
主成分などモデルに適した環境要因の補正を行う必要があります(=デメリット)。
特にSNP情報と統合解析する場合には、発現情報との交互作用と多重共線性について考慮しなければなりません。
現在発表されている論文においても、上記のような補正を怠っている場合が多く過剰適合している可能性があります。
まずは「遺伝子発現情報の有効性」について説明します。
今回は「専門的」などと偉そうに語ってしまったので、文献をいくつか引用します。
文中では略式表記し、文末に詳細な情報を載せますのであらかじめご了承ください。
発現情報の測定方法など基本的な内容は省略しても問題ないでしょうから、
「環境効果と発現量の関係」を取り上げていきます。
スポンサーリンク
環境要因がもたらす遺伝子発現量への影響
Idaghdourら(2008)の論文を引用します。
これは「環境要因がもたらす遺伝子発現量の変動」を検討した論文であり、
集団間で遺伝的多様性が低い集団の遺伝子発現量を比較しています。
<材料>
以下のモロッコ人における末梢血内白血球の遺伝子発現情報(10,177遺伝子)
(1) Urban : 10年以上Anza市に定住している都会人 20個体
(2) Rural : Sebt-Naborに定住する農村民 15個体
(3) Nomadic : サハラ砂漠内に居住している遊牧民 17個体
<手法>
① 10,177遺伝子の発現量を測定後、次式に適用
② 因子を“Location”とする分散分析を行い、発現量を集団間で比較
⇒ Locationの効果が、集団(Urban、 Rural、 Nomadic)間で異なるか検討
こういった書き方で大丈夫でしょうか?
本当は回帰式の構造も詳しく説明しなければならないのですが、毎回説明していくとなると面倒で…どうかご容赦ください<(_ _)>
結果に移ります。
見えづらい…でも続行しますw
FDR<0.01では10,177遺伝子中3,725の遺伝子(37%)が集団間で異なる発現量を示しています。
FDR<0.05では6,215遺伝子(61%)に有意差があり、最も特異的な発現が認められたのは都会集団でした。
この結果から、発現情報が環境要因の影響を強く受けていることが示唆されます。
ただし、環境的には砂漠集団が最も特異だと考えられるため、
今回用いた集団間で真に遺伝的多様性が低いのか疑問は残ります
(Boschら(2000)によって、モロッコ人の遺伝的多様性が他の民族よりも低いこと自体は示されています)。
これで、「発現情報は環境効果を反映する」可能性があることはわかりました。
次に疑問に感じるのは「発現情報が遺伝的要因を強く反映するか否か」です。
発現量の遺伝率が高い場合(遺伝効果が大きい場合)には、環境効果を発現量が十分に反映していない可能性が考えられます。
上記のIdaghdourら(2008)の論文でも、地域ごとに閉塞的交配が行われており、
かつ地域間に有意な遺伝的差異が認められなければ、環境ではなく遺伝によって発現量が決められていたことになります。
そこで、「遺伝的要因がもたらす遺伝子発現量の変動」を検討した論文をご紹介しましょう。
遺伝的要因がもたらす遺伝子発現量への影響
Petrettoら(2006)の論文をご紹介します。
こちらの論文では、遺伝子発現量の遺伝率およびeQTL効果の遺伝率を推定することで当該仮説を検討しています。
<材料>
組換え近交系ラット30個体における下記組織の発現情報
(1) 脂肪組織 (2) 腎臓組織 (3) 副腎組織 (4) 心臓組織(左心室)
(1)~(3)は13,669遺伝子、(4)のみ27,168遺伝子
<遺伝率の算出>
com(AS):同一遺伝子型集団間の分散、
com(WS):
f:近交係数
<eQTLの特定>
因子をマーカー遺伝子型とする分散分析を行い、eQTLを特定
⇒ eQTLと対象プローブの距離が10Mb以内であれば cis、それより遠い場合を trans と分類
<eQTL効果の算出>
:それぞれSHR、BN由来の遺伝子型を持つ個体の遺伝子発現量の平均
<結果>
eProbe(:eQTLの効果を受けているプローブ)の発現量およびeQTL効果の遺伝率
図表が見えなかろうが続行します。
eProbeのp=0.05における遺伝率は、0.14~0.37と低~中程度です。
同様にeQTL効果のp=0.05における遺伝率は、0.2~0.31と高くはない結果となっています。
cis-eQTLの方が、発現量の遺伝率、eQTL効果およびその遺伝率、すべてにおいてtrans-eQTLより高く、有意水準を厳しくしていくとさらに高い値となることが結果に示されています(見えないとは思いますが…)。
よって、この結果からcis-eQTLは、ある程度強い遺伝的効果をもつ一方で、trans-eQTLは遺伝性が低いと考えられます。
cis、transの差に関しては当然の結果です。
肝心なことは「遺伝子発現量は遺伝効果を反映するが、効果はあまり強くない」ということです。
一応、組織間の発現量の遺伝率も観ておきましょう。
組織ごとに遺伝率が異なれば、臨床試験で発現情報を得る細胞の採取箇所を限定しなければならなくなります。
横軸が遺伝率、縦軸が累計です。
視覚的にも明らかですが、遺伝的効果に組織特異的な要素がないことがわかります。
よって、集団や種によって異なる可能性は十分ありますが、
「遺伝的要因がもたらす遺伝子発現量の変動」は大きくはないことが分かります。
最後に環境要因と遺伝的要因を同時に取り上げた「遺伝子発現量の変動の検討」に関する論文をご紹介しましょう。
環境要因と遺伝的要因がもたらす遺伝子発現量への影響
Storeyら(2007)は「環境も遺伝的背景も異なる、アフリカと西欧人間の発現量」を比較することで、
「環境要因と遺伝的要因がもたらす遺伝子発現量の変動」を検討しています。
<材料>
下記のヒトのBリンパ芽球様細胞の5,194遺伝子の発現情報
(1)CEU (northern and western European):西欧人 8個体
(2)YRI (Yoruba of Ibadan,Nigeria):ナイジェリアのイバダンに定住するヨルバ族 8個体
<手法>
・ Storeyら(2006)のODP(optimal discovery procedure)法を使用
・ 集団内および集団間で発現量の分散を比較し、集団内の変動と集団間の変動のどちらが大きいか検討
<結果>
遺伝子発現量の差異(a 集団内 b 集団間)
縦軸が割合、横軸がp値、左が集団内、右が集団間での結果です。
82.6%の遺伝子は集団(ナイジェリアあるいは西欧人)内で発現量に有意差がみられ、17.4%の遺伝子が集団間で発現差が認められた結果となっています。
このことから、遺伝的要因を含めた場合でも、集団間で17.4%の遺伝子が異なる発現を示したため、環境効果の影響は強いと考えられます。
また、今回と類似の研究において、西欧人とアジア人の発現量を比べた研究(Spielmanら、2007)においても、26.1%の遺伝子が集団間で差が認められています。
長くなってしまいましたが、3本の論文を統合しまとめます。
「遺伝子発現量は環境効果を強く反映するため、発現情報をモデルに組み込むことで後天的情報を反映できる。
一方、遺伝効果も反映するため、解析に同時に用いる場合には適切な補正が必要である」
ただし、いずれの論文もサンプルサイズが小さいことやノイズの補正が不十分であることから、
より詳細に検討をするためには、近交系集団を大きく異なる環境で飼育し、発現量およびeQTLの比較を行う必要があると考えられます。
以上、『遺伝子発現情報のメリット・デメリットー発現量の有効性とノイズ(応用編1)』でした!
次の章では『環境要因がもたらす遺伝子発現情報へのノイズ』をご紹介します。
気温や性別によって発現量は影響を受けるのか、またノイズの多いヒトでのeQTLの効果分布はどうかなどを解説していきます。
引用文献
Idaghdour Y, Storey JD, Jadallah SJ, Gibson G: A genome-wide gene expression signature of environmental geography in leukocytes of Moroccan Amazighs. PLoS Genet. 2008, 4: e1000052.
Petretto E, Mangion J, Dickens NJ, Cook SA, Kumaran MK, Lu H, Fischer J, Maatz H, Kren V, Pravenec M, Hubner N, Aitman TJ: Heritability and tissue specificity of expression quantitative trait loci. PLoS Genet. 2006, 2: e172.
Storey JD, Madeoy J, Strout JL, Wurfel M, Ronald J, Akey JM: Gene-expression variation within and among human populations. Am. J. Hum. Genet. 2007, 80: 502–509.
スポンサーリンク
「遺伝子発現情報のメリット・デメリットー発現量の有効性とノイズ(応用編1)」まとめ
遺伝子発現情報を用いるメリット・デメリット
・ メリット:発現量を測定した時点における(組織固有の)生理的現象を反映できる
・ デメリット:食事や生活習慣、気候といった種々のノイズを効果に含むため、主成分などモデルに適した環境要因の補正を行う必要がある
環境要因がもたらす遺伝子発現量への影響
・ Idaghdourら(2008)の検討では、遺伝的多様性の低い集団で、FDR<0.01のとき37%、
・ FDR<0.05のとき61%の遺伝子が集団間で異なる発現量を示した
遺伝的要因がもたらす遺伝子発現量への影響
・ Petrettoら(2006)の検討では、遺伝子発現量の遺伝率は0.14~0.37、eQTL効果の遺伝率は0.2~0.31
・ cis-eQTLはtrans-eQTLよりも遺伝性が強いと考えられるが、中程度の遺伝率
環境要因&遺伝的要因がもたらす遺伝子発現量への影響
・ Storeyら(2007)の検討では、17.4%の遺伝子が地域間で発現差が認められた
小括
・ 環境要因と遺伝的要因を分けてとらえることは困難だが、遺伝子発現量に対して環境効果と遺伝的効果は同程度か、あるいは環境効果の方が大きい可能性が高い
(Giladら、2008;Montgomeryら、2009)
・ よって、集団や種によって異なるが、遺伝子発現量は環境効果を強く反映するため、発現情報をモデルに組み込むことで後天的情報を反映できる
・ その一方、遺伝効果も反映するため、解析に同時に用いる場合には適切な補正が必要である
・ より詳細に検討をするためには、近交系集団を大きく異なる環境で飼育し、発現量およびeQTLの比較などを行う必要がある