腸内細菌叢の組成データから疾病のリスクを推定するための手法を開発
─これまで原因不明とされてきた腸内細菌叢の異常(dysbiosis)に起因する様々な疾病の診断や治療・予防をサポートする新たなツールとして活用可能─
掲載誌 国際学術誌 『Frontiers in Microbiology』(2023年1月26日付掲載) 研究グループ シンバイオシス・ソリューションズ株式会社 代表取締役社長 増山 博昭
同上 研究開発本部 糸賀 達也・春日 純平・大熊 佳奈・蓮子 和己 他
一般財団法人辨野腸内フローラ研究所 理事長 辨野 義己プレスリリース 本研究に関するプレスリリースはこちら(PDF)
腸内細菌叢と疾病との関連性は、消化器疾患にとどまらず、アレルギー、自己免疫疾患、肥満や糖尿病などの生活習慣病、がん、神経・精神疾患など多くの疾病に関して報告されています。このため、これまでも腸内細菌を指標とした疾病の検出法や評価法の開発が試みられてきました。しかしながら、先行研究の多くは、単一の腸内細菌をバイオマーカーとして用いるものや、複数の菌を用いても、それらを独立の変数として扱っているため、1,000種類以上の多種多様な腸内細菌が相互作用しながら生息している複雑な生態系である腸内細菌叢と疾病の関連性の全体像を捉え、高い精度と再現性で疾病のリスクを推定できるものとはなっていませんでした。
本研究では、構造方程式モデリング(Structural Equation Modeling)※1の手法を用いて、同様の生理作用を持つ複数の腸内細菌(観測変数)によって構成される腸内細菌叢因子(潜在変数)を設定し、この潜在変数(特定の生理作用を表す潜在的な変数)と疾病との関連性を分析することで、疾病リスクを確率値として算出する画期的な手法を開発しました。
研究グループはまず初めに、アトピー性皮膚炎(以下「アトピー」)のみに罹患している日本人女性(AS)45名と健康な日本人女性(NC)321名の腸内細菌叢の組成データから、ASとNCの間で各菌属の効果量※2を計算し、アトピー罹患者と健康者の腸内細菌叢を特徴づける菌属を特定しました(図1)。
※1 構造方程式モデリング:複数の観測値からそれらが共通に持つ性質を因子として抽出する解析と、抽出された因子間の関係性を推定する解析を同時に行う統計的手法。
※2 効果量:ある現象に対して、着目している変数がどの程度の影響力を持っているのかを指標化した量のこと。
図1:アトピー性皮膚炎のみに罹患している日本人女性(AS)と健康な日本人女性(NC)を比較した場合の効果量の計算結果
横軸が効果量の大きさを表します。効果量が正の値となっている菌属はAS側の効果を示し、負の値となっている菌属はNC側の効果を示しています。
次に、効果量の計算結果(図1)から特定したアトピーと関連のある腸内細菌(菌属)のうち6つの菌属の占有率(相対存在量)のデータを観測変数に用いて、2つの潜在変数(腸内細菌叢因子)で構成された構造方程式モデルを構築しました(図2)。このモデルではアトピーの発症・増悪に関係すると仮定した因子(lv1)と、アトピーの抑制・緩和に関係すると仮定した因子(lv2)の2つの腸内細菌叢因子を設定しました。この結果、適合度指数GFI=0.95、AGFI=0.85、RMSEA=0.06、lv1からアトピー罹患変数へのパス係数が0.32(p<0.01)、lv2からアトピー罹患変数へのパス係数が-0.41(p<0.01)の構造方程式モデルを構築することができました。
図2:今回構築した、腸内細菌叢とアトピー性皮膚炎の関係を表す構造方程式モデル
緑の楕円が腸内細菌叢因子を表し、青の長方形は菌属を表します。オレンジの長方形はアトピーに罹患しているか否かを表す変数です。茶色の矢印の数値は、因子の値が上昇した場合、各菌属の占有率(相対存在量)がどの程度上昇するかを表します。青の矢印上の数値は、因子間の相関の大きさを表します。黄色の矢印の数値は、各因子からアトピー変数への影響の大きさと向きを表します。各数値の絶対値は、0以上1以下の値をとります。
これらのことから、構築したモデルは、腸内細菌叢がアトピーに及ぼす影響の全体像を、体内における炎症反応の亢進に関わる腸内細菌叢因子lv1と炎症反応の抑制に係る腸内細菌叢因子lv2を設定することによって構造化(モデル化)していることが分かります。
本研究では、女性のアトピーを事例として、腸内細菌叢の組成データからアトピーのリスクを推定する手法を開発しましたが、本研究で開発した疾病リスクの推定手法は、様々な疾病に応用することが可能です。そのことを示すため、本研究で開発した疾病リスクの推定手法を用いて、男性の心筋梗塞と女性の認知症の疾病リスク推定モデルを作成し、各々健康者と疾病罹患者の疾病リスクの推定値を算出しました(図3)。
図3:本研究で開発した手法を用いて算出された健康者と疾病罹患者の疾病リスク推定値の分布(例)
左図:男性の心筋梗塞、右図:女性の認知症
①疾病罹患者のうち、現在の腸内細菌叢が本疾病の原因の一端となっている可能性がある人の分布
②健康者のうち、現在の腸内細菌叢に起因して、本疾病に罹患する可能性がある人の分布
③健康者のうち、現在の腸内細菌叢に起因して、本疾病に罹患する可能性が低い人の分布
④疾病罹患者のうち、現在の腸内細菌叢が本疾病の原因の一端となっている可能性が低い人の分布
●男性の心筋梗塞の疾病リスク推定モデルの精度:AUC(※)=0.790
●女性の認知症の疾病リスク推定モデルの精度:AUC=0.897
※AUC:ROC曲線の下側領域の面積。この数値が1に近いほどモデルの精度が高いとされる。
男性の心筋梗塞の例では、疾病罹患者の約73%が中リスク以上に区分されるリスク推定値を示し、約47%が高リスクに区分されるリスク推定値を示しました。一方、健康者の約75%が低リスクに区分されるリスク推定値を示し、約25%が中リスク以上、約3%が高リスクに区分されるリスク推定値を示しています。この疾病リスク推定モデルのもととなった構造方程式モデルにおける目的変数(心筋梗塞の有無)に係わる誤差分散は0.348であり、男性の心筋梗塞の有無の約65%が当該モデル(腸内細菌)で説明できると推定されました。
女性の認知症の例では、疾病罹患者の約92%が中リスク以上に区分されるリスク推定値を示し、約67%が高リスクに区分されるリスク推定値を示しました。一方、健康者の約83%が低リスクに区分されるリスク推定値を示し、約17%が中リスク以上、約4%が高リスクに区分されるリスク推定値を示しています。この疾病リスク推定モデルのもととなった構造方程式モデルにおける目的変数(認知症の有無) に係わる誤差分散は0.209であり、女性の認知症の有無の約79%が当該モデル(腸内細菌)で説明できると推定されました。
原論文情報
Hidetaka Tokuno, Tatsuya Itoga, Jumpei Kasuga, Kana Okuma, Kazumi Hasuko, Hiroaki Masu yama, Yoshimi Benno.
Method for estimating disease risk from microbiome data using structural equation modeling. Frontiers in Microbiology 2023(14),
doi.org/10.3389/fmicb.2023.1035002
https://www.frontiersin.org/articles/10.3389/fmicb.2023.1035002/full