p値とは？有意差と臨床的意義の読み方

p値とは？臨床での読み方を先に整理
結論：p値だけで「効果あり」と判断しない
p値の意味
統計的有意差とは？
臨床的意義とは？
効果量を見る
95%信頼区間を見る
サンプルサイズとp値の関係
p値を読む5分フロー
現場でよくある詰まりどころ
まとめ：p値は入口、臨床判断は差の大きさで見る
よくある質問
次の一手
参考文献
著者情報

p値とは？臨床での読み方を先に整理

p値とは、統計解析で「今回のような結果がどの程度起こりにくいか」を示す指標です。ただし、p値は効果の大きさや臨床的な重要性を直接示すものではありません。この記事では、リハビリ職が論文を読むときに、p値、有意差、効果量、95%信頼区間、臨床的意義をどう組み合わせて判断するかを整理します。

論文の読み方全体を先に確認したい場合は、論文の信頼度を判断するチェックポイントも参考になります。

結論：p値だけで「効果あり」と判断しない

p値を見るときの結論は、p<0.05かどうかだけで臨床判断を決めないことです。

p値は入口として確認し、効果量、95%信頼区間、臨床的意義の4点セットで臨床判断する流れを示した図版 — p値は論文結果を読む入口です。効果量、95%信頼区間、臨床的意義を合わせて確認することで、臨床で使える結果かを判断しやすくなります。

p値を読むときに一緒に確認する項目
項目	分かること	注意点
p値	偶然だけでは説明しにくい結果か	効果の大きさは分からない
効果量	差や関連の大きさ	臨床的に意味があるかは別に確認する
95%信頼区間	推定値の不確実性	幅が広い場合は慎重に読む
臨床的意義	患者・利用者に意味のある差か	アウトカムや対象者によって判断が変わる

臨床では、「有意差があるか」よりも「患者にとって意味のある変化か」が重要です。

p値の意味

p値は、「差がない」という仮定のもとで、今回のような結果またはそれ以上に極端な結果がどのくらい起こりにくいかを示す値です。

値が小さいほど、偶然だけでは説明しにくい結果と考えます。ただし、p値は「仮説が正しい確率」ではありません。「p=0.03だから97%の確率で効果がある」という意味でもありません。

p値でよくある誤解
誤解	なぜ違うか	正しい見方
p値は仮説が正しい確率	仮説そのものの確率ではない	データと仮定のずれを見る
p<0.05なら効果が大きい	p値は効果量を示さない	効果量を確認する
p>0.05なら効果なし	検出力不足でも起こる	信頼区間も確認する

統計的有意差とは？

統計的有意差とは、観察された差や関連が、あらかじめ決めた基準よりも偶然だけでは説明しにくいと判断される状態です。

医学論文ではp<0.05が目安として使われることが多いですが、0.05は絶対的な境界ではありません。p=0.049とp=0.051を、まったく別物として扱うのは危険です。

p値の閾値で起こりやすい誤解
結果	ありがちな解釈	注意したい見方
p=0.049	有意差あり、効果あり	効果量と信頼区間も見る
p=0.051	有意差なし、効果なし	差の方向と不確実性を見る
p値が非常に小さい	とても重要な効果がある	サンプルサイズの影響も考える

臨床的意義とは？

臨床的意義とは、その差が患者・利用者にとって意味のある変化かどうかを考える視点です。

たとえば、歩行速度が統計的に有意に改善していても、その差が生活場面で実感できないほど小さければ、臨床的な意味は限定的です。リハビリ領域では、ADL、歩行速度、疼痛、QOL、転倒、再入院など、患者の生活に関わるアウトカムで考える必要があります。

統計的有意差と臨床的意義の違い
項目	見るもの	臨床での問い
統計的有意差	偶然だけでは説明しにくい差か	p値は基準を下回っているか
臨床的意義	患者に意味のある差か	生活や機能に役立つ変化か
効果量	差や関連の大きさ	どのくらい変わったか
95%信頼区間	推定の幅	結果はどのくらい不確実か

効果量を見る

効果量は、差や関連の大きさを示す指標です。

p値だけでは「差があるか」は分かっても、「どのくらい差があるか」は分かりません。臨床で使うには、平均差、標準化平均差、リスク比、オッズ比、相関係数などを確認し、その差が患者にとって意味のある変化かを考えます。

臨床家が確認したい主な効果量
効果量	主な場面	読み方の例
平均差	同じ単位の連続値	歩行速度が何m/s変わったか
標準化平均差	単位が異なる尺度の比較	介入効果の大きさを標準化して見る
リスク比	発生割合の比較	転倒や再入院のリスクが何倍か
オッズ比	症例対照研究など	要因とアウトカムの関連を見る

95%信頼区間を見る

95%信頼区間は、効果の推定値がどの程度の幅を持っているかを示す指標です。

信頼区間が狭ければ推定が比較的安定している可能性があり、広ければ不確実性が大きいと考えます。p値だけでなく信頼区間を見ることで、差の方向、差の大きさ、不確実性を同時に確認できます。

95%信頼区間を見るときのポイント
見るポイント	意味	臨床での読み方
幅が狭い	推定が比較的安定している	結果を解釈しやすい
幅が広い	不確実性が大きい	サンプルサイズやばらつきに注意する
差なしをまたぐ	効果なしの可能性も含む	効果なしと断定しない
臨床的に重要な差を含む	患者に意味のある差の可能性がある	MCIDや実践可能性も確認する

サンプルサイズとp値の関係

p値はサンプルサイズの影響を受けます。

サンプルサイズが大きい研究では、非常に小さな差でも統計的に有意になることがあります。一方で、サンプルサイズが小さい研究では、臨床的に意味がありそうな差でも有意差が出ないことがあります。

そのため、p<0.05だから重要、p>0.05だから意味がない、とは判断できません。

p値を読む5分フロー

論文でp値を見たら、次の順番で確認すると過大評価を防ぎやすくなります。

臨床家向け：p値を読む5分フロー
順番	確認すること	見るポイント
1	主要アウトカムか	研究で最も重視した結果か
2	p値を見る	有意差の有無を入口として確認する
3	効果量を見る	差や関連の大きさを確認する
4	95%信頼区間を見る	推定の不確実性を確認する
5	臨床的意義を見る	患者に意味のある差かを考える

論文を読む前に臨床疑問を整理したい場合は、PICOとは？論文検索と臨床疑問の作り方も参考になります。

現場でよくある詰まりどころ

現場で詰まりやすいのは、勉強会や申し送りで「有意差がありました」とだけ共有してしまう場面です。

実際の臨床では、その情報だけでは不十分です。どのアウトカムで、どのくらい差があり、患者にとって意味があるのかまで共有しないと、実践に落とし込みにくくなります。

p値を現場で共有するときの注意点
詰まりどころ	よくある失敗	回避策
有意差だけ伝える	効果の大きさが分からない	平均差やリスク比も一緒に伝える
p値だけで採用する	臨床的に小さい差を過大評価する	患者に意味のある差か確認する
非有意を効果なしとする	不確実性を見落とす	95%信頼区間を見る
主要アウトカムを見ない	副次アウトカムだけで判断する	研究目的と主要アウトカムを確認する

まとめ：p値は入口、臨床判断は差の大きさで見る

p値は、統計的有意差を確認するための重要な指標ですが、論文の結果を評価する結論ではありません。

p<0.05かどうかだけでなく、効果量、95%信頼区間、対象者、アウトカム、臨床的意義を合わせて確認する必要があります。臨床家にとって大切なのは、有意差があるかよりも、患者・利用者にとって意味のある変化かです。

よくある質問

各項目名をタップすると回答が開きます。

p値とは何ですか？

p値は、ある統計モデルのもとで、観察された結果がどの程度起こりにくいかを示す値です。一般にp<0.05なら統計的有意差ありとされますが、効果の大きさや臨床的な重要性を直接示すものではありません。

p<0.05なら効果があると考えてよいですか？

それだけでは不十分です。p<0.05は統計的に有意であることを示しますが、臨床的に意味のある差かどうかは、効果量、95%信頼区間、アウトカム、対象者への当てはまりを確認する必要があります。

p>0.05なら効果はないのですか？

必ずしも効果がないとは言えません。サンプルサイズが小さい、ばらつきが大きい、検出力が不足している場合でもp値が大きくなることがあります。95%信頼区間を確認し、不確実性を含めて読みます。

p値と効果量は何が違いますか？

p値は統計的に偶然だけでは説明しにくいかを見る指標です。一方、効果量は差や関連の大きさを示します。臨床で使うには、p値だけでなく効果量と臨床的意義を確認します。

p値を見るときに最初に確認することは何ですか？

まず、そのp値が主要アウトカムに対するものかを確認します。そのうえで、効果量、95%信頼区間、臨床的意義、対象者への当てはまりを順番に確認します。

次の一手

p値を理解したら、次は論文全体の信頼度を確認できるようにすると、結果の読み間違いを減らせます。まずは論文の信頼度を判断するチェックポイントを確認してください。

臨床疑問から論文を探す流れを整理したい場合は、PICOとは？論文検索と臨床疑問の作り方も参考になります。

参考文献

Wasserstein RL, Lazar NA. The ASA Statement on p-Values: Context, Process, and Purpose. Am Stat. 2016;70(2):129-133. doi:10.1080/00031305.2016.1154108. DOI
Wasserstein RL, Schirm AL, Lazar NA. Moving to a World Beyond “p < 0.05”. Am Stat. 2019;73(sup1):1-19. doi:10.1080/00031305.2019.1583913. DOI
Greenland S, Senn SJ, Rothman KJ, et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol. 2016;31(4):337-350. doi:10.1007/s10654-016-0149-3. PubMed
Willigenburg NW, et al. The difference between statistical significance and clinical relevance. Injury. 2023;54 Suppl 3:110955. doi:10.1016/j.injury.2023.110955. ScienceDirect