p 値とは?
論文を読む力は、職場選びにもつながります
p 値を正しく読めると、論文の「有意差あり/なし」に振り回されにくくなります。一方で、教育体制や共有文化が弱い職場では学びを活かしにくいこともあります。今の環境を整理したい方は、PT 向けキャリアガイドも参考にしてください。
p 値とは、統計解析でよく使われる指標の 1 つです。一般には「p < 0.05 なら有意差あり」と説明されることが多いですが、p 値は「結果が臨床的に重要である」「介入が必ず有効である」「仮説が正しい」と直接示すものではありません。
臨床家が論文を読むときは、p 値だけで判断せず、効果量、95% 信頼区間、対象者、アウトカム、臨床的意義を合わせて確認することが大切です。論文の読み方全体を整理したい場合は、先に 論文の信頼度を判断するチェックポイント を押さえておくと理解しやすくなります。
結論:p 値は「有意差の有無」だけで読むと危ない
p 値を見るときの結論は、p < 0.05 かどうかだけで判断しないことです。p 値は、ある統計モデルのもとで、観察されたデータがどの程度起こりにくいかを示す指標です。しかし、それだけで効果の大きさや臨床的な重要性は分かりません。
| 見るもの | 分かること | 分からないこと |
|---|---|---|
| p 値 | 統計的に偶然だけでは説明しにくいか | 効果の大きさ、臨床的な意味 |
| 効果量 | 差や関連の大きさ | その差が患者に意味を持つかは別に確認が必要 |
| 95% 信頼区間 | 推定値の不確実性 | 単独で臨床判断を完結できるわけではない |
| 臨床的意義 | 患者・利用者にとって意味のある差か | 研究ごとに基準や背景が異なる |
つまり、p 値は論文の結果を読む入口です。最終的には、差の大きさ、信頼区間、対象者、アウトカム、実施可能性を合わせて、臨床で使えるかを判断します。
p 値の意味をかんたんに整理する
p 値は、ざっくり言えば「差がない」という仮定のもとで、今回のような結果またはそれ以上に極端な結果がどれくらい起こりにくいかを示す値です。値が小さいほど、偶然だけでは説明しにくい結果と考えます。
ただし、p 値は「仮説が正しい確率」ではありません。また、「p = 0.03 だから 97% の確率で効果がある」という意味でもありません。この誤解は非常に多いため、p 値を読むときはまず意味を限定して理解する必要があります。
| 誤った読み方 | なぜ違うか | 正しい見方 |
|---|---|---|
| p 値は仮説が正しい確率 | p 値は仮説そのものの確率ではない | データと仮定の不一致の程度を見る |
| p < 0.05 なら効果が大きい | p 値は効果の大きさを示さない | 効果量と信頼区間を見る |
| p > 0.05 なら効果なし | 検出力不足やサンプルサイズ不足でも起こる | 信頼区間と差の方向を確認する |
| p 値だけで結論を決める | 臨床的意義やバイアスを見落とす | 方法・対象者・アウトカムも読む |
統計的有意差とは?
統計的有意差とは、研究で観察された差や関連が、あらかじめ決めた基準よりも偶然だけでは説明しにくいと判断される状態です。多くの医学論文では、p < 0.05 が有意差ありの目安として使われています。
しかし、0.05 は絶対的な境界ではありません。p = 0.049 と p = 0.051 の結果を、まったく別の意味として扱うのは危険です。p 値は連続的な値であり、0.05 を境に「有効/無効」を機械的に分けるものではありません。
| 結果 | ありがちな解釈 | 注意したい見方 |
|---|---|---|
| p = 0.049 | 有意差あり、効果あり | 効果量と信頼区間も確認する |
| p = 0.051 | 有意差なし、効果なし | 差の方向と不確実性を確認する |
| p が非常に小さい | とても重要な効果がある | サンプルサイズが大きいだけの可能性もある |
| p が大きい | 差はまったくない | 検出力不足の可能性もある |
臨床的意義とは?
臨床的意義とは、その差が患者・利用者にとって意味のある変化かどうかを考える視点です。たとえば、歩行速度が統計的に有意に改善していても、その差が生活場面で実感できないほど小さければ、臨床的な意味は限定的かもしれません。
リハビリ領域では、ADL、歩行速度、疼痛、QOL、転倒、再入院など、患者の生活に関わるアウトカムで考えることが重要です。p 値が有意かどうかだけではなく、「どのくらい変わったか」「患者に意味のある差か」「安全性や負担はどうか」を確認します。
| 項目 | 見るもの | 臨床での問い |
|---|---|---|
| 統計的有意差 | 偶然だけでは説明しにくい差か | p 値は基準を下回っているか |
| 臨床的意義 | 患者に意味のある差か | 生活や機能に役立つ変化か |
| 効果量 | 差や関連の大きさ | どのくらい変わったか |
| 95% 信頼区間 | 推定の幅 | 結果はどのくらい不確実か |
効果量を見る
効果量とは、群間差や関連の大きさを示す指標です。平均差、標準化平均差、リスク比、オッズ比、相関係数など、研究デザインやアウトカムによって使われる指標は異なります。
p 値だけでは「差があるか」は見えても、「どのくらい差があるか」は分かりません。臨床で使うには、効果量を確認し、その差が患者にとって意味のある変化かを考える必要があります。
| 効果量 | 主に使う場面 | 読み方の例 |
|---|---|---|
| 平均差 | 同じ単位の連続値 | 歩行速度が何 m/s 変わったか |
| 標準化平均差 | 単位が異なる尺度の比較 | 介入効果の大きさを標準化して見る |
| リスク比 | 発生割合の比較 | 転倒や再入院のリスクが何倍か |
| オッズ比 | 症例対照研究など | ある要因とアウトカムの関連を見る |
| 相関係数 | 2 つの変数の関連 | 筋力と歩行速度の関連を見る |
95% 信頼区間を見る
95% 信頼区間は、効果の推定値がどの程度の幅を持っているかを示す指標です。信頼区間が狭ければ推定が比較的安定している可能性があり、広ければ不確実性が大きいと考えます。
たとえば、平均差が 0.10 m/s でも、95% 信頼区間が 0.01〜0.19 m/s なのか、-0.05〜0.25 m/s なのかで解釈は変わります。p 値だけでなく信頼区間を見ることで、「差の方向」「差の大きさ」「不確実性」を同時に確認できます。
| 見るポイント | 意味 | 臨床での読み方 |
|---|---|---|
| 幅が狭い | 推定が比較的安定している | 結果を解釈しやすい |
| 幅が広い | 不確実性が大きい | サンプルサイズやばらつきに注意する |
| 差なしをまたぐ | 効果なしの可能性も含む | 「効果なし」と断定せず慎重に読む |
| 臨床的に重要な差を含む | 患者に意味のある差の可能性がある | MCID や実践可能性も確認する |
サンプルサイズと p 値の関係
p 値はサンプルサイズの影響を受けます。サンプルサイズが大きい研究では、非常に小さな差でも統計的に有意になることがあります。一方で、サンプルサイズが小さい研究では、臨床的に意味がありそうな差でも有意差が出ないことがあります。
そのため、「p < 0.05 だから重要」「p > 0.05 だから意味がない」とは判断できません。サンプルサイズ、効果量、信頼区間、アウトカムの臨床的意味を合わせて読む必要があります。
p 値を読む 5 分フロー
論文で p 値を見たら、最初に有意差の有無だけを見るのではなく、次の順番で確認します。特に、p 値の直後に効果量と信頼区間を確認する癖をつけると、結果を過大評価しにくくなります。
| 順番 | 確認すること | 見るポイント |
|---|---|---|
| 1 | 主要アウトカムか | 研究で最も重視した結果か |
| 2 | p 値を見る | 有意差の有無を入口として確認する |
| 3 | 効果量を見る | 差や関連の大きさを確認する |
| 4 | 95% 信頼区間を見る | 推定の不確実性を確認する |
| 5 | 臨床的意義を見る | 患者に意味のある差かを考える |
この流れは、介入研究だけでなく、観察研究や評価研究を読むときにも役立ちます。論文の結果を読む前に、PICO が自分の臨床疑問に合っているかも確認しておくと、解釈が安定します。PICO の作り方は、PICO とは?論文検索と臨床疑問の作り方で整理しています。
よくある誤解
p 値で最も多い誤解は、「有意差あり」を「臨床で使える」と読み替えてしまうことです。統計的に有意でも、差が小さすぎる、対象者が現場と違う、アウトカムが患者にとって重要でない場合は、臨床判断には使いにくくなります。
| よくある誤解 | なぜ危ないか | 正しい見方 |
|---|---|---|
| p < 0.05 なら臨床で有効 | 効果の大きさや重要性は分からない | 効果量と臨床的意義を見る |
| p > 0.05 なら効果なし | 検出力不足や不精確さの可能性がある | 信頼区間を確認する |
| p 値が小さいほど効果が大きい | サンプルサイズの影響を受ける | 差の大きさを別に見る |
| p 値だけ見れば十分 | 対象者・方法・バイアスを見落とす | 論文全体の信頼度を確認する |
現場の詰まりどころ
現場で詰まりやすいのは、勉強会や申し送りで「有意差がありました」とだけ共有してしまう場面です。その情報だけでは、どのアウトカムで、どのくらい差があり、患者にとって意味があるのかが分かりません。
| 詰まりどころ | よくある失敗 | 回避策 |
|---|---|---|
| 有意差だけ伝える | 効果の大きさが分からない | 平均差やリスク比も一緒に伝える |
| p 値だけで採用する | 臨床的に小さい差を過大評価する | 患者に意味のある差か確認する |
| 非有意を効果なしとする | 不確実性を見落とす | 95% 信頼区間を見る |
| 主要アウトカムを見ない | 副次アウトカムだけで判断する | 研究目的と主要アウトカムを確認する |
まとめ:p 値は入口、臨床判断は差の大きさで見る
p 値は、統計的有意差を確認するための重要な指標ですが、論文の結果を評価する結論ではありません。p < 0.05 かどうかだけでなく、効果量、95% 信頼区間、対象者、アウトカム、臨床的意義を合わせて確認する必要があります。
臨床家にとって大切なのは、「有意差があるか」よりも、「患者・利用者にとって意味のある変化か」です。p 値は入口として使い、最終的には研究の方法、差の大きさ、不確実性、現場への当てはまりを見て判断しましょう。
よくある質問
各項目名をタップ(クリック)すると回答が開きます。もう一度タップで閉じます。
p 値とは何ですか?
p 値は、ある統計モデルのもとで、観察された結果がどの程度起こりにくいかを示す値です。一般に p < 0.05 なら統計的有意差ありとされますが、効果の大きさや臨床的な重要性を直接示すものではありません。
p < 0.05 なら効果があると考えてよいですか?
それだけでは不十分です。p < 0.05 は統計的に有意であることを示しますが、臨床的に意味のある差かどうかは、効果量、95% 信頼区間、アウトカム、対象者への当てはまりを確認する必要があります。
p > 0.05 なら効果はないのですか?
必ずしも効果がないとは言えません。サンプルサイズが小さい、ばらつきが大きい、検出力が不足している場合でも p 値が大きくなることがあります。95% 信頼区間を確認し、不確実性を含めて読みます。
p 値と効果量は何が違いますか?
p 値は統計的に偶然だけでは説明しにくいかを見る指標です。一方、効果量は差や関連の大きさを示します。臨床で使うには、p 値よりも効果量と臨床的意義を重視する場面が多くなります。
p 値を見るときに最初に確認することは何ですか?
まず、その p 値が主要アウトカムに対するものかを確認します。そのうえで、効果量、95% 信頼区間、臨床的意義、対象者への当てはまりを順番に確認します。
次の一手
p 値を理解したら、次は 95% 信頼区間と効果量を押さえると、論文の結果をより実践的に読めるようになります。論文を読む前の問いの整理には、PICO とは?論文検索と臨床疑問の作り方が役立ちます。
論文全体の信頼度を確認したい場合は、論文の信頼度を判断するチェックポイントを参考にしてください。研究デザインの違いから復習したい方は、RCT・コホート研究・横断研究の違いも確認しておくと理解しやすくなります。
また、論文を読んでも職場で共有する文化や教育体制が弱いと、学んだ内容を実践に落とし込みにくいことがあります。環境要因も含めて整理したい方は、職場環境の詰まりを見える化できるチェックシートも活用してください。
参考文献
- Wasserstein RL, Lazar NA. The ASA Statement on p-Values: Context, Process, and Purpose. Am Stat. 2016;70(2):129-133. doi:10.1080/00031305.2016.1154108. DOI
- Wasserstein RL, Schirm AL, Lazar NA. Moving to a World Beyond “p < 0.05”. Am Stat. 2019;73(sup1):1-19. doi:10.1080/00031305.2019.1583913. DOI
- Greenland S, Senn SJ, Rothman KJ, et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol. 2016;31(4):337-350. doi:10.1007/s10654-016-0149-3. PubMed
- Hopewell S, Chan AW, Collins GS, et al. CONSORT 2025 statement: updated guideline for reporting randomised trials. BMJ. 2025;389:e081123. doi:10.1136/bmj-2024-081123. BMJ
- Hopewell S, Chan AW, Collins GS, et al. CONSORT 2025 explanation and elaboration. BMJ. 2025;389:e081124. doi:10.1136/bmj-2024-081124. BMJ
- Esterhuizen TM, et al. Disparity between statistical and clinical significance in randomised controlled trials: protocol for a methodological study. BMJ Open. 2024;14:e084375. BMJ Open
- Willigenburg NW, et al. The difference between statistical significance and clinical relevance. Injury. 2023;54 Suppl 3:110955. doi:10.1016/j.injury.2023.110955. ScienceDirect
著者情報

rehabilikun(理学療法士)
rehabilikun blog を 2022 年 4 月に開設。医療機関/介護福祉施設/訪問リハの現場経験に基づき、臨床に役立つ評価・プロトコルを発信。脳卒中・褥瘡などで講師登壇経験あり。
- 脳卒中 認定理学療法士
- 褥瘡・創傷ケア 認定理学療法士
- 登録理学療法士
- 3 学会合同呼吸療法認定士
- 福祉住環境コーディネーター 2 級
専門領域:脳卒中、褥瘡・創傷、呼吸リハ、栄養(リハ栄養)、シーティング、摂食・嚥下


