9/22/2016

Cubic Spline Analysis;3次スプライン解析

ある論文を読んでいて「Cubic Spline」という単語を見つけたので調べました。

統計的なモデルを見た目でわかりやすく示す曲線、のようなものです。
そしてその曲線は、非常に自然で、しなやかな形らしいです。

先日読んだ論文で、「LDL-Cを70mg/dL未満にしても、70-100mg/dLと変わりませんよ。」という内容を目で見てわかりやすく表したのが、下の図です。
Cubic Spline Curveという表示方法のようです
基準を決めて、そこから予測される危険度;HRをモデル化して、それを曲線で表したのがこれです。

これで言及できる事は「LDL-Cは120mg/dL以上は確実によくない」という事ですね。

「この論文では70mg/dL未満は意味がないよ」ということを暗に言いたいのでしょうが、曲線だけ見ると、リスクが一番低くなるのは、LDL-Cが85mg/dLあたりです。
ということで、「LDL-Cは85mg/dLを目指しましょう。120mg/dL以上はだめですよ。ちょっとぐらい低くても問題ないですよ。」という結論になると思います。

しかし、これを曲線でなく、直線モデルで表すと、確実にCTTのような、右上がりの直線モデルが出来上がると思います。

メタ解析で、いくつもの規定点からモデルを作成したらCTTの結論になったのに、この研究ではなぜこのような曲線になったのでしょうか?IMPROVE-ITとも異なります。

その答えは、

母集団が違う。140mg/dL以上の症例は除いている。
ここで考えるのが、
「じゃあ100以下の群で調べたらどうなるのか?」
「もっと細かく単純にLDL-Cの値で5分位にぐらいわけて、モデルを作成したらどうなったか?」
たぶん違う結論になるのでしょう。
また
そもそも解析のやり方が人為的。基準を中間群において3群をそれぞれ比較。つまり、モデル曲線のプロット点は3つしかない。
上の図は、プロットされる3点。その3点から導いた曲線が前述の図。
Cubic Spline Curveはすくないプロット点からそれを補う補完する解析
プロペンシティーも、母集団に偏りがあるから無理やり特殊な解析でアジャストさせた解析であって、いうなればトリッキーな解析。
と思えます。

いろんな解析をした結果、こんな結論になりましたよ。
ということです。
論文にも流行があって、母集団を4分位や5分位に分けて解析する事が、僕的に流行ったりしました。
しかし、個人的には、本当に強固なモデルであれば、どうやってもその強固性は保持されると思います。
本質を見失わないように、見た目にだまされないように、しっかりついていきたいと思います。


最後に、この曲線をSTATAで描けるか?
で、調べると一応「mkspline sutbname = oldvar, cubic」というコマンドで出来るようです。

メニューからは、
Data > Create of change data > Other variable-creation commands > Linear and cubic spline construction
から、いけるようです。 

さてさて、自分のデータで、モデルを作ってやって見ましょう。

と思いましたが、ちょっと時間がないので、暇なときにまた…

0 件のコメント:

コメントを投稿