自分が今いる学部だと授業で基本的に使うのは、RかPythonで、SASをやっている人がほぼいないのですが、個人的には医療系行く人は少しだけでもSAS触れてくれると嬉しいなということもあり最近SAS系の記事を書いてます。今回はその一環として無料で利用可能なSAS OnDemand for Academics(SAS ODA)とPython を連携させるやり方をまとめていこうと思います。
続きを読む
大まかな内容としてはロジスティック回帰分析の概要と、それを実際にSASで実行するとしたらどんな感じのプログラムを組めばいいかを簡単にまとめていこうと思います。
また今回の内容とは関係ないのですが、最近SNSなどを経由してこのブログに関しての応援のコメントもいただくことも増え大変感謝しております。医療分野における解析方法の理論、実装面をできる限り最新のものまで追えるように引き続き頑張っていこうと思うので、今後ともよろしくお願いします。というわけで、ロジスティック回帰の話に入っていきます。
生存時間解析をもう一度丁寧に勉強しなおしているところで、以前に作成したカプランマイヤー曲線に関する記事だと少し内容が物足りないところがあるかなということで、内容を補足していこうと思います。なお生存時間解析自体の理論的な話については、下記の記事でシリーズものとしてまとめているのでそちらを参照いただけると幸いです。
医学研究において頻繁に出てくる解析手法の一つに生存時間解析というものがあります。生存時間解析は名前の通り生存時間に関する解析手法であり、研究に携わる者としては非常に重要な分野かと思います。ただその内容は理論的にも難しい部分があり、多くの方が躓きやすい分野でもあるかなと思います。
個人的な話ですが、メインの適用分野を一つ決めてそれを軸に統計的因果推論の学習・研究をしていきたいなと考えています。実はその候補の一つが生存時間(時間依存性交絡あたり)で、今回の記事はそれに向けた備忘録的なものでもあります。ちなみにタイトルからもわかる通りシリーズ化します。
今回は以前に書いた操作変数法に関する概略の続きとして、実際に操作変数法を用いて因果効果の推定が行われた研究を、後追いしつつ、紹介していこうと思います。前記事はこちら。
使用するデータはangrist and krueger(1991)での教育年数と賃金に関するデータです。この研究は、操作変数法を利用した研究としては経済分野では非常に有名で、様々な文献、書籍等でその名前があげられています。